aboutsummaryrefslogtreecommitdiffhomepage
path: root/src/jumper
diff options
context:
space:
mode:
authorGravatar Mike Reed <reed@google.com>2017-08-31 12:17:52 -0400
committerGravatar Skia Commit-Bot <skia-commit-bot@chromium.org>2017-08-31 16:43:02 +0000
commite3d1e5d768739e8315dabc528367a99873d01147 (patch)
treecd5fb125e9c2a61ee330289593b611bf25474b70 /src/jumper
parent88917bfc5b7760f6f946b3532d701e2772b6986e (diff)
add 8bit stages for load/store 565
approx 2.5x faster on arm64 for sprite 8888 --> 565 blits Bug: skia: Change-Id: I524f993fee16196385dc07cbec39ef378b1301e5 Reviewed-on: https://skia-review.googlesource.com/41162 Reviewed-by: Florin Malita <fmalita@chromium.org> Reviewed-by: Mike Klein <mtklein@chromium.org> Commit-Queue: Mike Reed <reed@google.com>
Diffstat (limited to 'src/jumper')
-rw-r--r--src/jumper/SkJumper.cpp1
-rw-r--r--src/jumper/SkJumper_generated.S6375
-rw-r--r--src/jumper/SkJumper_generated_win.S6359
-rw-r--r--src/jumper/SkJumper_stages_8bit.cpp70
4 files changed, 7451 insertions, 5354 deletions
diff --git a/src/jumper/SkJumper.cpp b/src/jumper/SkJumper.cpp
index 52a89b389e..df15397fc4 100644
--- a/src/jumper/SkJumper.cpp
+++ b/src/jumper/SkJumper.cpp
@@ -70,6 +70,7 @@ using StartPipelineFn = void(size_t,size_t,size_t,size_t, void**);
M(load_bgra) M(load_bgra_dst) M(store_bgra) \
M(load_a8) M(load_a8_dst) M(store_a8) \
M(load_g8) M(load_g8_dst) \
+ M(load_565_dst) M(store_565) \
M(swap_rb) \
M(srcover_rgba_8888) \
M(lerp_1_float) \
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index 83b7117da2..9c370f599b 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -9348,15 +9348,15 @@ _sk_seed_shader_hsw:
.byte 197,249,110,194 // vmovd %edx,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,173,183,2,0 // vbroadcastss 0x2b7ad(%rip),%ymm1 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,13,105,193,2,0 // vbroadcastss 0x2c169(%rip),%ymm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 197,252,88,5,73,185,2,0 // vaddps 0x2b949(%rip),%ymm0,%ymm0 # 2ba00 <_sk_overlay_sse2_8bit+0x5e4>
+ .byte 197,252,88,5,9,195,2,0 // vaddps 0x2c309(%rip),%ymm0,%ymm0 # 2c3c0 <_sk_overlay_sse2_8bit+0x5e8>
.byte 197,249,110,209 // vmovd %ecx,%xmm2
.byte 196,226,125,88,210 // vpbroadcastd %xmm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,137,183,2,0 // vbroadcastss 0x2b789(%rip),%ymm2 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,21,69,193,2,0 // vbroadcastss 0x2c145(%rip),%ymm2 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -9371,17 +9371,17 @@ _sk_dither_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,121,110,194 // vmovd %edx,%xmm8
.byte 196,66,125,88,192 // vpbroadcastd %xmm8,%ymm8
- .byte 197,61,254,5,36,185,2,0 // vpaddd 0x2b924(%rip),%ymm8,%ymm8 # 2ba20 <_sk_overlay_sse2_8bit+0x604>
+ .byte 197,61,254,5,228,194,2,0 // vpaddd 0x2c2e4(%rip),%ymm8,%ymm8 # 2c3e0 <_sk_overlay_sse2_8bit+0x608>
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9
.byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9
- .byte 196,98,125,88,21,77,183,2,0 // vpbroadcastd 0x2b74d(%rip),%ymm10 # 2b860 <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,88,21,9,193,2,0 // vpbroadcastd 0x2c109(%rip),%ymm10 # 2c21c <_sk_overlay_sse2_8bit+0x444>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,50,183,2,0 // vpbroadcastd 0x2b732(%rip),%ymm12 # 2b864 <_sk_overlay_sse2_8bit+0x448>
- .byte 196,98,125,88,45,45,183,2,0 // vpbroadcastd 0x2b72d(%rip),%ymm13 # 2b868 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,125,88,37,238,192,2,0 // vpbroadcastd 0x2c0ee(%rip),%ymm12 # 2c220 <_sk_overlay_sse2_8bit+0x448>
+ .byte 196,98,125,88,45,233,192,2,0 // vpbroadcastd 0x2c0e9(%rip),%ymm13 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -9396,8 +9396,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,223,182,2,0 // vbroadcastss 0x2b6df(%rip),%ymm9 # 2b86c <_sk_overlay_sse2_8bit+0x450>
- .byte 196,98,125,24,21,218,182,2,0 // vbroadcastss 0x2b6da(%rip),%ymm10 # 2b870 <_sk_overlay_sse2_8bit+0x454>
+ .byte 196,98,125,24,13,155,192,2,0 // vbroadcastss 0x2c09b(%rip),%ymm9 # 2c228 <_sk_overlay_sse2_8bit+0x450>
+ .byte 196,98,125,24,21,150,192,2,0 // vbroadcastss 0x2c096(%rip),%ymm10 # 2c22c <_sk_overlay_sse2_8bit+0x454>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8
.byte 196,65,44,89,192 // vmulps %ymm8,%ymm10,%ymm8
@@ -9431,7 +9431,7 @@ HIDDEN _sk_black_color_hsw
FUNCTION(_sk_black_color_hsw)
_sk_black_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,98,182,2,0 // vbroadcastss 0x2b662(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,30,192,2,0 // vbroadcastss 0x2c01e(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -9442,7 +9442,7 @@ HIDDEN _sk_white_color_hsw
FUNCTION(_sk_white_color_hsw)
_sk_white_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,73,182,2,0 // vbroadcastss 0x2b649(%rip),%ymm0 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,5,192,2,0 // vbroadcastss 0x2c005(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -9488,7 +9488,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,232,181,2,0 // vbroadcastss 0x2b5e8(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,164,191,2,0 // vbroadcastss 0x2bfa4(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -9504,7 +9504,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,183,181,2,0 // vbroadcastss 0x2b5b7(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,115,191,2,0 // vbroadcastss 0x2bf73(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -9543,7 +9543,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,90,181,2,0 // vbroadcastss 0x2b55a(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,22,191,2,0 // vbroadcastss 0x2bf16(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -9556,7 +9556,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,57,181,2,0 // vbroadcastss 0x2b539(%rip),%ymm0 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,245,190,2,0 // vbroadcastss 0x2bef5(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -9569,7 +9569,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,24,181,2,0 // vbroadcastss 0x2b518(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,212,190,2,0 // vbroadcastss 0x2bed4(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -9582,7 +9582,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,243,180,2,0 // vbroadcastss 0x2b4f3(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,175,190,2,0 // vbroadcastss 0x2beaf(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -9606,7 +9606,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,186,180,2,0 // vbroadcastss 0x2b4ba(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,118,190,2,0 // vbroadcastss 0x2be76(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9629,7 +9629,7 @@ HIDDEN _sk_plus__hsw
FUNCTION(_sk_plus__hsw)
_sk_plus__hsw:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,5,105,180,2,0 // vbroadcastss 0x2b469(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,37,190,2,0 // vbroadcastss 0x2be25(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
@@ -9659,7 +9659,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,20,180,2,0 // vbroadcastss 0x2b414(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,208,189,2,0 // vbroadcastss 0x2bdd0(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9693,7 +9693,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,152,179,2,0 // vbroadcastss 0x2b398(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,84,189,2,0 // vbroadcastss 0x2bd54(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9718,7 +9718,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,67,179,2,0 // vbroadcastss 0x2b343(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,255,188,2,0 // vbroadcastss 0x2bcff(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9746,7 +9746,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,226,178,2,0 // vbroadcastss 0x2b2e2(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,158,188,2,0 // vbroadcastss 0x2bc9e(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9768,7 +9768,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,156,178,2,0 // vbroadcastss 0x2b29c(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,88,188,2,0 // vbroadcastss 0x2bc58(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9778,7 +9778,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,134,178,2,0 // vbroadcastss 0x2b286(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,66,188,2,0 // vbroadcastss 0x2bc42(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -9836,7 +9836,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,150,177,2,0 // vbroadcastss 0x2b196(%rip),%ymm9 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,13,82,187,2,0 // vbroadcastss 0x2bb52(%rip),%ymm9 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -9889,7 +9889,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,176,176,2,0 // vbroadcastss 0x2b0b0(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,108,186,2,0 // vbroadcastss 0x2ba6c(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9940,7 +9940,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,228,175,2,0 // vbroadcastss 0x2afe4(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,160,185,2,0 // vbroadcastss 0x2b9a0(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -10001,10 +10001,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,255,174,2,0 // vbroadcastss 0x2aeff(%rip),%ymm11 # 2b874 <_sk_overlay_sse2_8bit+0x458>
+ .byte 196,98,125,24,29,187,184,2,0 // vbroadcastss 0x2b8bb(%rip),%ymm11 # 2c230 <_sk_overlay_sse2_8bit+0x458>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,240,174,2,0 // vbroadcastss 0x2aef0(%rip),%ymm12 # 2b878 <_sk_overlay_sse2_8bit+0x45c>
+ .byte 196,98,125,24,37,172,184,2,0 // vbroadcastss 0x2b8ac(%rip),%ymm12 # 2c234 <_sk_overlay_sse2_8bit+0x45c>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -10014,7 +10014,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,159,174,2,0 // vbroadcastss 0x2ae9f(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,91,184,2,0 // vbroadcastss 0x2b85b(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -10127,11 +10127,11 @@ _sk_hue_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,183,172,2,0 // vbroadcastss 0x2acb7(%rip),%ymm14 # 2b87c <_sk_overlay_sse2_8bit+0x460>
- .byte 196,98,125,24,61,178,172,2,0 // vbroadcastss 0x2acb2(%rip),%ymm15 # 2b880 <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,53,115,182,2,0 // vbroadcastss 0x2b673(%rip),%ymm14 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,61,110,182,2,0 // vbroadcastss 0x2b66e(%rip),%ymm15 # 2c23c <_sk_overlay_sse2_8bit+0x464>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,163,172,2,0 // vbroadcastss 0x2aca3(%rip),%ymm0 # 2b884 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,226,125,24,5,95,182,2,0 // vbroadcastss 0x2b65f(%rip),%ymm0 # 2c240 <_sk_overlay_sse2_8bit+0x468>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -10186,7 +10186,7 @@ _sk_hue_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,100,171,2,0 // vbroadcastss 0x2ab64(%rip),%ymm1 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,13,32,181,2,0 // vbroadcastss 0x2b520(%rip),%ymm1 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -10240,11 +10240,11 @@ _sk_saturation_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,151,170,2,0 // vbroadcastss 0x2aa97(%rip),%ymm14 # 2b87c <_sk_overlay_sse2_8bit+0x460>
- .byte 196,98,125,24,61,146,170,2,0 // vbroadcastss 0x2aa92(%rip),%ymm15 # 2b880 <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,53,83,180,2,0 // vbroadcastss 0x2b453(%rip),%ymm14 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,61,78,180,2,0 // vbroadcastss 0x2b44e(%rip),%ymm15 # 2c23c <_sk_overlay_sse2_8bit+0x464>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,131,170,2,0 // vbroadcastss 0x2aa83(%rip),%ymm0 # 2b884 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,226,125,24,5,63,180,2,0 // vbroadcastss 0x2b43f(%rip),%ymm0 # 2c240 <_sk_overlay_sse2_8bit+0x468>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -10299,7 +10299,7 @@ _sk_saturation_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,68,169,2,0 // vbroadcastss 0x2a944(%rip),%ymm1 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,13,0,179,2,0 // vbroadcastss 0x2b300(%rip),%ymm1 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -10327,11 +10327,11 @@ _sk_color_hsw:
.byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
.byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
.byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
- .byte 196,98,125,24,45,249,168,2,0 // vbroadcastss 0x2a8f9(%rip),%ymm13 # 2b87c <_sk_overlay_sse2_8bit+0x460>
- .byte 196,98,125,24,53,244,168,2,0 // vbroadcastss 0x2a8f4(%rip),%ymm14 # 2b880 <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,45,181,178,2,0 // vbroadcastss 0x2b2b5(%rip),%ymm13 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,53,176,178,2,0 // vbroadcastss 0x2b2b0(%rip),%ymm14 # 2c23c <_sk_overlay_sse2_8bit+0x464>
.byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
.byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
- .byte 196,98,125,24,61,229,168,2,0 // vbroadcastss 0x2a8e5(%rip),%ymm15 # 2b884 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,98,125,24,61,161,178,2,0 // vbroadcastss 0x2b2a1(%rip),%ymm15 # 2c240 <_sk_overlay_sse2_8bit+0x468>
.byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -10387,7 +10387,7 @@ _sk_color_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,155,167,2,0 // vbroadcastss 0x2a79b(%rip),%ymm0 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,87,177,2,0 // vbroadcastss 0x2b157(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -10415,11 +10415,11 @@ _sk_luminosity_hsw:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
.byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
- .byte 196,98,125,24,45,80,167,2,0 // vbroadcastss 0x2a750(%rip),%ymm13 # 2b87c <_sk_overlay_sse2_8bit+0x460>
- .byte 196,98,125,24,53,75,167,2,0 // vbroadcastss 0x2a74b(%rip),%ymm14 # 2b880 <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,45,12,177,2,0 // vbroadcastss 0x2b10c(%rip),%ymm13 # 2c238 <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,53,7,177,2,0 // vbroadcastss 0x2b107(%rip),%ymm14 # 2c23c <_sk_overlay_sse2_8bit+0x464>
.byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
.byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
- .byte 196,98,125,24,61,60,167,2,0 // vbroadcastss 0x2a73c(%rip),%ymm15 # 2b884 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,98,125,24,61,248,176,2,0 // vbroadcastss 0x2b0f8(%rip),%ymm15 # 2c240 <_sk_overlay_sse2_8bit+0x468>
.byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -10475,7 +10475,7 @@ _sk_luminosity_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,242,165,2,0 // vbroadcastss 0x2a5f2(%rip),%ymm0 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,174,175,2,0 // vbroadcastss 0x2afae(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -10506,17 +10506,17 @@ _sk_srcover_rgba_8888_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 15,133,179,0,0,0 // jne 137f <_sk_srcover_rgba_8888_hsw+0xd3>
.byte 196,129,126,111,60,152 // vmovdqu (%r8,%r11,4),%ymm7
- .byte 197,197,219,37,102,167,2,0 // vpand 0x2a766(%rip),%ymm7,%ymm4 # 2ba40 <_sk_overlay_sse2_8bit+0x624>
+ .byte 197,197,219,37,38,177,2,0 // vpand 0x2b126(%rip),%ymm7,%ymm4 # 2c400 <_sk_overlay_sse2_8bit+0x628>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,69,0,45,121,167,2,0 // vpshufb 0x2a779(%rip),%ymm7,%ymm5 # 2ba60 <_sk_overlay_sse2_8bit+0x644>
+ .byte 196,226,69,0,45,57,177,2,0 // vpshufb 0x2b139(%rip),%ymm7,%ymm5 # 2c420 <_sk_overlay_sse2_8bit+0x648>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,69,0,53,140,167,2,0 // vpshufb 0x2a78c(%rip),%ymm7,%ymm6 # 2ba80 <_sk_overlay_sse2_8bit+0x664>
+ .byte 196,226,69,0,53,76,177,2,0 // vpshufb 0x2b14c(%rip),%ymm7,%ymm6 # 2c440 <_sk_overlay_sse2_8bit+0x668>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,82,165,2,0 // vbroadcastss 0x2a552(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,14,175,2,0 // vbroadcastss 0x2af0e(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,113,165,2,0 // vbroadcastss 0x2a571(%rip),%ymm9 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,13,45,175,2,0 // vbroadcastss 0x2af2d(%rip),%ymm9 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -10644,7 +10644,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,94,163,2,0 // vbroadcastss 0x2a35e(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,26,173,2,0 // vbroadcastss 0x2ad1a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -10656,7 +10656,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,61,163,2,0 // vbroadcastss 0x2a33d(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,249,172,2,0 // vbroadcastss 0x2acf9(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -10668,7 +10668,7 @@ HIDDEN _sk_clamp_a_dst_hsw
.globl _sk_clamp_a_dst_hsw
FUNCTION(_sk_clamp_a_dst_hsw)
_sk_clamp_a_dst_hsw:
- .byte 196,98,125,24,5,31,163,2,0 // vbroadcastss 0x2a31f(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,219,172,2,0 // vbroadcastss 0x2acdb(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -10701,7 +10701,7 @@ HIDDEN _sk_invert_hsw
.globl _sk_invert_hsw
FUNCTION(_sk_invert_hsw)
_sk_invert_hsw:
- .byte 196,98,125,24,5,218,162,2,0 // vbroadcastss 0x2a2da(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,150,172,2,0 // vbroadcastss 0x2ac96(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -10757,7 +10757,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,106,162,2,0 // vbroadcastss 0x2a26a(%rip),%ymm10 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,21,38,172,2,0 // vbroadcastss 0x2ac26(%rip),%ymm10 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -10770,16 +10770,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,119,162,2,0 // vbroadcastss 0x2a277(%rip),%ymm8 # 2b88c <_sk_overlay_sse2_8bit+0x470>
+ .byte 196,98,125,24,5,51,172,2,0 // vbroadcastss 0x2ac33(%rip),%ymm8 # 2c248 <_sk_overlay_sse2_8bit+0x470>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,105,162,2,0 // vbroadcastss 0x2a269(%rip),%ymm11 # 2b890 <_sk_overlay_sse2_8bit+0x474>
- .byte 196,98,125,24,37,76,162,2,0 // vbroadcastss 0x2a24c(%rip),%ymm12 # 2b87c <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,29,37,172,2,0 // vbroadcastss 0x2ac25(%rip),%ymm11 # 2c24c <_sk_overlay_sse2_8bit+0x474>
+ .byte 196,98,125,24,37,8,172,2,0 // vbroadcastss 0x2ac08(%rip),%ymm12 # 2c238 <_sk_overlay_sse2_8bit+0x460>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,81,162,2,0 // vbroadcastss 0x2a251(%rip),%ymm14 # 2b894 <_sk_overlay_sse2_8bit+0x478>
+ .byte 196,98,125,24,53,13,172,2,0 // vbroadcastss 0x2ac0d(%rip),%ymm14 # 2c250 <_sk_overlay_sse2_8bit+0x478>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,71,162,2,0 // vbroadcastss 0x2a247(%rip),%ymm10 # 2b898 <_sk_overlay_sse2_8bit+0x47c>
+ .byte 196,98,125,24,21,3,172,2,0 // vbroadcastss 0x2ac03(%rip),%ymm10 # 2c254 <_sk_overlay_sse2_8bit+0x47c>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -10802,16 +10802,16 @@ HIDDEN _sk_from_srgb_dst_hsw
.globl _sk_from_srgb_dst_hsw
FUNCTION(_sk_from_srgb_dst_hsw)
_sk_from_srgb_dst_hsw:
- .byte 196,98,125,24,5,223,161,2,0 // vbroadcastss 0x2a1df(%rip),%ymm8 # 2b88c <_sk_overlay_sse2_8bit+0x470>
+ .byte 196,98,125,24,5,155,171,2,0 // vbroadcastss 0x2ab9b(%rip),%ymm8 # 2c248 <_sk_overlay_sse2_8bit+0x470>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,209,161,2,0 // vbroadcastss 0x2a1d1(%rip),%ymm11 # 2b890 <_sk_overlay_sse2_8bit+0x474>
- .byte 196,98,125,24,37,180,161,2,0 // vbroadcastss 0x2a1b4(%rip),%ymm12 # 2b87c <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,29,141,171,2,0 // vbroadcastss 0x2ab8d(%rip),%ymm11 # 2c24c <_sk_overlay_sse2_8bit+0x474>
+ .byte 196,98,125,24,37,112,171,2,0 // vbroadcastss 0x2ab70(%rip),%ymm12 # 2c238 <_sk_overlay_sse2_8bit+0x460>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13
- .byte 196,98,125,24,53,185,161,2,0 // vbroadcastss 0x2a1b9(%rip),%ymm14 # 2b894 <_sk_overlay_sse2_8bit+0x478>
+ .byte 196,98,125,24,53,117,171,2,0 // vbroadcastss 0x2ab75(%rip),%ymm14 # 2c250 <_sk_overlay_sse2_8bit+0x478>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,175,161,2,0 // vbroadcastss 0x2a1af(%rip),%ymm10 # 2b898 <_sk_overlay_sse2_8bit+0x47c>
+ .byte 196,98,125,24,21,107,171,2,0 // vbroadcastss 0x2ab6b(%rip),%ymm10 # 2c254 <_sk_overlay_sse2_8bit+0x47c>
.byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4
.byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -10835,19 +10835,19 @@ HIDDEN _sk_to_srgb_hsw
FUNCTION(_sk_to_srgb_hsw)
_sk_to_srgb_hsw:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,83,161,2,0 // vbroadcastss 0x2a153(%rip),%ymm8 # 2b89c <_sk_overlay_sse2_8bit+0x480>
+ .byte 196,98,125,24,5,15,171,2,0 // vbroadcastss 0x2ab0f(%rip),%ymm8 # 2c258 <_sk_overlay_sse2_8bit+0x480>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,73,161,2,0 // vbroadcastss 0x2a149(%rip),%ymm11 # 2b8a0 <_sk_overlay_sse2_8bit+0x484>
- .byte 196,98,125,24,37,68,161,2,0 // vbroadcastss 0x2a144(%rip),%ymm12 # 2b8a4 <_sk_overlay_sse2_8bit+0x488>
+ .byte 196,98,125,24,29,5,171,2,0 // vbroadcastss 0x2ab05(%rip),%ymm11 # 2c25c <_sk_overlay_sse2_8bit+0x484>
+ .byte 196,98,125,24,37,0,171,2,0 // vbroadcastss 0x2ab00(%rip),%ymm12 # 2c260 <_sk_overlay_sse2_8bit+0x488>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13
- .byte 196,98,125,24,53,53,161,2,0 // vbroadcastss 0x2a135(%rip),%ymm14 # 2b8a8 <_sk_overlay_sse2_8bit+0x48c>
+ .byte 196,98,125,24,53,241,170,2,0 // vbroadcastss 0x2aaf1(%rip),%ymm14 # 2c264 <_sk_overlay_sse2_8bit+0x48c>
.byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13
- .byte 196,98,125,24,61,43,161,2,0 // vbroadcastss 0x2a12b(%rip),%ymm15 # 2b8ac <_sk_overlay_sse2_8bit+0x490>
+ .byte 196,98,125,24,61,231,170,2,0 // vbroadcastss 0x2aae7(%rip),%ymm15 # 2c268 <_sk_overlay_sse2_8bit+0x490>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9
- .byte 196,98,125,24,45,23,161,2,0 // vbroadcastss 0x2a117(%rip),%ymm13 # 2b8b0 <_sk_overlay_sse2_8bit+0x494>
+ .byte 196,98,125,24,45,211,170,2,0 // vbroadcastss 0x2aad3(%rip),%ymm13 # 2c26c <_sk_overlay_sse2_8bit+0x494>
.byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -10881,26 +10881,26 @@ _sk_rgb_to_hsl_hsw:
.byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
.byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,50,160,2,0 // vbroadcastss 0x2a032(%rip),%ymm11 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,29,238,169,2,0 // vbroadcastss 0x2a9ee(%rip),%ymm11 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,115,160,2,0 // vbroadcastss 0x2a073(%rip),%ymm14 # 2b8b4 <_sk_overlay_sse2_8bit+0x498>
+ .byte 196,98,125,24,53,47,170,2,0 // vbroadcastss 0x2aa2f(%rip),%ymm14 # 2c270 <_sk_overlay_sse2_8bit+0x498>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,90,160,2,0 // vbroadcastss 0x2a05a(%rip),%ymm14 # 2b8bc <_sk_overlay_sse2_8bit+0x4a0>
+ .byte 196,98,125,24,53,22,170,2,0 // vbroadcastss 0x2aa16(%rip),%ymm14 # 2c278 <_sk_overlay_sse2_8bit+0x4a0>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,72,160,2,0 // vbroadcastss 0x2a048(%rip),%ymm14 # 2b8b8 <_sk_overlay_sse2_8bit+0x49c>
+ .byte 196,98,125,24,53,4,170,2,0 // vbroadcastss 0x2aa04(%rip),%ymm14 # 2c274 <_sk_overlay_sse2_8bit+0x49c>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,191,159,2,0 // vbroadcastss 0x29fbf(%rip),%ymm11 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,123,169,2,0 // vbroadcastss 0x2a97b(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -10910,7 +10910,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,238,159,2,0 // vbroadcastss 0x29fee(%rip),%ymm8 # 2b8c0 <_sk_overlay_sse2_8bit+0x4a4>
+ .byte 196,98,125,24,5,170,169,2,0 // vbroadcastss 0x2a9aa(%rip),%ymm8 # 2c27c <_sk_overlay_sse2_8bit+0x4a4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10927,30 +10927,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,75,159,2,0 // vbroadcastss 0x29f4b(%rip),%ymm8 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,7,169,2,0 // vbroadcastss 0x2a907(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,138,159,2,0 // vbroadcastss 0x29f8a(%rip),%ymm9 # 2b8b8 <_sk_overlay_sse2_8bit+0x49c>
+ .byte 196,98,125,24,13,70,169,2,0 // vbroadcastss 0x2a946(%rip),%ymm9 # 2c274 <_sk_overlay_sse2_8bit+0x49c>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,136,159,2,0 // vbroadcastss 0x29f88(%rip),%ymm11 # 2b8c4 <_sk_overlay_sse2_8bit+0x4a8>
+ .byte 196,98,125,24,29,68,169,2,0 // vbroadcastss 0x2a944(%rip),%ymm11 # 2c280 <_sk_overlay_sse2_8bit+0x4a8>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,90,159,2,0 // vbroadcastss 0x29f5a(%rip),%ymm13 # 2b8b4 <_sk_overlay_sse2_8bit+0x498>
+ .byte 196,98,125,24,45,22,169,2,0 // vbroadcastss 0x2a916(%rip),%ymm13 # 2c270 <_sk_overlay_sse2_8bit+0x498>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,84,159,2,0 // vbroadcastss 0x29f54(%rip),%ymm14 # 2b8bc <_sk_overlay_sse2_8bit+0x4a0>
+ .byte 196,98,125,24,53,16,169,2,0 // vbroadcastss 0x2a910(%rip),%ymm14 # 2c278 <_sk_overlay_sse2_8bit+0x4a0>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,78,159,2,0 // vbroadcastss 0x29f4e(%rip),%ymm3 # 2b8c8 <_sk_overlay_sse2_8bit+0x4ac>
+ .byte 196,226,125,24,29,10,169,2,0 // vbroadcastss 0x2a90a(%rip),%ymm3 # 2c284 <_sk_overlay_sse2_8bit+0x4ac>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,37,159,2,0 // vbroadcastss 0x29f25(%rip),%ymm12 # 2b8c0 <_sk_overlay_sse2_8bit+0x4a4>
+ .byte 196,98,125,24,37,225,168,2,0 // vbroadcastss 0x2a8e1(%rip),%ymm12 # 2c27c <_sk_overlay_sse2_8bit+0x4a4>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -10966,7 +10966,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,217,158,2,0 // vbroadcastss 0x29ed9(%rip),%ymm0 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,226,125,24,5,149,168,2,0 // vbroadcastss 0x2a895(%rip),%ymm0 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -11020,10 +11020,10 @@ _sk_scale_u8_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,58 // jne 1ae2 <_sk_scale_u8_hsw+0x52>
.byte 196,2,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm8
- .byte 197,57,219,5,154,167,2,0 // vpand 0x2a79a(%rip),%xmm8,%xmm8 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,57,219,5,218,177,2,0 // vpand 0x2b1da(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,7,158,2,0 // vbroadcastss 0x29e07(%rip),%ymm9 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,195,167,2,0 // vbroadcastss 0x2a7c3(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -11072,7 +11072,7 @@ _sk_scale_u8_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf001b8c <_sk_overlay_sse2_8bit+0xffffffffdefd6770>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf001b8c <_sk_overlay_sse2_8bit+0xffffffffdefd5db4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -11098,20 +11098,20 @@ _sk_scale_565_hsw:
.byte 15,133,161,0,0,0 // jne 1c58 <_sk_scale_565_hsw+0xc0>
.byte 196,1,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,9,157,2,0 // vpbroadcastd 0x29d09(%rip),%ymm9 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,98,125,88,13,197,166,2,0 // vpbroadcastd 0x2a6c5(%rip),%ymm9 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,250,156,2,0 // vbroadcastss 0x29cfa(%rip),%ymm10 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,98,125,24,21,182,166,2,0 // vbroadcastss 0x2a6b6(%rip),%ymm10 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,240,156,2,0 // vpbroadcastd 0x29cf0(%rip),%ymm10 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,98,125,88,21,172,166,2,0 // vpbroadcastd 0x2a6ac(%rip),%ymm10 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,225,156,2,0 // vbroadcastss 0x29ce1(%rip),%ymm11 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,98,125,24,29,157,166,2,0 // vbroadcastss 0x2a69d(%rip),%ymm11 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,215,156,2,0 // vpbroadcastd 0x29cd7(%rip),%ymm11 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,98,125,88,29,147,166,2,0 // vpbroadcastd 0x2a693(%rip),%ymm11 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,200,156,2,0 // vbroadcastss 0x29cc8(%rip),%ymm11 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,98,125,24,29,132,166,2,0 // vbroadcastss 0x2a684(%rip),%ymm11 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -11202,10 +11202,10 @@ _sk_lerp_u8_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,78 // jne 1d91 <_sk_lerp_u8_hsw+0x66>
.byte 196,2,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm8
- .byte 197,57,219,5,255,164,2,0 // vpand 0x2a4ff(%rip),%xmm8,%xmm8 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,57,219,5,63,175,2,0 // vpand 0x2af3f(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,108,155,2,0 // vbroadcastss 0x29b6c(%rip),%ymm9 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,40,165,2,0 // vbroadcastss 0x2a528(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -11257,7 +11257,7 @@ _sk_lerp_u8_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde001e3c <_sk_overlay_sse2_8bit+0xffffffffddfd6a20>
+ .byte 232,255,255,255,221 // callq ffffffffde001e3c <_sk_overlay_sse2_8bit+0xffffffffddfd6064>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -11283,20 +11283,20 @@ _sk_lerp_565_hsw:
.byte 15,133,181,0,0,0 // jne 1f1c <_sk_lerp_565_hsw+0xd4>
.byte 196,1,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,89,154,2,0 // vpbroadcastd 0x29a59(%rip),%ymm9 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,98,125,88,13,21,164,2,0 // vpbroadcastd 0x2a415(%rip),%ymm9 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,74,154,2,0 // vbroadcastss 0x29a4a(%rip),%ymm10 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,98,125,24,21,6,164,2,0 // vbroadcastss 0x2a406(%rip),%ymm10 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,64,154,2,0 // vpbroadcastd 0x29a40(%rip),%ymm10 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,98,125,88,21,252,163,2,0 // vpbroadcastd 0x2a3fc(%rip),%ymm10 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,49,154,2,0 // vbroadcastss 0x29a31(%rip),%ymm11 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,98,125,24,29,237,163,2,0 // vbroadcastss 0x2a3ed(%rip),%ymm11 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,39,154,2,0 // vpbroadcastd 0x29a27(%rip),%ymm11 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,98,125,88,29,227,163,2,0 // vpbroadcastd 0x2a3e3(%rip),%ymm11 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,24,154,2,0 // vbroadcastss 0x29a18(%rip),%ymm11 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,98,125,24,29,212,163,2,0 // vbroadcastss 0x2a3d4(%rip),%ymm11 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -11370,21 +11370,21 @@ _sk_load_tables_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,103 // jne 2031 <_sk_load_tables_hsw+0x71>
.byte 196,193,126,111,28,144 // vmovdqu (%r8,%rdx,4),%ymm3
- .byte 197,229,219,13,200,154,2,0 // vpand 0x29ac8(%rip),%ymm3,%ymm1 # 2baa0 <_sk_overlay_sse2_8bit+0x684>
+ .byte 197,229,219,13,136,164,2,0 // vpand 0x2a488(%rip),%ymm3,%ymm1 # 2c460 <_sk_overlay_sse2_8bit+0x688>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 76,139,64,8 // mov 0x8(%rax),%r8
.byte 76,139,72,16 // mov 0x10(%rax),%r9
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,194,109,146,4,136 // vgatherdps %ymm2,(%r8,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,200,154,2,0 // vpshufb 0x29ac8(%rip),%ymm3,%ymm2 # 2bac0 <_sk_overlay_sse2_8bit+0x6a4>
+ .byte 196,226,101,0,21,136,164,2,0 // vpshufb 0x2a488(%rip),%ymm3,%ymm2 # 2c480 <_sk_overlay_sse2_8bit+0x6a8>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,145 // vgatherdps %ymm9,(%r9,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,208,154,2,0 // vpshufb 0x29ad0(%rip),%ymm3,%ymm9 # 2bae0 <_sk_overlay_sse2_8bit+0x6c4>
+ .byte 196,98,101,0,13,144,164,2,0 // vpshufb 0x2a490(%rip),%ymm3,%ymm9 # 2c4a0 <_sk_overlay_sse2_8bit+0x6c8>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,168,152,2,0 // vbroadcastss 0x298a8(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,100,162,2,0 // vbroadcastss 0x2a264(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -11466,7 +11466,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,241,160,2,0 // vmovdqa 0x2a0f1(%rip),%xmm10 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,121,111,21,49,171,2,0 // vmovdqa 0x2ab31(%rip),%xmm10 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -11488,7 +11488,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,30,151,2,0 // vbroadcastss 0x2971e(%rip),%ymm8 # 2b8ec <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,98,125,24,5,218,160,2,0 // vbroadcastss 0x2a0da(%rip),%ymm8 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -11548,7 +11548,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 197,185,108,211 // vpunpcklqdq %xmm3,%xmm8,%xmm2
.byte 197,185,109,219 // vpunpckhqdq %xmm3,%xmm8,%xmm3
.byte 197,113,108,192 // vpunpcklqdq %xmm0,%xmm1,%xmm8
- .byte 197,121,111,13,128,159,2,0 // vmovdqa 0x29f80(%rip),%xmm9 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,121,111,13,192,169,2,0 // vmovdqa 0x2a9c0(%rip),%xmm9 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,193,105,219,193 // vpand %xmm9,%xmm2,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -11565,7 +11565,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 196,226,125,51,218 // vpmovzxwd %xmm2,%ymm3
.byte 196,226,45,146,20,152 // vgatherdps %ymm10,(%rax,%ymm3,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,56,149,2,0 // vbroadcastss 0x29538(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,244,158,2,0 // vbroadcastss 0x29ef4(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,72 // vmovd (%r8,%r9,2),%xmm0
.byte 196,1,121,196,92,72,4,2 // vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
@@ -11634,7 +11634,7 @@ HIDDEN _sk_byte_tables_hsw
FUNCTION(_sk_byte_tables_hsw)
_sk_byte_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,40,148,2,0 // vbroadcastss 0x29428(%rip),%ymm8 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,228,157,2,0 // vbroadcastss 0x29de4(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,200 // vmovq %xmm9,%r8
@@ -11756,7 +11756,7 @@ _sk_byte_tables_hsw:
.byte 67,15,182,4,17 // movzbl (%r9,%r10,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,17,146,2,0 // vbroadcastss 0x29211(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,205,155,2,0 // vbroadcastss 0x29bcd(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -11872,7 +11872,7 @@ _sk_byte_tables_rgb_hsw:
.byte 67,15,182,4,17 // movzbl (%r9,%r10,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,249,143,2,0 // vbroadcastss 0x28ff9(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,181,153,2,0 // vbroadcastss 0x299b5(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -11971,33 +11971,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,239,142,2,0 // vbroadcastss 0x28eef(%rip),%ymm12 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,98,125,24,45,234,142,2,0 // vbroadcastss 0x28eea(%rip),%ymm13 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,171,152,2,0 // vbroadcastss 0x298ab(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,45,166,152,2,0 // vbroadcastss 0x298a6(%rip),%ymm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,64,142,2,0 // vbroadcastss 0x28e40(%rip),%ymm13 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,45,252,151,2,0 // vbroadcastss 0x297fc(%rip),%ymm13 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,210,142,2,0 // vbroadcastss 0x28ed2(%rip),%ymm13 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,142,152,2,0 // vbroadcastss 0x2988e(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,200,142,2,0 // vbroadcastss 0x28ec8(%rip),%ymm11 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,132,152,2,0 // vbroadcastss 0x29884(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,190,142,2,0 // vbroadcastss 0x28ebe(%rip),%ymm12 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,122,152,2,0 // vbroadcastss 0x2987a(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,180,142,2,0 // vbroadcastss 0x28eb4(%rip),%ymm12 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,112,152,2,0 // vbroadcastss 0x29870(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,149,142,2,0 // vbroadcastss 0x28e95(%rip),%ymm11 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,81,152,2,0 // vbroadcastss 0x29851(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,139,142,2,0 // vbroadcastss 0x28e8b(%rip),%ymm11 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,71,152,2,0 // vbroadcastss 0x29847(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,129,142,2,0 // vbroadcastss 0x28e81(%rip),%ymm0 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,5,61,152,2,0 // vbroadcastss 0x2983d(%rip),%ymm0 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,119,142,2,0 // vbroadcastss 0x28e77(%rip),%ymm10 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,21,51,152,2,0 // vbroadcastss 0x29833(%rip),%ymm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,106,142,2,0 // vbroadcastss 0x28e6a(%rip),%ymm10 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,38,152,2,0 // vbroadcastss 0x29826(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12005,7 +12005,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,129,141,2,0 // vbroadcastss 0x28d81(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,61,151,2,0 // vbroadcastss 0x2973d(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12025,33 +12025,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,201,141,2,0 // vbroadcastss 0x28dc9(%rip),%ymm12 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,98,125,24,45,196,141,2,0 // vbroadcastss 0x28dc4(%rip),%ymm13 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,133,151,2,0 // vbroadcastss 0x29785(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,45,128,151,2,0 // vbroadcastss 0x29780(%rip),%ymm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,26,141,2,0 // vbroadcastss 0x28d1a(%rip),%ymm13 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,45,214,150,2,0 // vbroadcastss 0x296d6(%rip),%ymm13 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,172,141,2,0 // vbroadcastss 0x28dac(%rip),%ymm13 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,104,151,2,0 // vbroadcastss 0x29768(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,162,141,2,0 // vbroadcastss 0x28da2(%rip),%ymm11 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,94,151,2,0 // vbroadcastss 0x2975e(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,152,141,2,0 // vbroadcastss 0x28d98(%rip),%ymm12 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,84,151,2,0 // vbroadcastss 0x29754(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,142,141,2,0 // vbroadcastss 0x28d8e(%rip),%ymm12 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,74,151,2,0 // vbroadcastss 0x2974a(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,111,141,2,0 // vbroadcastss 0x28d6f(%rip),%ymm11 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,43,151,2,0 // vbroadcastss 0x2972b(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,101,141,2,0 // vbroadcastss 0x28d65(%rip),%ymm11 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,33,151,2,0 // vbroadcastss 0x29721(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,91,141,2,0 // vbroadcastss 0x28d5b(%rip),%ymm1 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,13,23,151,2,0 // vbroadcastss 0x29717(%rip),%ymm1 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,81,141,2,0 // vbroadcastss 0x28d51(%rip),%ymm10 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,21,13,151,2,0 // vbroadcastss 0x2970d(%rip),%ymm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,68,141,2,0 // vbroadcastss 0x28d44(%rip),%ymm10 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,0,151,2,0 // vbroadcastss 0x29700(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12059,7 +12059,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,91,140,2,0 // vbroadcastss 0x28c5b(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,23,150,2,0 // vbroadcastss 0x29617(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12079,33 +12079,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,163,140,2,0 // vbroadcastss 0x28ca3(%rip),%ymm12 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,98,125,24,45,158,140,2,0 // vbroadcastss 0x28c9e(%rip),%ymm13 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,95,150,2,0 // vbroadcastss 0x2965f(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,45,90,150,2,0 // vbroadcastss 0x2965a(%rip),%ymm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,244,139,2,0 // vbroadcastss 0x28bf4(%rip),%ymm13 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,45,176,149,2,0 // vbroadcastss 0x295b0(%rip),%ymm13 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,134,140,2,0 // vbroadcastss 0x28c86(%rip),%ymm13 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,66,150,2,0 // vbroadcastss 0x29642(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,124,140,2,0 // vbroadcastss 0x28c7c(%rip),%ymm11 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,56,150,2,0 // vbroadcastss 0x29638(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,114,140,2,0 // vbroadcastss 0x28c72(%rip),%ymm12 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,46,150,2,0 // vbroadcastss 0x2962e(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,104,140,2,0 // vbroadcastss 0x28c68(%rip),%ymm12 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,36,150,2,0 // vbroadcastss 0x29624(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,73,140,2,0 // vbroadcastss 0x28c49(%rip),%ymm11 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,5,150,2,0 // vbroadcastss 0x29605(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,63,140,2,0 // vbroadcastss 0x28c3f(%rip),%ymm11 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,251,149,2,0 // vbroadcastss 0x295fb(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,53,140,2,0 // vbroadcastss 0x28c35(%rip),%ymm2 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,21,241,149,2,0 // vbroadcastss 0x295f1(%rip),%ymm2 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,43,140,2,0 // vbroadcastss 0x28c2b(%rip),%ymm10 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,21,231,149,2,0 // vbroadcastss 0x295e7(%rip),%ymm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,30,140,2,0 // vbroadcastss 0x28c1e(%rip),%ymm10 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,218,149,2,0 // vbroadcastss 0x295da(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12113,7 +12113,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,53,139,2,0 // vbroadcastss 0x28b35(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,241,148,2,0 // vbroadcastss 0x294f1(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12133,33 +12133,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,125,139,2,0 // vbroadcastss 0x28b7d(%rip),%ymm12 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,98,125,24,45,120,139,2,0 // vbroadcastss 0x28b78(%rip),%ymm13 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,57,149,2,0 // vbroadcastss 0x29539(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,45,52,149,2,0 // vbroadcastss 0x29534(%rip),%ymm13 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,206,138,2,0 // vbroadcastss 0x28ace(%rip),%ymm13 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,45,138,148,2,0 // vbroadcastss 0x2948a(%rip),%ymm13 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,96,139,2,0 // vbroadcastss 0x28b60(%rip),%ymm13 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,28,149,2,0 // vbroadcastss 0x2951c(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,86,139,2,0 // vbroadcastss 0x28b56(%rip),%ymm11 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,18,149,2,0 // vbroadcastss 0x29512(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,76,139,2,0 // vbroadcastss 0x28b4c(%rip),%ymm12 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,8,149,2,0 // vbroadcastss 0x29508(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,66,139,2,0 // vbroadcastss 0x28b42(%rip),%ymm12 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,254,148,2,0 // vbroadcastss 0x294fe(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,35,139,2,0 // vbroadcastss 0x28b23(%rip),%ymm11 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,223,148,2,0 // vbroadcastss 0x294df(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,25,139,2,0 // vbroadcastss 0x28b19(%rip),%ymm11 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,213,148,2,0 // vbroadcastss 0x294d5(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,15,139,2,0 // vbroadcastss 0x28b0f(%rip),%ymm3 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,29,203,148,2,0 // vbroadcastss 0x294cb(%rip),%ymm3 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,5,139,2,0 // vbroadcastss 0x28b05(%rip),%ymm10 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,21,193,148,2,0 // vbroadcastss 0x294c1(%rip),%ymm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,248,138,2,0 // vbroadcastss 0x28af8(%rip),%ymm10 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,180,148,2,0 // vbroadcastss 0x294b4(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12167,7 +12167,7 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,15,138,2,0 // vbroadcastss 0x28a0f(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,203,147,2,0 // vbroadcastss 0x293cb(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12186,35 +12186,35 @@ _sk_gamma_hsw:
.byte 197,252,40,241 // vmovaps %ymm1,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,124,91,208 // vcvtdq2ps %ymm0,%ymm10
- .byte 196,98,125,24,29,98,138,2,0 // vbroadcastss 0x28a62(%rip),%ymm11 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
- .byte 196,226,125,24,45,93,138,2,0 // vbroadcastss 0x28a5d(%rip),%ymm5 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,29,30,148,2,0 // vbroadcastss 0x2941e(%rip),%ymm11 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,226,125,24,45,25,148,2,0 // vbroadcastss 0x29419(%rip),%ymm5 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 197,124,84,205 // vandps %ymm5,%ymm0,%ymm9
- .byte 196,226,125,24,37,180,137,2,0 // vbroadcastss 0x289b4(%rip),%ymm4 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,37,112,147,2,0 // vbroadcastss 0x29370(%rip),%ymm4 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,52,86,228 // vorps %ymm4,%ymm9,%ymm12
- .byte 196,98,125,24,45,71,138,2,0 // vbroadcastss 0x28a47(%rip),%ymm13 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,45,3,148,2,0 // vbroadcastss 0x29403(%rip),%ymm13 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,66,37,168,213 // vfmadd213ps %ymm13,%ymm11,%ymm10
- .byte 196,98,125,24,13,61,138,2,0 // vbroadcastss 0x28a3d(%rip),%ymm9 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,13,249,147,2,0 // vbroadcastss 0x293f9(%rip),%ymm9 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,66,29,188,209 // vfnmadd231ps %ymm9,%ymm12,%ymm10
.byte 197,124,91,246 // vcvtdq2ps %ymm6,%ymm14
.byte 196,66,37,168,245 // vfmadd213ps %ymm13,%ymm11,%ymm14
.byte 197,124,91,255 // vcvtdq2ps %ymm7,%ymm15
.byte 196,66,37,168,253 // vfmadd213ps %ymm13,%ymm11,%ymm15
- .byte 196,98,125,24,29,33,138,2,0 // vbroadcastss 0x28a21(%rip),%ymm11 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,29,221,147,2,0 // vbroadcastss 0x293dd(%rip),%ymm11 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,65,28,88,227 // vaddps %ymm11,%ymm12,%ymm12
- .byte 196,98,125,24,45,23,138,2,0 // vbroadcastss 0x28a17(%rip),%ymm13 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,45,211,147,2,0 // vbroadcastss 0x293d3(%rip),%ymm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 196,65,20,94,228 // vdivps %ymm12,%ymm13,%ymm12
.byte 196,65,44,92,212 // vsubps %ymm12,%ymm10,%ymm10
.byte 196,98,125,24,32 // vbroadcastss (%rax),%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
.byte 196,67,125,8,194,1 // vroundps $0x1,%ymm10,%ymm8
.byte 196,65,44,92,192 // vsubps %ymm8,%ymm10,%ymm8
- .byte 196,226,125,24,21,243,137,2,0 // vbroadcastss 0x289f3(%rip),%ymm2 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,226,125,24,21,175,147,2,0 // vbroadcastss 0x293af(%rip),%ymm2 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 197,44,88,210 // vaddps %ymm2,%ymm10,%ymm10
- .byte 196,226,125,24,29,234,137,2,0 // vbroadcastss 0x289ea(%rip),%ymm3 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,226,125,24,29,166,147,2,0 // vbroadcastss 0x293a6(%rip),%ymm3 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 196,98,61,188,211 // vfnmadd231ps %ymm3,%ymm8,%ymm10
- .byte 196,226,125,24,13,224,137,2,0 // vbroadcastss 0x289e0(%rip),%ymm1 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,13,156,147,2,0 // vbroadcastss 0x2939c(%rip),%ymm1 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 196,65,116,92,192 // vsubps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,5,214,137,2,0 // vbroadcastss 0x289d6(%rip),%ymm0 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,226,125,24,5,146,147,2,0 // vbroadcastss 0x29392(%rip),%ymm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 196,65,124,94,192 // vdivps %ymm8,%ymm0,%ymm8
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 197,204,84,245 // vandps %ymm5,%ymm6,%ymm6
@@ -12245,7 +12245,7 @@ _sk_gamma_hsw:
.byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
.byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
.byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
- .byte 196,226,125,24,13,71,137,2,0 // vbroadcastss 0x28947(%rip),%ymm1 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,226,125,24,13,3,147,2,0 // vbroadcastss 0x29303(%rip),%ymm1 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 197,188,89,209 // vmulps %ymm1,%ymm8,%ymm2
.byte 197,204,89,217 // vmulps %ymm1,%ymm6,%ymm3
.byte 197,252,89,225 // vmulps %ymm1,%ymm0,%ymm4
@@ -12265,26 +12265,26 @@ HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,5,137,2,0 // vbroadcastss 0x28905(%rip),%ymm8 # 2b91c <_sk_overlay_sse2_8bit+0x500>
- .byte 196,98,125,24,13,104,136,2,0 // vbroadcastss 0x28868(%rip),%ymm9 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
- .byte 196,98,125,24,21,247,136,2,0 // vbroadcastss 0x288f7(%rip),%ymm10 # 2b920 <_sk_overlay_sse2_8bit+0x504>
+ .byte 196,98,125,24,5,193,146,2,0 // vbroadcastss 0x292c1(%rip),%ymm8 # 2c2d8 <_sk_overlay_sse2_8bit+0x500>
+ .byte 196,98,125,24,13,36,146,2,0 // vbroadcastss 0x29224(%rip),%ymm9 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,21,179,146,2,0 // vbroadcastss 0x292b3(%rip),%ymm10 # 2c2dc <_sk_overlay_sse2_8bit+0x504>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,232,136,2,0 // vbroadcastss 0x288e8(%rip),%ymm9 # 2b924 <_sk_overlay_sse2_8bit+0x508>
+ .byte 196,98,125,24,13,164,146,2,0 // vbroadcastss 0x292a4(%rip),%ymm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x508>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,222,136,2,0 // vbroadcastss 0x288de(%rip),%ymm0 # 2b928 <_sk_overlay_sse2_8bit+0x50c>
+ .byte 196,226,125,24,5,154,146,2,0 // vbroadcastss 0x2929a(%rip),%ymm0 # 2c2e4 <_sk_overlay_sse2_8bit+0x50c>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,213,136,2,0 // vbroadcastss 0x288d5(%rip),%ymm8 # 2b92c <_sk_overlay_sse2_8bit+0x510>
+ .byte 196,98,125,24,5,145,146,2,0 // vbroadcastss 0x29291(%rip),%ymm8 # 2c2e8 <_sk_overlay_sse2_8bit+0x510>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,203,136,2,0 // vbroadcastss 0x288cb(%rip),%ymm9 # 2b930 <_sk_overlay_sse2_8bit+0x514>
+ .byte 196,98,125,24,13,135,146,2,0 // vbroadcastss 0x29287(%rip),%ymm9 # 2c2ec <_sk_overlay_sse2_8bit+0x514>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,184,136,2,0 // vbroadcastss 0x288b8(%rip),%ymm2 # 2b934 <_sk_overlay_sse2_8bit+0x518>
+ .byte 196,226,125,24,21,116,146,2,0 // vbroadcastss 0x29274(%rip),%ymm2 # 2c2f0 <_sk_overlay_sse2_8bit+0x518>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,174,136,2,0 // vbroadcastss 0x288ae(%rip),%ymm11 # 2b938 <_sk_overlay_sse2_8bit+0x51c>
+ .byte 196,98,125,24,29,106,146,2,0 // vbroadcastss 0x2926a(%rip),%ymm11 # 2c2f4 <_sk_overlay_sse2_8bit+0x51c>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,164,136,2,0 // vbroadcastss 0x288a4(%rip),%ymm12 # 2b93c <_sk_overlay_sse2_8bit+0x520>
+ .byte 196,98,125,24,37,96,146,2,0 // vbroadcastss 0x29260(%rip),%ymm12 # 2c2f8 <_sk_overlay_sse2_8bit+0x520>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -12299,9 +12299,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,89,136,2,0 // vbroadcastss 0x28859(%rip),%ymm0 # 2b940 <_sk_overlay_sse2_8bit+0x524>
+ .byte 196,226,125,24,5,21,146,2,0 // vbroadcastss 0x29215(%rip),%ymm0 # 2c2fc <_sk_overlay_sse2_8bit+0x524>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,80,136,2,0 // vbroadcastss 0x28850(%rip),%ymm8 # 2b944 <_sk_overlay_sse2_8bit+0x528>
+ .byte 196,98,125,24,5,12,146,2,0 // vbroadcastss 0x2920c(%rip),%ymm8 # 2c300 <_sk_overlay_sse2_8bit+0x528>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12319,10 +12319,10 @@ _sk_load_a8_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,52 // jne 3149 <_sk_load_a8_hsw+0x4c>
.byte 196,130,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm0
- .byte 197,249,219,5,45,145,2,0 // vpand 0x2912d(%rip),%xmm0,%xmm0 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,249,219,5,109,155,2,0 // vpand 0x29b6d(%rip),%xmm0,%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,155,135,2,0 // vbroadcastss 0x2879b(%rip),%ymm1 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,87,145,2,0 // vbroadcastss 0x29157(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -12370,7 +12370,7 @@ _sk_load_a8_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0031f0 <_sk_overlay_sse2_8bit+0xffffffffdefd7dd4>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0031f0 <_sk_overlay_sse2_8bit+0xffffffffdefd7418>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -12394,10 +12394,10 @@ _sk_load_a8_dst_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,52 // jne 3248 <_sk_load_a8_dst_hsw+0x4c>
.byte 196,130,121,48,36,24 // vpmovzxbw (%r8,%r11,1),%xmm4
- .byte 197,217,219,37,46,144,2,0 // vpand 0x2902e(%rip),%xmm4,%xmm4 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,217,219,37,110,154,2,0 // vpand 0x29a6e(%rip),%xmm4,%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,156,134,2,0 // vbroadcastss 0x2869c(%rip),%ymm5 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,45,88,144,2,0 // vbroadcastss 0x29058(%rip),%ymm5 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -12445,7 +12445,7 @@ _sk_load_a8_dst_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde0032f0 <_sk_overlay_sse2_8bit+0xffffffffddfd7ed4>
+ .byte 232,255,255,255,221 // callq ffffffffde0032f0 <_sk_overlay_sse2_8bit+0xffffffffddfd7518>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -12500,7 +12500,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,23,133,2,0 // vbroadcastss 0x28517(%rip),%ymm1 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,211,142,2,0 // vbroadcastss 0x28ed3(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -12522,7 +12522,7 @@ _sk_store_a8_hsw:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,152,132,2,0 // vbroadcastss 0x28498(%rip),%ymm8 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,84,142,2,0 // vbroadcastss 0x28e54(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -12547,13 +12547,13 @@ _sk_store_a8_hsw:
.byte 196,3,121,20,4,24,0 // vpextrb $0x0,%xmm8,(%r8,%r11,1)
.byte 235,202 // jmp 3415 <_sk_store_a8_hsw+0x41>
.byte 196,3,121,20,68,24,2,4 // vpextrb $0x4,%xmm8,0x2(%r8,%r11,1)
- .byte 196,98,57,0,5,4,142,2,0 // vpshufb 0x28e04(%rip),%xmm8,%xmm8 # 2c260 <_sk_overlay_sse2_8bit+0xe44>
+ .byte 196,98,57,0,5,68,152,2,0 // vpshufb 0x29844(%rip),%xmm8,%xmm8 # 2cca0 <_sk_overlay_sse2_8bit+0xec8>
.byte 196,3,121,21,4,24,0 // vpextrw $0x0,%xmm8,(%r8,%r11,1)
.byte 235,176 // jmp 3415 <_sk_store_a8_hsw+0x41>
.byte 196,3,121,20,68,24,6,12 // vpextrb $0xc,%xmm8,0x6(%r8,%r11,1)
.byte 196,3,121,20,68,24,5,10 // vpextrb $0xa,%xmm8,0x5(%r8,%r11,1)
.byte 196,3,121,20,68,24,4,8 // vpextrb $0x8,%xmm8,0x4(%r8,%r11,1)
- .byte 196,98,57,0,5,234,141,2,0 // vpshufb 0x28dea(%rip),%xmm8,%xmm8 # 2c270 <_sk_overlay_sse2_8bit+0xe54>
+ .byte 196,98,57,0,5,42,152,2,0 // vpshufb 0x2982a(%rip),%xmm8,%xmm8 # 2ccb0 <_sk_overlay_sse2_8bit+0xed8>
.byte 196,1,121,126,4,24 // vmovd %xmm8,(%r8,%r11,1)
.byte 235,135 // jmp 3415 <_sk_store_a8_hsw+0x41>
.byte 102,144 // xchg %ax,%ax
@@ -12590,13 +12590,13 @@ _sk_load_g8_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,57 // jne 34fd <_sk_load_g8_hsw+0x51>
.byte 196,130,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm0
- .byte 197,249,219,5,126,141,2,0 // vpand 0x28d7e(%rip),%xmm0,%xmm0 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,249,219,5,190,151,2,0 // vpand 0x297be(%rip),%xmm0,%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,236,131,2,0 // vbroadcastss 0x283ec(%rip),%ymm1 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,168,141,2,0 // vbroadcastss 0x28da8(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,105,131,2,0 // vbroadcastss 0x28369(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,37,141,2,0 // vbroadcastss 0x28d25(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -12641,7 +12641,7 @@ _sk_load_g8_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0035a4 <_sk_overlay_sse2_8bit+0xffffffffdefd8188>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0035a4 <_sk_overlay_sse2_8bit+0xffffffffdefd77cc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -12665,13 +12665,13 @@ _sk_load_g8_dst_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,57 // jne 3601 <_sk_load_g8_dst_hsw+0x51>
.byte 196,130,121,48,36,24 // vpmovzxbw (%r8,%r11,1),%xmm4
- .byte 197,217,219,37,122,140,2,0 // vpand 0x28c7a(%rip),%xmm4,%xmm4 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,217,219,37,186,150,2,0 // vpand 0x296ba(%rip),%xmm4,%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,232,130,2,0 // vbroadcastss 0x282e8(%rip),%ymm5 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,45,164,140,2,0 // vbroadcastss 0x28ca4(%rip),%ymm5 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,101,130,2,0 // vbroadcastss 0x28265(%rip),%ymm7 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,61,33,140,2,0 // vbroadcastss 0x28c21(%rip),%ymm7 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 255,224 // jmpq *%rax
@@ -12716,7 +12716,7 @@ _sk_load_g8_dst_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf0036a8 <_sk_overlay_sse2_8bit+0xffffffffdefd828c>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0036a8 <_sk_overlay_sse2_8bit+0xffffffffdefd78d0>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -12771,10 +12771,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,95,129,2,0 // vbroadcastss 0x2815f(%rip),%ymm1 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,27,139,2,0 // vbroadcastss 0x28b1b(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,220,128,2,0 // vbroadcastss 0x280dc(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,152,138,2,0 // vbroadcastss 0x28a98(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -12798,23 +12798,23 @@ _sk_load_565_hsw:
.byte 117,114 // jne 381e <_sk_load_565_hsw+0x8d>
.byte 196,129,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,20,129,2,0 // vpbroadcastd 0x28114(%rip),%ymm0 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,88,5,208,138,2,0 // vpbroadcastd 0x28ad0(%rip),%ymm0 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,7,129,2,0 // vbroadcastss 0x28107(%rip),%ymm1 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,13,195,138,2,0 // vbroadcastss 0x28ac3(%rip),%ymm1 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,254,128,2,0 // vpbroadcastd 0x280fe(%rip),%ymm1 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,88,13,186,138,2,0 // vpbroadcastd 0x28aba(%rip),%ymm1 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,241,128,2,0 // vbroadcastss 0x280f1(%rip),%ymm3 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,29,173,138,2,0 // vbroadcastss 0x28aad(%rip),%ymm3 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,232,128,2,0 // vpbroadcastd 0x280e8(%rip),%ymm3 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,88,29,164,138,2,0 // vpbroadcastd 0x28aa4(%rip),%ymm3 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,219,128,2,0 // vbroadcastss 0x280db(%rip),%ymm3 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,29,151,138,2,0 // vbroadcastss 0x28a97(%rip),%ymm3 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,64,128,2,0 // vbroadcastss 0x28040(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,252,137,2,0 // vbroadcastss 0x289fc(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
@@ -12877,23 +12877,23 @@ _sk_load_565_dst_hsw:
.byte 117,114 // jne 3949 <_sk_load_565_dst_hsw+0x8d>
.byte 196,129,122,111,36,88 // vmovdqu (%r8,%r11,2),%xmm4
.byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6
- .byte 196,226,125,88,37,233,127,2,0 // vpbroadcastd 0x27fe9(%rip),%ymm4 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,88,37,165,137,2,0 // vpbroadcastd 0x289a5(%rip),%ymm4 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,220,127,2,0 // vbroadcastss 0x27fdc(%rip),%ymm5 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,45,152,137,2,0 // vbroadcastss 0x28998(%rip),%ymm5 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,211,127,2,0 // vpbroadcastd 0x27fd3(%rip),%ymm5 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,88,45,143,137,2,0 // vpbroadcastd 0x2898f(%rip),%ymm5 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,198,127,2,0 // vbroadcastss 0x27fc6(%rip),%ymm7 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,61,130,137,2,0 // vbroadcastss 0x28982(%rip),%ymm7 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,88,61,189,127,2,0 // vpbroadcastd 0x27fbd(%rip),%ymm7 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,88,61,121,137,2,0 // vpbroadcastd 0x28979(%rip),%ymm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,176,127,2,0 // vbroadcastss 0x27fb0(%rip),%ymm7 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,61,108,137,2,0 // vbroadcastss 0x2896c(%rip),%ymm7 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,21,127,2,0 // vbroadcastss 0x27f15(%rip),%ymm7 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,61,209,136,2,0 // vbroadcastss 0x288d1(%rip),%ymm7 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
@@ -12989,23 +12989,23 @@ _sk_gather_565_hsw:
.byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,49,126,2,0 // vpbroadcastd 0x27e31(%rip),%ymm0 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,88,5,237,135,2,0 // vpbroadcastd 0x287ed(%rip),%ymm0 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,36,126,2,0 // vbroadcastss 0x27e24(%rip),%ymm1 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,13,224,135,2,0 // vbroadcastss 0x287e0(%rip),%ymm1 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,27,126,2,0 // vpbroadcastd 0x27e1b(%rip),%ymm1 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,88,13,215,135,2,0 // vpbroadcastd 0x287d7(%rip),%ymm1 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,14,126,2,0 // vbroadcastss 0x27e0e(%rip),%ymm3 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,29,202,135,2,0 // vbroadcastss 0x287ca(%rip),%ymm3 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,5,126,2,0 // vpbroadcastd 0x27e05(%rip),%ymm3 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,88,29,193,135,2,0 // vpbroadcastd 0x287c1(%rip),%ymm3 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,248,125,2,0 // vbroadcastss 0x27df8(%rip),%ymm3 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,29,180,135,2,0 // vbroadcastss 0x287b4(%rip),%ymm3 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,93,125,2,0 // vbroadcastss 0x27d5d(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,25,135,2,0 // vbroadcastss 0x28719(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
.byte 65,94 // pop %r14
@@ -13023,11 +13023,11 @@ _sk_store_565_hsw:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,33,126,2,0 // vbroadcastss 0x27e21(%rip),%ymm8 # 2b948 <_sk_overlay_sse2_8bit+0x52c>
+ .byte 196,98,125,24,5,221,135,2,0 // vbroadcastss 0x287dd(%rip),%ymm8 # 2c304 <_sk_overlay_sse2_8bit+0x52c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,12,126,2,0 // vbroadcastss 0x27e0c(%rip),%ymm10 # 2b94c <_sk_overlay_sse2_8bit+0x530>
+ .byte 196,98,125,24,21,200,135,2,0 // vbroadcastss 0x287c8(%rip),%ymm10 # 2c308 <_sk_overlay_sse2_8bit+0x530>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -13102,25 +13102,25 @@ _sk_load_4444_hsw:
.byte 15,133,138,0,0,0 // jne 3ca1 <_sk_load_4444_hsw+0xa9>
.byte 196,129,122,111,4,88 // vmovdqu (%r8,%r11,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,37,125,2,0 // vpbroadcastd 0x27d25(%rip),%ymm0 # 2b950 <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,88,5,225,134,2,0 // vpbroadcastd 0x286e1(%rip),%ymm0 # 2c30c <_sk_overlay_sse2_8bit+0x534>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,24,125,2,0 // vbroadcastss 0x27d18(%rip),%ymm1 # 2b954 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,13,212,134,2,0 // vbroadcastss 0x286d4(%rip),%ymm1 # 2c310 <_sk_overlay_sse2_8bit+0x538>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,15,125,2,0 // vpbroadcastd 0x27d0f(%rip),%ymm1 # 2b958 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,88,13,203,134,2,0 // vpbroadcastd 0x286cb(%rip),%ymm1 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,2,125,2,0 // vbroadcastss 0x27d02(%rip),%ymm2 # 2b95c <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,21,190,134,2,0 // vbroadcastss 0x286be(%rip),%ymm2 # 2c318 <_sk_overlay_sse2_8bit+0x540>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,249,124,2,0 // vpbroadcastd 0x27cf9(%rip),%ymm2 # 2b960 <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,88,21,181,134,2,0 // vpbroadcastd 0x286b5(%rip),%ymm2 # 2c31c <_sk_overlay_sse2_8bit+0x544>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,236,124,2,0 // vbroadcastss 0x27cec(%rip),%ymm8 # 2b964 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,168,134,2,0 // vbroadcastss 0x286a8(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,226,124,2,0 // vpbroadcastd 0x27ce2(%rip),%ymm8 # 2b968 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,88,5,158,134,2,0 // vpbroadcastd 0x2869e(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,212,124,2,0 // vbroadcastss 0x27cd4(%rip),%ymm8 # 2b96c <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,144,134,2,0 // vbroadcastss 0x28690(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13188,25 +13188,25 @@ _sk_load_4444_dst_hsw:
.byte 15,133,138,0,0,0 // jne 3ded <_sk_load_4444_dst_hsw+0xa9>
.byte 196,129,122,111,36,88 // vmovdqu (%r8,%r11,2),%xmm4
.byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7
- .byte 196,226,125,88,37,217,123,2,0 // vpbroadcastd 0x27bd9(%rip),%ymm4 # 2b950 <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,88,37,149,133,2,0 // vpbroadcastd 0x28595(%rip),%ymm4 # 2c30c <_sk_overlay_sse2_8bit+0x534>
.byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,204,123,2,0 // vbroadcastss 0x27bcc(%rip),%ymm5 # 2b954 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,45,136,133,2,0 // vbroadcastss 0x28588(%rip),%ymm5 # 2c310 <_sk_overlay_sse2_8bit+0x538>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,195,123,2,0 // vpbroadcastd 0x27bc3(%rip),%ymm5 # 2b958 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,88,45,127,133,2,0 // vpbroadcastd 0x2857f(%rip),%ymm5 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
.byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,182,123,2,0 // vbroadcastss 0x27bb6(%rip),%ymm6 # 2b95c <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,53,114,133,2,0 // vbroadcastss 0x28572(%rip),%ymm6 # 2c318 <_sk_overlay_sse2_8bit+0x540>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,88,53,173,123,2,0 // vpbroadcastd 0x27bad(%rip),%ymm6 # 2b960 <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,88,53,105,133,2,0 // vpbroadcastd 0x28569(%rip),%ymm6 # 2c31c <_sk_overlay_sse2_8bit+0x544>
.byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,160,123,2,0 // vbroadcastss 0x27ba0(%rip),%ymm8 # 2b964 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,92,133,2,0 // vbroadcastss 0x2855c(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,88,5,150,123,2,0 // vpbroadcastd 0x27b96(%rip),%ymm8 # 2b968 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,88,5,82,133,2,0 // vpbroadcastd 0x28552(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
.byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,136,123,2,0 // vbroadcastss 0x27b88(%rip),%ymm8 # 2b96c <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,68,133,2,0 // vbroadcastss 0x28544(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13304,25 +13304,25 @@ _sk_gather_4444_hsw:
.byte 65,15,183,4,88 // movzwl (%r8,%rbx,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,5,122,2,0 // vpbroadcastd 0x27a05(%rip),%ymm0 # 2b950 <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,88,5,193,131,2,0 // vpbroadcastd 0x283c1(%rip),%ymm0 # 2c30c <_sk_overlay_sse2_8bit+0x534>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,248,121,2,0 // vbroadcastss 0x279f8(%rip),%ymm1 # 2b954 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,13,180,131,2,0 // vbroadcastss 0x283b4(%rip),%ymm1 # 2c310 <_sk_overlay_sse2_8bit+0x538>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,239,121,2,0 // vpbroadcastd 0x279ef(%rip),%ymm1 # 2b958 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,88,13,171,131,2,0 // vpbroadcastd 0x283ab(%rip),%ymm1 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,226,121,2,0 // vbroadcastss 0x279e2(%rip),%ymm2 # 2b95c <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,21,158,131,2,0 // vbroadcastss 0x2839e(%rip),%ymm2 # 2c318 <_sk_overlay_sse2_8bit+0x540>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,217,121,2,0 // vpbroadcastd 0x279d9(%rip),%ymm2 # 2b960 <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,88,21,149,131,2,0 // vpbroadcastd 0x28395(%rip),%ymm2 # 2c31c <_sk_overlay_sse2_8bit+0x544>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,204,121,2,0 // vbroadcastss 0x279cc(%rip),%ymm8 # 2b964 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,136,131,2,0 // vbroadcastss 0x28388(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,194,121,2,0 // vpbroadcastd 0x279c2(%rip),%ymm8 # 2b968 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,88,5,126,131,2,0 // vpbroadcastd 0x2837e(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,180,121,2,0 // vbroadcastss 0x279b4(%rip),%ymm8 # 2b96c <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,112,131,2,0 // vbroadcastss 0x28370(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -13342,7 +13342,7 @@ _sk_store_4444_hsw:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,137,121,2,0 // vbroadcastss 0x27989(%rip),%ymm8 # 2b970 <_sk_overlay_sse2_8bit+0x554>
+ .byte 196,98,125,24,5,69,131,2,0 // vbroadcastss 0x28345(%rip),%ymm8 # 2c32c <_sk_overlay_sse2_8bit+0x554>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -13423,14 +13423,14 @@ _sk_load_8888_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,86 // jne 4136 <_sk_load_8888_hsw+0x72>
.byte 196,129,126,111,28,152 // vmovdqu (%r8,%r11,4),%ymm3
- .byte 197,229,219,5,18,122,2,0 // vpand 0x27a12(%rip),%ymm3,%ymm0 # 2bb00 <_sk_overlay_sse2_8bit+0x6e4>
+ .byte 197,229,219,5,210,131,2,0 // vpand 0x283d2(%rip),%ymm3,%ymm0 # 2c4c0 <_sk_overlay_sse2_8bit+0x6e8>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,213,119,2,0 // vbroadcastss 0x277d5(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,145,129,2,0 // vbroadcastss 0x28191(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,23,122,2,0 // vpshufb 0x27a17(%rip),%ymm3,%ymm1 # 2bb20 <_sk_overlay_sse2_8bit+0x704>
+ .byte 196,226,101,0,13,215,131,2,0 // vpshufb 0x283d7(%rip),%ymm3,%ymm1 # 2c4e0 <_sk_overlay_sse2_8bit+0x708>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,37,122,2,0 // vpshufb 0x27a25(%rip),%ymm3,%ymm2 # 2bb40 <_sk_overlay_sse2_8bit+0x724>
+ .byte 196,226,101,0,21,229,131,2,0 // vpshufb 0x283e5(%rip),%ymm3,%ymm2 # 2c500 <_sk_overlay_sse2_8bit+0x728>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13506,14 +13506,14 @@ _sk_load_8888_dst_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,86 // jne 426a <_sk_load_8888_dst_hsw+0x72>
.byte 196,129,126,111,60,152 // vmovdqu (%r8,%r11,4),%ymm7
- .byte 197,197,219,37,62,121,2,0 // vpand 0x2793e(%rip),%ymm7,%ymm4 # 2bb60 <_sk_overlay_sse2_8bit+0x744>
+ .byte 197,197,219,37,254,130,2,0 // vpand 0x282fe(%rip),%ymm7,%ymm4 # 2c520 <_sk_overlay_sse2_8bit+0x748>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,161,118,2,0 // vbroadcastss 0x276a1(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,93,128,2,0 // vbroadcastss 0x2805d(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
- .byte 196,226,69,0,45,67,121,2,0 // vpshufb 0x27943(%rip),%ymm7,%ymm5 # 2bb80 <_sk_overlay_sse2_8bit+0x764>
+ .byte 196,226,69,0,45,3,131,2,0 // vpshufb 0x28303(%rip),%ymm7,%ymm5 # 2c540 <_sk_overlay_sse2_8bit+0x768>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
.byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5
- .byte 196,226,69,0,53,81,121,2,0 // vpshufb 0x27951(%rip),%ymm7,%ymm6 # 2bba0 <_sk_overlay_sse2_8bit+0x784>
+ .byte 196,226,69,0,53,17,131,2,0 // vpshufb 0x28311(%rip),%ymm7,%ymm6 # 2c560 <_sk_overlay_sse2_8bit+0x788>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -13588,14 +13588,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,128 // vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- .byte 197,229,219,5,102,120,2,0 // vpand 0x27866(%rip),%ymm3,%ymm0 # 2bbc0 <_sk_overlay_sse2_8bit+0x7a4>
+ .byte 197,229,219,5,38,130,2,0 // vpand 0x28226(%rip),%ymm3,%ymm0 # 2c580 <_sk_overlay_sse2_8bit+0x7a8>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,105,117,2,0 // vbroadcastss 0x27569(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,37,127,2,0 // vbroadcastss 0x27f25(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,107,120,2,0 // vpshufb 0x2786b(%rip),%ymm3,%ymm1 # 2bbe0 <_sk_overlay_sse2_8bit+0x7c4>
+ .byte 196,226,101,0,13,43,130,2,0 // vpshufb 0x2822b(%rip),%ymm3,%ymm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x7c8>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,121,120,2,0 // vpshufb 0x27879(%rip),%ymm3,%ymm2 # 2bc00 <_sk_overlay_sse2_8bit+0x7e4>
+ .byte 196,226,101,0,21,57,130,2,0 // vpshufb 0x28239(%rip),%ymm3,%ymm2 # 2c5c0 <_sk_overlay_sse2_8bit+0x7e8>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13615,7 +13615,7 @@ _sk_store_8888_hsw:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,198,116,2,0 // vbroadcastss 0x274c6(%rip),%ymm8 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,130,126,2,0 // vbroadcastss 0x27e82(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -13694,14 +13694,14 @@ _sk_load_bgra_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,86 // jne 4516 <_sk_load_bgra_hsw+0x72>
.byte 196,129,126,111,28,152 // vmovdqu (%r8,%r11,4),%ymm3
- .byte 197,229,219,5,82,119,2,0 // vpand 0x27752(%rip),%ymm3,%ymm0 # 2bc20 <_sk_overlay_sse2_8bit+0x804>
+ .byte 197,229,219,5,18,129,2,0 // vpand 0x28112(%rip),%ymm3,%ymm0 # 2c5e0 <_sk_overlay_sse2_8bit+0x808>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,245,115,2,0 // vbroadcastss 0x273f5(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,177,125,2,0 // vbroadcastss 0x27db1(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,87,119,2,0 // vpshufb 0x27757(%rip),%ymm3,%ymm0 # 2bc40 <_sk_overlay_sse2_8bit+0x824>
+ .byte 196,226,101,0,5,23,129,2,0 // vpshufb 0x28117(%rip),%ymm3,%ymm0 # 2c600 <_sk_overlay_sse2_8bit+0x828>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,101,119,2,0 // vpshufb 0x27765(%rip),%ymm3,%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x844>
+ .byte 196,226,101,0,5,37,129,2,0 // vpshufb 0x28125(%rip),%ymm3,%ymm0 # 2c620 <_sk_overlay_sse2_8bit+0x848>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13777,14 +13777,14 @@ _sk_load_bgra_dst_hsw:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,86 // jne 464a <_sk_load_bgra_dst_hsw+0x72>
.byte 196,129,126,111,60,152 // vmovdqu (%r8,%r11,4),%ymm7
- .byte 197,197,219,37,126,118,2,0 // vpand 0x2767e(%rip),%ymm7,%ymm4 # 2bc80 <_sk_overlay_sse2_8bit+0x864>
+ .byte 197,197,219,37,62,128,2,0 // vpand 0x2803e(%rip),%ymm7,%ymm4 # 2c640 <_sk_overlay_sse2_8bit+0x868>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,193,114,2,0 // vbroadcastss 0x272c1(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,125,124,2,0 // vbroadcastss 0x27c7d(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6
- .byte 196,226,69,0,37,131,118,2,0 // vpshufb 0x27683(%rip),%ymm7,%ymm4 # 2bca0 <_sk_overlay_sse2_8bit+0x884>
+ .byte 196,226,69,0,37,67,128,2,0 // vpshufb 0x28043(%rip),%ymm7,%ymm4 # 2c660 <_sk_overlay_sse2_8bit+0x888>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5
- .byte 196,226,69,0,37,145,118,2,0 // vpshufb 0x27691(%rip),%ymm7,%ymm4 # 2bcc0 <_sk_overlay_sse2_8bit+0x8a4>
+ .byte 196,226,69,0,37,81,128,2,0 // vpshufb 0x28051(%rip),%ymm7,%ymm4 # 2c680 <_sk_overlay_sse2_8bit+0x8a8>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -13859,14 +13859,14 @@ _sk_gather_bgra_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,128 // vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- .byte 197,229,219,5,166,117,2,0 // vpand 0x275a6(%rip),%ymm3,%ymm0 # 2bce0 <_sk_overlay_sse2_8bit+0x8c4>
+ .byte 197,229,219,5,102,127,2,0 // vpand 0x27f66(%rip),%ymm3,%ymm0 # 2c6a0 <_sk_overlay_sse2_8bit+0x8c8>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,137,113,2,0 // vbroadcastss 0x27189(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,69,123,2,0 // vbroadcastss 0x27b45(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,171,117,2,0 // vpshufb 0x275ab(%rip),%ymm3,%ymm0 # 2bd00 <_sk_overlay_sse2_8bit+0x8e4>
+ .byte 196,226,101,0,5,107,127,2,0 // vpshufb 0x27f6b(%rip),%ymm3,%ymm0 # 2c6c0 <_sk_overlay_sse2_8bit+0x8e8>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,185,117,2,0 // vpshufb 0x275b9(%rip),%ymm3,%ymm0 # 2bd20 <_sk_overlay_sse2_8bit+0x904>
+ .byte 196,226,101,0,5,121,127,2,0 // vpshufb 0x27f79(%rip),%ymm3,%ymm0 # 2c6e0 <_sk_overlay_sse2_8bit+0x908>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13886,7 +13886,7 @@ _sk_store_bgra_hsw:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,230,112,2,0 // vbroadcastss 0x270e6(%rip),%ymm8 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,162,122,2,0 // vbroadcastss 0x27aa2(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -14194,7 +14194,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,147,108,2,0 // vbroadcastss 0x26c93(%rip),%ymm10 # 2b8ec <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,98,125,24,21,79,118,2,0 // vbroadcastss 0x2764f(%rip),%ymm10 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -14285,7 +14285,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,225,235,192 // vpor %xmm0,%xmm3,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,29,6,107,2,0 // vbroadcastss 0x26b06(%rip),%ymm3 # 2b8ec <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,226,125,24,29,194,116,2,0 // vbroadcastss 0x274c2(%rip),%ymm3 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
.byte 197,185,109,201 // vpunpckhqdq %xmm1,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -14302,7 +14302,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,40,106,2,0 // vbroadcastss 0x26a28(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,228,115,2,0 // vbroadcastss 0x273e4(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0
.byte 196,65,121,196,92,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
@@ -14378,7 +14378,7 @@ _sk_store_u16_be_hsw:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
- .byte 196,98,125,24,5,232,105,2,0 // vbroadcastss 0x269e8(%rip),%ymm8 # 2b974 <_sk_overlay_sse2_8bit+0x558>
+ .byte 196,98,125,24,5,164,115,2,0 // vbroadcastss 0x273a4(%rip),%ymm8 # 2c330 <_sk_overlay_sse2_8bit+0x558>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -14537,7 +14537,7 @@ _sk_load_f32_hsw:
.byte 255,92,255,255 // lcall *-0x1(%rdi,%rdi,8)
.byte 255,70,255 // incl -0x1(%rsi)
.byte 255 // (bad)
- .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 2900525c <_sk_overlay_sse2_8bit+0x28fd9e40>
+ .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 2900525c <_sk_overlay_sse2_8bit+0x28fd9484>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -14770,7 +14770,7 @@ _sk_mirror_x_hsw:
.byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8
- .byte 197,178,89,5,171,98,2,0 // vmulss 0x262ab(%rip),%xmm9,%xmm0 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 197,178,89,5,103,108,2,0 // vmulss 0x26c67(%rip),%xmm9,%xmm0 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
.byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0
@@ -14797,7 +14797,7 @@ _sk_mirror_y_hsw:
.byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8
- .byte 197,178,89,13,71,98,2,0 // vmulss 0x26247(%rip),%xmm9,%xmm1 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 197,178,89,13,3,108,2,0 // vmulss 0x26c03(%rip),%xmm9,%xmm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
.byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1
@@ -14819,7 +14819,7 @@ FUNCTION(_sk_clamp_x_1_hsw)
_sk_clamp_x_1_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,252,97,2,0 // vbroadcastss 0x261fc(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,184,107,2,0 // vbroadcastss 0x26bb8(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14837,9 +14837,9 @@ HIDDEN _sk_mirror_x_1_hsw
.globl _sk_mirror_x_1_hsw
FUNCTION(_sk_mirror_x_1_hsw)
_sk_mirror_x_1_hsw:
- .byte 196,98,125,24,5,243,97,2,0 // vbroadcastss 0x261f3(%rip),%ymm8 # 2b874 <_sk_overlay_sse2_8bit+0x458>
+ .byte 196,98,125,24,5,175,107,2,0 // vbroadcastss 0x26baf(%rip),%ymm8 # 2c230 <_sk_overlay_sse2_8bit+0x458>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,201,97,2,0 // vbroadcastss 0x261c9(%rip),%ymm9 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,13,133,107,2,0 // vbroadcastss 0x26b85(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -14855,11 +14855,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,181,98,2,0 // vbroadcastss 0x262b5(%rip),%ymm3 # 2b978 <_sk_overlay_sse2_8bit+0x55c>
- .byte 196,98,125,24,5,176,98,2,0 // vbroadcastss 0x262b0(%rip),%ymm8 # 2b97c <_sk_overlay_sse2_8bit+0x560>
+ .byte 196,226,125,24,29,113,108,2,0 // vbroadcastss 0x26c71(%rip),%ymm3 # 2c334 <_sk_overlay_sse2_8bit+0x55c>
+ .byte 196,98,125,24,5,108,108,2,0 // vbroadcastss 0x26c6c(%rip),%ymm8 # 2c338 <_sk_overlay_sse2_8bit+0x560>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,161,98,2,0 // vbroadcastss 0x262a1(%rip),%ymm3 # 2b980 <_sk_overlay_sse2_8bit+0x564>
+ .byte 196,226,125,24,29,93,108,2,0 // vbroadcastss 0x26c5d(%rip),%ymm3 # 2c33c <_sk_overlay_sse2_8bit+0x564>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -15123,14 +15123,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw
.globl _sk_gauss_a_to_rgba_hsw
FUNCTION(_sk_gauss_a_to_rgba_hsw)
_sk_gauss_a_to_rgba_hsw:
- .byte 196,226,125,24,5,171,94,2,0 // vbroadcastss 0x25eab(%rip),%ymm0 # 2b984 <_sk_overlay_sse2_8bit+0x568>
- .byte 196,226,125,24,13,166,94,2,0 // vbroadcastss 0x25ea6(%rip),%ymm1 # 2b988 <_sk_overlay_sse2_8bit+0x56c>
+ .byte 196,226,125,24,5,103,104,2,0 // vbroadcastss 0x26867(%rip),%ymm0 # 2c340 <_sk_overlay_sse2_8bit+0x568>
+ .byte 196,226,125,24,13,98,104,2,0 // vbroadcastss 0x26862(%rip),%ymm1 # 2c344 <_sk_overlay_sse2_8bit+0x56c>
.byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,156,94,2,0 // vbroadcastss 0x25e9c(%rip),%ymm0 # 2b98c <_sk_overlay_sse2_8bit+0x570>
+ .byte 196,226,125,24,5,88,104,2,0 // vbroadcastss 0x26858(%rip),%ymm0 # 2c348 <_sk_overlay_sse2_8bit+0x570>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
- .byte 196,226,125,24,13,146,94,2,0 // vbroadcastss 0x25e92(%rip),%ymm1 # 2b990 <_sk_overlay_sse2_8bit+0x574>
+ .byte 196,226,125,24,13,78,104,2,0 // vbroadcastss 0x2684e(%rip),%ymm1 # 2c34c <_sk_overlay_sse2_8bit+0x574>
.byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,136,94,2,0 // vbroadcastss 0x25e88(%rip),%ymm0 # 2b994 <_sk_overlay_sse2_8bit+0x578>
+ .byte 196,226,125,24,5,68,104,2,0 // vbroadcastss 0x26844(%rip),%ymm0 # 2c350 <_sk_overlay_sse2_8bit+0x578>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -15149,7 +15149,7 @@ _sk_gradient_hsw:
.byte 76,139,72,72 // mov 0x48(%rax),%r9
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 65,186,1,0,0,0 // mov $0x1,%r10d
- .byte 196,226,125,24,21,25,93,2,0 // vbroadcastss 0x25d19(%rip),%ymm2 # 2b860 <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,226,125,24,21,213,102,2,0 // vbroadcastss 0x266d5(%rip),%ymm2 # 2c21c <_sk_overlay_sse2_8bit+0x444>
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
.byte 196,130,125,24,28,145 // vbroadcastss (%r9,%r10,4),%ymm3
.byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3
@@ -15244,24 +15244,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,204,92,2,0 // vbroadcastss 0x25ccc(%rip),%ymm13 # 2b998 <_sk_overlay_sse2_8bit+0x57c>
- .byte 196,98,125,24,53,199,92,2,0 // vbroadcastss 0x25cc7(%rip),%ymm14 # 2b99c <_sk_overlay_sse2_8bit+0x580>
+ .byte 196,98,125,24,45,136,102,2,0 // vbroadcastss 0x26688(%rip),%ymm13 # 2c354 <_sk_overlay_sse2_8bit+0x57c>
+ .byte 196,98,125,24,53,131,102,2,0 // vbroadcastss 0x26683(%rip),%ymm14 # 2c358 <_sk_overlay_sse2_8bit+0x580>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,189,92,2,0 // vbroadcastss 0x25cbd(%rip),%ymm13 # 2b9a0 <_sk_overlay_sse2_8bit+0x584>
+ .byte 196,98,125,24,45,121,102,2,0 // vbroadcastss 0x26679(%rip),%ymm13 # 2c35c <_sk_overlay_sse2_8bit+0x584>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,179,92,2,0 // vbroadcastss 0x25cb3(%rip),%ymm14 # 2b9a4 <_sk_overlay_sse2_8bit+0x588>
+ .byte 196,98,125,24,53,111,102,2,0 // vbroadcastss 0x2666f(%rip),%ymm14 # 2c360 <_sk_overlay_sse2_8bit+0x588>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,158,92,2,0 // vbroadcastss 0x25c9e(%rip),%ymm10 # 2b9a8 <_sk_overlay_sse2_8bit+0x58c>
+ .byte 196,98,125,24,21,90,102,2,0 // vbroadcastss 0x2665a(%rip),%ymm10 # 2c364 <_sk_overlay_sse2_8bit+0x58c>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,52,91,2,0 // vbroadcastss 0x25b34(%rip),%ymm10 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,21,240,100,2,0 // vbroadcastss 0x264f0(%rip),%ymm10 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,30,91,2,0 // vbroadcastss 0x25b1e(%rip),%ymm10 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,21,218,100,2,0 // vbroadcastss 0x264da(%rip),%ymm10 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -15289,23 +15289,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,30,92,2,0 // vbroadcastss 0x25c1e(%rip),%ymm11 # 2b9ac <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,29,218,101,2,0 // vbroadcastss 0x265da(%rip),%ymm11 # 2c368 <_sk_overlay_sse2_8bit+0x590>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,253,91,2,0 // vbroadcastss 0x25bfd(%rip),%ymm9 # 2b9b0 <_sk_overlay_sse2_8bit+0x594>
+ .byte 196,98,125,24,13,185,101,2,0 // vbroadcastss 0x265b9(%rip),%ymm9 # 2c36c <_sk_overlay_sse2_8bit+0x594>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,224,91,2,0 // vbroadcastss 0x25be0(%rip),%ymm9 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,156,101,2,0 // vbroadcastss 0x2659c(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,113,90,2,0 // vbroadcastss 0x25a71(%rip),%ymm11 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,45,100,2,0 // vbroadcastss 0x2642d(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -15324,23 +15324,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,134,91,2,0 // vbroadcastss 0x25b86(%rip),%ymm11 # 2b9ac <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,29,66,101,2,0 // vbroadcastss 0x26542(%rip),%ymm11 # 2c368 <_sk_overlay_sse2_8bit+0x590>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,101,91,2,0 // vbroadcastss 0x25b65(%rip),%ymm9 # 2b9b0 <_sk_overlay_sse2_8bit+0x594>
+ .byte 196,98,125,24,13,33,101,2,0 // vbroadcastss 0x26521(%rip),%ymm9 # 2c36c <_sk_overlay_sse2_8bit+0x594>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,72,91,2,0 // vbroadcastss 0x25b48(%rip),%ymm9 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,4,101,2,0 // vbroadcastss 0x26504(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,217,89,2,0 // vbroadcastss 0x259d9(%rip),%ymm11 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,149,99,2,0 // vbroadcastss 0x26395(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -15358,14 +15358,14 @@ _sk_xy_to_2pt_conical_linear_hsw:
.byte 197,58,89,72,44 // vmulss 0x2c(%rax),%xmm8,%xmm9
.byte 196,66,125,24,201 // vbroadcastss %xmm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,244,90,2,0 // vbroadcastss 0x25af4(%rip),%ymm10 # 2b9ac <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,21,176,100,2,0 // vbroadcastss 0x264b0(%rip),%ymm10 # 2c368 <_sk_overlay_sse2_8bit+0x590>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
.byte 196,98,125,184,208 // vfmadd231ps %ymm0,%ymm0,%ymm10
.byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,215,90,2,0 // vbroadcastss 0x25ad7(%rip),%ymm8 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,5,147,100,2,0 // vbroadcastss 0x26493(%rip),%ymm8 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15405,7 +15405,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,23,89,2,0 // vbroadcastss 0x25917(%rip),%ymm8 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,211,98,2,0 // vbroadcastss 0x262d3(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -15439,9 +15439,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,7,90,2,0 // vbroadcastss 0x25a07(%rip),%ymm0 # 2b9b8 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,5,195,99,2,0 // vbroadcastss 0x263c3(%rip),%ymm0 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,158,88,2,0 // vbroadcastss 0x2589e(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,90,98,2,0 // vbroadcastss 0x2625a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15452,7 +15452,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,126,88,2,0 // vbroadcastss 0x2587e(%rip),%ymm0 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,5,58,98,2,0 // vbroadcastss 0x2623a(%rip),%ymm0 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -15464,9 +15464,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,190,89,2,0 // vbroadcastss 0x259be(%rip),%ymm1 # 2b9b8 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,13,122,99,2,0 // vbroadcastss 0x2637a(%rip),%ymm1 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,84,88,2,0 // vbroadcastss 0x25854(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,16,98,2,0 // vbroadcastss 0x26210(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15477,7 +15477,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,52,88,2,0 // vbroadcastss 0x25834(%rip),%ymm1 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,13,240,97,2,0 // vbroadcastss 0x261f0(%rip),%ymm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -15489,13 +15489,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,119,89,2,0 // vbroadcastss 0x25977(%rip),%ymm0 # 2b9bc <_sk_overlay_sse2_8bit+0x5a0>
+ .byte 196,226,125,24,5,51,99,2,0 // vbroadcastss 0x26333(%rip),%ymm0 # 2c378 <_sk_overlay_sse2_8bit+0x5a0>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,10,88,2,0 // vbroadcastss 0x2580a(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,198,97,2,0 // vbroadcastss 0x261c6(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,103,88,2,0 // vbroadcastss 0x25867(%rip),%ymm10 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
- .byte 196,98,125,24,29,82,89,2,0 // vbroadcastss 0x25952(%rip),%ymm11 # 2b9c0 <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,35,98,2,0 // vbroadcastss 0x26223(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,29,14,99,2,0 // vbroadcastss 0x2630e(%rip),%ymm11 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -15507,16 +15507,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,41,89,2,0 // vbroadcastss 0x25929(%rip),%ymm0 # 2b9b8 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,5,229,98,2,0 // vbroadcastss 0x262e5(%rip),%ymm0 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,192,87,2,0 // vbroadcastss 0x257c0(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,124,97,2,0 // vbroadcastss 0x2617c(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,26,89,2,0 // vbroadcastss 0x2591a(%rip),%ymm9 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
- .byte 196,98,125,24,21,21,89,2,0 // vbroadcastss 0x25915(%rip),%ymm10 # 2b9c8 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,13,214,98,2,0 // vbroadcastss 0x262d6(%rip),%ymm9 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,21,209,98,2,0 // vbroadcastss 0x262d1(%rip),%ymm10 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,151,87,2,0 // vbroadcastss 0x25797(%rip),%ymm9 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,13,83,97,2,0 // vbroadcastss 0x26153(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,253,88,2,0 // vbroadcastss 0x258fd(%rip),%ymm10 # 2b9cc <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,21,185,98,2,0 // vbroadcastss 0x262b9(%rip),%ymm10 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15527,14 +15527,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,109,87,2,0 // vbroadcastss 0x2576d(%rip),%ymm8 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,41,97,2,0 // vbroadcastss 0x26129(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,199,88,2,0 // vbroadcastss 0x258c7(%rip),%ymm10 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
- .byte 196,98,125,24,29,194,88,2,0 // vbroadcastss 0x258c2(%rip),%ymm11 # 2b9c8 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,21,131,98,2,0 // vbroadcastss 0x26283(%rip),%ymm10 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,29,126,98,2,0 // vbroadcastss 0x2627e(%rip),%ymm11 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,179,88,2,0 // vbroadcastss 0x258b3(%rip),%ymm8 # 2b9cc <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,5,111,98,2,0 // vbroadcastss 0x2626f(%rip),%ymm8 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15545,12 +15545,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,143,88,2,0 // vbroadcastss 0x2588f(%rip),%ymm0 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,226,125,24,5,75,98,2,0 // vbroadcastss 0x2624b(%rip),%ymm0 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,128,87,2,0 // vbroadcastss 0x25780(%rip),%ymm10 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
- .byte 196,98,125,24,29,107,88,2,0 // vbroadcastss 0x2586b(%rip),%ymm11 # 2b9c0 <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,60,97,2,0 // vbroadcastss 0x2613c(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,29,39,98,2,0 // vbroadcastss 0x26227(%rip),%ymm11 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -15562,13 +15562,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,70,88,2,0 // vbroadcastss 0x25846(%rip),%ymm1 # 2b9bc <_sk_overlay_sse2_8bit+0x5a0>
+ .byte 196,226,125,24,13,2,98,2,0 // vbroadcastss 0x26202(%rip),%ymm1 # 2c378 <_sk_overlay_sse2_8bit+0x5a0>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,216,86,2,0 // vbroadcastss 0x256d8(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,148,96,2,0 // vbroadcastss 0x26094(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,53,87,2,0 // vbroadcastss 0x25735(%rip),%ymm10 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
- .byte 196,98,125,24,29,32,88,2,0 // vbroadcastss 0x25820(%rip),%ymm11 # 2b9c0 <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,241,96,2,0 // vbroadcastss 0x260f1(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,29,220,97,2,0 // vbroadcastss 0x261dc(%rip),%ymm11 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -15580,16 +15580,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,247,87,2,0 // vbroadcastss 0x257f7(%rip),%ymm1 # 2b9b8 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,13,179,97,2,0 // vbroadcastss 0x261b3(%rip),%ymm1 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,141,86,2,0 // vbroadcastss 0x2568d(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,73,96,2,0 // vbroadcastss 0x26049(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,231,87,2,0 // vbroadcastss 0x257e7(%rip),%ymm9 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
- .byte 196,98,125,24,21,226,87,2,0 // vbroadcastss 0x257e2(%rip),%ymm10 # 2b9c8 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,13,163,97,2,0 // vbroadcastss 0x261a3(%rip),%ymm9 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,21,158,97,2,0 // vbroadcastss 0x2619e(%rip),%ymm10 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,100,86,2,0 // vbroadcastss 0x25664(%rip),%ymm9 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,13,32,96,2,0 // vbroadcastss 0x26020(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,202,87,2,0 // vbroadcastss 0x257ca(%rip),%ymm10 # 2b9cc <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,21,134,97,2,0 // vbroadcastss 0x26186(%rip),%ymm10 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15600,14 +15600,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,58,86,2,0 // vbroadcastss 0x2563a(%rip),%ymm8 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,246,95,2,0 // vbroadcastss 0x25ff6(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,147,87,2,0 // vbroadcastss 0x25793(%rip),%ymm10 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
- .byte 196,98,125,24,29,142,87,2,0 // vbroadcastss 0x2578e(%rip),%ymm11 # 2b9c8 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,21,79,97,2,0 // vbroadcastss 0x2614f(%rip),%ymm10 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,29,74,97,2,0 // vbroadcastss 0x2614a(%rip),%ymm11 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,127,87,2,0 // vbroadcastss 0x2577f(%rip),%ymm8 # 2b9cc <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,5,59,97,2,0 // vbroadcastss 0x2613b(%rip),%ymm8 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15618,12 +15618,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,91,87,2,0 // vbroadcastss 0x2575b(%rip),%ymm1 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,226,125,24,13,23,97,2,0 // vbroadcastss 0x26117(%rip),%ymm1 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,75,86,2,0 // vbroadcastss 0x2564b(%rip),%ymm10 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
- .byte 196,98,125,24,29,54,87,2,0 // vbroadcastss 0x25736(%rip),%ymm11 # 2b9c0 <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,7,96,2,0 // vbroadcastss 0x26007(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,29,242,96,2,0 // vbroadcastss 0x260f2(%rip),%ymm11 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -15761,19 +15761,19 @@ _sk_clut_3D_hsw:
.byte 197,254,127,76,36,160 // vmovdqu %ymm1,-0x60(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
- .byte 196,226,125,88,61,9,85,2,0 // vpbroadcastd 0x25509(%rip),%ymm7 # 2b9d4 <_sk_overlay_sse2_8bit+0x5b8>
+ .byte 196,226,125,88,61,197,94,2,0 // vpbroadcastd 0x25ec5(%rip),%ymm7 # 2c390 <_sk_overlay_sse2_8bit+0x5b8>
.byte 196,226,117,64,207 // vpmulld %ymm7,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,98,77,146,4,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- .byte 196,98,125,88,21,125,83,2,0 // vpbroadcastd 0x2537d(%rip),%ymm10 # 2b860 <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,88,21,57,93,2,0 // vpbroadcastd 0x25d39(%rip),%ymm10 # 2c21c <_sk_overlay_sse2_8bit+0x444>
.byte 196,193,117,254,242 // vpaddd %ymm10,%ymm1,%ymm6
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
.byte 196,226,37,146,28,176 // vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- .byte 196,98,125,88,29,108,83,2,0 // vpbroadcastd 0x2536c(%rip),%ymm11 # 2b868 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,125,88,29,40,93,2,0 // vpbroadcastd 0x25d28(%rip),%ymm11 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
.byte 196,193,117,254,203 // vpaddd %ymm11,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,226,77,146,36,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- .byte 196,98,125,24,45,188,84,2,0 // vbroadcastss 0x254bc(%rip),%ymm13 # 2b9d0 <_sk_overlay_sse2_8bit+0x5b4>
+ .byte 196,98,125,24,45,120,94,2,0 // vbroadcastss 0x25e78(%rip),%ymm13 # 2c38c <_sk_overlay_sse2_8bit+0x5b4>
.byte 196,193,124,88,245 // vaddps %ymm13,%ymm0,%ymm6
.byte 197,254,91,246 // vcvttps2dq %ymm6,%ymm6
.byte 196,226,77,64,205 // vpmulld %ymm5,%ymm6,%ymm1
@@ -15993,19 +15993,19 @@ _sk_clut_4D_hsw:
.byte 197,126,91,245 // vcvttps2dq %ymm5,%ymm14
.byte 196,98,13,64,233 // vpmulld %ymm1,%ymm14,%ymm13
.byte 197,149,254,198 // vpaddd %ymm6,%ymm13,%ymm0
- .byte 196,98,125,88,21,82,80,2,0 // vpbroadcastd 0x25052(%rip),%ymm10 # 2b9d4 <_sk_overlay_sse2_8bit+0x5b8>
+ .byte 196,98,125,88,21,14,90,2,0 // vpbroadcastd 0x25a0e(%rip),%ymm10 # 2c390 <_sk_overlay_sse2_8bit+0x5b8>
.byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,98,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- .byte 196,98,125,88,29,197,78,2,0 // vpbroadcastd 0x24ec5(%rip),%ymm11 # 2b860 <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,88,29,129,88,2,0 // vpbroadcastd 0x25881(%rip),%ymm11 # 2c21c <_sk_overlay_sse2_8bit+0x444>
.byte 196,65,125,254,195 // vpaddd %ymm11,%ymm0,%ymm8
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,162,53,146,20,128 // vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- .byte 196,98,125,88,37,180,78,2,0 // vpbroadcastd 0x24eb4(%rip),%ymm12 # 2b868 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,125,88,37,112,88,2,0 // vpbroadcastd 0x25870(%rip),%ymm12 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
.byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,226,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- .byte 196,98,125,24,13,3,80,2,0 // vbroadcastss 0x25003(%rip),%ymm9 # 2b9d0 <_sk_overlay_sse2_8bit+0x5b4>
+ .byte 196,98,125,24,13,191,89,2,0 // vbroadcastss 0x259bf(%rip),%ymm9 # 2c38c <_sk_overlay_sse2_8bit+0x5b4>
.byte 196,65,84,88,193 // vaddps %ymm9,%ymm5,%ymm8
.byte 196,65,126,91,192 // vcvttps2dq %ymm8,%ymm8
.byte 196,226,61,64,193 // vpmulld %ymm1,%ymm8,%ymm0
@@ -16330,7 +16330,7 @@ _sk_clut_4D_hsw:
.byte 197,196,92,214 // vsubps %ymm6,%ymm7,%ymm2
.byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,177,71,2,0 // vbroadcastss 0x247b1(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,109,81,2,0 // vbroadcastss 0x2516d(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,16,164,36,32,3,0,0 // vmovups 0x320(%rsp),%ymm4
.byte 197,252,16,172,36,64,3,0,0 // vmovups 0x340(%rsp),%ymm5
.byte 197,252,16,180,36,96,3,0,0 // vmovups 0x360(%rsp),%ymm6
@@ -16410,16 +16410,16 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,207,70,2,0 // vbroadcastss 0x246cf(%rip),%ymm1 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,13,139,80,2,0 // vbroadcastss 0x2508b(%rip),%ymm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 197,252,88,5,171,75,2,0 // vaddps 0x24bab(%rip),%ymm0,%ymm0 # 2bd40 <_sk_overlay_sse2_8bit+0x924>
+ .byte 197,252,88,5,107,85,2,0 // vaddps 0x2556b(%rip),%ymm0,%ymm0 # 2c700 <_sk_overlay_sse2_8bit+0x928>
.byte 197,249,110,209 // vmovd %ecx,%xmm2
.byte 197,249,112,210,0 // vpshufd $0x0,%xmm2,%xmm2
.byte 196,227,109,24,210,1 // vinsertf128 $0x1,%xmm2,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,165,70,2,0 // vbroadcastss 0x246a5(%rip),%ymm2 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,21,97,80,2,0 // vbroadcastss 0x25061(%rip),%ymm2 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -16434,14 +16434,14 @@ _sk_dither_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,121,110,194 // vmovd %edx,%xmm8
.byte 196,65,121,112,192,0 // vpshufd $0x0,%xmm8,%xmm8
- .byte 197,57,254,13,159,80,2,0 // vpaddd 0x2509f(%rip),%xmm8,%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0xe64>
- .byte 197,57,254,5,167,80,2,0 // vpaddd 0x250a7(%rip),%xmm8,%xmm8 # 2c290 <_sk_overlay_sse2_8bit+0xe74>
+ .byte 197,57,254,13,223,90,2,0 // vpaddd 0x25adf(%rip),%xmm8,%xmm9 # 2ccc0 <_sk_overlay_sse2_8bit+0xee8>
+ .byte 197,57,254,5,231,90,2,0 // vpaddd 0x25ae7(%rip),%xmm8,%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0xef8>
.byte 196,67,53,24,192,1 // vinsertf128 $0x1,%xmm8,%ymm9,%ymm8
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,83,70,2,0 // vbroadcastss 0x24653(%rip),%ymm11 # 2b860 <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,24,29,15,80,2,0 // vbroadcastss 0x2500f(%rip),%ymm11 # 2c21c <_sk_overlay_sse2_8bit+0x444>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -16452,8 +16452,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,20,70,2,0 // vbroadcastss 0x24614(%rip),%ymm12 # 2b864 <_sk_overlay_sse2_8bit+0x448>
- .byte 196,98,125,24,45,15,70,2,0 // vbroadcastss 0x2460f(%rip),%ymm13 # 2b868 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,125,24,37,208,79,2,0 // vbroadcastss 0x24fd0(%rip),%ymm12 # 2c220 <_sk_overlay_sse2_8bit+0x448>
+ .byte 196,98,125,24,45,203,79,2,0 // vbroadcastss 0x24fcb(%rip),%ymm13 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -16480,9 +16480,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,122,69,2,0 // vbroadcastss 0x2457a(%rip),%ymm9 # 2b86c <_sk_overlay_sse2_8bit+0x450>
+ .byte 196,98,125,24,13,54,79,2,0 // vbroadcastss 0x24f36(%rip),%ymm9 # 2c228 <_sk_overlay_sse2_8bit+0x450>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,112,69,2,0 // vbroadcastss 0x24570(%rip),%ymm9 # 2b870 <_sk_overlay_sse2_8bit+0x454>
+ .byte 196,98,125,24,13,44,79,2,0 // vbroadcastss 0x24f2c(%rip),%ymm9 # 2c22c <_sk_overlay_sse2_8bit+0x454>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
@@ -16516,7 +16516,7 @@ HIDDEN _sk_black_color_avx
FUNCTION(_sk_black_color_avx)
_sk_black_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,248,68,2,0 // vbroadcastss 0x244f8(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,180,78,2,0 // vbroadcastss 0x24eb4(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -16527,7 +16527,7 @@ HIDDEN _sk_white_color_avx
FUNCTION(_sk_white_color_avx)
_sk_white_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,223,68,2,0 // vbroadcastss 0x244df(%rip),%ymm0 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,155,78,2,0 // vbroadcastss 0x24e9b(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -16573,7 +16573,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,126,68,2,0 // vbroadcastss 0x2447e(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,58,78,2,0 // vbroadcastss 0x24e3a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -16594,7 +16594,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,60,68,2,0 // vbroadcastss 0x2443c(%rip),%ymm9 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,13,248,77,2,0 // vbroadcastss 0x24df8(%rip),%ymm9 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -16636,7 +16636,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,215,67,2,0 // vbroadcastss 0x243d7(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,147,77,2,0 // vbroadcastss 0x24d93(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -16649,7 +16649,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,182,67,2,0 // vbroadcastss 0x243b6(%rip),%ymm0 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,114,77,2,0 // vbroadcastss 0x24d72(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -16662,7 +16662,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,149,67,2,0 // vbroadcastss 0x24395(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,81,77,2,0 // vbroadcastss 0x24d51(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -16679,7 +16679,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,100,67,2,0 // vbroadcastss 0x24364(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,32,77,2,0 // vbroadcastss 0x24d20(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -16707,7 +16707,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,31,67,2,0 // vbroadcastss 0x2431f(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,219,76,2,0 // vbroadcastss 0x24cdb(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16738,7 +16738,7 @@ HIDDEN _sk_plus__avx
FUNCTION(_sk_plus__avx)
_sk_plus__avx:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,5,174,66,2,0 // vbroadcastss 0x242ae(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,106,76,2,0 // vbroadcastss 0x24c6a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
@@ -16772,7 +16772,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,77,66,2,0 // vbroadcastss 0x2424d(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,9,76,2,0 // vbroadcastss 0x24c09(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16809,7 +16809,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,201,65,2,0 // vbroadcastss 0x241c9(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,133,75,2,0 // vbroadcastss 0x24b85(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16835,7 +16835,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,113,65,2,0 // vbroadcastss 0x24171(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,45,75,2,0 // vbroadcastss 0x24b2d(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16864,7 +16864,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,13,65,2,0 // vbroadcastss 0x2410d(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,201,74,2,0 // vbroadcastss 0x24ac9(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16887,7 +16887,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,196,64,2,0 // vbroadcastss 0x240c4(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,128,74,2,0 // vbroadcastss 0x24a80(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16898,7 +16898,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,171,64,2,0 // vbroadcastss 0x240ab(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,103,74,2,0 // vbroadcastss 0x24a67(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -16960,7 +16960,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,175,63,2,0 // vbroadcastss 0x23faf(%rip),%ymm9 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,13,107,73,2,0 // vbroadcastss 0x2496b(%rip),%ymm9 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -17017,7 +17017,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,186,62,2,0 // vbroadcastss 0x23eba(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,118,72,2,0 // vbroadcastss 0x24876(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17072,7 +17072,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,223,61,2,0 // vbroadcastss 0x23ddf(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,155,71,2,0 // vbroadcastss 0x2479b(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17138,10 +17138,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,230,60,2,0 // vbroadcastss 0x23ce6(%rip),%ymm11 # 2b874 <_sk_overlay_sse2_8bit+0x458>
+ .byte 196,98,125,24,29,162,70,2,0 // vbroadcastss 0x246a2(%rip),%ymm11 # 2c230 <_sk_overlay_sse2_8bit+0x458>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,215,60,2,0 // vbroadcastss 0x23cd7(%rip),%ymm13 # 2b878 <_sk_overlay_sse2_8bit+0x45c>
+ .byte 196,98,125,24,45,147,70,2,0 // vbroadcastss 0x24693(%rip),%ymm13 # 2c234 <_sk_overlay_sse2_8bit+0x45c>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -17152,7 +17152,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,129,60,2,0 // vbroadcastss 0x23c81(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,61,70,2,0 // vbroadcastss 0x2463d(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -17279,12 +17279,12 @@ _sk_hue_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,100,58,2,0 // vbroadcastss 0x23a64(%rip),%ymm14 # 2b87c <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,53,32,68,2,0 // vbroadcastss 0x24420(%rip),%ymm14 # 2c238 <_sk_overlay_sse2_8bit+0x460>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,90,58,2,0 // vbroadcastss 0x23a5a(%rip),%ymm15 # 2b880 <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,61,22,68,2,0 // vbroadcastss 0x24416(%rip),%ymm15 # 2c23c <_sk_overlay_sse2_8bit+0x464>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,75,58,2,0 // vbroadcastss 0x23a4b(%rip),%ymm0 # 2b884 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,226,125,24,5,7,68,2,0 // vbroadcastss 0x24407(%rip),%ymm0 # 2c240 <_sk_overlay_sse2_8bit+0x468>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -17345,7 +17345,7 @@ _sk_hue_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,248,56,2,0 // vbroadcastss 0x238f8(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,180,66,2,0 // vbroadcastss 0x242b4(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17402,12 +17402,12 @@ _sk_saturation_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,34,56,2,0 // vbroadcastss 0x23822(%rip),%ymm14 # 2b87c <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,53,222,65,2,0 // vbroadcastss 0x241de(%rip),%ymm14 # 2c238 <_sk_overlay_sse2_8bit+0x460>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,24,56,2,0 // vbroadcastss 0x23818(%rip),%ymm15 # 2b880 <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,61,212,65,2,0 // vbroadcastss 0x241d4(%rip),%ymm15 # 2c23c <_sk_overlay_sse2_8bit+0x464>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,9,56,2,0 // vbroadcastss 0x23809(%rip),%ymm0 # 2b884 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,226,125,24,5,197,65,2,0 // vbroadcastss 0x241c5(%rip),%ymm0 # 2c240 <_sk_overlay_sse2_8bit+0x468>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -17468,7 +17468,7 @@ _sk_saturation_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,182,54,2,0 // vbroadcastss 0x236b6(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,114,64,2,0 // vbroadcastss 0x24072(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17497,12 +17497,12 @@ _sk_color_avx:
.byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
.byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
.byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
- .byte 196,98,125,24,45,104,54,2,0 // vbroadcastss 0x23668(%rip),%ymm13 # 2b87c <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,45,36,64,2,0 // vbroadcastss 0x24024(%rip),%ymm13 # 2c238 <_sk_overlay_sse2_8bit+0x460>
.byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
- .byte 196,98,125,24,53,94,54,2,0 // vbroadcastss 0x2365e(%rip),%ymm14 # 2b880 <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,53,26,64,2,0 // vbroadcastss 0x2401a(%rip),%ymm14 # 2c23c <_sk_overlay_sse2_8bit+0x464>
.byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,79,54,2,0 // vbroadcastss 0x2364f(%rip),%ymm15 # 2b884 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,98,125,24,61,11,64,2,0 // vbroadcastss 0x2400b(%rip),%ymm15 # 2c240 <_sk_overlay_sse2_8bit+0x468>
.byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -17565,7 +17565,7 @@ _sk_color_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,234,52,2,0 // vbroadcastss 0x234ea(%rip),%ymm0 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,166,62,2,0 // vbroadcastss 0x23ea6(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17595,12 +17595,12 @@ _sk_luminosity_avx:
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
- .byte 196,98,125,24,45,152,52,2,0 // vbroadcastss 0x23498(%rip),%ymm13 # 2b87c <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,45,84,62,2,0 // vbroadcastss 0x23e54(%rip),%ymm13 # 2c238 <_sk_overlay_sse2_8bit+0x460>
.byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
- .byte 196,98,125,24,53,142,52,2,0 // vbroadcastss 0x2348e(%rip),%ymm14 # 2b880 <_sk_overlay_sse2_8bit+0x464>
+ .byte 196,98,125,24,53,74,62,2,0 // vbroadcastss 0x23e4a(%rip),%ymm14 # 2c23c <_sk_overlay_sse2_8bit+0x464>
.byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,127,52,2,0 // vbroadcastss 0x2347f(%rip),%ymm15 # 2b884 <_sk_overlay_sse2_8bit+0x468>
+ .byte 196,98,125,24,61,59,62,2,0 // vbroadcastss 0x23e3b(%rip),%ymm15 # 2c240 <_sk_overlay_sse2_8bit+0x468>
.byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -17663,7 +17663,7 @@ _sk_luminosity_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,26,51,2,0 // vbroadcastss 0x2331a(%rip),%ymm0 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,5,214,60,2,0 // vbroadcastss 0x23cd6(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17697,7 +17697,7 @@ _sk_srcover_rgba_8888_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 15,133,42,1,0,0 // jne 86d7 <_sk_srcover_rgba_8888_avx+0x14a>
.byte 196,1,125,16,4,152 // vmovupd (%r8,%r11,4),%ymm8
- .byte 197,125,40,13,165,55,2,0 // vmovapd 0x237a5(%rip),%ymm9 # 2bd60 <_sk_overlay_sse2_8bit+0x944>
+ .byte 197,125,40,13,101,65,2,0 // vmovapd 0x24165(%rip),%ymm9 # 2c720 <_sk_overlay_sse2_8bit+0x948>
.byte 196,193,61,84,225 // vandpd %ymm9,%ymm8,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,81,114,208,8 // vpsrld $0x8,%xmm8,%xmm5
@@ -17715,9 +17715,9 @@ _sk_srcover_rgba_8888_avx:
.byte 197,193,114,215,24 // vpsrld $0x18,%xmm7,%xmm7
.byte 196,227,61,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,64,50,2,0 // vbroadcastss 0x23240(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,252,59,2,0 // vbroadcastss 0x23bfc(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,95,50,2,0 // vbroadcastss 0x2325f(%rip),%ymm9 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,13,27,60,2,0 // vbroadcastss 0x23c1b(%rip),%ymm9 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
@@ -17861,7 +17861,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,254,47,2,0 // vbroadcastss 0x22ffe(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,186,57,2,0 // vbroadcastss 0x239ba(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -17873,7 +17873,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,221,47,2,0 // vbroadcastss 0x22fdd(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,153,57,2,0 // vbroadcastss 0x23999(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -17885,7 +17885,7 @@ HIDDEN _sk_clamp_a_dst_avx
.globl _sk_clamp_a_dst_avx
FUNCTION(_sk_clamp_a_dst_avx)
_sk_clamp_a_dst_avx:
- .byte 196,98,125,24,5,191,47,2,0 // vbroadcastss 0x22fbf(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,123,57,2,0 // vbroadcastss 0x2397b(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -17918,7 +17918,7 @@ HIDDEN _sk_invert_avx
.globl _sk_invert_avx
FUNCTION(_sk_invert_avx)
_sk_invert_avx:
- .byte 196,98,125,24,5,122,47,2,0 // vbroadcastss 0x22f7a(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,54,57,2,0 // vbroadcastss 0x23936(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -17974,7 +17974,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,10,47,2,0 // vbroadcastss 0x22f0a(%rip),%ymm10 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,21,198,56,2,0 // vbroadcastss 0x238c6(%rip),%ymm10 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -17987,17 +17987,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,23,47,2,0 // vbroadcastss 0x22f17(%rip),%ymm8 # 2b88c <_sk_overlay_sse2_8bit+0x470>
+ .byte 196,98,125,24,5,211,56,2,0 // vbroadcastss 0x238d3(%rip),%ymm8 # 2c248 <_sk_overlay_sse2_8bit+0x470>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,245,46,2,0 // vbroadcastss 0x22ef5(%rip),%ymm11 # 2b87c <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,29,177,56,2,0 // vbroadcastss 0x238b1(%rip),%ymm11 # 2c238 <_sk_overlay_sse2_8bit+0x460>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,251,46,2,0 // vbroadcastss 0x22efb(%rip),%ymm13 # 2b890 <_sk_overlay_sse2_8bit+0x474>
+ .byte 196,98,125,24,45,183,56,2,0 // vbroadcastss 0x238b7(%rip),%ymm13 # 2c24c <_sk_overlay_sse2_8bit+0x474>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,236,46,2,0 // vbroadcastss 0x22eec(%rip),%ymm12 # 2b894 <_sk_overlay_sse2_8bit+0x478>
+ .byte 196,98,125,24,37,168,56,2,0 // vbroadcastss 0x238a8(%rip),%ymm12 # 2c250 <_sk_overlay_sse2_8bit+0x478>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,226,46,2,0 // vbroadcastss 0x22ee2(%rip),%ymm14 # 2b898 <_sk_overlay_sse2_8bit+0x47c>
+ .byte 196,98,125,24,53,158,56,2,0 // vbroadcastss 0x2389e(%rip),%ymm14 # 2c254 <_sk_overlay_sse2_8bit+0x47c>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -18023,17 +18023,17 @@ HIDDEN _sk_from_srgb_dst_avx
.globl _sk_from_srgb_dst_avx
FUNCTION(_sk_from_srgb_dst_avx)
_sk_from_srgb_dst_avx:
- .byte 196,98,125,24,5,107,46,2,0 // vbroadcastss 0x22e6b(%rip),%ymm8 # 2b88c <_sk_overlay_sse2_8bit+0x470>
+ .byte 196,98,125,24,5,39,56,2,0 // vbroadcastss 0x23827(%rip),%ymm8 # 2c248 <_sk_overlay_sse2_8bit+0x470>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,73,46,2,0 // vbroadcastss 0x22e49(%rip),%ymm11 # 2b87c <_sk_overlay_sse2_8bit+0x460>
+ .byte 196,98,125,24,29,5,56,2,0 // vbroadcastss 0x23805(%rip),%ymm11 # 2c238 <_sk_overlay_sse2_8bit+0x460>
.byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12
- .byte 196,98,125,24,45,79,46,2,0 // vbroadcastss 0x22e4f(%rip),%ymm13 # 2b890 <_sk_overlay_sse2_8bit+0x474>
+ .byte 196,98,125,24,45,11,56,2,0 // vbroadcastss 0x2380b(%rip),%ymm13 # 2c24c <_sk_overlay_sse2_8bit+0x474>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,64,46,2,0 // vbroadcastss 0x22e40(%rip),%ymm12 # 2b894 <_sk_overlay_sse2_8bit+0x478>
+ .byte 196,98,125,24,37,252,55,2,0 // vbroadcastss 0x237fc(%rip),%ymm12 # 2c250 <_sk_overlay_sse2_8bit+0x478>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,54,46,2,0 // vbroadcastss 0x22e36(%rip),%ymm14 # 2b898 <_sk_overlay_sse2_8bit+0x47c>
+ .byte 196,98,125,24,53,242,55,2,0 // vbroadcastss 0x237f2(%rip),%ymm14 # 2c254 <_sk_overlay_sse2_8bit+0x47c>
.byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4
.byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -18060,20 +18060,20 @@ HIDDEN _sk_to_srgb_avx
FUNCTION(_sk_to_srgb_avx)
_sk_to_srgb_avx:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,203,45,2,0 // vbroadcastss 0x22dcb(%rip),%ymm8 # 2b89c <_sk_overlay_sse2_8bit+0x480>
+ .byte 196,98,125,24,5,135,55,2,0 // vbroadcastss 0x23787(%rip),%ymm8 # 2c258 <_sk_overlay_sse2_8bit+0x480>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,197,45,2,0 // vbroadcastss 0x22dc5(%rip),%ymm11 # 2b8a4 <_sk_overlay_sse2_8bit+0x488>
+ .byte 196,98,125,24,29,129,55,2,0 // vbroadcastss 0x23781(%rip),%ymm11 # 2c260 <_sk_overlay_sse2_8bit+0x488>
.byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12
- .byte 196,98,125,24,45,179,45,2,0 // vbroadcastss 0x22db3(%rip),%ymm13 # 2b8a0 <_sk_overlay_sse2_8bit+0x484>
+ .byte 196,98,125,24,45,111,55,2,0 // vbroadcastss 0x2376f(%rip),%ymm13 # 2c25c <_sk_overlay_sse2_8bit+0x484>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12
- .byte 196,98,125,24,53,168,45,2,0 // vbroadcastss 0x22da8(%rip),%ymm14 # 2b8a8 <_sk_overlay_sse2_8bit+0x48c>
+ .byte 196,98,125,24,53,100,55,2,0 // vbroadcastss 0x23764(%rip),%ymm14 # 2c264 <_sk_overlay_sse2_8bit+0x48c>
.byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12
- .byte 196,98,125,24,61,158,45,2,0 // vbroadcastss 0x22d9e(%rip),%ymm15 # 2b8ac <_sk_overlay_sse2_8bit+0x490>
+ .byte 196,98,125,24,61,90,55,2,0 // vbroadcastss 0x2375a(%rip),%ymm15 # 2c268 <_sk_overlay_sse2_8bit+0x490>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,37,138,45,2,0 // vbroadcastss 0x22d8a(%rip),%ymm12 # 2b8b0 <_sk_overlay_sse2_8bit+0x494>
+ .byte 196,98,125,24,37,70,55,2,0 // vbroadcastss 0x23746(%rip),%ymm12 # 2c26c <_sk_overlay_sse2_8bit+0x494>
.byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -18110,7 +18110,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
.byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,150,44,2,0 // vbroadcastss 0x22c96(%rip),%ymm11 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,29,82,54,2,0 // vbroadcastss 0x23652(%rip),%ymm11 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -18120,19 +18120,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,195,44,2,0 // vbroadcastss 0x22cc3(%rip),%ymm11 # 2b8bc <_sk_overlay_sse2_8bit+0x4a0>
+ .byte 196,98,125,24,29,127,54,2,0 // vbroadcastss 0x2367f(%rip),%ymm11 # 2c278 <_sk_overlay_sse2_8bit+0x4a0>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,177,44,2,0 // vbroadcastss 0x22cb1(%rip),%ymm11 # 2b8b8 <_sk_overlay_sse2_8bit+0x49c>
+ .byte 196,98,125,24,29,109,54,2,0 // vbroadcastss 0x2366d(%rip),%ymm11 # 2c274 <_sk_overlay_sse2_8bit+0x49c>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,153,44,2,0 // vbroadcastss 0x22c99(%rip),%ymm2 # 2b8b4 <_sk_overlay_sse2_8bit+0x498>
+ .byte 196,226,125,24,21,85,54,2,0 // vbroadcastss 0x23655(%rip),%ymm2 # 2c270 <_sk_overlay_sse2_8bit+0x498>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,20,44,2,0 // vbroadcastss 0x22c14(%rip),%ymm12 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,208,53,2,0 // vbroadcastss 0x235d0(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -18142,7 +18142,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,67,44,2,0 // vbroadcastss 0x22c43(%rip),%ymm8 # 2b8c0 <_sk_overlay_sse2_8bit+0x4a4>
+ .byte 196,98,125,24,5,255,53,2,0 // vbroadcastss 0x235ff(%rip),%ymm8 # 2c27c <_sk_overlay_sse2_8bit+0x4a4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18159,7 +18159,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,160,43,2,0 // vbroadcastss 0x22ba0(%rip),%ymm8 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,92,53,2,0 // vbroadcastss 0x2355c(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -18167,23 +18167,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,226,43,2,0 // vbroadcastss 0x22be2(%rip),%ymm11 # 2b8c4 <_sk_overlay_sse2_8bit+0x4a8>
+ .byte 196,98,125,24,29,158,53,2,0 // vbroadcastss 0x2359e(%rip),%ymm11 # 2c280 <_sk_overlay_sse2_8bit+0x4a8>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,180,43,2,0 // vbroadcastss 0x22bb4(%rip),%ymm12 # 2b8b4 <_sk_overlay_sse2_8bit+0x498>
+ .byte 196,98,125,24,37,112,53,2,0 // vbroadcastss 0x23570(%rip),%ymm12 # 2c270 <_sk_overlay_sse2_8bit+0x498>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,174,43,2,0 // vbroadcastss 0x22bae(%rip),%ymm13 # 2b8bc <_sk_overlay_sse2_8bit+0x4a0>
+ .byte 196,98,125,24,45,106,53,2,0 // vbroadcastss 0x2356a(%rip),%ymm13 # 2c278 <_sk_overlay_sse2_8bit+0x4a0>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,163,43,2,0 // vbroadcastss 0x22ba3(%rip),%ymm1 # 2b8c8 <_sk_overlay_sse2_8bit+0x4ac>
+ .byte 196,226,125,24,13,95,53,2,0 // vbroadcastss 0x2355f(%rip),%ymm1 # 2c284 <_sk_overlay_sse2_8bit+0x4ac>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,122,43,2,0 // vbroadcastss 0x22b7a(%rip),%ymm14 # 2b8c0 <_sk_overlay_sse2_8bit+0x4a4>
+ .byte 196,98,125,24,53,54,53,2,0 // vbroadcastss 0x23536(%rip),%ymm14 # 2c27c <_sk_overlay_sse2_8bit+0x4a4>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -18202,7 +18202,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,36,43,2,0 // vbroadcastss 0x22b24(%rip),%ymm0 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,226,125,24,5,224,52,2,0 // vbroadcastss 0x234e0(%rip),%ymm0 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -18258,13 +18258,13 @@ _sk_scale_u8_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,74 // jne 8ead <_sk_scale_u8_avx+0x62>
.byte 196,2,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm8
- .byte 197,57,219,5,223,51,2,0 // vpand 0x233df(%rip),%xmm8,%xmm8 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,57,219,5,31,62,2,0 // vpand 0x23e1f(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,60,42,2,0 // vbroadcastss 0x22a3c(%rip),%ymm9 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,248,51,2,0 // vbroadcastss 0x233f8(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -18312,7 +18312,7 @@ _sk_scale_u8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde008f58 <_sk_overlay_sse2_8bit+0xffffffffddfddb3c>
+ .byte 232,255,255,255,221 // callq ffffffffde008f58 <_sk_overlay_sse2_8bit+0xffffffffddfdd180>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -18341,20 +18341,20 @@ _sk_scale_565_avx:
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,45,41,2,0 // vbroadcastss 0x2292d(%rip),%ymm9 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,98,125,24,13,233,50,2,0 // vbroadcastss 0x232e9(%rip),%ymm9 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,30,41,2,0 // vbroadcastss 0x2291e(%rip),%ymm10 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,98,125,24,21,218,50,2,0 // vbroadcastss 0x232da(%rip),%ymm10 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,20,41,2,0 // vbroadcastss 0x22914(%rip),%ymm10 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,98,125,24,21,208,50,2,0 // vbroadcastss 0x232d0(%rip),%ymm10 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,5,41,2,0 // vbroadcastss 0x22905(%rip),%ymm11 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,98,125,24,29,193,50,2,0 // vbroadcastss 0x232c1(%rip),%ymm11 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,251,40,2,0 // vbroadcastss 0x228fb(%rip),%ymm11 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,98,125,24,29,183,50,2,0 // vbroadcastss 0x232b7(%rip),%ymm11 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,236,40,2,0 // vbroadcastss 0x228ec(%rip),%ymm11 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,98,125,24,29,168,50,2,0 // vbroadcastss 0x232a8(%rip),%ymm11 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -18449,13 +18449,13 @@ _sk_lerp_u8_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,110 // jne 919d <_sk_lerp_u8_avx+0x86>
.byte 196,2,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm8
- .byte 197,57,219,5,19,49,2,0 // vpand 0x23113(%rip),%xmm8,%xmm8 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,57,219,5,83,59,2,0 // vpand 0x23b53(%rip),%xmm8,%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,112,39,2,0 // vbroadcastss 0x22770(%rip),%ymm9 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,44,49,2,0 // vbroadcastss 0x2312c(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -18542,20 +18542,20 @@ _sk_lerp_565_avx:
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,57,38,2,0 // vbroadcastss 0x22639(%rip),%ymm9 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,98,125,24,13,245,47,2,0 // vbroadcastss 0x22ff5(%rip),%ymm9 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,42,38,2,0 // vbroadcastss 0x2262a(%rip),%ymm10 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,98,125,24,21,230,47,2,0 // vbroadcastss 0x22fe6(%rip),%ymm10 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,32,38,2,0 // vbroadcastss 0x22620(%rip),%ymm10 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,98,125,24,21,220,47,2,0 // vbroadcastss 0x22fdc(%rip),%ymm10 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,17,38,2,0 // vbroadcastss 0x22611(%rip),%ymm11 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,98,125,24,29,205,47,2,0 // vbroadcastss 0x22fcd(%rip),%ymm11 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,7,38,2,0 // vbroadcastss 0x22607(%rip),%ymm11 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,98,125,24,29,195,47,2,0 // vbroadcastss 0x22fc3(%rip),%ymm11 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,248,37,2,0 // vbroadcastss 0x225f8(%rip),%ymm11 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,98,125,24,29,180,47,2,0 // vbroadcastss 0x22fb4(%rip),%ymm11 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -18634,7 +18634,7 @@ _sk_load_tables_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 15,133,4,2,0,0 // jne 9608 <_sk_load_tables_avx+0x218>
.byte 196,65,125,16,20,144 // vmovupd (%r8,%rdx,4),%ymm10
- .byte 197,125,40,13,110,41,2,0 // vmovapd 0x2296e(%rip),%ymm9 # 2bd80 <_sk_overlay_sse2_8bit+0x964>
+ .byte 197,125,40,13,46,51,2,0 // vmovapd 0x2332e(%rip),%ymm9 # 2c740 <_sk_overlay_sse2_8bit+0x968>
.byte 196,193,45,84,201 // vandpd %ymm9,%ymm10,%ymm1
.byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0
.byte 196,193,249,126,192 // vmovq %xmm0,%r8
@@ -18726,7 +18726,7 @@ _sk_load_tables_avx:
.byte 196,193,65,114,213,24 // vpsrld $0x18,%xmm13,%xmm7
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,214,34,2,0 // vbroadcastss 0x222d6(%rip),%ymm7 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,61,146,44,2,0 // vbroadcastss 0x22c92(%rip),%ymm7 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -18810,7 +18810,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11
.byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1
.byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12
- .byte 197,121,111,21,11,43,2,0 // vmovdqa 0x22b0b(%rip),%xmm10 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,121,111,21,75,53,2,0 // vmovdqa 0x2354b(%rip),%xmm10 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -18908,7 +18908,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,174,31,2,0 // vbroadcastss 0x21fae(%rip),%ymm7 # 2b8ec <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,226,125,24,61,106,41,2,0 // vbroadcastss 0x2296a(%rip),%ymm7 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -18971,7 +18971,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 197,185,108,211 // vpunpcklqdq %xmm3,%xmm8,%xmm2
.byte 197,57,109,219 // vpunpckhqdq %xmm3,%xmm8,%xmm11
.byte 197,113,108,192 // vpunpcklqdq %xmm0,%xmm1,%xmm8
- .byte 197,121,111,13,255,39,2,0 // vmovdqa 0x227ff(%rip),%xmm9 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,121,111,13,63,50,2,0 // vmovdqa 0x2323f(%rip),%xmm9 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 196,193,105,219,193 // vpand %xmm9,%xmm2,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -19061,7 +19061,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2
.byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,60,28,2,0 // vbroadcastss 0x21c3c(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,248,37,2,0 // vbroadcastss 0x225f8(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
.byte 255,224 // jmpq *%rax
@@ -19132,7 +19132,7 @@ HIDDEN _sk_byte_tables_avx
FUNCTION(_sk_byte_tables_avx)
_sk_byte_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,32,27,2,0 // vbroadcastss 0x21b20(%rip),%ymm8 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,220,36,2,0 // vbroadcastss 0x224dc(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,200 // vmovq %xmm9,%r8
@@ -19251,7 +19251,7 @@ _sk_byte_tables_avx:
.byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1
.byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- .byte 196,98,125,24,13,14,25,2,0 // vbroadcastss 0x2190e(%rip),%ymm9 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,202,34,2,0 // vbroadcastss 0x222ca(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -19367,7 +19367,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,235,22,2,0 // vbroadcastss 0x216eb(%rip),%ymm9 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,167,32,2,0 // vbroadcastss 0x220a7(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1
.byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2
@@ -19604,36 +19604,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,124,19,2,0 // vbroadcastss 0x2137c(%rip),%ymm12 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,37,56,29,2,0 // vbroadcastss 0x21d38(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,114,19,2,0 // vbroadcastss 0x21372(%rip),%ymm12 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,46,29,2,0 // vbroadcastss 0x21d2e(%rip),%ymm12 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,200,18,2,0 // vbroadcastss 0x212c8(%rip),%ymm12 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,132,28,2,0 // vbroadcastss 0x21c84(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,90,19,2,0 // vbroadcastss 0x2135a(%rip),%ymm12 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,37,22,29,2,0 // vbroadcastss 0x21d16(%rip),%ymm12 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,80,19,2,0 // vbroadcastss 0x21350(%rip),%ymm12 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,37,12,29,2,0 // vbroadcastss 0x21d0c(%rip),%ymm12 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,65,19,2,0 // vbroadcastss 0x21341(%rip),%ymm12 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,253,28,2,0 // vbroadcastss 0x21cfd(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,55,19,2,0 // vbroadcastss 0x21337(%rip),%ymm12 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,243,28,2,0 // vbroadcastss 0x21cf3(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,27,19,2,0 // vbroadcastss 0x2131b(%rip),%ymm11 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,215,28,2,0 // vbroadcastss 0x21cd7(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,17,19,2,0 // vbroadcastss 0x21311(%rip),%ymm11 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,205,28,2,0 // vbroadcastss 0x21ccd(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,2,19,2,0 // vbroadcastss 0x21302(%rip),%ymm11 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,98,125,24,29,190,28,2,0 // vbroadcastss 0x21cbe(%rip),%ymm11 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,248,18,2,0 // vbroadcastss 0x212f8(%rip),%ymm11 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,29,180,28,2,0 // vbroadcastss 0x21cb4(%rip),%ymm11 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,233,18,2,0 // vbroadcastss 0x212e9(%rip),%ymm10 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,165,28,2,0 // vbroadcastss 0x21ca5(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19641,7 +19641,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,0,18,2,0 // vbroadcastss 0x21200(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,188,27,2,0 // vbroadcastss 0x21bbc(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19663,36 +19663,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,65,18,2,0 // vbroadcastss 0x21241(%rip),%ymm12 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,37,253,27,2,0 // vbroadcastss 0x21bfd(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,55,18,2,0 // vbroadcastss 0x21237(%rip),%ymm12 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,243,27,2,0 // vbroadcastss 0x21bf3(%rip),%ymm12 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,141,17,2,0 // vbroadcastss 0x2118d(%rip),%ymm12 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,73,27,2,0 // vbroadcastss 0x21b49(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,31,18,2,0 // vbroadcastss 0x2121f(%rip),%ymm12 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,37,219,27,2,0 // vbroadcastss 0x21bdb(%rip),%ymm12 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,21,18,2,0 // vbroadcastss 0x21215(%rip),%ymm12 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,37,209,27,2,0 // vbroadcastss 0x21bd1(%rip),%ymm12 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,6,18,2,0 // vbroadcastss 0x21206(%rip),%ymm12 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,194,27,2,0 // vbroadcastss 0x21bc2(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,252,17,2,0 // vbroadcastss 0x211fc(%rip),%ymm12 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,184,27,2,0 // vbroadcastss 0x21bb8(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,224,17,2,0 // vbroadcastss 0x211e0(%rip),%ymm11 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,156,27,2,0 // vbroadcastss 0x21b9c(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,214,17,2,0 // vbroadcastss 0x211d6(%rip),%ymm11 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,146,27,2,0 // vbroadcastss 0x21b92(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,199,17,2,0 // vbroadcastss 0x211c7(%rip),%ymm11 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,98,125,24,29,131,27,2,0 // vbroadcastss 0x21b83(%rip),%ymm11 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,189,17,2,0 // vbroadcastss 0x211bd(%rip),%ymm11 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,29,121,27,2,0 // vbroadcastss 0x21b79(%rip),%ymm11 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,174,17,2,0 // vbroadcastss 0x211ae(%rip),%ymm10 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,106,27,2,0 // vbroadcastss 0x21b6a(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19700,7 +19700,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,197,16,2,0 // vbroadcastss 0x210c5(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,129,26,2,0 // vbroadcastss 0x21a81(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19722,36 +19722,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,6,17,2,0 // vbroadcastss 0x21106(%rip),%ymm12 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,37,194,26,2,0 // vbroadcastss 0x21ac2(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,252,16,2,0 // vbroadcastss 0x210fc(%rip),%ymm12 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,184,26,2,0 // vbroadcastss 0x21ab8(%rip),%ymm12 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,82,16,2,0 // vbroadcastss 0x21052(%rip),%ymm12 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,14,26,2,0 // vbroadcastss 0x21a0e(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,228,16,2,0 // vbroadcastss 0x210e4(%rip),%ymm12 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,37,160,26,2,0 // vbroadcastss 0x21aa0(%rip),%ymm12 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,218,16,2,0 // vbroadcastss 0x210da(%rip),%ymm12 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,37,150,26,2,0 // vbroadcastss 0x21a96(%rip),%ymm12 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,203,16,2,0 // vbroadcastss 0x210cb(%rip),%ymm12 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,135,26,2,0 // vbroadcastss 0x21a87(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,193,16,2,0 // vbroadcastss 0x210c1(%rip),%ymm12 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,125,26,2,0 // vbroadcastss 0x21a7d(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,165,16,2,0 // vbroadcastss 0x210a5(%rip),%ymm11 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,97,26,2,0 // vbroadcastss 0x21a61(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,155,16,2,0 // vbroadcastss 0x2109b(%rip),%ymm11 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,87,26,2,0 // vbroadcastss 0x21a57(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,140,16,2,0 // vbroadcastss 0x2108c(%rip),%ymm11 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,98,125,24,29,72,26,2,0 // vbroadcastss 0x21a48(%rip),%ymm11 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,130,16,2,0 // vbroadcastss 0x21082(%rip),%ymm11 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,29,62,26,2,0 // vbroadcastss 0x21a3e(%rip),%ymm11 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,115,16,2,0 // vbroadcastss 0x21073(%rip),%ymm10 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,47,26,2,0 // vbroadcastss 0x21a2f(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19759,7 +19759,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,138,15,2,0 // vbroadcastss 0x20f8a(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,70,25,2,0 // vbroadcastss 0x21946(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19781,36 +19781,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,203,15,2,0 // vbroadcastss 0x20fcb(%rip),%ymm12 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,37,135,25,2,0 // vbroadcastss 0x21987(%rip),%ymm12 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,193,15,2,0 // vbroadcastss 0x20fc1(%rip),%ymm12 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,37,125,25,2,0 // vbroadcastss 0x2197d(%rip),%ymm12 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,23,15,2,0 // vbroadcastss 0x20f17(%rip),%ymm12 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,37,211,24,2,0 // vbroadcastss 0x218d3(%rip),%ymm12 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,169,15,2,0 // vbroadcastss 0x20fa9(%rip),%ymm12 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,37,101,25,2,0 // vbroadcastss 0x21965(%rip),%ymm12 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,159,15,2,0 // vbroadcastss 0x20f9f(%rip),%ymm12 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,37,91,25,2,0 // vbroadcastss 0x2195b(%rip),%ymm12 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,144,15,2,0 // vbroadcastss 0x20f90(%rip),%ymm12 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,76,25,2,0 // vbroadcastss 0x2194c(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,134,15,2,0 // vbroadcastss 0x20f86(%rip),%ymm12 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,37,66,25,2,0 // vbroadcastss 0x21942(%rip),%ymm12 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,106,15,2,0 // vbroadcastss 0x20f6a(%rip),%ymm11 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,29,38,25,2,0 // vbroadcastss 0x21926(%rip),%ymm11 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,96,15,2,0 // vbroadcastss 0x20f60(%rip),%ymm11 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,98,125,24,29,28,25,2,0 // vbroadcastss 0x2191c(%rip),%ymm11 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,81,15,2,0 // vbroadcastss 0x20f51(%rip),%ymm11 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,98,125,24,29,13,25,2,0 // vbroadcastss 0x2190d(%rip),%ymm11 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,71,15,2,0 // vbroadcastss 0x20f47(%rip),%ymm11 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,98,125,24,29,3,25,2,0 // vbroadcastss 0x21903(%rip),%ymm11 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,56,15,2,0 // vbroadcastss 0x20f38(%rip),%ymm10 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,98,125,24,21,244,24,2,0 // vbroadcastss 0x218f4(%rip),%ymm10 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19818,7 +19818,7 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,79,14,2,0 // vbroadcastss 0x20e4f(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,11,24,2,0 // vbroadcastss 0x2180b(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19837,34 +19837,34 @@ _sk_gamma_avx:
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,91,200 // vcvtdq2ps %ymm0,%ymm1
- .byte 196,98,125,24,5,162,14,2,0 // vbroadcastss 0x20ea2(%rip),%ymm8 # 2b8f0 <_sk_overlay_sse2_8bit+0x4d4>
+ .byte 196,98,125,24,5,94,24,2,0 // vbroadcastss 0x2185e(%rip),%ymm8 # 2c2ac <_sk_overlay_sse2_8bit+0x4d4>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,152,14,2,0 // vbroadcastss 0x20e98(%rip),%ymm9 # 2b8f4 <_sk_overlay_sse2_8bit+0x4d8>
+ .byte 196,98,125,24,13,84,24,2,0 // vbroadcastss 0x21854(%rip),%ymm9 # 2c2b0 <_sk_overlay_sse2_8bit+0x4d8>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
- .byte 196,226,125,24,37,238,13,2,0 // vbroadcastss 0x20dee(%rip),%ymm4 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,37,170,23,2,0 // vbroadcastss 0x217aa(%rip),%ymm4 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,252,86,196 // vorps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,21,129,14,2,0 // vbroadcastss 0x20e81(%rip),%ymm10 # 2b8f8 <_sk_overlay_sse2_8bit+0x4dc>
+ .byte 196,98,125,24,21,61,24,2,0 // vbroadcastss 0x2183d(%rip),%ymm10 # 2c2b4 <_sk_overlay_sse2_8bit+0x4dc>
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,29,119,14,2,0 // vbroadcastss 0x20e77(%rip),%ymm11 # 2b8fc <_sk_overlay_sse2_8bit+0x4e0>
+ .byte 196,98,125,24,29,51,24,2,0 // vbroadcastss 0x21833(%rip),%ymm11 # 2c2b8 <_sk_overlay_sse2_8bit+0x4e0>
.byte 196,193,124,89,211 // vmulps %ymm11,%ymm0,%ymm2
.byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
- .byte 196,98,125,24,37,105,14,2,0 // vbroadcastss 0x20e69(%rip),%ymm12 # 2b900 <_sk_overlay_sse2_8bit+0x4e4>
+ .byte 196,98,125,24,37,37,24,2,0 // vbroadcastss 0x21825(%rip),%ymm12 # 2c2bc <_sk_overlay_sse2_8bit+0x4e4>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,45,95,14,2,0 // vbroadcastss 0x20e5f(%rip),%ymm13 # 2b904 <_sk_overlay_sse2_8bit+0x4e8>
+ .byte 196,98,125,24,45,27,24,2,0 // vbroadcastss 0x2181b(%rip),%ymm13 # 2c2c0 <_sk_overlay_sse2_8bit+0x4e8>
.byte 197,148,94,192 // vdivps %ymm0,%ymm13,%ymm0
.byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
.byte 196,98,125,24,48 // vbroadcastss (%rax),%ymm14
.byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
.byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
.byte 197,252,92,241 // vsubps %ymm1,%ymm0,%ymm6
- .byte 196,98,125,24,61,62,14,2,0 // vbroadcastss 0x20e3e(%rip),%ymm15 # 2b908 <_sk_overlay_sse2_8bit+0x4ec>
+ .byte 196,98,125,24,61,250,23,2,0 // vbroadcastss 0x217fa(%rip),%ymm15 # 2c2c4 <_sk_overlay_sse2_8bit+0x4ec>
.byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
- .byte 196,226,125,24,29,52,14,2,0 // vbroadcastss 0x20e34(%rip),%ymm3 # 2b90c <_sk_overlay_sse2_8bit+0x4f0>
+ .byte 196,226,125,24,29,240,23,2,0 // vbroadcastss 0x217f0(%rip),%ymm3 # 2c2c8 <_sk_overlay_sse2_8bit+0x4f0>
.byte 197,204,89,203 // vmulps %ymm3,%ymm6,%ymm1
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
- .byte 196,226,125,24,21,39,14,2,0 // vbroadcastss 0x20e27(%rip),%ymm2 # 2b910 <_sk_overlay_sse2_8bit+0x4f4>
+ .byte 196,226,125,24,21,227,23,2,0 // vbroadcastss 0x217e3(%rip),%ymm2 # 2c2cc <_sk_overlay_sse2_8bit+0x4f4>
.byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0
- .byte 196,226,125,24,53,30,14,2,0 // vbroadcastss 0x20e1e(%rip),%ymm6 # 2b914 <_sk_overlay_sse2_8bit+0x4f8>
+ .byte 196,226,125,24,53,218,23,2,0 // vbroadcastss 0x217da(%rip),%ymm6 # 2c2d0 <_sk_overlay_sse2_8bit+0x4f8>
.byte 197,204,94,192 // vdivps %ymm0,%ymm6,%ymm0
.byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
@@ -19906,7 +19906,7 @@ _sk_gamma_avx:
.byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
.byte 197,204,94,210 // vdivps %ymm2,%ymm6,%ymm2
.byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,97,13,2,0 // vbroadcastss 0x20d61(%rip),%ymm2 # 2b918 <_sk_overlay_sse2_8bit+0x4fc>
+ .byte 196,226,125,24,21,29,23,2,0 // vbroadcastss 0x2171d(%rip),%ymm2 # 2c2d4 <_sk_overlay_sse2_8bit+0x4fc>
.byte 197,236,89,92,36,128 // vmulps -0x80(%rsp),%ymm2,%ymm3
.byte 197,252,89,226 // vmulps %ymm2,%ymm0,%ymm4
.byte 197,244,89,210 // vmulps %ymm2,%ymm1,%ymm2
@@ -19926,31 +19926,31 @@ HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,29,13,2,0 // vbroadcastss 0x20d1d(%rip),%ymm8 # 2b91c <_sk_overlay_sse2_8bit+0x500>
+ .byte 196,98,125,24,5,217,22,2,0 // vbroadcastss 0x216d9(%rip),%ymm8 # 2c2d8 <_sk_overlay_sse2_8bit+0x500>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,123,12,2,0 // vbroadcastss 0x20c7b(%rip),%ymm8 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,55,22,2,0 // vbroadcastss 0x21637(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,5,13,2,0 // vbroadcastss 0x20d05(%rip),%ymm9 # 2b920 <_sk_overlay_sse2_8bit+0x504>
+ .byte 196,98,125,24,13,193,22,2,0 // vbroadcastss 0x216c1(%rip),%ymm9 # 2c2dc <_sk_overlay_sse2_8bit+0x504>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,241,12,2,0 // vbroadcastss 0x20cf1(%rip),%ymm8 # 2b924 <_sk_overlay_sse2_8bit+0x508>
+ .byte 196,98,125,24,5,173,22,2,0 // vbroadcastss 0x216ad(%rip),%ymm8 # 2c2e0 <_sk_overlay_sse2_8bit+0x508>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,231,12,2,0 // vbroadcastss 0x20ce7(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x50c>
+ .byte 196,98,125,24,5,163,22,2,0 // vbroadcastss 0x216a3(%rip),%ymm8 # 2c2e4 <_sk_overlay_sse2_8bit+0x50c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,221,12,2,0 // vbroadcastss 0x20cdd(%rip),%ymm8 # 2b92c <_sk_overlay_sse2_8bit+0x510>
+ .byte 196,98,125,24,5,153,22,2,0 // vbroadcastss 0x21699(%rip),%ymm8 # 2c2e8 <_sk_overlay_sse2_8bit+0x510>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,207,12,2,0 // vbroadcastss 0x20ccf(%rip),%ymm8 # 2b930 <_sk_overlay_sse2_8bit+0x514>
+ .byte 196,98,125,24,5,139,22,2,0 // vbroadcastss 0x2168b(%rip),%ymm8 # 2c2ec <_sk_overlay_sse2_8bit+0x514>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,184,12,2,0 // vbroadcastss 0x20cb8(%rip),%ymm9 # 2b934 <_sk_overlay_sse2_8bit+0x518>
+ .byte 196,98,125,24,13,116,22,2,0 // vbroadcastss 0x21674(%rip),%ymm9 # 2c2f0 <_sk_overlay_sse2_8bit+0x518>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,173,12,2,0 // vbroadcastss 0x20cad(%rip),%ymm11 # 2b938 <_sk_overlay_sse2_8bit+0x51c>
+ .byte 196,98,125,24,29,105,22,2,0 // vbroadcastss 0x21669(%rip),%ymm11 # 2c2f4 <_sk_overlay_sse2_8bit+0x51c>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,163,12,2,0 // vbroadcastss 0x20ca3(%rip),%ymm12 # 2b93c <_sk_overlay_sse2_8bit+0x520>
+ .byte 196,98,125,24,37,95,22,2,0 // vbroadcastss 0x2165f(%rip),%ymm12 # 2c2f8 <_sk_overlay_sse2_8bit+0x520>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -19965,9 +19965,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,89,12,2,0 // vbroadcastss 0x20c59(%rip),%ymm0 # 2b940 <_sk_overlay_sse2_8bit+0x524>
+ .byte 196,226,125,24,5,21,22,2,0 // vbroadcastss 0x21615(%rip),%ymm0 # 2c2fc <_sk_overlay_sse2_8bit+0x524>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,80,12,2,0 // vbroadcastss 0x20c50(%rip),%ymm8 # 2b944 <_sk_overlay_sse2_8bit+0x528>
+ .byte 196,98,125,24,5,12,22,2,0 // vbroadcastss 0x2160c(%rip),%ymm8 # 2c300 <_sk_overlay_sse2_8bit+0x528>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19985,13 +19985,13 @@ _sk_load_a8_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,66 // jne ad57 <_sk_load_a8_avx+0x5a>
.byte 196,130,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm0
- .byte 197,249,219,5,45,21,2,0 // vpand 0x2152d(%rip),%xmm0,%xmm0 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,249,219,5,109,31,2,0 // vpand 0x21f6d(%rip),%xmm0,%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,141,11,2,0 // vbroadcastss 0x20b8d(%rip),%ymm1 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,73,21,2,0 // vbroadcastss 0x21549(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -20065,13 +20065,13 @@ _sk_load_a8_dst_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,66 // jne ae66 <_sk_load_a8_dst_avx+0x5a>
.byte 196,130,121,48,36,24 // vpmovzxbw (%r8,%r11,1),%xmm4
- .byte 197,217,219,37,30,20,2,0 // vpand 0x2141e(%rip),%xmm4,%xmm4 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,217,219,37,94,30,2,0 // vpand 0x21e5e(%rip),%xmm4,%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,126,10,2,0 // vbroadcastss 0x20a7e(%rip),%ymm5 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,45,58,20,2,0 // vbroadcastss 0x2143a(%rip),%ymm5 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -20179,7 +20179,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,229,8,2,0 // vbroadcastss 0x208e5(%rip),%ymm1 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,161,18,2,0 // vbroadcastss 0x212a1(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -20201,7 +20201,7 @@ _sk_store_a8_avx:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,102,8,2,0 // vbroadcastss 0x20866(%rip),%ymm8 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,34,18,2,0 // vbroadcastss 0x21222(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -20226,13 +20226,13 @@ _sk_store_a8_avx:
.byte 196,3,121,20,4,24,0 // vpextrb $0x0,%xmm8,(%r8,%r11,1)
.byte 235,202 // jmp b047 <_sk_store_a8_avx+0x41>
.byte 196,3,121,20,68,24,2,4 // vpextrb $0x4,%xmm8,0x2(%r8,%r11,1)
- .byte 196,98,57,0,5,210,17,2,0 // vpshufb 0x211d2(%rip),%xmm8,%xmm8 # 2c260 <_sk_overlay_sse2_8bit+0xe44>
+ .byte 196,98,57,0,5,18,28,2,0 // vpshufb 0x21c12(%rip),%xmm8,%xmm8 # 2cca0 <_sk_overlay_sse2_8bit+0xec8>
.byte 196,3,121,21,4,24,0 // vpextrw $0x0,%xmm8,(%r8,%r11,1)
.byte 235,176 // jmp b047 <_sk_store_a8_avx+0x41>
.byte 196,3,121,20,68,24,6,12 // vpextrb $0xc,%xmm8,0x6(%r8,%r11,1)
.byte 196,3,121,20,68,24,5,10 // vpextrb $0xa,%xmm8,0x5(%r8,%r11,1)
.byte 196,3,121,20,68,24,4,8 // vpextrb $0x8,%xmm8,0x4(%r8,%r11,1)
- .byte 196,98,57,0,5,184,17,2,0 // vpshufb 0x211b8(%rip),%xmm8,%xmm8 # 2c270 <_sk_overlay_sse2_8bit+0xe54>
+ .byte 196,98,57,0,5,248,27,2,0 // vpshufb 0x21bf8(%rip),%xmm8,%xmm8 # 2ccb0 <_sk_overlay_sse2_8bit+0xed8>
.byte 196,1,121,126,4,24 // vmovd %xmm8,(%r8,%r11,1)
.byte 235,135 // jmp b047 <_sk_store_a8_avx+0x41>
.byte 180,255 // mov $0xff,%ah
@@ -20268,16 +20268,16 @@ _sk_load_g8_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,71 // jne b13b <_sk_load_g8_avx+0x5f>
.byte 196,130,121,48,4,24 // vpmovzxbw (%r8,%r11,1),%xmm0
- .byte 197,249,219,5,78,17,2,0 // vpand 0x2114e(%rip),%xmm0,%xmm0 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,249,219,5,142,27,2,0 // vpand 0x21b8e(%rip),%xmm0,%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,174,7,2,0 // vbroadcastss 0x207ae(%rip),%ymm1 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,106,17,2,0 // vbroadcastss 0x2116a(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,43,7,2,0 // vbroadcastss 0x2072b(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,231,16,2,0 // vbroadcastss 0x210e7(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -20348,16 +20348,16 @@ _sk_load_g8_dst_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,71 // jne b24f <_sk_load_g8_dst_avx+0x5f>
.byte 196,130,121,48,36,24 // vpmovzxbw (%r8,%r11,1),%xmm4
- .byte 197,217,219,37,58,16,2,0 // vpand 0x2103a(%rip),%xmm4,%xmm4 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 197,217,219,37,122,26,2,0 // vpand 0x21a7a(%rip),%xmm4,%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,154,6,2,0 // vbroadcastss 0x2069a(%rip),%ymm5 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,45,86,16,2,0 // vbroadcastss 0x21056(%rip),%ymm5 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,23,6,2,0 // vbroadcastss 0x20617(%rip),%ymm7 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,61,211,15,2,0 // vbroadcastss 0x20fd3(%rip),%ymm7 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 255,224 // jmpq *%rax
@@ -20463,10 +20463,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,201 // vpmovzxbd %xmm1,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,249,4,2,0 // vbroadcastss 0x204f9(%rip),%ymm1 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,226,125,24,13,181,14,2,0 // vbroadcastss 0x20eb5(%rip),%ymm1 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,118,4,2,0 // vbroadcastss 0x20476(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,50,14,2,0 // vbroadcastss 0x20e32(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -20493,23 +20493,23 @@ _sk_load_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,156,4,2,0 // vbroadcastss 0x2049c(%rip),%ymm0 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,24,5,88,14,2,0 // vbroadcastss 0x20e58(%rip),%ymm0 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,143,4,2,0 // vbroadcastss 0x2048f(%rip),%ymm1 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,13,75,14,2,0 // vbroadcastss 0x20e4b(%rip),%ymm1 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,134,4,2,0 // vbroadcastss 0x20486(%rip),%ymm1 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,24,13,66,14,2,0 // vbroadcastss 0x20e42(%rip),%ymm1 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,121,4,2,0 // vbroadcastss 0x20479(%rip),%ymm3 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,29,53,14,2,0 // vbroadcastss 0x20e35(%rip),%ymm3 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,112,4,2,0 // vbroadcastss 0x20470(%rip),%ymm3 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,24,29,44,14,2,0 // vbroadcastss 0x20e2c(%rip),%ymm3 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,99,4,2,0 // vbroadcastss 0x20463(%rip),%ymm3 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,29,31,14,2,0 // vbroadcastss 0x20e1f(%rip),%ymm3 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,200,3,2,0 // vbroadcastss 0x203c8(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,132,13,2,0 // vbroadcastss 0x20d84(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
@@ -20575,23 +20575,23 @@ _sk_load_565_dst_avx:
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- .byte 196,226,125,24,37,91,3,2,0 // vbroadcastss 0x2035b(%rip),%ymm4 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,24,37,23,13,2,0 // vbroadcastss 0x20d17(%rip),%ymm4 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,78,3,2,0 // vbroadcastss 0x2034e(%rip),%ymm5 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,45,10,13,2,0 // vbroadcastss 0x20d0a(%rip),%ymm5 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,69,3,2,0 // vbroadcastss 0x20345(%rip),%ymm5 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,24,45,1,13,2,0 // vbroadcastss 0x20d01(%rip),%ymm5 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,56,3,2,0 // vbroadcastss 0x20338(%rip),%ymm7 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,61,244,12,2,0 // vbroadcastss 0x20cf4(%rip),%ymm7 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,24,61,47,3,2,0 // vbroadcastss 0x2032f(%rip),%ymm7 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,24,61,235,12,2,0 // vbroadcastss 0x20ceb(%rip),%ymm7 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,34,3,2,0 // vbroadcastss 0x20322(%rip),%ymm7 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,61,222,12,2,0 // vbroadcastss 0x20cde(%rip),%ymm7 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,135,2,2,0 // vbroadcastss 0x20287(%rip),%ymm7 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,61,67,12,2,0 // vbroadcastss 0x20c43(%rip),%ymm7 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
@@ -20693,23 +20693,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,130,1,2,0 // vbroadcastss 0x20182(%rip),%ymm0 # 2b8d4 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 196,226,125,24,5,62,11,2,0 // vbroadcastss 0x20b3e(%rip),%ymm0 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,117,1,2,0 // vbroadcastss 0x20175(%rip),%ymm1 # 2b8d8 <_sk_overlay_sse2_8bit+0x4bc>
+ .byte 196,226,125,24,13,49,11,2,0 // vbroadcastss 0x20b31(%rip),%ymm1 # 2c294 <_sk_overlay_sse2_8bit+0x4bc>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,108,1,2,0 // vbroadcastss 0x2016c(%rip),%ymm1 # 2b8dc <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,226,125,24,13,40,11,2,0 // vbroadcastss 0x20b28(%rip),%ymm1 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,95,1,2,0 // vbroadcastss 0x2015f(%rip),%ymm3 # 2b8e0 <_sk_overlay_sse2_8bit+0x4c4>
+ .byte 196,226,125,24,29,27,11,2,0 // vbroadcastss 0x20b1b(%rip),%ymm3 # 2c29c <_sk_overlay_sse2_8bit+0x4c4>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,86,1,2,0 // vbroadcastss 0x20156(%rip),%ymm3 # 2b8e4 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 196,226,125,24,29,18,11,2,0 // vbroadcastss 0x20b12(%rip),%ymm3 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,73,1,2,0 // vbroadcastss 0x20149(%rip),%ymm3 # 2b8e8 <_sk_overlay_sse2_8bit+0x4cc>
+ .byte 196,226,125,24,29,5,11,2,0 // vbroadcastss 0x20b05(%rip),%ymm3 # 2c2a4 <_sk_overlay_sse2_8bit+0x4cc>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,174,0,2,0 // vbroadcastss 0x200ae(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,106,10,2,0 // vbroadcastss 0x20a6a(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
.byte 65,94 // pop %r14
@@ -20728,14 +20728,14 @@ _sk_store_565_avx:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,113,1,2,0 // vbroadcastss 0x20171(%rip),%ymm8 # 2b948 <_sk_overlay_sse2_8bit+0x52c>
+ .byte 196,98,125,24,5,45,11,2,0 // vbroadcastss 0x20b2d(%rip),%ymm8 # 2c304 <_sk_overlay_sse2_8bit+0x52c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,74,1,2,0 // vbroadcastss 0x2014a(%rip),%ymm10 # 2b94c <_sk_overlay_sse2_8bit+0x530>
+ .byte 196,98,125,24,21,6,11,2,0 // vbroadcastss 0x20b06(%rip),%ymm10 # 2c308 <_sk_overlay_sse2_8bit+0x530>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -20816,25 +20816,25 @@ _sk_load_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,67,0,2,0 // vbroadcastss 0x20043(%rip),%ymm0 # 2b950 <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,24,5,255,9,2,0 // vbroadcastss 0x209ff(%rip),%ymm0 # 2c30c <_sk_overlay_sse2_8bit+0x534>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,54,0,2,0 // vbroadcastss 0x20036(%rip),%ymm1 # 2b954 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,13,242,9,2,0 // vbroadcastss 0x209f2(%rip),%ymm1 # 2c310 <_sk_overlay_sse2_8bit+0x538>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,45,0,2,0 // vbroadcastss 0x2002d(%rip),%ymm1 # 2b958 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,24,13,233,9,2,0 // vbroadcastss 0x209e9(%rip),%ymm1 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,32,0,2,0 // vbroadcastss 0x20020(%rip),%ymm2 # 2b95c <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,21,220,9,2,0 // vbroadcastss 0x209dc(%rip),%ymm2 # 2c318 <_sk_overlay_sse2_8bit+0x540>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,23,0,2,0 // vbroadcastss 0x20017(%rip),%ymm2 # 2b960 <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,24,21,211,9,2,0 // vbroadcastss 0x209d3(%rip),%ymm2 # 2c31c <_sk_overlay_sse2_8bit+0x544>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,10,0,2,0 // vbroadcastss 0x2000a(%rip),%ymm8 # 2b964 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,198,9,2,0 // vbroadcastss 0x209c6(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,0,0,2,0 // vbroadcastss 0x20000(%rip),%ymm8 # 2b968 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,24,5,188,9,2,0 // vbroadcastss 0x209bc(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,242,255,1,0 // vbroadcastss 0x1fff2(%rip),%ymm8 # 2b96c <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,174,9,2,0 // vbroadcastss 0x209ae(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -20903,25 +20903,25 @@ _sk_load_4444_dst_avx:
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- .byte 196,226,125,24,37,235,254,1,0 // vbroadcastss 0x1feeb(%rip),%ymm4 # 2b950 <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,24,37,167,8,2,0 // vbroadcastss 0x208a7(%rip),%ymm4 # 2c30c <_sk_overlay_sse2_8bit+0x534>
.byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,222,254,1,0 // vbroadcastss 0x1fede(%rip),%ymm5 # 2b954 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,45,154,8,2,0 // vbroadcastss 0x2089a(%rip),%ymm5 # 2c310 <_sk_overlay_sse2_8bit+0x538>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,213,254,1,0 // vbroadcastss 0x1fed5(%rip),%ymm5 # 2b958 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,24,45,145,8,2,0 // vbroadcastss 0x20891(%rip),%ymm5 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
.byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,200,254,1,0 // vbroadcastss 0x1fec8(%rip),%ymm6 # 2b95c <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,53,132,8,2,0 // vbroadcastss 0x20884(%rip),%ymm6 # 2c318 <_sk_overlay_sse2_8bit+0x540>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,24,53,191,254,1,0 // vbroadcastss 0x1febf(%rip),%ymm6 # 2b960 <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,24,53,123,8,2,0 // vbroadcastss 0x2087b(%rip),%ymm6 # 2c31c <_sk_overlay_sse2_8bit+0x544>
.byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,178,254,1,0 // vbroadcastss 0x1feb2(%rip),%ymm8 # 2b964 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,110,8,2,0 // vbroadcastss 0x2086e(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,24,5,168,254,1,0 // vbroadcastss 0x1fea8(%rip),%ymm8 # 2b968 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,24,5,100,8,2,0 // vbroadcastss 0x20864(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
.byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,154,254,1,0 // vbroadcastss 0x1fe9a(%rip),%ymm8 # 2b96c <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,86,8,2,0 // vbroadcastss 0x20856(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21025,25 +21025,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,250,252,1,0 // vbroadcastss 0x1fcfa(%rip),%ymm0 # 2b950 <_sk_overlay_sse2_8bit+0x534>
+ .byte 196,226,125,24,5,182,6,2,0 // vbroadcastss 0x206b6(%rip),%ymm0 # 2c30c <_sk_overlay_sse2_8bit+0x534>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,237,252,1,0 // vbroadcastss 0x1fced(%rip),%ymm1 # 2b954 <_sk_overlay_sse2_8bit+0x538>
+ .byte 196,226,125,24,13,169,6,2,0 // vbroadcastss 0x206a9(%rip),%ymm1 # 2c310 <_sk_overlay_sse2_8bit+0x538>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,228,252,1,0 // vbroadcastss 0x1fce4(%rip),%ymm1 # 2b958 <_sk_overlay_sse2_8bit+0x53c>
+ .byte 196,226,125,24,13,160,6,2,0 // vbroadcastss 0x206a0(%rip),%ymm1 # 2c314 <_sk_overlay_sse2_8bit+0x53c>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,215,252,1,0 // vbroadcastss 0x1fcd7(%rip),%ymm2 # 2b95c <_sk_overlay_sse2_8bit+0x540>
+ .byte 196,226,125,24,21,147,6,2,0 // vbroadcastss 0x20693(%rip),%ymm2 # 2c318 <_sk_overlay_sse2_8bit+0x540>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,206,252,1,0 // vbroadcastss 0x1fcce(%rip),%ymm2 # 2b960 <_sk_overlay_sse2_8bit+0x544>
+ .byte 196,226,125,24,21,138,6,2,0 // vbroadcastss 0x2068a(%rip),%ymm2 # 2c31c <_sk_overlay_sse2_8bit+0x544>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,193,252,1,0 // vbroadcastss 0x1fcc1(%rip),%ymm8 # 2b964 <_sk_overlay_sse2_8bit+0x548>
+ .byte 196,98,125,24,5,125,6,2,0 // vbroadcastss 0x2067d(%rip),%ymm8 # 2c320 <_sk_overlay_sse2_8bit+0x548>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,183,252,1,0 // vbroadcastss 0x1fcb7(%rip),%ymm8 # 2b968 <_sk_overlay_sse2_8bit+0x54c>
+ .byte 196,98,125,24,5,115,6,2,0 // vbroadcastss 0x20673(%rip),%ymm8 # 2c324 <_sk_overlay_sse2_8bit+0x54c>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,169,252,1,0 // vbroadcastss 0x1fca9(%rip),%ymm8 # 2b96c <_sk_overlay_sse2_8bit+0x550>
+ .byte 196,98,125,24,5,101,6,2,0 // vbroadcastss 0x20665(%rip),%ymm8 # 2c328 <_sk_overlay_sse2_8bit+0x550>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -21064,7 +21064,7 @@ _sk_store_4444_avx:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,125,252,1,0 // vbroadcastss 0x1fc7d(%rip),%ymm8 # 2b970 <_sk_overlay_sse2_8bit+0x554>
+ .byte 196,98,125,24,5,57,6,2,0 // vbroadcastss 0x20639(%rip),%ymm8 # 2c32c <_sk_overlay_sse2_8bit+0x554>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -21154,10 +21154,10 @@ _sk_load_8888_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 15,133,135,0,0,0 // jne beaf <_sk_load_8888_avx+0xa7>
.byte 196,1,125,16,12,152 // vmovupd (%r8,%r11,4),%ymm9
- .byte 197,125,40,21,106,255,1,0 // vmovapd 0x1ff6a(%rip),%ymm10 # 2bda0 <_sk_overlay_sse2_8bit+0x984>
+ .byte 197,125,40,21,42,9,2,0 // vmovapd 0x2092a(%rip),%ymm10 # 2c760 <_sk_overlay_sse2_8bit+0x988>
.byte 196,193,53,84,194 // vandpd %ymm10,%ymm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,136,250,1,0 // vbroadcastss 0x1fa88(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,68,4,2,0 // vbroadcastss 0x20444(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -21249,10 +21249,10 @@ _sk_load_8888_dst_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 15,133,135,0,0,0 // jne c027 <_sk_load_8888_dst_avx+0xa7>
.byte 196,1,125,16,12,152 // vmovupd (%r8,%r11,4),%ymm9
- .byte 197,125,40,21,18,254,1,0 // vmovapd 0x1fe12(%rip),%ymm10 # 2bdc0 <_sk_overlay_sse2_8bit+0x9a4>
+ .byte 197,125,40,21,210,7,2,0 // vmovapd 0x207d2(%rip),%ymm10 # 2c780 <_sk_overlay_sse2_8bit+0x9a8>
.byte 196,193,53,84,226 // vandpd %ymm10,%ymm9,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,16,249,1,0 // vbroadcastss 0x1f910(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,204,2,2,0 // vbroadcastss 0x202cc(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -21371,10 +21371,10 @@ _sk_gather_8888_avx:
.byte 196,131,121,34,4,152,2 // vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
.byte 196,131,121,34,28,144,3 // vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,54,252,1,0 // vmovaps 0x1fc36(%rip),%ymm10 # 2bde0 <_sk_overlay_sse2_8bit+0x9c4>
+ .byte 197,124,40,21,246,5,2,0 // vmovaps 0x205f6(%rip),%ymm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x9c8>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,20,247,1,0 // vbroadcastss 0x1f714(%rip),%ymm9 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,13,208,0,2,0 // vbroadcastss 0x200d0(%rip),%ymm9 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -21411,7 +21411,7 @@ _sk_store_8888_avx:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,68,246,1,0 // vbroadcastss 0x1f644(%rip),%ymm8 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,0,0,2,0 // vbroadcastss 0x20000(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -21499,10 +21499,10 @@ _sk_load_bgra_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 15,133,135,0,0,0 // jne c403 <_sk_load_bgra_avx+0xa7>
.byte 196,1,125,16,12,152 // vmovupd (%r8,%r11,4),%ymm9
- .byte 197,125,40,21,118,250,1,0 // vmovapd 0x1fa76(%rip),%ymm10 # 2be00 <_sk_overlay_sse2_8bit+0x9e4>
+ .byte 197,125,40,21,54,4,2,0 // vmovapd 0x20436(%rip),%ymm10 # 2c7c0 <_sk_overlay_sse2_8bit+0x9e8>
.byte 196,193,53,84,202 // vandpd %ymm10,%ymm9,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,98,125,24,5,52,245,1,0 // vbroadcastss 0x1f534(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,240,254,1,0 // vbroadcastss 0x1fef0(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -21594,10 +21594,10 @@ _sk_load_bgra_dst_avx:
.byte 72,133,255 // test %rdi,%rdi
.byte 15,133,135,0,0,0 // jne c57b <_sk_load_bgra_dst_avx+0xa7>
.byte 196,1,125,16,12,152 // vmovupd (%r8,%r11,4),%ymm9
- .byte 197,125,40,21,30,249,1,0 // vmovapd 0x1f91e(%rip),%ymm10 # 2be20 <_sk_overlay_sse2_8bit+0xa04>
+ .byte 197,125,40,21,222,2,2,0 // vmovapd 0x202de(%rip),%ymm10 # 2c7e0 <_sk_overlay_sse2_8bit+0xa08>
.byte 196,193,53,84,234 // vandpd %ymm10,%ymm9,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,98,125,24,5,188,243,1,0 // vbroadcastss 0x1f3bc(%rip),%ymm8 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,5,120,253,1,0 // vbroadcastss 0x1fd78(%rip),%ymm8 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -21716,10 +21716,10 @@ _sk_gather_bgra_avx:
.byte 196,131,121,34,4,152,2 // vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
.byte 196,131,121,34,28,144,3 // vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,13,66,247,1,0 // vmovaps 0x1f742(%rip),%ymm9 # 2be40 <_sk_overlay_sse2_8bit+0xa24>
+ .byte 197,124,40,13,2,1,2,0 // vmovaps 0x20102(%rip),%ymm9 # 2c800 <_sk_overlay_sse2_8bit+0xa28>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,192,241,1,0 // vbroadcastss 0x1f1c0(%rip),%ymm10 # 2b8d0 <_sk_overlay_sse2_8bit+0x4b4>
+ .byte 196,98,125,24,21,124,251,1,0 // vbroadcastss 0x1fb7c(%rip),%ymm10 # 2c28c <_sk_overlay_sse2_8bit+0x4b4>
.byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2
.byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
@@ -21756,7 +21756,7 @@ _sk_store_bgra_avx:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 196,98,125,24,5,240,240,1,0 // vbroadcastss 0x1f0f0(%rip),%ymm8 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 196,98,125,24,5,172,250,1,0 // vbroadcastss 0x1faac(%rip),%ymm8 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -21865,13 +21865,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,143,240,1,0 // vbroadcastss 0x1f08f(%rip),%ymm12 # 2b9d8 <_sk_overlay_sse2_8bit+0x5bc>
+ .byte 196,98,125,24,37,75,250,1,0 // vbroadcastss 0x1fa4b(%rip),%ymm12 # 2c394 <_sk_overlay_sse2_8bit+0x5bc>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,83,240,1,0 // vbroadcastss 0x1f053(%rip),%xmm11 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,121,24,29,15,250,1,0 // vbroadcastss 0x1fa0f(%rip),%xmm11 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,109,240,1,0 // vbroadcastss 0x1f06d(%rip),%xmm13 # 2b9dc <_sk_overlay_sse2_8bit+0x5c0>
+ .byte 196,98,121,24,45,41,250,1,0 // vbroadcastss 0x1fa29(%rip),%xmm13 # 2c398 <_sk_overlay_sse2_8bit+0x5c0>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -21885,7 +21885,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,35,240,1,0 // vbroadcastss 0x1f023(%rip),%xmm3 # 2b9e0 <_sk_overlay_sse2_8bit+0x5c4>
+ .byte 196,226,121,24,29,223,249,1,0 // vbroadcastss 0x1f9df(%rip),%xmm3 # 2c39c <_sk_overlay_sse2_8bit+0x5c4>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -22037,13 +22037,13 @@ _sk_load_f16_dst_avx:
.byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- .byte 196,98,125,24,37,70,237,1,0 // vbroadcastss 0x1ed46(%rip),%ymm12 # 2b9d8 <_sk_overlay_sse2_8bit+0x5bc>
+ .byte 196,98,125,24,37,2,247,1,0 // vbroadcastss 0x1f702(%rip),%ymm12 # 2c394 <_sk_overlay_sse2_8bit+0x5bc>
.byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5
.byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4
.byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14
- .byte 196,98,121,24,29,10,237,1,0 // vbroadcastss 0x1ed0a(%rip),%xmm11 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,121,24,29,198,246,1,0 // vbroadcastss 0x1f6c6(%rip),%xmm11 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7
- .byte 196,98,121,24,45,36,237,1,0 // vbroadcastss 0x1ed24(%rip),%xmm13 # 2b9dc <_sk_overlay_sse2_8bit+0x5c0>
+ .byte 196,98,121,24,45,224,246,1,0 // vbroadcastss 0x1f6e0(%rip),%xmm13 # 2c398 <_sk_overlay_sse2_8bit+0x5c0>
.byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7
.byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -22057,7 +22057,7 @@ _sk_load_f16_dst_avx:
.byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
.byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4
.byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5
- .byte 196,226,121,24,61,218,236,1,0 // vbroadcastss 0x1ecda(%rip),%xmm7 # 2b9e0 <_sk_overlay_sse2_8bit+0x5c4>
+ .byte 196,226,121,24,61,150,246,1,0 // vbroadcastss 0x1f696(%rip),%xmm7 # 2c39c <_sk_overlay_sse2_8bit+0x5c4>
.byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5
.byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -22236,13 +22236,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,210 // vpunpckhwd %xmm2,%xmm0,%xmm2
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
- .byte 196,98,125,24,37,139,233,1,0 // vbroadcastss 0x1e98b(%rip),%ymm12 # 2b9d8 <_sk_overlay_sse2_8bit+0x5bc>
+ .byte 196,98,125,24,37,71,243,1,0 // vbroadcastss 0x1f347(%rip),%ymm12 # 2c394 <_sk_overlay_sse2_8bit+0x5bc>
.byte 196,193,124,84,212 // vandps %ymm12,%ymm0,%ymm2
.byte 197,252,87,194 // vxorps %ymm2,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,79,233,1,0 // vbroadcastss 0x1e94f(%rip),%xmm11 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,121,24,29,11,243,1,0 // vbroadcastss 0x1f30b(%rip),%xmm11 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,105,233,1,0 // vbroadcastss 0x1e969(%rip),%xmm13 # 2b9dc <_sk_overlay_sse2_8bit+0x5c0>
+ .byte 196,98,121,24,45,37,243,1,0 // vbroadcastss 0x1f325(%rip),%xmm13 # 2c398 <_sk_overlay_sse2_8bit+0x5c0>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -22256,7 +22256,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,194 // vorps %ymm2,%ymm0,%ymm0
.byte 196,227,125,25,194,1 // vextractf128 $0x1,%ymm0,%xmm2
- .byte 196,226,121,24,29,31,233,1,0 // vbroadcastss 0x1e91f(%rip),%xmm3 # 2b9e0 <_sk_overlay_sse2_8bit+0x5c4>
+ .byte 196,226,121,24,29,219,242,1,0 // vbroadcastss 0x1f2db(%rip),%xmm3 # 2c39c <_sk_overlay_sse2_8bit+0x5c4>
.byte 197,233,254,211 // vpaddd %xmm3,%xmm2,%xmm2
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
@@ -22360,12 +22360,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,8,231,1,0 // vbroadcastss 0x1e708(%rip),%ymm9 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,196,240,1,0 // vbroadcastss 0x1f0c4(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,25,231,1,0 // vbroadcastss 0x1e719(%rip),%xmm8 # 2b9e4 <_sk_overlay_sse2_8bit+0x5c8>
+ .byte 196,98,121,24,5,213,240,1,0 // vbroadcastss 0x1f0d5(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0x5c8>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -22375,7 +22375,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,224,230,1,0 // vbroadcastss 0x1e6e0(%rip),%ymm10 # 2b9e8 <_sk_overlay_sse2_8bit+0x5cc>
+ .byte 196,98,125,24,21,156,240,1,0 // vbroadcastss 0x1f09c(%rip),%ymm10 # 2c3a4 <_sk_overlay_sse2_8bit+0x5cc>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -22530,7 +22530,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,10,227,1,0 // vbroadcastss 0x1e30a(%rip),%ymm11 # 2b8ec <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,98,125,24,29,198,236,1,0 // vbroadcastss 0x1ecc6(%rip),%ymm11 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -22630,7 +22630,7 @@ _sk_load_rgb_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,21,76,225,1,0 // vbroadcastss 0x1e14c(%rip),%ymm2 # 2b8ec <_sk_overlay_sse2_8bit+0x4d0>
+ .byte 196,226,125,24,21,8,235,1,0 // vbroadcastss 0x1eb08(%rip),%ymm2 # 2c2a8 <_sk_overlay_sse2_8bit+0x4d0>
.byte 197,252,89,194 // vmulps %ymm2,%ymm0,%ymm0
.byte 197,185,109,201 // vpunpckhqdq %xmm1,%xmm8,%xmm1
.byte 197,225,113,241,8 // vpsllw $0x8,%xmm1,%xmm3
@@ -22651,7 +22651,7 @@ _sk_load_rgb_u16_be_avx:
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
.byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,88,224,1,0 // vbroadcastss 0x1e058(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,20,234,1,0 // vbroadcastss 0x1ea14(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,64 // vmovd (%r8,%rax,2),%xmm0
.byte 196,65,121,196,92,64,4,2 // vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
@@ -22727,7 +22727,7 @@ _sk_store_u16_be_avx:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
- .byte 196,98,125,24,5,24,224,1,0 // vbroadcastss 0x1e018(%rip),%ymm8 # 2b974 <_sk_overlay_sse2_8bit+0x558>
+ .byte 196,98,125,24,5,212,233,1,0 // vbroadcastss 0x1e9d4(%rip),%ymm8 # 2c330 <_sk_overlay_sse2_8bit+0x558>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -22886,7 +22886,7 @@ _sk_load_f32_avx:
.byte 255,92,255,255 // lcall *-0x1(%rdi,%rdi,8)
.byte 255,70,255 // incl -0x1(%rsi)
.byte 255 // (bad)
- .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 2900dc2c <_sk_overlay_sse2_8bit+0x28fe2810>
+ .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 2900dc2c <_sk_overlay_sse2_8bit+0x28fe1e54>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -23135,7 +23135,7 @@ _sk_mirror_x_avx:
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- .byte 197,178,89,5,131,216,1,0 // vmulss 0x1d883(%rip),%xmm9,%xmm0 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 197,178,89,5,63,226,1,0 // vmulss 0x1e23f(%rip),%xmm9,%xmm0 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
@@ -23169,7 +23169,7 @@ _sk_mirror_y_avx:
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- .byte 197,178,89,13,246,215,1,0 // vmulss 0x1d7f6(%rip),%xmm9,%xmm1 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 197,178,89,13,178,225,1,0 // vmulss 0x1e1b2(%rip),%xmm9,%xmm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
@@ -23196,7 +23196,7 @@ FUNCTION(_sk_clamp_x_1_avx)
_sk_clamp_x_1_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,144,215,1,0 // vbroadcastss 0x1d790(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,76,225,1,0 // vbroadcastss 0x1e14c(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23214,9 +23214,9 @@ HIDDEN _sk_mirror_x_1_avx
.globl _sk_mirror_x_1_avx
FUNCTION(_sk_mirror_x_1_avx)
_sk_mirror_x_1_avx:
- .byte 196,98,125,24,5,135,215,1,0 // vbroadcastss 0x1d787(%rip),%ymm8 # 2b874 <_sk_overlay_sse2_8bit+0x458>
+ .byte 196,98,125,24,5,67,225,1,0 // vbroadcastss 0x1e143(%rip),%ymm8 # 2c230 <_sk_overlay_sse2_8bit+0x458>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,93,215,1,0 // vbroadcastss 0x1d75d(%rip),%ymm9 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,13,25,225,1,0 // vbroadcastss 0x1e119(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -23232,12 +23232,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,73,216,1,0 // vbroadcastss 0x1d849(%rip),%ymm3 # 2b978 <_sk_overlay_sse2_8bit+0x55c>
+ .byte 196,226,125,24,29,5,226,1,0 // vbroadcastss 0x1e205(%rip),%ymm3 # 2c334 <_sk_overlay_sse2_8bit+0x55c>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,64,216,1,0 // vbroadcastss 0x1d840(%rip),%ymm3 # 2b97c <_sk_overlay_sse2_8bit+0x560>
+ .byte 196,226,125,24,29,252,225,1,0 // vbroadcastss 0x1e1fc(%rip),%ymm3 # 2c338 <_sk_overlay_sse2_8bit+0x560>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,51,216,1,0 // vbroadcastss 0x1d833(%rip),%ymm1 # 2b980 <_sk_overlay_sse2_8bit+0x564>
+ .byte 196,226,125,24,13,239,225,1,0 // vbroadcastss 0x1e1ef(%rip),%ymm1 # 2c33c <_sk_overlay_sse2_8bit+0x564>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23645,18 +23645,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx
.globl _sk_gauss_a_to_rgba_avx
FUNCTION(_sk_gauss_a_to_rgba_avx)
_sk_gauss_a_to_rgba_avx:
- .byte 196,226,125,24,5,78,209,1,0 // vbroadcastss 0x1d14e(%rip),%ymm0 # 2b988 <_sk_overlay_sse2_8bit+0x56c>
+ .byte 196,226,125,24,5,10,219,1,0 // vbroadcastss 0x1db0a(%rip),%ymm0 # 2c344 <_sk_overlay_sse2_8bit+0x56c>
.byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
- .byte 196,226,125,24,13,61,209,1,0 // vbroadcastss 0x1d13d(%rip),%ymm1 # 2b984 <_sk_overlay_sse2_8bit+0x568>
+ .byte 196,226,125,24,13,249,218,1,0 // vbroadcastss 0x1daf9(%rip),%ymm1 # 2c340 <_sk_overlay_sse2_8bit+0x568>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,52,209,1,0 // vbroadcastss 0x1d134(%rip),%ymm1 # 2b98c <_sk_overlay_sse2_8bit+0x570>
+ .byte 196,226,125,24,13,240,218,1,0 // vbroadcastss 0x1daf0(%rip),%ymm1 # 2c348 <_sk_overlay_sse2_8bit+0x570>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,39,209,1,0 // vbroadcastss 0x1d127(%rip),%ymm1 # 2b990 <_sk_overlay_sse2_8bit+0x574>
+ .byte 196,226,125,24,13,227,218,1,0 // vbroadcastss 0x1dae3(%rip),%ymm1 # 2c34c <_sk_overlay_sse2_8bit+0x574>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,26,209,1,0 // vbroadcastss 0x1d11a(%rip),%ymm1 # 2b994 <_sk_overlay_sse2_8bit+0x578>
+ .byte 196,226,125,24,13,214,218,1,0 // vbroadcastss 0x1dad6(%rip),%ymm1 # 2c350 <_sk_overlay_sse2_8bit+0x578>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -23683,7 +23683,7 @@ _sk_gradient_avx:
.byte 73,255,200 // dec %r8
.byte 72,131,195,4 // add $0x4,%rbx
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
- .byte 196,98,125,24,21,155,207,1,0 // vbroadcastss 0x1cf9b(%rip),%ymm10 # 2b860 <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,125,24,21,87,217,1,0 // vbroadcastss 0x1d957(%rip),%ymm10 # 2c21c <_sk_overlay_sse2_8bit+0x444>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8
.byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8
@@ -23877,27 +23877,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,198,204,1,0 // vbroadcastss 0x1ccc6(%rip),%ymm13 # 2b998 <_sk_overlay_sse2_8bit+0x57c>
+ .byte 196,98,125,24,45,130,214,1,0 // vbroadcastss 0x1d682(%rip),%ymm13 # 2c354 <_sk_overlay_sse2_8bit+0x57c>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,188,204,1,0 // vbroadcastss 0x1ccbc(%rip),%ymm14 # 2b99c <_sk_overlay_sse2_8bit+0x580>
+ .byte 196,98,125,24,53,120,214,1,0 // vbroadcastss 0x1d678(%rip),%ymm14 # 2c358 <_sk_overlay_sse2_8bit+0x580>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,173,204,1,0 // vbroadcastss 0x1ccad(%rip),%ymm14 # 2b9a0 <_sk_overlay_sse2_8bit+0x584>
+ .byte 196,98,125,24,53,105,214,1,0 // vbroadcastss 0x1d669(%rip),%ymm14 # 2c35c <_sk_overlay_sse2_8bit+0x584>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,158,204,1,0 // vbroadcastss 0x1cc9e(%rip),%ymm13 # 2b9a4 <_sk_overlay_sse2_8bit+0x588>
+ .byte 196,98,125,24,45,90,214,1,0 // vbroadcastss 0x1d65a(%rip),%ymm13 # 2c360 <_sk_overlay_sse2_8bit+0x588>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,137,204,1,0 // vbroadcastss 0x1cc89(%rip),%ymm10 # 2b9a8 <_sk_overlay_sse2_8bit+0x58c>
+ .byte 196,98,125,24,21,69,214,1,0 // vbroadcastss 0x1d645(%rip),%ymm10 # 2c364 <_sk_overlay_sse2_8bit+0x58c>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,31,203,1,0 // vbroadcastss 0x1cb1f(%rip),%ymm10 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,21,219,212,1,0 // vbroadcastss 0x1d4db(%rip),%ymm10 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,9,203,1,0 // vbroadcastss 0x1cb09(%rip),%ymm10 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,21,197,212,1,0 // vbroadcastss 0x1d4c5(%rip),%ymm10 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -23927,7 +23927,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,255,203,1,0 // vbroadcastss 0x1cbff(%rip),%ymm11 # 2b9ac <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,29,187,213,1,0 // vbroadcastss 0x1d5bb(%rip),%ymm11 # 2c368 <_sk_overlay_sse2_8bit+0x590>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -23936,17 +23936,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,211,203,1,0 // vbroadcastss 0x1cbd3(%rip),%ymm9 # 2b9b0 <_sk_overlay_sse2_8bit+0x594>
+ .byte 196,98,125,24,13,143,213,1,0 // vbroadcastss 0x1d58f(%rip),%ymm9 # 2c36c <_sk_overlay_sse2_8bit+0x594>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,177,203,1,0 // vbroadcastss 0x1cbb1(%rip),%ymm9 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,109,213,1,0 // vbroadcastss 0x1d56d(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,66,202,1,0 // vbroadcastss 0x1ca42(%rip),%ymm11 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,254,211,1,0 // vbroadcastss 0x1d3fe(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -23966,7 +23966,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,81,203,1,0 // vbroadcastss 0x1cb51(%rip),%ymm11 # 2b9ac <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,29,13,213,1,0 // vbroadcastss 0x1d50d(%rip),%ymm11 # 2c368 <_sk_overlay_sse2_8bit+0x590>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -23975,17 +23975,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,37,203,1,0 // vbroadcastss 0x1cb25(%rip),%ymm9 # 2b9b0 <_sk_overlay_sse2_8bit+0x594>
+ .byte 196,98,125,24,13,225,212,1,0 // vbroadcastss 0x1d4e1(%rip),%ymm9 # 2c36c <_sk_overlay_sse2_8bit+0x594>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,3,203,1,0 // vbroadcastss 0x1cb03(%rip),%ymm9 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,13,191,212,1,0 // vbroadcastss 0x1d4bf(%rip),%ymm9 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,148,201,1,0 // vbroadcastss 0x1c994(%rip),%ymm11 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,29,80,211,1,0 // vbroadcastss 0x1d350(%rip),%ymm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -24004,7 +24004,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,67,121,4,201,0 // vpermilps $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,169,202,1,0 // vbroadcastss 0x1caa9(%rip),%ymm10 # 2b9ac <_sk_overlay_sse2_8bit+0x590>
+ .byte 196,98,125,24,21,101,212,1,0 // vbroadcastss 0x1d465(%rip),%ymm10 # 2c368 <_sk_overlay_sse2_8bit+0x590>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
@@ -24013,7 +24013,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,129,202,1,0 // vbroadcastss 0x1ca81(%rip),%ymm8 # 2b9b4 <_sk_overlay_sse2_8bit+0x598>
+ .byte 196,98,125,24,5,61,212,1,0 // vbroadcastss 0x1d43d(%rip),%ymm8 # 2c370 <_sk_overlay_sse2_8bit+0x598>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24054,7 +24054,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,189,200,1,0 // vbroadcastss 0x1c8bd(%rip),%ymm8 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,121,210,1,0 // vbroadcastss 0x1d279(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -24091,9 +24091,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,165,201,1,0 // vbroadcastss 0x1c9a5(%rip),%ymm0 # 2b9b8 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,5,97,211,1,0 // vbroadcastss 0x1d361(%rip),%ymm0 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,60,200,1,0 // vbroadcastss 0x1c83c(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,248,209,1,0 // vbroadcastss 0x1d1f8(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24104,7 +24104,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,28,200,1,0 // vbroadcastss 0x1c81c(%rip),%ymm0 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,5,216,209,1,0 // vbroadcastss 0x1d1d8(%rip),%ymm0 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -24116,9 +24116,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,92,201,1,0 // vbroadcastss 0x1c95c(%rip),%ymm1 # 2b9b8 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,13,24,211,1,0 // vbroadcastss 0x1d318(%rip),%ymm1 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,242,199,1,0 // vbroadcastss 0x1c7f2(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,174,209,1,0 // vbroadcastss 0x1d1ae(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24129,7 +24129,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,210,199,1,0 // vbroadcastss 0x1c7d2(%rip),%ymm1 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,226,125,24,13,142,209,1,0 // vbroadcastss 0x1d18e(%rip),%ymm1 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -24141,14 +24141,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,21,201,1,0 // vbroadcastss 0x1c915(%rip),%ymm0 # 2b9bc <_sk_overlay_sse2_8bit+0x5a0>
+ .byte 196,226,125,24,5,209,210,1,0 // vbroadcastss 0x1d2d1(%rip),%ymm0 # 2c378 <_sk_overlay_sse2_8bit+0x5a0>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,168,199,1,0 // vbroadcastss 0x1c7a8(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,100,209,1,0 // vbroadcastss 0x1d164(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,249,200,1,0 // vbroadcastss 0x1c8f9(%rip),%ymm10 # 2b9c0 <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,181,210,1,0 // vbroadcastss 0x1d2b5(%rip),%ymm10 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,247,199,1,0 // vbroadcastss 0x1c7f7(%rip),%ymm10 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,21,179,209,1,0 // vbroadcastss 0x1d1b3(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -24160,19 +24160,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,194,200,1,0 // vbroadcastss 0x1c8c2(%rip),%ymm0 # 2b9b8 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,5,126,210,1,0 // vbroadcastss 0x1d27e(%rip),%ymm0 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,89,199,1,0 // vbroadcastss 0x1c759(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,21,209,1,0 // vbroadcastss 0x1d115(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,183,200,1,0 // vbroadcastss 0x1c8b7(%rip),%ymm9 # 2b9c8 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,13,115,210,1,0 // vbroadcastss 0x1d273(%rip),%ymm9 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,165,200,1,0 // vbroadcastss 0x1c8a5(%rip),%ymm10 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,21,97,210,1,0 // vbroadcastss 0x1d261(%rip),%ymm10 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,38,199,1,0 // vbroadcastss 0x1c726(%rip),%ymm10 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,21,226,208,1,0 // vbroadcastss 0x1d0e2(%rip),%ymm10 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,135,200,1,0 // vbroadcastss 0x1c887(%rip),%ymm9 # 2b9cc <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,13,67,210,1,0 // vbroadcastss 0x1d243(%rip),%ymm9 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24183,17 +24183,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,247,198,1,0 // vbroadcastss 0x1c6f7(%rip),%ymm8 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,179,208,1,0 // vbroadcastss 0x1d0b3(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,85,200,1,0 // vbroadcastss 0x1c855(%rip),%ymm10 # 2b9c8 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,21,17,210,1,0 // vbroadcastss 0x1d211(%rip),%ymm10 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,67,200,1,0 // vbroadcastss 0x1c843(%rip),%ymm11 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,29,255,209,1,0 // vbroadcastss 0x1d1ff(%rip),%ymm11 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,46,200,1,0 // vbroadcastss 0x1c82e(%rip),%ymm9 # 2b9cc <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,13,234,209,1,0 // vbroadcastss 0x1d1ea(%rip),%ymm9 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24204,13 +24204,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,10,200,1,0 // vbroadcastss 0x1c80a(%rip),%ymm0 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,226,125,24,5,198,209,1,0 // vbroadcastss 0x1d1c6(%rip),%ymm0 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,239,199,1,0 // vbroadcastss 0x1c7ef(%rip),%ymm10 # 2b9c0 <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,171,209,1,0 // vbroadcastss 0x1d1ab(%rip),%ymm10 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,237,198,1,0 // vbroadcastss 0x1c6ed(%rip),%ymm10 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,21,169,208,1,0 // vbroadcastss 0x1d0a9(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -24222,14 +24222,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,188,199,1,0 // vbroadcastss 0x1c7bc(%rip),%ymm1 # 2b9bc <_sk_overlay_sse2_8bit+0x5a0>
+ .byte 196,226,125,24,13,120,209,1,0 // vbroadcastss 0x1d178(%rip),%ymm1 # 2c378 <_sk_overlay_sse2_8bit+0x5a0>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,78,198,1,0 // vbroadcastss 0x1c64e(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,10,208,1,0 // vbroadcastss 0x1d00a(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,159,199,1,0 // vbroadcastss 0x1c79f(%rip),%ymm10 # 2b9c0 <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,91,209,1,0 // vbroadcastss 0x1d15b(%rip),%ymm10 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,157,198,1,0 // vbroadcastss 0x1c69d(%rip),%ymm10 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,21,89,208,1,0 // vbroadcastss 0x1d059(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -24241,19 +24241,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,104,199,1,0 // vbroadcastss 0x1c768(%rip),%ymm1 # 2b9b8 <_sk_overlay_sse2_8bit+0x59c>
+ .byte 196,226,125,24,13,36,209,1,0 // vbroadcastss 0x1d124(%rip),%ymm1 # 2c374 <_sk_overlay_sse2_8bit+0x59c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,254,197,1,0 // vbroadcastss 0x1c5fe(%rip),%ymm8 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,98,125,24,5,186,207,1,0 // vbroadcastss 0x1cfba(%rip),%ymm8 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,92,199,1,0 // vbroadcastss 0x1c75c(%rip),%ymm9 # 2b9c8 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,13,24,209,1,0 // vbroadcastss 0x1d118(%rip),%ymm9 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,74,199,1,0 // vbroadcastss 0x1c74a(%rip),%ymm10 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,21,6,209,1,0 // vbroadcastss 0x1d106(%rip),%ymm10 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,203,197,1,0 // vbroadcastss 0x1c5cb(%rip),%ymm10 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,21,135,207,1,0 // vbroadcastss 0x1cf87(%rip),%ymm10 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,44,199,1,0 // vbroadcastss 0x1c72c(%rip),%ymm9 # 2b9cc <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,13,232,208,1,0 // vbroadcastss 0x1d0e8(%rip),%ymm9 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24264,17 +24264,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,156,197,1,0 // vbroadcastss 0x1c59c(%rip),%ymm8 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 196,98,125,24,5,88,207,1,0 // vbroadcastss 0x1cf58(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,249,198,1,0 // vbroadcastss 0x1c6f9(%rip),%ymm10 # 2b9c8 <_sk_overlay_sse2_8bit+0x5ac>
+ .byte 196,98,125,24,21,181,208,1,0 // vbroadcastss 0x1d0b5(%rip),%ymm10 # 2c384 <_sk_overlay_sse2_8bit+0x5ac>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,231,198,1,0 // vbroadcastss 0x1c6e7(%rip),%ymm11 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,98,125,24,29,163,208,1,0 // vbroadcastss 0x1d0a3(%rip),%ymm11 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,210,198,1,0 // vbroadcastss 0x1c6d2(%rip),%ymm9 # 2b9cc <_sk_overlay_sse2_8bit+0x5b0>
+ .byte 196,98,125,24,13,142,208,1,0 // vbroadcastss 0x1d08e(%rip),%ymm9 # 2c388 <_sk_overlay_sse2_8bit+0x5b0>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -24285,13 +24285,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,174,198,1,0 // vbroadcastss 0x1c6ae(%rip),%ymm1 # 2b9c4 <_sk_overlay_sse2_8bit+0x5a8>
+ .byte 196,226,125,24,13,106,208,1,0 // vbroadcastss 0x1d06a(%rip),%ymm1 # 2c380 <_sk_overlay_sse2_8bit+0x5a8>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,146,198,1,0 // vbroadcastss 0x1c692(%rip),%ymm10 # 2b9c0 <_sk_overlay_sse2_8bit+0x5a4>
+ .byte 196,98,125,24,21,78,208,1,0 // vbroadcastss 0x1d04e(%rip),%ymm10 # 2c37c <_sk_overlay_sse2_8bit+0x5a4>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,144,197,1,0 // vbroadcastss 0x1c590(%rip),%ymm10 # 2b8cc <_sk_overlay_sse2_8bit+0x4b0>
+ .byte 196,98,125,24,21,76,207,1,0 // vbroadcastss 0x1cf4c(%rip),%ymm10 # 2c288 <_sk_overlay_sse2_8bit+0x4b0>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -24434,7 +24434,7 @@ _sk_clut_3D_avx:
.byte 197,249,127,68,36,224 // vmovdqa %xmm0,-0x20(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,121,254,194 // vpaddd %xmm10,%xmm0,%xmm0
- .byte 196,98,121,24,29,64,196,1,0 // vbroadcastss 0x1c440(%rip),%xmm11 # 2b9d4 <_sk_overlay_sse2_8bit+0x5b8>
+ .byte 196,98,121,24,29,252,205,1,0 // vbroadcastss 0x1cdfc(%rip),%xmm11 # 2c390 <_sk_overlay_sse2_8bit+0x5b8>
.byte 196,194,121,64,203 // vpmulld %xmm11,%xmm0,%xmm1
.byte 196,193,249,126,200 // vmovq %xmm1,%r8
.byte 69,137,193 // mov %r8d,%r9d
@@ -24468,7 +24468,7 @@ _sk_clut_3D_avx:
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,227,93,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
.byte 197,252,17,92,36,64 // vmovups %ymm3,0x40(%rsp)
- .byte 196,98,121,24,13,9,194,1,0 // vbroadcastss 0x1c209(%rip),%xmm9 # 2b860 <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,121,24,13,197,203,1,0 // vbroadcastss 0x1cbc5(%rip),%xmm9 # 2c21c <_sk_overlay_sse2_8bit+0x444>
.byte 196,193,105,254,249 // vpaddd %xmm9,%xmm2,%xmm7
.byte 196,195,249,22,248,1 // vpextrq $0x1,%xmm7,%r8
.byte 196,193,249,126,249 // vmovq %xmm7,%r9
@@ -24496,7 +24496,7 @@ _sk_clut_3D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,254,1 // vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- .byte 196,98,121,24,37,126,193,1,0 // vbroadcastss 0x1c17e(%rip),%xmm12 # 2b868 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,121,24,37,58,203,1,0 // vbroadcastss 0x1cb3a(%rip),%xmm12 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
.byte 196,193,105,254,212 // vpaddd %xmm12,%xmm2,%xmm2
.byte 196,195,249,22,208,1 // vpextrq $0x1,%xmm2,%r8
.byte 196,193,249,126,209 // vmovq %xmm2,%r9
@@ -24524,7 +24524,7 @@ _sk_clut_3D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,105,33,213,48 // vinsertps $0x30,%xmm5,%xmm2,%xmm2
.byte 196,227,109,24,225,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- .byte 196,226,125,24,13,82,194,1,0 // vbroadcastss 0x1c252(%rip),%ymm1 # 2b9d0 <_sk_overlay_sse2_8bit+0x5b4>
+ .byte 196,226,125,24,13,14,204,1,0 // vbroadcastss 0x1cc0e(%rip),%ymm1 # 2c38c <_sk_overlay_sse2_8bit+0x5b4>
.byte 197,188,88,209 // vaddps %ymm1,%ymm8,%ymm2
.byte 197,252,17,76,36,32 // vmovups %ymm1,0x20(%rsp)
.byte 197,254,91,210 // vcvttps2dq %ymm2,%ymm2
@@ -25277,7 +25277,7 @@ _sk_clut_4D_avx:
.byte 196,226,25,64,200 // vpmulld %xmm0,%xmm12,%xmm1
.byte 197,249,127,76,36,128 // vmovdqa %xmm1,-0x80(%rsp)
.byte 197,241,254,202 // vpaddd %xmm2,%xmm1,%xmm1
- .byte 196,98,121,24,61,2,179,1,0 // vbroadcastss 0x1b302(%rip),%xmm15 # 2b9d4 <_sk_overlay_sse2_8bit+0x5b8>
+ .byte 196,98,121,24,61,190,188,1,0 // vbroadcastss 0x1bcbe(%rip),%xmm15 # 2c390 <_sk_overlay_sse2_8bit+0x5b8>
.byte 196,194,113,64,247 // vpmulld %xmm15,%xmm1,%xmm6
.byte 196,193,249,126,240 // vmovq %xmm6,%r8
.byte 69,137,193 // mov %r8d,%r9d
@@ -25315,7 +25315,7 @@ _sk_clut_4D_avx:
.byte 196,163,65,33,60,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,99,53,24,247,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- .byte 196,98,121,24,21,179,176,1,0 // vbroadcastss 0x1b0b3(%rip),%xmm10 # 2b860 <_sk_overlay_sse2_8bit+0x444>
+ .byte 196,98,121,24,21,111,186,1,0 // vbroadcastss 0x1ba6f(%rip),%xmm10 # 2c21c <_sk_overlay_sse2_8bit+0x444>
.byte 196,65,97,254,202 // vpaddd %xmm10,%xmm3,%xmm9
.byte 196,67,249,22,200,1 // vpextrq $0x1,%xmm9,%r8
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -25343,7 +25343,7 @@ _sk_clut_4D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,220,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- .byte 196,98,121,24,13,40,176,1,0 // vbroadcastss 0x1b028(%rip),%xmm9 # 2b868 <_sk_overlay_sse2_8bit+0x44c>
+ .byte 196,98,121,24,13,228,185,1,0 // vbroadcastss 0x1b9e4(%rip),%xmm9 # 2c224 <_sk_overlay_sse2_8bit+0x44c>
.byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
.byte 196,195,249,22,216,1 // vpextrq $0x1,%xmm3,%r8
.byte 196,193,249,126,217 // vmovq %xmm3,%r9
@@ -25371,7 +25371,7 @@ _sk_clut_4D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,89,33,229,48 // vinsertps $0x30,%xmm5,%xmm4,%xmm4
.byte 196,227,93,24,243,1 // vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- .byte 196,226,125,24,37,252,176,1,0 // vbroadcastss 0x1b0fc(%rip),%ymm4 # 2b9d0 <_sk_overlay_sse2_8bit+0x5b4>
+ .byte 196,226,125,24,37,184,186,1,0 // vbroadcastss 0x1bab8(%rip),%ymm4 # 2c38c <_sk_overlay_sse2_8bit+0x5b4>
.byte 197,148,88,220 // vaddps %ymm4,%ymm13,%ymm3
.byte 197,252,40,252 // vmovaps %ymm4,%ymm7
.byte 197,252,17,124,36,32 // vmovups %ymm7,0x20(%rsp)
@@ -26801,7 +26801,7 @@ _sk_clut_4D_avx:
.byte 197,220,89,210 // vmulps %ymm2,%ymm4,%ymm2
.byte 197,212,88,210 // vaddps %ymm2,%ymm5,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,10,146,1,0 // vbroadcastss 0x1920a(%rip),%ymm3 # 2b85c <_sk_overlay_sse2_8bit+0x440>
+ .byte 196,226,125,24,29,198,155,1,0 // vbroadcastss 0x19bc6(%rip),%ymm3 # 2c218 <_sk_overlay_sse2_8bit+0x440>
.byte 197,252,16,164,36,32,2,0,0 // vmovups 0x220(%rsp),%ymm4
.byte 197,252,16,172,36,64,2,0,0 // vmovups 0x240(%rsp),%ymm5
.byte 197,252,16,180,36,96,2,0,0 // vmovups 0x260(%rsp),%ymm6
@@ -26881,15 +26881,15 @@ _sk_seed_shader_sse41:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,21,121,155,1,0 // movaps 0x19b79(%rip),%xmm2 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 15,40,21,185,165,1,0 // movaps 0x1a5b9(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 15,88,194 // addps %xmm2,%xmm0
- .byte 15,88,5,127,155,1,0 // addps 0x19b7f(%rip),%xmm0 # 2c2b0 <_sk_overlay_sse2_8bit+0xe94>
+ .byte 15,88,5,191,165,1,0 // addps 0x1a5bf(%rip),%xmm0 # 2ccf0 <_sk_overlay_sse2_8bit+0xf18>
.byte 102,15,110,201 // movd %ecx,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,119,155,1,0 // movaps 0x19b77(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,183,165,1,0 // movaps 0x1a5b7(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -26904,18 +26904,18 @@ _sk_dither_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 102,68,15,110,194 // movd %edx,%xmm8
.byte 102,69,15,112,200,0 // pshufd $0x0,%xmm8,%xmm9
- .byte 102,68,15,254,13,16,155,1,0 // paddd 0x19b10(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0xe64>
+ .byte 102,68,15,254,13,80,165,1,0 // paddd 0x1a550(%rip),%xmm9 # 2ccc0 <_sk_overlay_sse2_8bit+0xee8>
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,71,155,1,0 // movdqa 0x19b47(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,111,21,135,165,1,0 // movdqa 0x1a587(%rip),%xmm10 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,51,155,1,0 // movdqa 0x19b33(%rip),%xmm12 # 2c2e0 <_sk_overlay_sse2_8bit+0xec4>
- .byte 102,68,15,111,45,58,155,1,0 // movdqa 0x19b3a(%rip),%xmm13 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,68,15,111,37,115,165,1,0 // movdqa 0x1a573(%rip),%xmm12 # 2cd20 <_sk_overlay_sse2_8bit+0xf48>
+ .byte 102,68,15,111,45,122,165,1,0 // movdqa 0x1a57a(%rip),%xmm13 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -26931,8 +26931,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,245,154,1,0 // mulps 0x19af5(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xee4>
- .byte 68,15,88,5,253,154,1,0 // addps 0x19afd(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xef4>
+ .byte 68,15,89,5,53,165,1,0 // mulps 0x1a535(%rip),%xmm8 # 2cd40 <_sk_overlay_sse2_8bit+0xf68>
+ .byte 68,15,88,5,61,165,1,0 // addps 0x1a53d(%rip),%xmm8 # 2cd50 <_sk_overlay_sse2_8bit+0xf78>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -26974,7 +26974,7 @@ HIDDEN _sk_black_color_sse41
FUNCTION(_sk_black_color_sse41)
_sk_black_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,51,154,1,0 // movaps 0x19a33(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,115,164,1,0 // movaps 0x1a473(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -26985,7 +26985,7 @@ HIDDEN _sk_white_color_sse41
FUNCTION(_sk_white_color_sse41)
_sk_white_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,31,154,1,0 // movaps 0x19a1f(%rip),%xmm0 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,5,95,164,1,0 // movaps 0x1a45f(%rip),%xmm0 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -27031,7 +27031,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,207,153,1,0 // movaps 0x199cf(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,15,164,1,0 // movaps 0x1a40f(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -27056,7 +27056,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,130,153,1,0 // movaps 0x19982(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,194,163,1,0 // movaps 0x1a3c2(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -27103,7 +27103,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,22,153,1,0 // movaps 0x19916(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,86,163,1,0 // movaps 0x1a356(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -27116,7 +27116,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,246,152,1,0 // movaps 0x198f6(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,54,163,1,0 // movaps 0x1a336(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -27133,7 +27133,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,201,152,1,0 // movaps 0x198c9(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,9,163,1,0 // movaps 0x1a309(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -27153,7 +27153,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,141,152,1,0 // movaps 0x1988d(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,205,162,1,0 // movaps 0x1a2cd(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -27181,7 +27181,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,81,152,1,0 // movaps 0x19851(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,145,162,1,0 // movaps 0x1a291(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -27219,7 +27219,7 @@ HIDDEN _sk_plus__sse41
FUNCTION(_sk_plus__sse41)
_sk_plus__sse41:
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 68,15,40,5,210,151,1,0 // movaps 0x197d2(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,18,162,1,0 // movaps 0x1a212(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 65,15,93,200 // minps %xmm8,%xmm1
@@ -27261,7 +27261,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,94,151,1,0 // movaps 0x1975e(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,158,161,1,0 // movaps 0x1a19e(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -27309,7 +27309,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,185,150,1,0 // movaps 0x196b9(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,249,160,1,0 // movaps 0x1a0f9(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27343,7 +27343,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,78,150,1,0 // movaps 0x1964e(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,142,160,1,0 // movaps 0x1a08e(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27380,7 +27380,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,216,149,1,0 // movaps 0x195d8(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,24,160,1,0 // movaps 0x1a018(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27408,7 +27408,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,136,149,1,0 // movaps 0x19588(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,200,159,1,0 // movaps 0x19fc8(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27420,7 +27420,7 @@ HIDDEN _sk_colorburn_sse41
.globl _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
- .byte 68,15,40,29,111,149,1,0 // movaps 0x1956f(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,29,175,159,1,0 // movaps 0x19faf(%rip),%xmm11 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 68,15,92,231 // subps %xmm7,%xmm12
.byte 69,15,40,204 // movaps %xmm12,%xmm9
@@ -27504,7 +27504,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,57,148,1,0 // movaps 0x19439(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,21,121,158,1,0 // movaps 0x19e79(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -27586,7 +27586,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,4,147,1,0 // movaps 0x19304(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,21,68,157,1,0 // movaps 0x19d44(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -27669,7 +27669,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,217,145,1,0 // movaps 0x191d9(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,21,25,156,1,0 // movaps 0x19c19(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -27754,7 +27754,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,160,144,1,0 // movaps 0x190a0(%rip),%xmm1 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,13,224,154,1,0 // movaps 0x19ae0(%rip),%xmm1 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -27767,10 +27767,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,206,144,1,0 // movaps 0x190ce(%rip),%xmm13 # 2c320 <_sk_overlay_sse2_8bit+0xf04>
+ .byte 68,15,40,45,14,155,1,0 // movaps 0x19b0e(%rip),%xmm13 # 2cd60 <_sk_overlay_sse2_8bit+0xf88>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,206,144,1,0 // movaps 0x190ce(%rip),%xmm12 # 2c330 <_sk_overlay_sse2_8bit+0xf14>
+ .byte 68,15,40,37,14,155,1,0 // movaps 0x19b0e(%rip),%xmm12 # 2cd70 <_sk_overlay_sse2_8bit+0xf98>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -27956,12 +27956,12 @@ _sk_hue_sse41:
.byte 68,15,84,208 // andps %xmm0,%xmm10
.byte 15,84,200 // andps %xmm0,%xmm1
.byte 68,15,84,232 // andps %xmm0,%xmm13
- .byte 15,40,5,57,142,1,0 // movaps 0x18e39(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 15,40,5,121,152,1,0 // movaps 0x19879(%rip),%xmm0 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 68,15,89,224 // mulps %xmm0,%xmm12
- .byte 15,40,21,62,142,1,0 // movaps 0x18e3e(%rip),%xmm2 # 2c350 <_sk_overlay_sse2_8bit+0xf34>
+ .byte 15,40,21,126,152,1,0 // movaps 0x1987e(%rip),%xmm2 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
.byte 15,89,250 // mulps %xmm2,%xmm7
.byte 65,15,88,252 // addps %xmm12,%xmm7
- .byte 68,15,40,53,63,142,1,0 // movaps 0x18e3f(%rip),%xmm14 # 2c360 <_sk_overlay_sse2_8bit+0xf44>
+ .byte 68,15,40,53,127,152,1,0 // movaps 0x1987f(%rip),%xmm14 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
.byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,255 // addps %xmm7,%xmm15
@@ -28044,7 +28044,7 @@ _sk_hue_sse41:
.byte 65,15,88,214 // addps %xmm14,%xmm2
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,40,13,83,140,1,0 // movaps 0x18c53(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,147,150,1,0 // movaps 0x19693(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,40,225 // movaps %xmm9,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
@@ -28138,14 +28138,14 @@ _sk_saturation_sse41:
.byte 68,15,84,215 // andps %xmm7,%xmm10
.byte 68,15,84,223 // andps %xmm7,%xmm11
.byte 68,15,84,199 // andps %xmm7,%xmm8
- .byte 15,40,21,125,139,1,0 // movaps 0x18b7d(%rip),%xmm2 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 15,40,21,189,149,1,0 // movaps 0x195bd(%rip),%xmm2 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,40,13,128,139,1,0 // movaps 0x18b80(%rip),%xmm1 # 2c350 <_sk_overlay_sse2_8bit+0xf34>
+ .byte 15,40,13,192,149,1,0 // movaps 0x195c0(%rip),%xmm1 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,251 // addps %xmm3,%xmm7
- .byte 68,15,40,45,127,139,1,0 // movaps 0x18b7f(%rip),%xmm13 # 2c360 <_sk_overlay_sse2_8bit+0xf44>
+ .byte 68,15,40,45,191,149,1,0 // movaps 0x195bf(%rip),%xmm13 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 68,15,88,247 // addps %xmm7,%xmm14
.byte 65,15,40,218 // movaps %xmm10,%xmm3
@@ -28226,7 +28226,7 @@ _sk_saturation_sse41:
.byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
- .byte 68,15,40,13,149,137,1,0 // movaps 0x18995(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,213,147,1,0 // movaps 0x193d5(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 68,15,92,204 // subps %xmm4,%xmm9
.byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
@@ -28281,14 +28281,14 @@ _sk_color_sse41:
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 68,15,89,244 // mulps %xmm4,%xmm14
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 68,15,40,13,80,137,1,0 // movaps 0x18950(%rip),%xmm9 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,13,144,147,1,0 // movaps 0x19390(%rip),%xmm9 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 65,15,89,249 // mulps %xmm9,%xmm7
- .byte 68,15,40,21,80,137,1,0 // movaps 0x18950(%rip),%xmm10 # 2c350 <_sk_overlay_sse2_8bit+0xf34>
+ .byte 68,15,40,21,144,147,1,0 // movaps 0x19390(%rip),%xmm10 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
.byte 65,15,40,219 // movaps %xmm11,%xmm3
.byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,40,29,77,137,1,0 // movaps 0x1894d(%rip),%xmm11 # 2c360 <_sk_overlay_sse2_8bit+0xf44>
+ .byte 68,15,40,29,141,147,1,0 // movaps 0x1938d(%rip),%xmm11 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
@@ -28373,7 +28373,7 @@ _sk_color_sse41:
.byte 65,15,88,251 // addps %xmm11,%xmm7
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
- .byte 68,15,40,13,89,135,1,0 // movaps 0x18759(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,153,145,1,0 // movaps 0x19199(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 68,15,89,192 // mulps %xmm0,%xmm8
@@ -28425,13 +28425,13 @@ _sk_luminosity_sse41:
.byte 69,15,89,216 // mulps %xmm8,%xmm11
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,89,205 // mulps %xmm5,%xmm9
- .byte 68,15,40,5,33,135,1,0 // movaps 0x18721(%rip),%xmm8 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,5,97,145,1,0 // movaps 0x19161(%rip),%xmm8 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,21,37,135,1,0 // movaps 0x18725(%rip),%xmm10 # 2c350 <_sk_overlay_sse2_8bit+0xf34>
+ .byte 68,15,40,21,101,145,1,0 // movaps 0x19165(%rip),%xmm10 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 65,15,89,234 // mulps %xmm10,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 68,15,40,37,35,135,1,0 // movaps 0x18723(%rip),%xmm12 # 2c360 <_sk_overlay_sse2_8bit+0xf44>
+ .byte 68,15,40,37,99,145,1,0 // movaps 0x19163(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
.byte 68,15,40,242 // movaps %xmm2,%xmm14
.byte 69,15,89,244 // mulps %xmm12,%xmm14
.byte 68,15,88,245 // addps %xmm5,%xmm14
@@ -28516,7 +28516,7 @@ _sk_luminosity_sse41:
.byte 65,15,88,244 // addps %xmm12,%xmm6
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
- .byte 15,40,5,41,133,1,0 // movaps 0x18529(%rip),%xmm0 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,5,105,143,1,0 // movaps 0x18f69(%rip),%xmm0 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,226 // mulps %xmm2,%xmm4
@@ -28564,20 +28564,20 @@ _sk_srcover_rgba_8888_sse41:
.byte 15,133,219,0,0,0 // jne 13eff <_sk_srcover_rgba_8888_sse41+0xfb>
.byte 243,65,15,111,60,128 // movdqu (%r8,%rax,4),%xmm7
.byte 72,133,255 // test %rdi,%rdi
- .byte 102,15,111,37,59,133,1,0 // movdqa 0x1853b(%rip),%xmm4 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,37,123,143,1,0 // movdqa 0x18f7b(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,55,133,1,0 // pshufb 0x18537(%rip),%xmm5 # 2c380 <_sk_overlay_sse2_8bit+0xf64>
+ .byte 102,15,56,0,45,119,143,1,0 // pshufb 0x18f77(%rip),%xmm5 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,55,133,1,0 // pshufb 0x18537(%rip),%xmm6 # 2c390 <_sk_overlay_sse2_8bit+0xf74>
+ .byte 102,15,56,0,53,119,143,1,0 // pshufb 0x18f77(%rip),%xmm6 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 68,15,40,5,84,132,1,0 // movaps 0x18454(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,148,142,1,0 // movaps 0x18e94(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,40,133,1,0 // movaps 0x18528(%rip),%xmm12 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,37,104,143,1,0 // movaps 0x18f68(%rip),%xmm12 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -28657,7 +28657,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,35,131,1,0 // movaps 0x18323(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,99,141,1,0 // movaps 0x18d63(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -28669,7 +28669,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,8,131,1,0 // minps 0x18308(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,93,29,72,141,1,0 // minps 0x18d48(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -28680,7 +28680,7 @@ HIDDEN _sk_clamp_a_dst_sse41
.globl _sk_clamp_a_dst_sse41
FUNCTION(_sk_clamp_a_dst_sse41)
_sk_clamp_a_dst_sse41:
- .byte 15,93,61,244,130,1,0 // minps 0x182f4(%rip),%xmm7 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,93,61,52,141,1,0 // minps 0x18d34(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -28715,7 +28715,7 @@ HIDDEN _sk_invert_sse41
.globl _sk_invert_sse41
FUNCTION(_sk_invert_sse41)
_sk_invert_sse41:
- .byte 68,15,40,5,176,130,1,0 // movaps 0x182b0(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,240,140,1,0 // movaps 0x18cf0(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -28777,7 +28777,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,58,130,1,0 // movaps 0x1823a(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,122,140,1,0 // movaps 0x18c7a(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -28791,20 +28791,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,5,131,1,0 // movaps 0x18305(%rip),%xmm11 # 2c3b0 <_sk_overlay_sse2_8bit+0xf94>
+ .byte 68,15,40,29,69,141,1,0 // movaps 0x18d45(%rip),%xmm11 # 2cdf0 <_sk_overlay_sse2_8bit+0x1018>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,125,130,1,0 // movaps 0x1827d(%rip),%xmm12 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,37,189,140,1,0 // movaps 0x18cbd(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,237,130,1,0 // movaps 0x182ed(%rip),%xmm13 # 2c3c0 <_sk_overlay_sse2_8bit+0xfa4>
+ .byte 68,15,40,45,45,141,1,0 // movaps 0x18d2d(%rip),%xmm13 # 2ce00 <_sk_overlay_sse2_8bit+0x1028>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,237,130,1,0 // movaps 0x182ed(%rip),%xmm14 # 2c3d0 <_sk_overlay_sse2_8bit+0xfb4>
+ .byte 68,15,40,53,45,141,1,0 // movaps 0x18d2d(%rip),%xmm14 # 2ce10 <_sk_overlay_sse2_8bit+0x1038>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,241,130,1,0 // movaps 0x182f1(%rip),%xmm15 # 2c3e0 <_sk_overlay_sse2_8bit+0xfc4>
+ .byte 68,15,40,61,49,141,1,0 // movaps 0x18d31(%rip),%xmm15 # 2ce20 <_sk_overlay_sse2_8bit+0x1048>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -28841,19 +28841,19 @@ FUNCTION(_sk_from_srgb_dst_sse41)
_sk_from_srgb_dst_sse41:
.byte 68,15,40,204 // movaps %xmm4,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,29,60,130,1,0 // movaps 0x1823c(%rip),%xmm11 # 2c3b0 <_sk_overlay_sse2_8bit+0xf94>
+ .byte 68,15,40,29,124,140,1,0 // movaps 0x18c7c(%rip),%xmm11 # 2cdf0 <_sk_overlay_sse2_8bit+0x1018>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 68,15,40,37,181,129,1,0 // movaps 0x181b5(%rip),%xmm12 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,37,245,139,1,0 // movaps 0x18bf5(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 65,15,89,228 // mulps %xmm12,%xmm4
- .byte 68,15,40,45,41,130,1,0 // movaps 0x18229(%rip),%xmm13 # 2c3c0 <_sk_overlay_sse2_8bit+0xfa4>
+ .byte 68,15,40,45,105,140,1,0 // movaps 0x18c69(%rip),%xmm13 # 2ce00 <_sk_overlay_sse2_8bit+0x1028>
.byte 65,15,88,229 // addps %xmm13,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 68,15,40,53,42,130,1,0 // movaps 0x1822a(%rip),%xmm14 # 2c3d0 <_sk_overlay_sse2_8bit+0xfb4>
+ .byte 68,15,40,53,106,140,1,0 // movaps 0x18c6a(%rip),%xmm14 # 2ce10 <_sk_overlay_sse2_8bit+0x1038>
.byte 65,15,88,230 // addps %xmm14,%xmm4
- .byte 68,15,40,61,46,130,1,0 // movaps 0x1822e(%rip),%xmm15 # 2c3e0 <_sk_overlay_sse2_8bit+0xfc4>
+ .byte 68,15,40,61,110,140,1,0 // movaps 0x18c6e(%rip),%xmm15 # 2ce20 <_sk_overlay_sse2_8bit+0x1048>
.byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4
@@ -28897,22 +28897,22 @@ _sk_to_srgb_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
- .byte 68,15,40,29,162,129,1,0 // movaps 0x181a2(%rip),%xmm11 # 2c3f0 <_sk_overlay_sse2_8bit+0xfd4>
+ .byte 68,15,40,29,226,139,1,0 // movaps 0x18be2(%rip),%xmm11 # 2ce30 <_sk_overlay_sse2_8bit+0x1058>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 68,15,40,37,162,129,1,0 // movaps 0x181a2(%rip),%xmm12 # 2c400 <_sk_overlay_sse2_8bit+0xfe4>
+ .byte 68,15,40,37,226,139,1,0 // movaps 0x18be2(%rip),%xmm12 # 2ce40 <_sk_overlay_sse2_8bit+0x1068>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,40,21,162,129,1,0 // movaps 0x181a2(%rip),%xmm10 # 2c410 <_sk_overlay_sse2_8bit+0xff4>
+ .byte 68,15,40,21,226,139,1,0 // movaps 0x18be2(%rip),%xmm10 # 2ce50 <_sk_overlay_sse2_8bit+0x1078>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 68,15,40,45,162,129,1,0 // movaps 0x181a2(%rip),%xmm13 # 2c420 <_sk_overlay_sse2_8bit+0x1004>
+ .byte 68,15,40,45,226,139,1,0 // movaps 0x18be2(%rip),%xmm13 # 2ce60 <_sk_overlay_sse2_8bit+0x1088>
.byte 69,15,88,253 // addps %xmm13,%xmm15
- .byte 68,15,40,53,166,129,1,0 // movaps 0x181a6(%rip),%xmm14 # 2c430 <_sk_overlay_sse2_8bit+0x1014>
+ .byte 68,15,40,53,230,139,1,0 // movaps 0x18be6(%rip),%xmm14 # 2ce70 <_sk_overlay_sse2_8bit+0x1098>
.byte 69,15,88,198 // addps %xmm14,%xmm8
.byte 69,15,83,192 // rcpps %xmm8,%xmm8
.byte 69,15,89,199 // mulps %xmm15,%xmm8
- .byte 68,15,40,61,162,129,1,0 // movaps 0x181a2(%rip),%xmm15 # 2c440 <_sk_overlay_sse2_8bit+0x1024>
+ .byte 68,15,40,61,226,139,1,0 // movaps 0x18be2(%rip),%xmm15 # 2ce80 <_sk_overlay_sse2_8bit+0x10a8>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,82,202 // rsqrtps %xmm2,%xmm9
@@ -28967,7 +28967,7 @@ _sk_rgb_to_hsl_sse41:
.byte 68,15,93,224 // minps %xmm0,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,89,127,1,0 // movaps 0x17f59(%rip),%xmm14 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,53,153,137,1,0 // movaps 0x18999(%rip),%xmm14 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -28976,27 +28976,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,192,128,1,0 // andps 0x180c0(%rip),%xmm15 # 2c450 <_sk_overlay_sse2_8bit+0x1034>
+ .byte 68,15,84,61,0,139,1,0 // andps 0x18b00(%rip),%xmm15 # 2ce90 <_sk_overlay_sse2_8bit+0x10b8>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,179,128,1,0 // movaps 0x180b3(%rip),%xmm13 # 2c460 <_sk_overlay_sse2_8bit+0x1044>
+ .byte 68,15,40,45,243,138,1,0 // movaps 0x18af3(%rip),%xmm13 # 2cea0 <_sk_overlay_sse2_8bit+0x10c8>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,175,128,1,0 // addps 0x180af(%rip),%xmm8 # 2c470 <_sk_overlay_sse2_8bit+0x1054>
+ .byte 68,15,88,5,239,138,1,0 // addps 0x18aef(%rip),%xmm8 # 2ceb0 <_sk_overlay_sse2_8bit+0x10d8>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,167,128,1,0 // mulps 0x180a7(%rip),%xmm8 # 2c480 <_sk_overlay_sse2_8bit+0x1064>
+ .byte 68,15,89,5,231,138,1,0 // mulps 0x18ae7(%rip),%xmm8 # 2cec0 <_sk_overlay_sse2_8bit+0x10e8>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,171,126,1,0 // movaps 0x17eab(%rip),%xmm0 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 15,40,5,235,136,1,0 // movaps 0x188eb(%rip),%xmm0 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -29018,7 +29018,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,97,126,1,0 // movaps 0x17e61(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,13,161,136,1,0 // movaps 0x188a1(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -29031,19 +29031,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,28,128,1,0 // movaps 0x1801c(%rip),%xmm14 # 2c490 <_sk_overlay_sse2_8bit+0x1074>
+ .byte 68,15,40,53,92,138,1,0 // movaps 0x18a5c(%rip),%xmm14 # 2ced0 <_sk_overlay_sse2_8bit+0x10f8>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,21,128,1,0 // movaps 0x18015(%rip),%xmm11 # 2c4a0 <_sk_overlay_sse2_8bit+0x1084>
+ .byte 68,15,40,29,85,138,1,0 // movaps 0x18a55(%rip),%xmm11 # 2cee0 <_sk_overlay_sse2_8bit+0x1108>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,174,127,1,0 // movaps 0x17fae(%rip),%xmm7 # 2c450 <_sk_overlay_sse2_8bit+0x1034>
+ .byte 15,40,61,238,137,1,0 // movaps 0x189ee(%rip),%xmm7 # 2ce90 <_sk_overlay_sse2_8bit+0x10b8>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,191,127,1,0 // movaps 0x17fbf(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x1054>
+ .byte 15,40,29,255,137,1,0 // movaps 0x189ff(%rip),%xmm3 # 2ceb0 <_sk_overlay_sse2_8bit+0x10d8>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -29053,7 +29053,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,158,127,1,0 // movaps 0x17f9e(%rip),%xmm12 # 2c480 <_sk_overlay_sse2_8bit+0x1064>
+ .byte 68,15,40,37,222,137,1,0 // movaps 0x189de(%rip),%xmm12 # 2cec0 <_sk_overlay_sse2_8bit+0x10e8>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -29087,7 +29087,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,54,127,1,0 // addps 0x17f36(%rip),%xmm10 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 68,15,88,21,118,137,1,0 // addps 0x18976(%rip),%xmm10 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -29144,9 +29144,9 @@ _sk_scale_u8_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,52 // jne 14661 <_sk_scale_u8_sse41+0x4c>
.byte 102,71,15,56,49,4,16 // pmovzxbd (%r8,%r10,1),%xmm8
- .byte 102,68,15,219,5,51,125,1,0 // pand 0x17d33(%rip),%xmm8 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,68,15,219,5,115,135,1,0 // pand 0x18773(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,119,126,1,0 // mulps 0x17e77(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,89,5,183,136,1,0 // mulps 0x188b7(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -29190,17 +29190,17 @@ _sk_scale_565_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 15,133,159,0,0,0 // jne 1477b <_sk_scale_565_sse41+0xc3>
.byte 102,71,15,56,51,28,80 // pmovzxwd (%r8,%r10,2),%xmm11
- .byte 102,15,111,5,229,125,1,0 // movdqa 0x17de5(%rip),%xmm0 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,15,111,5,37,136,1,0 // movdqa 0x18825(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,65,15,219,195 // pand %xmm11,%xmm0
.byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
- .byte 68,15,89,13,228,125,1,0 // mulps 0x17de4(%rip),%xmm9 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,15,111,5,236,125,1,0 // movdqa 0x17dec(%rip),%xmm0 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 68,15,89,13,36,136,1,0 // mulps 0x18824(%rip),%xmm9 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,15,111,5,44,136,1,0 // movdqa 0x1882c(%rip),%xmm0 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,65,15,219,195 // pand %xmm11,%xmm0
.byte 68,15,91,208 // cvtdq2ps %xmm0,%xmm10
- .byte 68,15,89,21,235,125,1,0 // mulps 0x17deb(%rip),%xmm10 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,68,15,219,29,242,125,1,0 // pand 0x17df2(%rip),%xmm11 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 68,15,89,21,43,136,1,0 // mulps 0x1882b(%rip),%xmm10 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,68,15,219,29,50,136,1,0 // pand 0x18832(%rip),%xmm11 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11
- .byte 68,15,89,29,246,125,1,0 // mulps 0x17df6(%rip),%xmm11 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 68,15,89,29,54,136,1,0 // mulps 0x18836(%rip),%xmm11 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
.byte 69,15,40,226 // movaps %xmm10,%xmm12
@@ -29277,9 +29277,9 @@ _sk_lerp_u8_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,72 // jne 1486b <_sk_lerp_u8_sse41+0x60>
.byte 102,71,15,56,49,4,16 // pmovzxbd (%r8,%r10,1),%xmm8
- .byte 102,68,15,219,5,61,123,1,0 // pand 0x17b3d(%rip),%xmm8 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,68,15,219,5,125,133,1,0 // pand 0x1857d(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,129,124,1,0 // mulps 0x17c81(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,89,5,193,134,1,0 // mulps 0x186c1(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -29330,17 +29330,17 @@ _sk_lerp_565_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 15,133,165,0,0,0 // jne 1498e <_sk_lerp_565_sse41+0xc9>
.byte 102,71,15,56,51,20,80 // pmovzxwd (%r8,%r10,2),%xmm10
- .byte 102,15,111,5,216,123,1,0 // movdqa 0x17bd8(%rip),%xmm0 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,15,111,5,24,134,1,0 // movdqa 0x18618(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
- .byte 68,15,89,13,215,123,1,0 // mulps 0x17bd7(%rip),%xmm9 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,15,111,5,223,123,1,0 // movdqa 0x17bdf(%rip),%xmm0 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 68,15,89,13,23,134,1,0 // mulps 0x18617(%rip),%xmm9 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,15,111,5,31,134,1,0 // movdqa 0x1861f(%rip),%xmm0 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 68,15,91,216 // cvtdq2ps %xmm0,%xmm11
- .byte 68,15,89,29,222,123,1,0 // mulps 0x17bde(%rip),%xmm11 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,68,15,219,21,229,123,1,0 // pand 0x17be5(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 68,15,89,29,30,134,1,0 // mulps 0x1861e(%rip),%xmm11 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,68,15,219,21,37,134,1,0 // pand 0x18625(%rip),%xmm10 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,233,123,1,0 // mulps 0x17be9(%rip),%xmm10 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 68,15,89,21,41,134,1,0 // mulps 0x18629(%rip),%xmm10 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -29396,7 +29396,7 @@ _sk_load_tables_sse41:
.byte 243,69,15,111,4,144 // movdqu (%r8,%rdx,4),%xmm8
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,15,111,5,107,121,1,0 // movdqa 0x1796b(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,5,171,131,1,0 // movdqa 0x183ab(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,192,1 // pextrq $0x1,%xmm0,%r8
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -29411,7 +29411,7 @@ _sk_load_tables_sse41:
.byte 102,66,15,58,33,4,155,32 // insertps $0x20,(%rbx,%r11,4),%xmm0
.byte 102,66,15,58,33,4,3,48 // insertps $0x30,(%rbx,%r8,1),%xmm0
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,38,121,1,0 // pshufb 0x17926(%rip),%xmm1 # 2c380 <_sk_overlay_sse2_8bit+0xf64>
+ .byte 102,15,56,0,13,102,131,1,0 // pshufb 0x18366(%rip),%xmm1 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
.byte 102,73,15,58,22,200,1 // pextrq $0x1,%xmm1,%r8
.byte 102,72,15,126,203 // movq %xmm1,%rbx
.byte 68,15,182,203 // movzbl %bl,%r9d
@@ -29426,7 +29426,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,64,24 // mov 0x18(%rax),%r8
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,226,120,1,0 // pshufb 0x178e2(%rip),%xmm2 # 2c390 <_sk_overlay_sse2_8bit+0xf74>
+ .byte 102,15,56,0,21,34,131,1,0 // pshufb 0x18322(%rip),%xmm2 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
.byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,200 // movzbl %al,%r9d
@@ -29441,7 +29441,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,191,121,1,0 // mulps 0x179bf(%rip),%xmm3 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,29,255,131,1,0 // mulps 0x183ff(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -29482,7 +29482,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,145,121,1,0 // movdqa 0x17991(%rip),%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0x1114>
+ .byte 102,68,15,111,5,209,131,1,0 // movdqa 0x183d1(%rip),%xmm8 # 2cf70 <_sk_overlay_sse2_8bit+0x1198>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -29500,7 +29500,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
.byte 243,66,15,16,20,3 // movss (%rbx,%r8,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
- .byte 102,15,56,0,13,64,121,1,0 // pshufb 0x17940(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0x1124>
+ .byte 102,15,56,0,13,128,131,1,0 // pshufb 0x18380(%rip),%xmm1 # 2cf80 <_sk_overlay_sse2_8bit+0x11a8>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,200,1 // pextrq $0x1,%xmm1,%r8
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -29536,7 +29536,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,142,120,1,0 // mulps 0x1788e(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0x1134>
+ .byte 15,89,29,206,130,1,0 // mulps 0x182ce(%rip),%xmm3 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -29576,7 +29576,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,215,119,1,0 // movdqa 0x177d7(%rip),%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0x1114>
+ .byte 102,68,15,111,5,23,130,1,0 // movdqa 0x18217(%rip),%xmm8 # 2cf70 <_sk_overlay_sse2_8bit+0x1198>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -29594,7 +29594,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0
.byte 243,66,15,16,28,3 // movss (%rbx,%r8,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
- .byte 102,15,56,0,13,166,119,1,0 // pshufb 0x177a6(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0x1144>
+ .byte 102,15,56,0,13,230,129,1,0 // pshufb 0x181e6(%rip),%xmm1 # 2cfa0 <_sk_overlay_sse2_8bit+0x11c8>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,200,1 // pextrq $0x1,%xmm1,%r8
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -29625,7 +29625,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,24 // movss (%r8,%rbx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,97,116,1,0 // movaps 0x17461(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,161,126,1,0 // movaps 0x17ea1(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 255,224 // jmpq *%rax
@@ -29657,7 +29657,7 @@ _sk_byte_tables_sse41:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,205,116,1,0 // movaps 0x174cd(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,5,13,127,1,0 // movaps 0x17f0d(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,58,22,192,1 // pextrq $0x1,%xmm0,%r8
@@ -29676,7 +29676,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,142,117,1,0 // movaps 0x1758e(%rip),%xmm9 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,13,206,127,1,0 // movaps 0x17fce(%rip),%xmm9 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -29770,7 +29770,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,250,115,1,0 // movaps 0x173fa(%rip),%xmm9 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,13,58,126,1,0 // movaps 0x17e3a(%rip),%xmm9 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -29948,31 +29948,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,236,113,1,0 // mulps 0x171ec(%rip),%xmm8 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 68,15,84,21,244,113,1,0 // andps 0x171f4(%rip),%xmm10 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 68,15,86,21,12,111,1,0 // orps 0x16f0c(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
- .byte 68,15,88,5,244,113,1,0 // addps 0x171f4(%rip),%xmm8 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
- .byte 68,15,40,37,252,113,1,0 // movaps 0x171fc(%rip),%xmm12 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,89,5,44,124,1,0 // mulps 0x17c2c(%rip),%xmm8 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 68,15,84,21,52,124,1,0 // andps 0x17c34(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 68,15,86,21,76,121,1,0 // orps 0x1794c(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,5,52,124,1,0 // addps 0x17c34(%rip),%xmm8 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 68,15,40,37,60,124,1,0 // movaps 0x17c3c(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,252,113,1,0 // addps 0x171fc(%rip),%xmm10 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
- .byte 68,15,40,37,4,114,1,0 // movaps 0x17204(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,88,21,60,124,1,0 // addps 0x17c3c(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 68,15,40,37,68,124,1,0 // movaps 0x17c44(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,241,113,1,0 // addps 0x171f1(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
- .byte 68,15,40,21,249,113,1,0 // movaps 0x171f9(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 68,15,88,5,49,124,1,0 // addps 0x17c31(%rip),%xmm8 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 68,15,40,21,57,124,1,0 // movaps 0x17c39(%rip),%xmm10 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,249,113,1,0 // movaps 0x171f9(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 68,15,40,21,57,124,1,0 // movaps 0x17c39(%rip),%xmm10 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,253,113,1,0 // movaps 0x171fd(%rip),%xmm11 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 68,15,40,29,61,124,1,0 // movaps 0x17c3d(%rip),%xmm11 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,253,113,1,0 // mulps 0x171fd(%rip),%xmm11 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 68,15,89,29,61,124,1,0 // mulps 0x17c3d(%rip),%xmm11 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -29980,7 +29980,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,132,110,1,0 // minps 0x16e84(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,93,5,196,120,1,0 // minps 0x178c4(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -30010,31 +30010,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,197,112,1,0 // mulps 0x170c5(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 68,15,84,29,205,112,1,0 // andps 0x170cd(%rip),%xmm11 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 68,15,86,29,229,109,1,0 // orps 0x16de5(%rip),%xmm11 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
- .byte 68,15,88,37,205,112,1,0 // addps 0x170cd(%rip),%xmm12 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
- .byte 15,40,13,214,112,1,0 // movaps 0x170d6(%rip),%xmm1 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,89,37,5,123,1,0 // mulps 0x17b05(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 68,15,84,29,13,123,1,0 // andps 0x17b0d(%rip),%xmm11 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 68,15,86,29,37,120,1,0 // orps 0x17825(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,37,13,123,1,0 // addps 0x17b0d(%rip),%xmm12 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 15,40,13,22,123,1,0 // movaps 0x17b16(%rip),%xmm1 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,214,112,1,0 // addps 0x170d6(%rip),%xmm11 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
- .byte 15,40,13,223,112,1,0 // movaps 0x170df(%rip),%xmm1 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,88,29,22,123,1,0 // addps 0x17b16(%rip),%xmm11 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 15,40,13,31,123,1,0 // movaps 0x17b1f(%rip),%xmm1 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,204,112,1,0 // addps 0x170cc(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
- .byte 15,40,13,213,112,1,0 // movaps 0x170d5(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 68,15,88,37,12,123,1,0 // addps 0x17b0c(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 15,40,13,21,123,1,0 // movaps 0x17b15(%rip),%xmm1 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,213,112,1,0 // movaps 0x170d5(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 68,15,40,21,21,123,1,0 // movaps 0x17b15(%rip),%xmm10 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,218,112,1,0 // movaps 0x170da(%rip),%xmm1 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 15,40,13,26,123,1,0 // movaps 0x17b1a(%rip),%xmm1 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,219,112,1,0 // mulps 0x170db(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 15,89,13,27,123,1,0 // mulps 0x17b1b(%rip),%xmm1 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -30042,7 +30042,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,102,109,1,0 // minps 0x16d66(%rip),%xmm1 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,93,13,166,119,1,0 // minps 0x177a6(%rip),%xmm1 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -30072,31 +30072,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,167,111,1,0 // mulps 0x16fa7(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 68,15,84,29,175,111,1,0 // andps 0x16faf(%rip),%xmm11 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 68,15,86,29,199,108,1,0 // orps 0x16cc7(%rip),%xmm11 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
- .byte 68,15,88,37,175,111,1,0 // addps 0x16faf(%rip),%xmm12 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
- .byte 15,40,21,184,111,1,0 // movaps 0x16fb8(%rip),%xmm2 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,89,37,231,121,1,0 // mulps 0x179e7(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 68,15,84,29,239,121,1,0 // andps 0x179ef(%rip),%xmm11 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 68,15,86,29,7,119,1,0 // orps 0x17707(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,37,239,121,1,0 // addps 0x179ef(%rip),%xmm12 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 15,40,21,248,121,1,0 // movaps 0x179f8(%rip),%xmm2 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,184,111,1,0 // addps 0x16fb8(%rip),%xmm11 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
- .byte 15,40,21,193,111,1,0 // movaps 0x16fc1(%rip),%xmm2 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,88,29,248,121,1,0 // addps 0x179f8(%rip),%xmm11 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 15,40,21,1,122,1,0 // movaps 0x17a01(%rip),%xmm2 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,174,111,1,0 // addps 0x16fae(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
- .byte 15,40,21,183,111,1,0 // movaps 0x16fb7(%rip),%xmm2 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 68,15,88,37,238,121,1,0 // addps 0x179ee(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 15,40,21,247,121,1,0 // movaps 0x179f7(%rip),%xmm2 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,183,111,1,0 // movaps 0x16fb7(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 68,15,40,21,247,121,1,0 // movaps 0x179f7(%rip),%xmm10 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,188,111,1,0 // movaps 0x16fbc(%rip),%xmm2 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 15,40,21,252,121,1,0 // movaps 0x179fc(%rip),%xmm2 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,189,111,1,0 // mulps 0x16fbd(%rip),%xmm2 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 15,89,21,253,121,1,0 // mulps 0x179fd(%rip),%xmm2 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -30104,7 +30104,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,72,108,1,0 // minps 0x16c48(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,93,21,136,118,1,0 // minps 0x17688(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -30134,31 +30134,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,137,110,1,0 // mulps 0x16e89(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 68,15,84,29,145,110,1,0 // andps 0x16e91(%rip),%xmm11 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 68,15,86,29,169,107,1,0 // orps 0x16ba9(%rip),%xmm11 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
- .byte 68,15,88,37,145,110,1,0 // addps 0x16e91(%rip),%xmm12 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
- .byte 15,40,29,154,110,1,0 // movaps 0x16e9a(%rip),%xmm3 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,89,37,201,120,1,0 // mulps 0x178c9(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 68,15,84,29,209,120,1,0 // andps 0x178d1(%rip),%xmm11 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 68,15,86,29,233,117,1,0 // orps 0x175e9(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,37,209,120,1,0 // addps 0x178d1(%rip),%xmm12 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 15,40,29,218,120,1,0 // movaps 0x178da(%rip),%xmm3 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,154,110,1,0 // addps 0x16e9a(%rip),%xmm11 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
- .byte 15,40,29,163,110,1,0 // movaps 0x16ea3(%rip),%xmm3 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,88,29,218,120,1,0 // addps 0x178da(%rip),%xmm11 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 15,40,29,227,120,1,0 // movaps 0x178e3(%rip),%xmm3 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,144,110,1,0 // addps 0x16e90(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
- .byte 15,40,29,153,110,1,0 // movaps 0x16e99(%rip),%xmm3 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 68,15,88,37,208,120,1,0 // addps 0x178d0(%rip),%xmm12 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 15,40,29,217,120,1,0 // movaps 0x178d9(%rip),%xmm3 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,153,110,1,0 // movaps 0x16e99(%rip),%xmm10 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 68,15,40,21,217,120,1,0 // movaps 0x178d9(%rip),%xmm10 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,158,110,1,0 // movaps 0x16e9e(%rip),%xmm3 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 15,40,29,222,120,1,0 // movaps 0x178de(%rip),%xmm3 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,159,110,1,0 // mulps 0x16e9f(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 15,89,29,223,120,1,0 // mulps 0x178df(%rip),%xmm3 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -30166,7 +30166,7 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,42,107,1,0 // minps 0x16b2a(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,93,29,106,117,1,0 // minps 0x1756a(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -30183,20 +30183,20 @@ _sk_gamma_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,169,109,1,0 // mulps 0x16da9(%rip),%xmm0 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 68,15,40,53,177,109,1,0 // movaps 0x16db1(%rip),%xmm14 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
+ .byte 15,89,5,233,119,1,0 // mulps 0x177e9(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 68,15,40,53,241,119,1,0 // movaps 0x177f1(%rip),%xmm14 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,37,197,106,1,0 // movaps 0x16ac5(%rip),%xmm12 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,37,5,117,1,0 // movaps 0x17505(%rip),%xmm12 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,86,212 // orps %xmm12,%xmm2
- .byte 68,15,40,21,169,109,1,0 // movaps 0x16da9(%rip),%xmm10 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
+ .byte 68,15,40,21,233,119,1,0 // movaps 0x177e9(%rip),%xmm10 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,29,173,109,1,0 // movaps 0x16dad(%rip),%xmm11 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,40,29,237,119,1,0 // movaps 0x177ed(%rip),%xmm11 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,13,171,109,1,0 // movaps 0x16dab(%rip),%xmm9 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
+ .byte 68,15,40,13,235,119,1,0 // movaps 0x177eb(%rip),%xmm9 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 68,15,40,45,175,109,1,0 // movaps 0x16daf(%rip),%xmm13 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,40,45,239,119,1,0 // movaps 0x177ef(%rip),%xmm13 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30207,21 +30207,21 @@ _sk_gamma_sse41:
.byte 102,15,58,8,208,1 // roundps $0x1,%xmm0,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,146,109,1,0 // movaps 0x16d92(%rip),%xmm6 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
+ .byte 15,40,53,210,119,1,0 // movaps 0x177d2(%rip),%xmm6 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,168,109,1,0 // movaps 0x16da8(%rip),%xmm7 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 15,40,61,232,119,1,0 // movaps 0x177e8(%rip),%xmm7 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,136,109,1,0 // movaps 0x16d88(%rip),%xmm4 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 15,40,37,200,119,1,0 // movaps 0x177c8(%rip),%xmm4 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,154,109,1,0 // movaps 0x16d9a(%rip),%xmm15 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 68,15,40,61,218,119,1,0 // movaps 0x177da(%rip),%xmm15 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,246,108,1,0 // mulps 0x16cf6(%rip),%xmm0 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
+ .byte 15,89,5,54,119,1,0 // mulps 0x17736(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
.byte 65,15,84,206 // andps %xmm14,%xmm1
.byte 65,15,86,204 // orps %xmm12,%xmm1
.byte 65,15,88,194 // addps %xmm10,%xmm0
@@ -30247,8 +30247,8 @@ _sk_gamma_sse41:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,151,108,1,0 // mulps 0x16c97(%rip),%xmm0 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 15,84,29,160,108,1,0 // andps 0x16ca0(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
+ .byte 15,89,5,215,118,1,0 // mulps 0x176d7(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 15,84,29,224,118,1,0 // andps 0x176e0(%rip),%xmm3 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
.byte 65,15,86,220 // orps %xmm12,%xmm3
.byte 65,15,88,194 // addps %xmm10,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
@@ -30266,7 +30266,7 @@ _sk_gamma_sse41:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,232,108,1,0 // movaps 0x16ce8(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 15,40,5,40,119,1,0 // movaps 0x17728(%rip),%xmm0 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -30286,29 +30286,29 @@ HIDDEN _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,184,108,1,0 // mulps 0x16cb8(%rip),%xmm8 # 2c620 <_sk_overlay_sse2_8bit+0x1204>
- .byte 68,15,40,13,48,106,1,0 // movaps 0x16a30(%rip),%xmm9 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,89,5,248,118,1,0 // mulps 0x176f8(%rip),%xmm8 # 2d060 <_sk_overlay_sse2_8bit+0x1288>
+ .byte 68,15,40,13,112,116,1,0 // movaps 0x17470(%rip),%xmm9 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,181,108,1,0 // movaps 0x16cb5(%rip),%xmm0 # 2c630 <_sk_overlay_sse2_8bit+0x1214>
+ .byte 15,40,5,245,118,1,0 // movaps 0x176f5(%rip),%xmm0 # 2d070 <_sk_overlay_sse2_8bit+0x1298>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,179,108,1,0 // addps 0x16cb3(%rip),%xmm8 # 2c640 <_sk_overlay_sse2_8bit+0x1224>
- .byte 68,15,89,5,187,108,1,0 // mulps 0x16cbb(%rip),%xmm8 # 2c650 <_sk_overlay_sse2_8bit+0x1234>
- .byte 15,89,13,196,108,1,0 // mulps 0x16cc4(%rip),%xmm1 # 2c660 <_sk_overlay_sse2_8bit+0x1244>
+ .byte 68,15,88,5,243,118,1,0 // addps 0x176f3(%rip),%xmm8 # 2d080 <_sk_overlay_sse2_8bit+0x12a8>
+ .byte 68,15,89,5,251,118,1,0 // mulps 0x176fb(%rip),%xmm8 # 2d090 <_sk_overlay_sse2_8bit+0x12b8>
+ .byte 15,89,13,4,119,1,0 // mulps 0x17704(%rip),%xmm1 # 2d0a0 <_sk_overlay_sse2_8bit+0x12c8>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,201,108,1,0 // mulps 0x16cc9(%rip),%xmm2 # 2c670 <_sk_overlay_sse2_8bit+0x1254>
+ .byte 15,89,21,9,119,1,0 // mulps 0x17709(%rip),%xmm2 # 2d0b0 <_sk_overlay_sse2_8bit+0x12d8>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,189,108,1,0 // movaps 0x16cbd(%rip),%xmm9 # 2c680 <_sk_overlay_sse2_8bit+0x1264>
+ .byte 68,15,40,13,253,118,1,0 // movaps 0x176fd(%rip),%xmm9 # 2d0c0 <_sk_overlay_sse2_8bit+0x12e8>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,189,108,1,0 // movaps 0x16cbd(%rip),%xmm2 # 2c690 <_sk_overlay_sse2_8bit+0x1274>
+ .byte 15,40,21,253,118,1,0 // movaps 0x176fd(%rip),%xmm2 # 2d0d0 <_sk_overlay_sse2_8bit+0x12f8>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,194,108,1,0 // movaps 0x16cc2(%rip),%xmm12 # 2c6a0 <_sk_overlay_sse2_8bit+0x1284>
+ .byte 68,15,40,37,2,119,1,0 // movaps 0x17702(%rip),%xmm12 # 2d0e0 <_sk_overlay_sse2_8bit+0x1308>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -30327,8 +30327,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,123,108,1,0 // mulps 0x16c7b(%rip),%xmm1 # 2c6b0 <_sk_overlay_sse2_8bit+0x1294>
- .byte 15,89,21,132,108,1,0 // mulps 0x16c84(%rip),%xmm2 # 2c6c0 <_sk_overlay_sse2_8bit+0x12a4>
+ .byte 15,89,13,187,118,1,0 // mulps 0x176bb(%rip),%xmm1 # 2d0f0 <_sk_overlay_sse2_8bit+0x1318>
+ .byte 15,89,21,196,118,1,0 // mulps 0x176c4(%rip),%xmm2 # 2d100 <_sk_overlay_sse2_8bit+0x1328>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -30347,9 +30347,9 @@ _sk_load_a8_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,39 // jne 15a86 <_sk_load_a8_sse41+0x3f>
.byte 102,67,15,56,49,4,16 // pmovzxbd (%r8,%r10,1),%xmm0
- .byte 102,15,219,5,2,105,1,0 // pand 0x16902(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,219,5,66,115,1,0 // pand 0x17342(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,72,106,1,0 // mulps 0x16a48(%rip),%xmm3 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,29,136,116,1,0 // mulps 0x17488(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -30389,9 +30389,9 @@ _sk_load_a8_dst_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,39 // jne 15b12 <_sk_load_a8_dst_sse41+0x3f>
.byte 102,67,15,56,49,36,16 // pmovzxbd (%r8,%r10,1),%xmm4
- .byte 102,15,219,37,118,104,1,0 // pand 0x16876(%rip),%xmm4 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,219,37,182,114,1,0 // pand 0x172b6(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,188,105,1,0 // mulps 0x169bc(%rip),%xmm7 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,61,252,115,1,0 // mulps 0x173fc(%rip),%xmm7 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
@@ -30444,7 +30444,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,241,104,1,0 // mulps 0x168f1(%rip),%xmm3 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,29,49,115,1,0 // mulps 0x17331(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -30461,7 +30461,7 @@ _sk_store_a8_sse41:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
- .byte 68,15,40,5,167,103,1,0 // movaps 0x167a7(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,5,231,113,1,0 // movaps 0x171e7(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
@@ -30482,7 +30482,7 @@ _sk_store_a8_sse41:
.byte 65,128,249,3 // cmp $0x3,%r9b
.byte 117,221 // jne 15c1b <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,68,16,2,8 // pextrb $0x8,%xmm8,0x2(%r8,%r10,1)
- .byte 102,68,15,56,0,5,127,106,1,0 // pshufb 0x16a7f(%rip),%xmm8 # 2c6d0 <_sk_overlay_sse2_8bit+0x12b4>
+ .byte 102,68,15,56,0,5,191,116,1,0 // pshufb 0x174bf(%rip),%xmm8 # 2d110 <_sk_overlay_sse2_8bit+0x1338>
.byte 102,71,15,58,21,4,16,0 // pextrw $0x0,%xmm8,(%r8,%r10,1)
.byte 235,192 // jmp 15c1b <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,4,16,0 // pextrb $0x0,%xmm8,(%r8,%r10,1)
@@ -30501,11 +30501,11 @@ _sk_load_g8_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,42 // jne 15ca7 <_sk_load_g8_sse41+0x42>
.byte 102,67,15,56,49,4,16 // pmovzxbd (%r8,%r10,1),%xmm0
- .byte 102,15,219,5,228,102,1,0 // pand 0x166e4(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,219,5,36,113,1,0 // pand 0x17124(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,42,104,1,0 // mulps 0x1682a(%rip),%xmm0 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,5,106,114,1,0 // mulps 0x1726a(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,33,102,1,0 // movaps 0x16621(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,97,112,1,0 // movaps 0x17061(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -30543,11 +30543,11 @@ _sk_load_g8_dst_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,42 // jne 15d36 <_sk_load_g8_dst_sse41+0x42>
.byte 102,67,15,56,49,36,16 // pmovzxbd (%r8,%r10,1),%xmm4
- .byte 102,15,219,37,85,102,1,0 // pand 0x16655(%rip),%xmm4 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,219,37,149,112,1,0 // pand 0x17095(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,155,103,1,0 // mulps 0x1679b(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,37,219,113,1,0 // mulps 0x171db(%rip),%xmm4 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,146,101,1,0 // movaps 0x16592(%rip),%xmm7 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,61,210,111,1,0 // movaps 0x16fd2(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
@@ -30598,9 +30598,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,205,102,1,0 // mulps 0x166cd(%rip),%xmm0 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,5,13,113,1,0 // mulps 0x1710d(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,196,100,1,0 // movaps 0x164c4(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,4,111,1,0 // movaps 0x16f04(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -30619,19 +30619,19 @@ _sk_load_565_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,80 // jne 15e6f <_sk_load_565_sse41+0x6b>
.byte 102,67,15,56,51,20,80 // pmovzxwd (%r8,%r10,2),%xmm2
- .byte 102,15,111,5,162,102,1,0 // movdqa 0x166a2(%rip),%xmm0 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,15,111,5,226,112,1,0 // movdqa 0x170e2(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,164,102,1,0 // mulps 0x166a4(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,15,111,13,172,102,1,0 // movdqa 0x166ac(%rip),%xmm1 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 15,89,5,228,112,1,0 // mulps 0x170e4(%rip),%xmm0 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,15,111,13,236,112,1,0 // movdqa 0x170ec(%rip),%xmm1 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,174,102,1,0 // mulps 0x166ae(%rip),%xmm1 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,15,219,21,182,102,1,0 // pand 0x166b6(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 15,89,13,238,112,1,0 // mulps 0x170ee(%rip),%xmm1 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,15,219,21,246,112,1,0 // pand 0x170f6(%rip),%xmm2 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,188,102,1,0 // mulps 0x166bc(%rip),%xmm2 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 15,89,21,252,112,1,0 // mulps 0x170fc(%rip),%xmm2 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,83,100,1,0 // movaps 0x16453(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,147,110,1,0 // movaps 0x16e93(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
@@ -30667,19 +30667,19 @@ _sk_load_565_dst_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,80 // jne 15f2a <_sk_load_565_dst_sse41+0x6b>
.byte 102,67,15,56,51,52,80 // pmovzxwd (%r8,%r10,2),%xmm6
- .byte 102,15,111,37,231,101,1,0 // movdqa 0x165e7(%rip),%xmm4 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,15,111,37,39,112,1,0 // movdqa 0x17027(%rip),%xmm4 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,233,101,1,0 // mulps 0x165e9(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,15,111,45,241,101,1,0 // movdqa 0x165f1(%rip),%xmm5 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 15,89,37,41,112,1,0 // mulps 0x17029(%rip),%xmm4 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,15,111,45,49,112,1,0 // movdqa 0x17031(%rip),%xmm5 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,243,101,1,0 // mulps 0x165f3(%rip),%xmm5 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,15,219,53,251,101,1,0 // pand 0x165fb(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 15,89,45,51,112,1,0 // mulps 0x17033(%rip),%xmm5 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,15,219,53,59,112,1,0 // pand 0x1703b(%rip),%xmm6 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,1,102,1,0 // mulps 0x16601(%rip),%xmm6 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 15,89,53,65,112,1,0 // mulps 0x17041(%rip),%xmm6 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,152,99,1,0 // movaps 0x16398(%rip),%xmm7 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,61,216,109,1,0 // movaps 0x16dd8(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
@@ -30726,19 +30726,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,64 // movzwl (%r8,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,236,100,1,0 // movdqa 0x164ec(%rip),%xmm0 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,15,111,5,44,111,1,0 // movdqa 0x16f2c(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,238,100,1,0 // mulps 0x164ee(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,15,111,13,246,100,1,0 // movdqa 0x164f6(%rip),%xmm1 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 15,89,5,46,111,1,0 // mulps 0x16f2e(%rip),%xmm0 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,15,111,13,54,111,1,0 // movdqa 0x16f36(%rip),%xmm1 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,248,100,1,0 // mulps 0x164f8(%rip),%xmm1 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,15,219,21,0,101,1,0 // pand 0x16500(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 15,89,13,56,111,1,0 // mulps 0x16f38(%rip),%xmm1 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,15,219,21,64,111,1,0 // pand 0x16f40(%rip),%xmm2 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,6,101,1,0 // mulps 0x16506(%rip),%xmm2 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 15,89,21,70,111,1,0 // mulps 0x16f46(%rip),%xmm2 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,157,98,1,0 // movaps 0x1629d(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,221,108,1,0 // movaps 0x16cdd(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_sse41
@@ -30752,12 +30752,12 @@ _sk_store_565_sse41:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,157,102,1,0 // movaps 0x1669d(%rip),%xmm8 # 2c6e0 <_sk_overlay_sse2_8bit+0x12c4>
+ .byte 68,15,40,5,221,112,1,0 // movaps 0x170dd(%rip),%xmm8 # 2d120 <_sk_overlay_sse2_8bit+0x1348>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,146,102,1,0 // movaps 0x16692(%rip),%xmm10 # 2c6f0 <_sk_overlay_sse2_8bit+0x12d4>
+ .byte 68,15,40,21,210,112,1,0 // movaps 0x170d2(%rip),%xmm10 # 2d130 <_sk_overlay_sse2_8bit+0x1358>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -30801,21 +30801,21 @@ _sk_load_4444_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,95 // jne 1614f <_sk_load_4444_sse41+0x7a>
.byte 102,67,15,56,51,28,80 // pmovzxwd (%r8,%r10,2),%xmm3
- .byte 102,15,111,5,1,102,1,0 // movdqa 0x16601(%rip),%xmm0 # 2c700 <_sk_overlay_sse2_8bit+0x12e4>
+ .byte 102,15,111,5,65,112,1,0 // movdqa 0x17041(%rip),%xmm0 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,3,102,1,0 // mulps 0x16603(%rip),%xmm0 # 2c710 <_sk_overlay_sse2_8bit+0x12f4>
- .byte 102,15,111,13,11,102,1,0 // movdqa 0x1660b(%rip),%xmm1 # 2c720 <_sk_overlay_sse2_8bit+0x1304>
+ .byte 15,89,5,67,112,1,0 // mulps 0x17043(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
+ .byte 102,15,111,13,75,112,1,0 // movdqa 0x1704b(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,13,102,1,0 // mulps 0x1660d(%rip),%xmm1 # 2c730 <_sk_overlay_sse2_8bit+0x1314>
- .byte 102,15,111,21,21,102,1,0 // movdqa 0x16615(%rip),%xmm2 # 2c740 <_sk_overlay_sse2_8bit+0x1324>
+ .byte 15,89,13,77,112,1,0 // mulps 0x1704d(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
+ .byte 102,15,111,21,85,112,1,0 // movdqa 0x17055(%rip),%xmm2 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,23,102,1,0 // mulps 0x16617(%rip),%xmm2 # 2c750 <_sk_overlay_sse2_8bit+0x1334>
- .byte 102,15,219,29,31,102,1,0 // pand 0x1661f(%rip),%xmm3 # 2c760 <_sk_overlay_sse2_8bit+0x1344>
+ .byte 15,89,21,87,112,1,0 // mulps 0x17057(%rip),%xmm2 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
+ .byte 102,15,219,29,95,112,1,0 // pand 0x1705f(%rip),%xmm3 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,37,102,1,0 // mulps 0x16625(%rip),%xmm3 # 2c770 <_sk_overlay_sse2_8bit+0x1354>
+ .byte 15,89,29,101,112,1,0 // mulps 0x17065(%rip),%xmm3 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
@@ -30852,21 +30852,21 @@ _sk_load_4444_dst_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,95 // jne 16219 <_sk_load_4444_dst_sse41+0x7a>
.byte 102,67,15,56,51,60,80 // pmovzxwd (%r8,%r10,2),%xmm7
- .byte 102,15,111,37,55,101,1,0 // movdqa 0x16537(%rip),%xmm4 # 2c700 <_sk_overlay_sse2_8bit+0x12e4>
+ .byte 102,15,111,37,119,111,1,0 // movdqa 0x16f77(%rip),%xmm4 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,57,101,1,0 // mulps 0x16539(%rip),%xmm4 # 2c710 <_sk_overlay_sse2_8bit+0x12f4>
- .byte 102,15,111,45,65,101,1,0 // movdqa 0x16541(%rip),%xmm5 # 2c720 <_sk_overlay_sse2_8bit+0x1304>
+ .byte 15,89,37,121,111,1,0 // mulps 0x16f79(%rip),%xmm4 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
+ .byte 102,15,111,45,129,111,1,0 // movdqa 0x16f81(%rip),%xmm5 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,67,101,1,0 // mulps 0x16543(%rip),%xmm5 # 2c730 <_sk_overlay_sse2_8bit+0x1314>
- .byte 102,15,111,53,75,101,1,0 // movdqa 0x1654b(%rip),%xmm6 # 2c740 <_sk_overlay_sse2_8bit+0x1324>
+ .byte 15,89,45,131,111,1,0 // mulps 0x16f83(%rip),%xmm5 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
+ .byte 102,15,111,53,139,111,1,0 // movdqa 0x16f8b(%rip),%xmm6 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,77,101,1,0 // mulps 0x1654d(%rip),%xmm6 # 2c750 <_sk_overlay_sse2_8bit+0x1334>
- .byte 102,15,219,61,85,101,1,0 // pand 0x16555(%rip),%xmm7 # 2c760 <_sk_overlay_sse2_8bit+0x1344>
+ .byte 15,89,53,141,111,1,0 // mulps 0x16f8d(%rip),%xmm6 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
+ .byte 102,15,219,61,149,111,1,0 // pand 0x16f95(%rip),%xmm7 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,91,101,1,0 // mulps 0x1655b(%rip),%xmm7 # 2c770 <_sk_overlay_sse2_8bit+0x1354>
+ .byte 15,89,61,155,111,1,0 // mulps 0x16f9b(%rip),%xmm7 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
@@ -30914,21 +30914,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,64 // movzwl (%r8,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,45,100,1,0 // movdqa 0x1642d(%rip),%xmm0 # 2c700 <_sk_overlay_sse2_8bit+0x12e4>
+ .byte 102,15,111,5,109,110,1,0 // movdqa 0x16e6d(%rip),%xmm0 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,47,100,1,0 // mulps 0x1642f(%rip),%xmm0 # 2c710 <_sk_overlay_sse2_8bit+0x12f4>
- .byte 102,15,111,13,55,100,1,0 // movdqa 0x16437(%rip),%xmm1 # 2c720 <_sk_overlay_sse2_8bit+0x1304>
+ .byte 15,89,5,111,110,1,0 // mulps 0x16e6f(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
+ .byte 102,15,111,13,119,110,1,0 // movdqa 0x16e77(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,57,100,1,0 // mulps 0x16439(%rip),%xmm1 # 2c730 <_sk_overlay_sse2_8bit+0x1314>
- .byte 102,15,111,21,65,100,1,0 // movdqa 0x16441(%rip),%xmm2 # 2c740 <_sk_overlay_sse2_8bit+0x1324>
+ .byte 15,89,13,121,110,1,0 // mulps 0x16e79(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
+ .byte 102,15,111,21,129,110,1,0 // movdqa 0x16e81(%rip),%xmm2 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,67,100,1,0 // mulps 0x16443(%rip),%xmm2 # 2c750 <_sk_overlay_sse2_8bit+0x1334>
- .byte 102,15,219,29,75,100,1,0 // pand 0x1644b(%rip),%xmm3 # 2c760 <_sk_overlay_sse2_8bit+0x1344>
+ .byte 15,89,21,131,110,1,0 // mulps 0x16e83(%rip),%xmm2 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
+ .byte 102,15,219,29,139,110,1,0 // pand 0x16e8b(%rip),%xmm3 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,81,100,1,0 // mulps 0x16451(%rip),%xmm3 # 2c770 <_sk_overlay_sse2_8bit+0x1354>
+ .byte 15,89,29,145,110,1,0 // mulps 0x16e91(%rip),%xmm3 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30943,7 +30943,7 @@ _sk_store_4444_sse41:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,63,100,1,0 // movaps 0x1643f(%rip),%xmm8 # 2c780 <_sk_overlay_sse2_8bit+0x1364>
+ .byte 68,15,40,5,127,110,1,0 // movaps 0x16e7f(%rip),%xmm8 # 2d1c0 <_sk_overlay_sse2_8bit+0x13e8>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -30997,17 +30997,17 @@ _sk_load_8888_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,89 // jne 1645c <_sk_load_8888_sse41+0x75>
.byte 243,65,15,111,28,128 // movdqu (%r8,%rax,4),%xmm3
- .byte 102,15,111,5,95,95,1,0 // movdqa 0x15f5f(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,5,159,105,1,0 // movdqa 0x1699f(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,160,96,1,0 // movaps 0x160a0(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,224,106,1,0 // movaps 0x16ae0(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,79,95,1,0 // pshufb 0x15f4f(%rip),%xmm1 # 2c380 <_sk_overlay_sse2_8bit+0xf64>
+ .byte 102,15,56,0,13,143,105,1,0 // pshufb 0x1698f(%rip),%xmm1 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,75,95,1,0 // pshufb 0x15f4b(%rip),%xmm2 # 2c390 <_sk_overlay_sse2_8bit+0xf74>
+ .byte 102,15,56,0,21,139,105,1,0 // pshufb 0x1698b(%rip),%xmm2 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31046,17 +31046,17 @@ _sk_load_8888_dst_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,89 // jne 16516 <_sk_load_8888_dst_sse41+0x75>
.byte 243,65,15,111,60,128 // movdqu (%r8,%rax,4),%xmm7
- .byte 102,15,111,37,165,94,1,0 // movdqa 0x15ea5(%rip),%xmm4 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,37,229,104,1,0 // movdqa 0x168e5(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,230,95,1,0 // movaps 0x15fe6(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,38,106,1,0 // movaps 0x16a26(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,149,94,1,0 // pshufb 0x15e95(%rip),%xmm5 # 2c380 <_sk_overlay_sse2_8bit+0xf64>
+ .byte 102,15,56,0,45,213,104,1,0 // pshufb 0x168d5(%rip),%xmm5 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,145,94,1,0 // pshufb 0x15e91(%rip),%xmm6 # 2c390 <_sk_overlay_sse2_8bit+0xf74>
+ .byte 102,15,56,0,53,209,104,1,0 // pshufb 0x168d1(%rip),%xmm6 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -31103,17 +31103,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,128,1 // pinsrd $0x1,(%r8,%rax,4),%xmm3
.byte 102,67,15,58,34,28,152,2 // pinsrd $0x2,(%r8,%r11,4),%xmm3
.byte 102,67,15,58,34,28,144,3 // pinsrd $0x3,(%r8,%r10,4),%xmm3
- .byte 102,15,111,5,181,93,1,0 // movdqa 0x15db5(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,5,245,103,1,0 // movdqa 0x167f5(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,246,94,1,0 // movaps 0x15ef6(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,54,105,1,0 // movaps 0x16936(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,165,93,1,0 // pshufb 0x15da5(%rip),%xmm1 # 2c380 <_sk_overlay_sse2_8bit+0xf64>
+ .byte 102,15,56,0,13,229,103,1,0 // pshufb 0x167e5(%rip),%xmm1 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,161,93,1,0 // pshufb 0x15da1(%rip),%xmm2 # 2c390 <_sk_overlay_sse2_8bit+0xf74>
+ .byte 102,15,56,0,21,225,103,1,0 // pshufb 0x167e1(%rip),%xmm2 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31133,7 +31133,7 @@ _sk_store_8888_sse41:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,123,93,1,0 // movaps 0x15d7b(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,5,187,103,1,0 // movaps 0x167bb(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -31184,17 +31184,17 @@ _sk_load_bgra_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,89 // jne 1672c <_sk_load_bgra_sse41+0x75>
.byte 243,65,15,111,28,128 // movdqu (%r8,%rax,4),%xmm3
- .byte 102,15,111,5,143,92,1,0 // movdqa 0x15c8f(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,5,207,102,1,0 // movdqa 0x166cf(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,208,93,1,0 // movaps 0x15dd0(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,16,104,1,0 // movaps 0x16810(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,127,92,1,0 // pshufb 0x15c7f(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0xf64>
+ .byte 102,15,56,0,5,191,102,1,0 // pshufb 0x166bf(%rip),%xmm0 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,123,92,1,0 // pshufb 0x15c7b(%rip),%xmm0 # 2c390 <_sk_overlay_sse2_8bit+0xf74>
+ .byte 102,15,56,0,5,187,102,1,0 // pshufb 0x166bb(%rip),%xmm0 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31233,17 +31233,17 @@ _sk_load_bgra_dst_sse41:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,89 // jne 167e6 <_sk_load_bgra_dst_sse41+0x75>
.byte 243,65,15,111,60,128 // movdqu (%r8,%rax,4),%xmm7
- .byte 102,15,111,37,213,91,1,0 // movdqa 0x15bd5(%rip),%xmm4 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,37,21,102,1,0 // movdqa 0x16615(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,244 // cvtdq2ps %xmm4,%xmm6
- .byte 68,15,40,5,22,93,1,0 // movaps 0x15d16(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,86,103,1,0 // movaps 0x16756(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,197,91,1,0 // pshufb 0x15bc5(%rip),%xmm4 # 2c380 <_sk_overlay_sse2_8bit+0xf64>
+ .byte 102,15,56,0,37,5,102,1,0 // pshufb 0x16605(%rip),%xmm4 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
.byte 15,91,236 // cvtdq2ps %xmm4,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,193,91,1,0 // pshufb 0x15bc1(%rip),%xmm4 # 2c390 <_sk_overlay_sse2_8bit+0xf74>
+ .byte 102,15,56,0,37,1,102,1,0 // pshufb 0x16601(%rip),%xmm4 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -31290,17 +31290,17 @@ _sk_gather_bgra_sse41:
.byte 102,65,15,58,34,28,128,1 // pinsrd $0x1,(%r8,%rax,4),%xmm3
.byte 102,67,15,58,34,28,152,2 // pinsrd $0x2,(%r8,%r11,4),%xmm3
.byte 102,67,15,58,34,28,144,3 // pinsrd $0x3,(%r8,%r10,4),%xmm3
- .byte 102,15,111,5,229,90,1,0 // movdqa 0x15ae5(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,5,37,101,1,0 // movdqa 0x16525(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,38,92,1,0 // movaps 0x15c26(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,102,102,1,0 // movaps 0x16666(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,213,90,1,0 // pshufb 0x15ad5(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0xf64>
+ .byte 102,15,56,0,5,21,101,1,0 // pshufb 0x16515(%rip),%xmm0 # 2cdc0 <_sk_overlay_sse2_8bit+0xfe8>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,209,90,1,0 // pshufb 0x15ad1(%rip),%xmm0 # 2c390 <_sk_overlay_sse2_8bit+0xf74>
+ .byte 102,15,56,0,5,17,101,1,0 // pshufb 0x16511(%rip),%xmm0 # 2cdd0 <_sk_overlay_sse2_8bit+0xff8>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31320,7 +31320,7 @@ _sk_store_bgra_sse41:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,171,90,1,0 // movaps 0x15aab(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,5,235,100,1,0 // movaps 0x164eb(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -31379,18 +31379,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,176,93,1,0 // movdqa 0x15db0(%rip),%xmm8 # 2c790 <_sk_overlay_sse2_8bit+0x1374>
+ .byte 102,68,15,111,5,240,103,1,0 // movdqa 0x167f0(%rip),%xmm8 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,171,93,1,0 // movdqa 0x15dab(%rip),%xmm3 # 2c7a0 <_sk_overlay_sse2_8bit+0x1384>
+ .byte 102,15,111,29,235,103,1,0 // movdqa 0x167eb(%rip),%xmm3 # 2d1e0 <_sk_overlay_sse2_8bit+0x1408>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,151,93,1,0 // movdqa 0x15d97(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x1394>
+ .byte 102,68,15,111,21,215,103,1,0 // movdqa 0x167d7(%rip),%xmm10 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -31466,18 +31466,18 @@ _sk_load_f16_dst_sse41:
.byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11
.byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9
.byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5
- .byte 102,68,15,111,5,24,92,1,0 // movdqa 0x15c18(%rip),%xmm8 # 2c790 <_sk_overlay_sse2_8bit+0x1374>
+ .byte 102,68,15,111,5,88,102,1,0 // movdqa 0x16658(%rip),%xmm8 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
.byte 102,15,111,245 // movdqa %xmm5,%xmm6
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,239,238 // pxor %xmm6,%xmm5
- .byte 102,15,111,61,19,92,1,0 // movdqa 0x15c13(%rip),%xmm7 # 2c7a0 <_sk_overlay_sse2_8bit+0x1384>
+ .byte 102,15,111,61,83,102,1,0 // movdqa 0x16653(%rip),%xmm7 # 2d1e0 <_sk_overlay_sse2_8bit+0x1408>
.byte 102,15,114,246,16 // pslld $0x10,%xmm6
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4
.byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4
.byte 102,15,114,245,13 // pslld $0xd,%xmm5
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,68,15,111,21,255,91,1,0 // movdqa 0x15bff(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x1394>
+ .byte 102,68,15,111,21,63,102,1,0 // movdqa 0x1663f(%rip),%xmm10 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
.byte 102,65,15,254,234 // paddd %xmm10,%xmm5
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -31562,18 +31562,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,83,90,1,0 // movdqa 0x15a53(%rip),%xmm8 # 2c790 <_sk_overlay_sse2_8bit+0x1374>
+ .byte 102,68,15,111,5,147,100,1,0 // movdqa 0x16493(%rip),%xmm8 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,78,90,1,0 // movdqa 0x15a4e(%rip),%xmm3 # 2c7a0 <_sk_overlay_sse2_8bit+0x1384>
+ .byte 102,15,111,29,142,100,1,0 // movdqa 0x1648e(%rip),%xmm3 # 2d1e0 <_sk_overlay_sse2_8bit+0x1408>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,58,90,1,0 // movdqa 0x15a3a(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x1394>
+ .byte 102,68,15,111,21,122,100,1,0 // movdqa 0x1647a(%rip),%xmm10 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -31626,17 +31626,17 @@ _sk_store_f16_sse41:
.byte 73,193,224,3 // shl $0x3,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,94,89,1,0 // movdqa 0x1595e(%rip),%xmm10 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
+ .byte 102,68,15,111,21,158,99,1,0 // movdqa 0x1639e(%rip),%xmm10 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
.byte 102,68,15,111,216 // movdqa %xmm0,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,235 // pxor %xmm11,%xmm13
- .byte 102,68,15,111,13,81,89,1,0 // movdqa 0x15951(%rip),%xmm9 # 2c7d0 <_sk_overlay_sse2_8bit+0x13b4>
+ .byte 102,68,15,111,13,145,99,1,0 // movdqa 0x16391(%rip),%xmm9 # 2d210 <_sk_overlay_sse2_8bit+0x1438>
.byte 102,65,15,114,211,16 // psrld $0x10,%xmm11
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,37,66,89,1,0 // movdqa 0x15942(%rip),%xmm12 # 2c7e0 <_sk_overlay_sse2_8bit+0x13c4>
+ .byte 102,68,15,111,37,130,99,1,0 // movdqa 0x16382(%rip),%xmm12 # 2d220 <_sk_overlay_sse2_8bit+0x1448>
.byte 102,69,15,235,220 // por %xmm12,%xmm11
.byte 102,69,15,254,221 // paddd %xmm13,%xmm11
.byte 102,69,15,223,195 // pandn %xmm11,%xmm8
@@ -31725,7 +31725,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,34,85,1,0 // movaps 0x15522(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0x1134>
+ .byte 68,15,40,5,98,95,1,0 // movaps 0x15f62(%rip),%xmm8 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -31799,7 +31799,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,241,83,1,0 // movaps 0x153f1(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0x1134>
+ .byte 68,15,40,5,49,94,1,0 // movaps 0x15e31(%rip),%xmm8 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -31816,7 +31816,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,24,81,1,0 // movaps 0x15118(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,88,91,1,0 // movaps 0x15b58(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,64 // movd (%r8,%rax,2),%xmm2
.byte 102,65,15,196,84,64,4,2 // pinsrw $0x2,0x4(%r8,%rax,2),%xmm2
@@ -31850,7 +31850,7 @@ _sk_store_u16_be_sse41:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
- .byte 68,15,40,21,193,85,1,0 // movaps 0x155c1(%rip),%xmm10 # 2c7f0 <_sk_overlay_sse2_8bit+0x13d4>
+ .byte 68,15,40,21,1,96,1,0 // movaps 0x16001(%rip),%xmm10 # 2d230 <_sk_overlay_sse2_8bit+0x1458>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -32125,7 +32125,7 @@ _sk_mirror_x_sse41:
.byte 65,15,92,194 // subps %xmm10,%xmm0
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,99,66,1,0 // mulss 0x14263(%rip),%xmm9 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 243,68,15,89,13,31,76,1,0 // mulss 0x14c1f(%rip),%xmm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -32156,7 +32156,7 @@ _sk_mirror_y_sse41:
.byte 65,15,92,202 // subps %xmm10,%xmm1
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,241,65,1,0 // mulss 0x141f1(%rip),%xmm9 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 243,68,15,89,13,173,75,1,0 // mulss 0x14bad(%rip),%xmm9 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,201 // mulps %xmm1,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -32181,7 +32181,7 @@ FUNCTION(_sk_clamp_x_1_sse41)
_sk_clamp_x_1_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,4,76,1,0 // minps 0x14c04(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,93,5,68,86,1,0 // minps 0x15644(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -32199,9 +32199,9 @@ HIDDEN _sk_mirror_x_1_sse41
.globl _sk_mirror_x_1_sse41
FUNCTION(_sk_mirror_x_1_sse41)
_sk_mirror_x_1_sse41:
- .byte 68,15,40,5,69,76,1,0 // movaps 0x14c45(%rip),%xmm8 # 2c320 <_sk_overlay_sse2_8bit+0xf04>
+ .byte 68,15,40,5,133,86,1,0 // movaps 0x15685(%rip),%xmm8 # 2cd60 <_sk_overlay_sse2_8bit+0xf88>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,185,75,1,0 // movaps 0x14bb9(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,13,249,85,1,0 // movaps 0x155f9(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
.byte 69,15,88,201 // addps %xmm9,%xmm9
@@ -32218,10 +32218,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,232,80,1,0 // mulps 0x150e8(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x13e4>
- .byte 15,89,13,241,80,1,0 // mulps 0x150f1(%rip),%xmm1 # 2c810 <_sk_overlay_sse2_8bit+0x13f4>
+ .byte 15,89,5,40,91,1,0 // mulps 0x15b28(%rip),%xmm0 # 2d240 <_sk_overlay_sse2_8bit+0x1468>
+ .byte 15,89,13,49,91,1,0 // mulps 0x15b31(%rip),%xmm1 # 2d250 <_sk_overlay_sse2_8bit+0x1478>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,247,80,1,0 // mulps 0x150f7(%rip),%xmm3 # 2c820 <_sk_overlay_sse2_8bit+0x1404>
+ .byte 15,89,29,55,91,1,0 // mulps 0x15b37(%rip),%xmm3 # 2d260 <_sk_overlay_sse2_8bit+0x1488>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -32624,15 +32624,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41
.globl _sk_gauss_a_to_rgba_sse41
FUNCTION(_sk_gauss_a_to_rgba_sse41)
_sk_gauss_a_to_rgba_sse41:
- .byte 15,40,5,166,74,1,0 // movaps 0x14aa6(%rip),%xmm0 # 2c830 <_sk_overlay_sse2_8bit+0x1414>
+ .byte 15,40,5,230,84,1,0 // movaps 0x154e6(%rip),%xmm0 # 2d270 <_sk_overlay_sse2_8bit+0x1498>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,172,74,1,0 // addps 0x14aac(%rip),%xmm0 # 2c840 <_sk_overlay_sse2_8bit+0x1424>
+ .byte 15,88,5,236,84,1,0 // addps 0x154ec(%rip),%xmm0 # 2d280 <_sk_overlay_sse2_8bit+0x14a8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,178,74,1,0 // addps 0x14ab2(%rip),%xmm0 # 2c850 <_sk_overlay_sse2_8bit+0x1434>
+ .byte 15,88,5,242,84,1,0 // addps 0x154f2(%rip),%xmm0 # 2d290 <_sk_overlay_sse2_8bit+0x14b8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,184,74,1,0 // addps 0x14ab8(%rip),%xmm0 # 2c860 <_sk_overlay_sse2_8bit+0x1444>
+ .byte 15,88,5,248,84,1,0 // addps 0x154f8(%rip),%xmm0 # 2d2a0 <_sk_overlay_sse2_8bit+0x14c8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,190,74,1,0 // addps 0x14abe(%rip),%xmm0 # 2c870 <_sk_overlay_sse2_8bit+0x1454>
+ .byte 15,88,5,254,84,1,0 // addps 0x154fe(%rip),%xmm0 # 2d2b0 <_sk_overlay_sse2_8bit+0x14d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -32652,7 +32652,7 @@ _sk_gradient_sse41:
.byte 73,255,200 // dec %r8
.byte 73,131,193,4 // add $0x4,%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,236,68,1,0 // movaps 0x144ec(%rip),%xmm2 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 15,40,21,44,79,1,0 // movaps 0x14f2c(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 243,65,15,16,25 // movss (%r9),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -32791,26 +32791,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,43,72,1,0 // movaps 0x1482b(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1464>
+ .byte 68,15,40,21,107,82,1,0 // movaps 0x1526b(%rip),%xmm10 # 2d2c0 <_sk_overlay_sse2_8bit+0x14e8>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,47,72,1,0 // addps 0x1482f(%rip),%xmm10 # 2c890 <_sk_overlay_sse2_8bit+0x1474>
+ .byte 68,15,88,21,111,82,1,0 // addps 0x1526f(%rip),%xmm10 # 2d2d0 <_sk_overlay_sse2_8bit+0x14f8>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,51,72,1,0 // addps 0x14833(%rip),%xmm10 # 2c8a0 <_sk_overlay_sse2_8bit+0x1484>
+ .byte 68,15,88,21,115,82,1,0 // addps 0x15273(%rip),%xmm10 # 2d2e0 <_sk_overlay_sse2_8bit+0x1508>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,55,72,1,0 // addps 0x14837(%rip),%xmm10 # 2c8b0 <_sk_overlay_sse2_8bit+0x1494>
+ .byte 68,15,88,21,119,82,1,0 // addps 0x15277(%rip),%xmm10 # 2d2f0 <_sk_overlay_sse2_8bit+0x1518>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,54,72,1,0 // movaps 0x14836(%rip),%xmm11 # 2c8c0 <_sk_overlay_sse2_8bit+0x14a4>
+ .byte 68,15,40,29,118,82,1,0 // movaps 0x15276(%rip),%xmm11 # 2d300 <_sk_overlay_sse2_8bit+0x1528>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,255,65,1,0 // movaps 0x141ff(%rip),%xmm11 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,29,63,76,1,0 // movaps 0x14c3f(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,1,66,1,0 // movaps 0x14201(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,65,76,1,0 // movaps 0x14c41(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -32844,7 +32844,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,170,71,1,0 // mulps 0x147aa(%rip),%xmm9 # 2c8d0 <_sk_overlay_sse2_8bit+0x14b4>
+ .byte 68,15,89,13,234,81,1,0 // mulps 0x151ea(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -32852,7 +32852,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,149,71,1,0 // mulps 0x14795(%rip),%xmm10 # 2c8e0 <_sk_overlay_sse2_8bit+0x14c4>
+ .byte 68,15,89,21,213,81,1,0 // mulps 0x151d5(%rip),%xmm10 # 2d320 <_sk_overlay_sse2_8bit+0x1548>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -32861,8 +32861,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,77,70,1,0 // xorps 0x1464d(%rip),%xmm9 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
- .byte 68,15,89,5,37,65,1,0 // mulps 0x14125(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,87,13,141,80,1,0 // xorps 0x1508d(%rip),%xmm9 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 68,15,89,5,101,75,1,0 // mulps 0x14b65(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -32883,7 +32883,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,12,71,1,0 // mulps 0x1470c(%rip),%xmm9 # 2c8d0 <_sk_overlay_sse2_8bit+0x14b4>
+ .byte 68,15,89,13,76,81,1,0 // mulps 0x1514c(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -32891,7 +32891,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,247,70,1,0 // mulps 0x146f7(%rip),%xmm10 # 2c8e0 <_sk_overlay_sse2_8bit+0x14c4>
+ .byte 68,15,89,21,55,81,1,0 // mulps 0x15137(%rip),%xmm10 # 2d320 <_sk_overlay_sse2_8bit+0x1548>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -32900,8 +32900,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,175,69,1,0 // xorps 0x145af(%rip),%xmm9 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
- .byte 68,15,89,5,135,64,1,0 // mulps 0x14087(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,87,13,239,79,1,0 // xorps 0x14fef(%rip),%xmm9 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 68,15,89,5,199,74,1,0 // mulps 0x14ac7(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -32919,7 +32919,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,127,70,1,0 // mulps 0x1467f(%rip),%xmm9 # 2c8d0 <_sk_overlay_sse2_8bit+0x14b4>
+ .byte 68,15,89,13,191,80,1,0 // mulps 0x150bf(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -32927,7 +32927,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,75,69,1,0 // xorps 0x1454b(%rip),%xmm0 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
+ .byte 15,87,5,139,79,1,0 // xorps 0x14f8b(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -32970,7 +32970,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,193,63,1,0 // movaps 0x13fc1(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,5,1,74,1,0 // movaps 0x14a01(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -33014,8 +33014,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,131,69,1,0 // addps 0x14583(%rip),%xmm0 # 2c8f0 <_sk_overlay_sse2_8bit+0x14d4>
- .byte 68,15,40,13,75,63,1,0 // movaps 0x13f4b(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,5,195,79,1,0 // addps 0x14fc3(%rip),%xmm0 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
+ .byte 68,15,40,13,139,73,1,0 // movaps 0x1498b(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33028,7 +33028,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,10,63,1,0 // addps 0x13f0a(%rip),%xmm0 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 15,88,5,74,73,1,0 // addps 0x1494a(%rip),%xmm0 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33040,8 +33040,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,60,69,1,0 // addps 0x1453c(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x14d4>
- .byte 68,15,40,13,4,63,1,0 // movaps 0x13f04(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,13,124,79,1,0 // addps 0x14f7c(%rip),%xmm1 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
+ .byte 68,15,40,13,68,73,1,0 // movaps 0x14944(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33054,7 +33054,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,194,62,1,0 // addps 0x13ec2(%rip),%xmm1 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 15,88,13,2,73,1,0 // addps 0x14902(%rip),%xmm1 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33066,13 +33066,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,5,69,1,0 // addps 0x14505(%rip),%xmm0 # 2c900 <_sk_overlay_sse2_8bit+0x14e4>
- .byte 68,15,40,13,189,62,1,0 // movaps 0x13ebd(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,5,69,79,1,0 // addps 0x14f45(%rip),%xmm0 # 2d340 <_sk_overlay_sse2_8bit+0x1568>
+ .byte 68,15,40,13,253,72,1,0 // movaps 0x148fd(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,249,68,1,0 // mulps 0x144f9(%rip),%xmm9 # 2c910 <_sk_overlay_sse2_8bit+0x14f4>
- .byte 68,15,88,13,145,64,1,0 // addps 0x14091(%rip),%xmm9 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 68,15,89,13,57,79,1,0 // mulps 0x14f39(%rip),%xmm9 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
+ .byte 68,15,88,13,209,74,1,0 // addps 0x14ad1(%rip),%xmm9 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33085,16 +33085,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,176,68,1,0 // addps 0x144b0(%rip),%xmm0 # 2c8f0 <_sk_overlay_sse2_8bit+0x14d4>
- .byte 68,15,40,13,120,62,1,0 // movaps 0x13e78(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,5,240,78,1,0 // addps 0x14ef0(%rip),%xmm0 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
+ .byte 68,15,40,13,184,72,1,0 // movaps 0x148b8(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,204,68,1,0 // movaps 0x144cc(%rip),%xmm8 # 2c920 <_sk_overlay_sse2_8bit+0x1504>
+ .byte 68,15,40,5,12,79,1,0 // movaps 0x14f0c(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,208,68,1,0 // addps 0x144d0(%rip),%xmm8 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 68,15,88,5,16,79,1,0 // addps 0x14f10(%rip),%xmm8 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,52,62,1,0 // addps 0x13e34(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,88,5,116,72,1,0 // addps 0x14874(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,200,68,1,0 // addps 0x144c8(%rip),%xmm8 # 2c940 <_sk_overlay_sse2_8bit+0x1524>
+ .byte 68,15,88,5,8,79,1,0 // addps 0x14f08(%rip),%xmm8 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33104,17 +33104,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,18,62,1,0 // movaps 0x13e12(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,5,82,72,1,0 // movaps 0x14852(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,126,68,1,0 // movaps 0x1447e(%rip),%xmm10 # 2c920 <_sk_overlay_sse2_8bit+0x1504>
+ .byte 68,15,40,21,190,78,1,0 // movaps 0x14ebe(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,130,68,1,0 // addps 0x14482(%rip),%xmm10 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 68,15,88,21,194,78,1,0 // addps 0x14ec2(%rip),%xmm10 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,126,68,1,0 // addps 0x1447e(%rip),%xmm10 # 2c940 <_sk_overlay_sse2_8bit+0x1524>
+ .byte 68,15,88,21,190,78,1,0 // addps 0x14ebe(%rip),%xmm10 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33126,11 +33126,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,81,68,1,0 // addps 0x14451(%rip),%xmm0 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 15,88,5,145,78,1,0 // addps 0x14e91(%rip),%xmm0 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,33,68,1,0 // mulps 0x14421(%rip),%xmm8 # 2c910 <_sk_overlay_sse2_8bit+0x14f4>
- .byte 68,15,88,5,185,63,1,0 // addps 0x13fb9(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 68,15,89,5,97,78,1,0 // mulps 0x14e61(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
+ .byte 68,15,88,5,249,73,1,0 // addps 0x149f9(%rip),%xmm8 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33143,13 +33143,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,231,67,1,0 // addps 0x143e7(%rip),%xmm1 # 2c900 <_sk_overlay_sse2_8bit+0x14e4>
- .byte 68,15,40,13,159,61,1,0 // movaps 0x13d9f(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,13,39,78,1,0 // addps 0x14e27(%rip),%xmm1 # 2d340 <_sk_overlay_sse2_8bit+0x1568>
+ .byte 68,15,40,13,223,71,1,0 // movaps 0x147df(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,219,67,1,0 // mulps 0x143db(%rip),%xmm9 # 2c910 <_sk_overlay_sse2_8bit+0x14f4>
- .byte 68,15,88,13,115,63,1,0 // addps 0x13f73(%rip),%xmm9 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 68,15,89,13,27,78,1,0 // mulps 0x14e1b(%rip),%xmm9 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
+ .byte 68,15,88,13,179,73,1,0 // addps 0x149b3(%rip),%xmm9 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33162,16 +33162,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,145,67,1,0 // addps 0x14391(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x14d4>
- .byte 68,15,40,13,89,61,1,0 // movaps 0x13d59(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,13,209,77,1,0 // addps 0x14dd1(%rip),%xmm1 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
+ .byte 68,15,40,13,153,71,1,0 // movaps 0x14799(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,173,67,1,0 // movaps 0x143ad(%rip),%xmm8 # 2c920 <_sk_overlay_sse2_8bit+0x1504>
+ .byte 68,15,40,5,237,77,1,0 // movaps 0x14ded(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,177,67,1,0 // addps 0x143b1(%rip),%xmm8 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 68,15,88,5,241,77,1,0 // addps 0x14df1(%rip),%xmm8 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,21,61,1,0 // addps 0x13d15(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,88,5,85,71,1,0 // addps 0x14755(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,169,67,1,0 // addps 0x143a9(%rip),%xmm8 # 2c940 <_sk_overlay_sse2_8bit+0x1524>
+ .byte 68,15,88,5,233,77,1,0 // addps 0x14de9(%rip),%xmm8 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33181,17 +33181,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,243,60,1,0 // movaps 0x13cf3(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,5,51,71,1,0 // movaps 0x14733(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,94,67,1,0 // movaps 0x1435e(%rip),%xmm10 # 2c920 <_sk_overlay_sse2_8bit+0x1504>
+ .byte 68,15,40,21,158,77,1,0 // movaps 0x14d9e(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,98,67,1,0 // addps 0x14362(%rip),%xmm10 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 68,15,88,21,162,77,1,0 // addps 0x14da2(%rip),%xmm10 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,94,67,1,0 // addps 0x1435e(%rip),%xmm10 # 2c940 <_sk_overlay_sse2_8bit+0x1524>
+ .byte 68,15,88,21,158,77,1,0 // addps 0x14d9e(%rip),%xmm10 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33203,11 +33203,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,48,67,1,0 // addps 0x14330(%rip),%xmm1 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 15,88,13,112,77,1,0 // addps 0x14d70(%rip),%xmm1 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,0,67,1,0 // mulps 0x14300(%rip),%xmm8 # 2c910 <_sk_overlay_sse2_8bit+0x14f4>
- .byte 68,15,88,5,152,62,1,0 // addps 0x13e98(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 68,15,89,5,64,77,1,0 // mulps 0x14d40(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
+ .byte 68,15,88,5,216,72,1,0 // addps 0x148d8(%rip),%xmm8 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33350,10 +33350,10 @@ _sk_clut_3D_sse41:
.byte 102,68,15,56,64,227 // pmulld %xmm3,%xmm12
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,15,254,209 // paddd %xmm1,%xmm2
- .byte 102,15,111,37,96,65,1,0 // movdqa 0x14160(%rip),%xmm4 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,37,160,75,1,0 // movdqa 0x14ba0(%rip),%xmm4 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
- .byte 102,68,15,111,61,189,58,1,0 // movdqa 0x13abd(%rip),%xmm15 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,111,61,253,68,1,0 // movdqa 0x144fd(%rip),%xmm15 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,65,15,254,231 // paddd %xmm15,%xmm4
.byte 102,73,15,58,22,224,1 // pextrq $0x1,%xmm4,%r8
@@ -33373,7 +33373,7 @@ _sk_clut_3D_sse41:
.byte 102,65,15,58,22,209,1 // pextrd $0x1,%xmm2,%r9d
.byte 102,65,15,58,22,210,2 // pextrd $0x2,%xmm2,%r10d
.byte 102,65,15,58,22,211,3 // pextrd $0x3,%xmm2,%r11d
- .byte 102,68,15,111,13,110,58,1,0 // movdqa 0x13a6e(%rip),%xmm9 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,68,15,111,13,174,68,1,0 // movdqa 0x144ae(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,65,15,254,209 // paddd %xmm9,%xmm2
.byte 102,73,15,58,22,214,1 // pextrq $0x1,%xmm2,%r14
.byte 102,72,15,126,211 // movq %xmm2,%rbx
@@ -33387,7 +33387,7 @@ _sk_clut_3D_sse41:
.byte 73,193,238,32 // shr $0x20,%r14
.byte 243,66,15,16,20,176 // movss (%rax,%r14,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
- .byte 15,40,45,131,64,1,0 // movaps 0x14083(%rip),%xmm5 # 2c950 <_sk_overlay_sse2_8bit+0x1534>
+ .byte 15,40,45,195,74,1,0 // movaps 0x14ac3(%rip),%xmm5 # 2d390 <_sk_overlay_sse2_8bit+0x15b8>
.byte 68,15,88,197 // addps %xmm5,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 15,40,215 // movaps %xmm7,%xmm2
@@ -33556,7 +33556,7 @@ _sk_clut_3D_sse41:
.byte 102,68,15,254,232 // paddd %xmm0,%xmm13
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
- .byte 102,15,111,45,54,61,1,0 // movdqa 0x13d36(%rip),%xmm5 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,45,118,71,1,0 // movdqa 0x14776(%rip),%xmm5 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,56,64,213 // pmulld %xmm5,%xmm2
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,254,207 // paddd %xmm15,%xmm1
@@ -33662,7 +33662,7 @@ _sk_clut_3D_sse41:
.byte 102,69,15,58,22,225,1 // pextrd $0x1,%xmm12,%r9d
.byte 102,69,15,58,22,226,2 // pextrd $0x2,%xmm12,%r10d
.byte 102,69,15,58,22,227,3 // pextrd $0x3,%xmm12,%r11d
- .byte 102,15,111,21,145,52,1,0 // movdqa 0x13491(%rip),%xmm2 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,111,21,209,62,1,0 // movdqa 0x13ed1(%rip),%xmm2 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,68,15,254,226 // paddd %xmm2,%xmm12
.byte 102,76,15,58,22,225,1 // pextrq $0x1,%xmm12,%rcx
.byte 102,76,15,126,227 // movq %xmm12,%rbx
@@ -33837,8 +33837,8 @@ _sk_clut_4D_sse41:
.byte 102,65,15,111,197 // movdqa %xmm13,%xmm0
.byte 102,68,15,127,108,36,176 // movdqa %xmm13,-0x50(%rsp)
.byte 102,15,254,193 // paddd %xmm1,%xmm0
- .byte 102,15,56,64,5,255,55,1,0 // pmulld 0x137ff(%rip),%xmm0 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
- .byte 102,68,15,111,29,102,49,1,0 // movdqa 0x13166(%rip),%xmm11 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,56,64,5,63,66,1,0 // pmulld 0x1423f(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,68,15,111,29,166,59,1,0 // movdqa 0x13ba6(%rip),%xmm11 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,65,15,254,211 // paddd %xmm11,%xmm2
.byte 102,73,15,58,22,208,1 // pextrq $0x1,%xmm2,%r8
@@ -33858,7 +33858,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,68,15,111,5,23,49,1,0 // movdqa 0x13117(%rip),%xmm8 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,68,15,111,5,87,59,1,0 // movdqa 0x13b57(%rip),%xmm8 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,73,15,58,22,198,1 // pextrq $0x1,%xmm0,%r14
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -33872,7 +33872,7 @@ _sk_clut_4D_sse41:
.byte 73,193,238,32 // shr $0x20,%r14
.byte 243,66,15,16,4,176 // movss (%rax,%r14,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
- .byte 15,40,53,44,55,1,0 // movaps 0x1372c(%rip),%xmm6 # 2c950 <_sk_overlay_sse2_8bit+0x1534>
+ .byte 15,40,53,108,65,1,0 // movaps 0x1416c(%rip),%xmm6 # 2d390 <_sk_overlay_sse2_8bit+0x15b8>
.byte 68,15,88,214 // addps %xmm6,%xmm10
.byte 68,15,41,84,36,48 // movaps %xmm10,0x30(%rsp)
.byte 15,88,254 // addps %xmm6,%xmm7
@@ -33885,7 +33885,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,68,15,111,214 // movdqa %xmm6,%xmm10
.byte 102,68,15,127,84,36,160 // movdqa %xmm10,-0x60(%rsp)
- .byte 102,15,56,64,13,253,54,1,0 // pmulld 0x136fd(%rip),%xmm1 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,56,64,13,61,65,1,0 // pmulld 0x1413d(%rip),%xmm1 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,73,15,58,22,230,1 // pextrq $0x1,%xmm4,%r14
@@ -33943,11 +33943,11 @@ _sk_clut_4D_sse41:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,5,207,53,1,0 // movdqa 0x135cf(%rip),%xmm0 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,5,15,64,1,0 // movdqa 0x1400f(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,56,64,200 // pmulld %xmm0,%xmm1
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,5,40,47,1,0 // movdqa 0x12f28(%rip),%xmm8 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,111,5,104,57,1,0 // movdqa 0x13968(%rip),%xmm8 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,197 // movq %xmm0,%rbp
@@ -34049,7 +34049,7 @@ _sk_clut_4D_sse41:
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,68,15,111,108,36,176 // movdqa -0x50(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,45,157,51,1,0 // movdqa 0x1339d(%rip),%xmm5 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,45,221,61,1,0 // movdqa 0x13ddd(%rip),%xmm5 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,56,64,205 // pmulld %xmm5,%xmm1
.byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,58,22,205,1 // pextrd $0x1,%xmm1,%ebp
@@ -34061,7 +34061,7 @@ _sk_clut_4D_sse41:
.byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,198,44,1,0 // movdqa 0x12cc6(%rip),%xmm3 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,111,29,6,55,1,0 // movdqa 0x13706(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
.byte 102,72,15,126,213 // movq %xmm2,%rbp
@@ -34109,7 +34109,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,195,1 // pextrd $0x1,%xmm0,%r11d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,192,3 // pextrd $0x3,%xmm0,%r8d
- .byte 102,15,254,5,238,43,1,0 // paddd 0x12bee(%rip),%xmm0 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,254,5,46,54,1,0 // paddd 0x1362e(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,195 // movq %xmm0,%rbx
.byte 137,221 // mov %ebx,%ebp
@@ -34138,10 +34138,10 @@ _sk_clut_4D_sse41:
.byte 102,15,254,100,36,144 // paddd -0x70(%rsp),%xmm4
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,65,15,254,197 // paddd %xmm13,%xmm0
- .byte 102,68,15,111,45,206,49,1,0 // movdqa 0x131ce(%rip),%xmm13 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,68,15,111,45,14,60,1,0 // movdqa 0x13c0e(%rip),%xmm13 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,65,15,56,64,197 // pmulld %xmm13,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,111,53,44,43,1,0 // movdqa 0x12b2c(%rip),%xmm6 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,111,53,108,53,1,0 // movdqa 0x1356c(%rip),%xmm6 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,205 // movq %xmm1,%rbp
@@ -34159,7 +34159,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,61,234,42,1,0 // movdqa 0x12aea(%rip),%xmm7 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,111,61,42,53,1,0 // movdqa 0x1352a(%rip),%xmm7 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,254,199 // paddd %xmm7,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -34176,7 +34176,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,65,15,56,64,229 // pmulld %xmm13,%xmm4
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
- .byte 102,68,15,111,45,114,42,1,0 // movdqa 0x12a72(%rip),%xmm13 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,111,45,178,52,1,0 // movdqa 0x134b2(%rip),%xmm13 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,65,15,254,245 // paddd %xmm13,%xmm6
.byte 102,72,15,58,22,241,1 // pextrq $0x1,%xmm6,%rcx
.byte 102,72,15,126,243 // movq %xmm6,%rbx
@@ -34255,7 +34255,7 @@ _sk_clut_4D_sse41:
.byte 102,68,15,111,76,36,176 // movdqa -0x50(%rsp),%xmm9
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,254,194 // paddd %xmm2,%xmm0
- .byte 102,15,111,29,126,47,1,0 // movdqa 0x12f7e(%rip),%xmm3 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,29,190,57,1,0 // movdqa 0x139be(%rip),%xmm3 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,56,64,195 // pmulld %xmm3,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,69,15,111,213 // movdqa %xmm13,%xmm10
@@ -34276,7 +34276,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,45,157,40,1,0 // movdqa 0x1289d(%rip),%xmm5 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,111,45,221,50,1,0 // movdqa 0x132dd(%rip),%xmm5 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -34364,7 +34364,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,225,1 // pextrd $0x1,%xmm4,%r9d
.byte 102,65,15,58,22,226,2 // pextrd $0x2,%xmm4,%r10d
.byte 102,65,15,58,22,227,3 // pextrd $0x3,%xmm4,%r11d
- .byte 102,68,15,111,13,209,38,1,0 // movdqa 0x126d1(%rip),%xmm9 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,68,15,111,13,17,49,1,0 // movdqa 0x13111(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,65,15,254,225 // paddd %xmm9,%xmm4
.byte 102,72,15,58,22,225,1 // pextrq $0x1,%xmm4,%rcx
.byte 102,72,15,126,227 // movq %xmm4,%rbx
@@ -34446,7 +34446,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,76,36,176 // paddd -0x50(%rsp),%xmm1
.byte 102,65,15,56,64,205 // pmulld %xmm13,%xmm1
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,37,5,37,1,0 // movdqa 0x12505(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,111,37,69,47,1,0 // movdqa 0x12f45(%rip),%xmm12 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,65,15,254,196 // paddd %xmm12,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,197 // movq %xmm0,%rbp
@@ -34464,7 +34464,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,201,1 // pextrd $0x1,%xmm1,%r9d
.byte 102,65,15,58,22,202,2 // pextrd $0x2,%xmm1,%r10d
.byte 102,65,15,58,22,203,3 // pextrd $0x3,%xmm1,%r11d
- .byte 102,15,111,29,194,36,1,0 // movdqa 0x124c2(%rip),%xmm3 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,111,29,2,47,1,0 // movdqa 0x12f02(%rip),%xmm3 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -34533,9 +34533,9 @@ _sk_clut_4D_sse41:
.byte 102,68,15,254,116,36,144 // paddd -0x70(%rsp),%xmm14
.byte 102,15,111,68,36,176 // movdqa -0x50(%rsp),%xmm0
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
- .byte 102,15,56,64,5,190,41,1,0 // pmulld 0x129be(%rip),%xmm0 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,56,64,5,254,51,1,0 // pmulld 0x133fe(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,5,34,35,1,0 // paddd 0x12322(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,254,5,98,45,1,0 // paddd 0x12d62(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,197 // movq %xmm0,%rbp
.byte 137,235 // mov %ebp,%ebx
@@ -34568,8 +34568,8 @@ _sk_clut_4D_sse41:
.byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
.byte 102,68,15,254,116,36,160 // paddd -0x60(%rsp),%xmm14
- .byte 102,68,15,56,64,53,3,41,1,0 // pmulld 0x12903(%rip),%xmm14 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
- .byte 102,15,111,5,107,34,1,0 // movdqa 0x1226b(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,56,64,53,67,51,1,0 // pmulld 0x13343(%rip),%xmm14 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
+ .byte 102,15,111,5,171,44,1,0 // movdqa 0x12cab(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -34650,7 +34650,7 @@ _sk_clut_4D_sse41:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,215 // addps %xmm7,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,233,32,1,0 // movaps 0x120e9(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,41,43,1,0 // movaps 0x12b29(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 72,139,76,36,248 // mov -0x8(%rsp),%rcx
.byte 15,40,100,36,80 // movaps 0x50(%rsp),%xmm4
.byte 15,40,108,36,96 // movaps 0x60(%rsp),%xmm5
@@ -34735,15 +34735,15 @@ _sk_seed_shader_sse2:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,21,245,31,1,0 // movaps 0x11ff5(%rip),%xmm2 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 15,40,21,53,42,1,0 // movaps 0x12a35(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 15,88,194 // addps %xmm2,%xmm0
- .byte 15,88,5,251,31,1,0 // addps 0x11ffb(%rip),%xmm0 # 2c2b0 <_sk_overlay_sse2_8bit+0xe94>
+ .byte 15,88,5,59,42,1,0 // addps 0x12a3b(%rip),%xmm0 # 2ccf0 <_sk_overlay_sse2_8bit+0xf18>
.byte 102,15,110,201 // movd %ecx,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,243,31,1,0 // movaps 0x11ff3(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,51,42,1,0 // movaps 0x12a33(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -34758,18 +34758,18 @@ _sk_dither_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 102,68,15,110,194 // movd %edx,%xmm8
.byte 102,69,15,112,200,0 // pshufd $0x0,%xmm8,%xmm9
- .byte 102,68,15,254,13,140,31,1,0 // paddd 0x11f8c(%rip),%xmm9 # 2c280 <_sk_overlay_sse2_8bit+0xe64>
+ .byte 102,68,15,254,13,204,41,1,0 // paddd 0x129cc(%rip),%xmm9 # 2ccc0 <_sk_overlay_sse2_8bit+0xee8>
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,195,31,1,0 // movdqa 0x11fc3(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,111,21,3,42,1,0 // movdqa 0x12a03(%rip),%xmm10 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,175,31,1,0 // movdqa 0x11faf(%rip),%xmm12 # 2c2e0 <_sk_overlay_sse2_8bit+0xec4>
- .byte 102,68,15,111,45,182,31,1,0 // movdqa 0x11fb6(%rip),%xmm13 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,68,15,111,37,239,41,1,0 // movdqa 0x129ef(%rip),%xmm12 # 2cd20 <_sk_overlay_sse2_8bit+0xf48>
+ .byte 102,68,15,111,45,246,41,1,0 // movdqa 0x129f6(%rip),%xmm13 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -34785,8 +34785,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,113,31,1,0 // mulps 0x11f71(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xee4>
- .byte 68,15,88,5,121,31,1,0 // addps 0x11f79(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xef4>
+ .byte 68,15,89,5,177,41,1,0 // mulps 0x129b1(%rip),%xmm8 # 2cd40 <_sk_overlay_sse2_8bit+0xf68>
+ .byte 68,15,88,5,185,41,1,0 // addps 0x129b9(%rip),%xmm8 # 2cd50 <_sk_overlay_sse2_8bit+0xf78>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -34828,7 +34828,7 @@ HIDDEN _sk_black_color_sse2
FUNCTION(_sk_black_color_sse2)
_sk_black_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,175,30,1,0 // movaps 0x11eaf(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,239,40,1,0 // movaps 0x128ef(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -34839,7 +34839,7 @@ HIDDEN _sk_white_color_sse2
FUNCTION(_sk_white_color_sse2)
_sk_white_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,155,30,1,0 // movaps 0x11e9b(%rip),%xmm0 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,5,219,40,1,0 // movaps 0x128db(%rip),%xmm0 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -34885,7 +34885,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,75,30,1,0 // movaps 0x11e4b(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,139,40,1,0 // movaps 0x1288b(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -34910,7 +34910,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,254,29,1,0 // movaps 0x11dfe(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,62,40,1,0 // movaps 0x1283e(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -34957,7 +34957,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,146,29,1,0 // movaps 0x11d92(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,210,39,1,0 // movaps 0x127d2(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -34970,7 +34970,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,114,29,1,0 // movaps 0x11d72(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,178,39,1,0 // movaps 0x127b2(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -34987,7 +34987,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,69,29,1,0 // movaps 0x11d45(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,133,39,1,0 // movaps 0x12785(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -35007,7 +35007,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,9,29,1,0 // movaps 0x11d09(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,73,39,1,0 // movaps 0x12749(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -35035,7 +35035,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,205,28,1,0 // movaps 0x11ccd(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,13,39,1,0 // movaps 0x1270d(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -35073,7 +35073,7 @@ HIDDEN _sk_plus__sse2
FUNCTION(_sk_plus__sse2)
_sk_plus__sse2:
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 68,15,40,5,78,28,1,0 // movaps 0x11c4e(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,142,38,1,0 // movaps 0x1268e(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 65,15,93,200 // minps %xmm8,%xmm1
@@ -35115,7 +35115,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,218,27,1,0 // movaps 0x11bda(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,26,38,1,0 // movaps 0x1261a(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -35163,7 +35163,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,53,27,1,0 // movaps 0x11b35(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,117,37,1,0 // movaps 0x12575(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35197,7 +35197,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,202,26,1,0 // movaps 0x11aca(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,10,37,1,0 // movaps 0x1250a(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35234,7 +35234,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,84,26,1,0 // movaps 0x11a54(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,148,36,1,0 // movaps 0x12494(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35262,7 +35262,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,4,26,1,0 // movaps 0x11a04(%rip),%xmm2 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,21,68,36,1,0 // movaps 0x12444(%rip),%xmm2 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35275,7 +35275,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,13,231,25,1,0 // movaps 0x119e7(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,39,36,1,0 // movaps 0x12427(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -35370,7 +35370,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,143,24,1,0 // movaps 0x1188f(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,21,207,34,1,0 // movaps 0x122cf(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -35462,7 +35462,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,56,23,1,0 // movaps 0x11738(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,29,120,33,1,0 // movaps 0x12178(%rip),%xmm11 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -35550,7 +35550,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,246,21,1,0 // movaps 0x115f6(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,54,32,1,0 // movaps 0x12036(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -35641,7 +35641,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,163,20,1,0 // movaps 0x114a3(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,227,30,1,0 // movaps 0x11ee3(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -35654,10 +35654,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,205,20,1,0 // movaps 0x114cd(%rip),%xmm14 # 2c320 <_sk_overlay_sse2_8bit+0xf04>
+ .byte 68,15,40,53,13,31,1,0 // movaps 0x11f0d(%rip),%xmm14 # 2cd60 <_sk_overlay_sse2_8bit+0xf88>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,205,20,1,0 // movaps 0x114cd(%rip),%xmm10 # 2c330 <_sk_overlay_sse2_8bit+0xf14>
+ .byte 68,15,40,21,13,31,1,0 // movaps 0x11f0d(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0xf98>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -35802,7 +35802,7 @@ _sk_hue_sse2:
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,40,5,96,18,1,0 // movaps 0x11260(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,160,28,1,0 // movaps 0x11ca0(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 15,40,207 // movaps %xmm7,%xmm1
.byte 68,15,92,217 // subps %xmm1,%xmm11
@@ -35850,12 +35850,12 @@ _sk_hue_sse2:
.byte 69,15,84,206 // andps %xmm14,%xmm9
.byte 69,15,84,214 // andps %xmm14,%xmm10
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,61,29,18,1,0 // movaps 0x1121d(%rip),%xmm15 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,61,93,28,1,0 // movaps 0x11c5d(%rip),%xmm15 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 65,15,89,231 // mulps %xmm15,%xmm4
- .byte 15,40,5,34,18,1,0 // movaps 0x11222(%rip),%xmm0 # 2c350 <_sk_overlay_sse2_8bit+0xf34>
+ .byte 15,40,5,98,28,1,0 // movaps 0x11c62(%rip),%xmm0 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
- .byte 68,15,40,53,36,18,1,0 // movaps 0x11224(%rip),%xmm14 # 2c360 <_sk_overlay_sse2_8bit+0xf44>
+ .byte 68,15,40,53,100,28,1,0 // movaps 0x11c64(%rip),%xmm14 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
.byte 68,15,40,239 // movaps %xmm7,%xmm13
.byte 69,15,89,238 // mulps %xmm14,%xmm13
.byte 68,15,88,238 // addps %xmm6,%xmm13
@@ -36033,14 +36033,14 @@ _sk_saturation_sse2:
.byte 68,15,84,211 // andps %xmm3,%xmm10
.byte 68,15,84,203 // andps %xmm3,%xmm9
.byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,40,5,118,15,1,0 // movaps 0x10f76(%rip),%xmm8 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,5,182,25,1,0 // movaps 0x119b6(%rip),%xmm8 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 15,40,214 // movaps %xmm6,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,40,13,120,15,1,0 // movaps 0x10f78(%rip),%xmm1 # 2c350 <_sk_overlay_sse2_8bit+0xf34>
+ .byte 15,40,13,184,25,1,0 // movaps 0x119b8(%rip),%xmm1 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,217 // mulps %xmm1,%xmm3
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,37,119,15,1,0 // movaps 0x10f77(%rip),%xmm12 # 2c360 <_sk_overlay_sse2_8bit+0xf44>
+ .byte 68,15,40,37,183,25,1,0 // movaps 0x119b7(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
.byte 65,15,40,210 // movaps %xmm10,%xmm2
@@ -36085,7 +36085,7 @@ _sk_saturation_sse2:
.byte 15,40,223 // movaps %xmm7,%xmm3
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 68,15,40,5,44,14,1,0 // movaps 0x10e2c(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,108,24,1,0 // movaps 0x1186c(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 15,88,253 // addps %xmm5,%xmm7
@@ -36186,14 +36186,14 @@ _sk_color_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 68,15,40,45,58,13,1,0 // movaps 0x10d3a(%rip),%xmm13 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,45,122,23,1,0 // movaps 0x1177a(%rip),%xmm13 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 68,15,40,198 // movaps %xmm6,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,58,13,1,0 // movaps 0x10d3a(%rip),%xmm14 # 2c350 <_sk_overlay_sse2_8bit+0xf34>
+ .byte 68,15,40,53,122,23,1,0 // movaps 0x1177a(%rip),%xmm14 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,29,54,13,1,0 // movaps 0x10d36(%rip),%xmm11 # 2c360 <_sk_overlay_sse2_8bit+0xf44>
+ .byte 68,15,40,29,118,23,1,0 // movaps 0x11776(%rip),%xmm11 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
.byte 69,15,89,227 // mulps %xmm11,%xmm12
.byte 68,15,88,224 // addps %xmm0,%xmm12
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -36201,7 +36201,7 @@ _sk_color_sse2:
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 68,15,40,5,114,12,1,0 // movaps 0x10c72(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,178,22,1,0 // movaps 0x116b2(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,89,252 // mulps %xmm4,%xmm7
@@ -36337,15 +36337,15 @@ _sk_luminosity_sse2:
.byte 68,15,40,205 // movaps %xmm5,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 68,15,40,37,249,10,1,0 // movaps 0x10af9(%rip),%xmm12 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,37,57,21,1,0 // movaps 0x11539(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 68,15,40,199 // movaps %xmm7,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,249,10,1,0 // movaps 0x10af9(%rip),%xmm13 # 2c350 <_sk_overlay_sse2_8bit+0xf34>
+ .byte 68,15,40,45,57,21,1,0 // movaps 0x11539(%rip),%xmm13 # 2cd90 <_sk_overlay_sse2_8bit+0xfb8>
.byte 68,15,40,241 // movaps %xmm1,%xmm14
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 69,15,88,240 // addps %xmm8,%xmm14
- .byte 68,15,40,29,245,10,1,0 // movaps 0x10af5(%rip),%xmm11 # 2c360 <_sk_overlay_sse2_8bit+0xf44>
- .byte 68,15,40,5,77,10,1,0 // movaps 0x10a4d(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,29,53,21,1,0 // movaps 0x11535(%rip),%xmm11 # 2cda0 <_sk_overlay_sse2_8bit+0xfc8>
+ .byte 68,15,40,5,141,20,1,0 // movaps 0x1148d(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 68,15,92,248 // subps %xmm0,%xmm15
@@ -36489,7 +36489,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,133,228,0,0,0 // jne 1bb5e <_sk_srcover_rgba_8888_sse2+0x104>
.byte 243,69,15,111,4,128 // movdqu (%r8,%rax,4),%xmm8
.byte 72,133,255 // test %rdi,%rdi
- .byte 102,15,111,53,229,8,1,0 // movdqa 0x108e5(%rip),%xmm6 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,53,37,19,1,0 // movdqa 0x11325(%rip),%xmm6 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,65,15,111,224 // movdqa %xmm8,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
@@ -36503,9 +36503,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,91,247 // cvtdq2ps %xmm7,%xmm6
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7
- .byte 68,15,40,5,245,7,1,0 // movaps 0x107f5(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,53,18,1,0 // movaps 0x11235(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,201,8,1,0 // movaps 0x108c9(%rip),%xmm12 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,37,9,19,1,0 // movaps 0x11309(%rip),%xmm12 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -36585,7 +36585,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,197,6,1,0 // movaps 0x106c5(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,5,17,1,0 // movaps 0x11105(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -36597,7 +36597,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,170,6,1,0 // minps 0x106aa(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,93,29,234,16,1,0 // minps 0x110ea(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -36608,7 +36608,7 @@ HIDDEN _sk_clamp_a_dst_sse2
.globl _sk_clamp_a_dst_sse2
FUNCTION(_sk_clamp_a_dst_sse2)
_sk_clamp_a_dst_sse2:
- .byte 15,93,61,150,6,1,0 // minps 0x10696(%rip),%xmm7 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,93,61,214,16,1,0 // minps 0x110d6(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -36643,7 +36643,7 @@ HIDDEN _sk_invert_sse2
.globl _sk_invert_sse2
FUNCTION(_sk_invert_sse2)
_sk_invert_sse2:
- .byte 68,15,40,5,82,6,1,0 // movaps 0x10652(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,5,146,16,1,0 // movaps 0x11092(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -36705,7 +36705,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,220,5,1,0 // movaps 0x105dc(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,28,16,1,0 // movaps 0x1101c(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -36719,20 +36719,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,167,6,1,0 // movaps 0x106a7(%rip),%xmm8 # 2c3b0 <_sk_overlay_sse2_8bit+0xf94>
+ .byte 68,15,40,5,231,16,1,0 // movaps 0x110e7(%rip),%xmm8 # 2cdf0 <_sk_overlay_sse2_8bit+0x1018>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,31,6,1,0 // movaps 0x1061f(%rip),%xmm9 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,13,95,16,1,0 // movaps 0x1105f(%rip),%xmm9 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,143,6,1,0 // movaps 0x1068f(%rip),%xmm10 # 2c3c0 <_sk_overlay_sse2_8bit+0xfa4>
+ .byte 68,15,40,21,207,16,1,0 // movaps 0x110cf(%rip),%xmm10 # 2ce00 <_sk_overlay_sse2_8bit+0x1028>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,143,6,1,0 // movaps 0x1068f(%rip),%xmm11 # 2c3d0 <_sk_overlay_sse2_8bit+0xfb4>
+ .byte 68,15,40,29,207,16,1,0 // movaps 0x110cf(%rip),%xmm11 # 2ce10 <_sk_overlay_sse2_8bit+0x1038>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,147,6,1,0 // movaps 0x10693(%rip),%xmm12 # 2c3e0 <_sk_overlay_sse2_8bit+0xfc4>
+ .byte 68,15,40,37,211,16,1,0 // movaps 0x110d3(%rip),%xmm12 # 2ce20 <_sk_overlay_sse2_8bit+0x1048>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -36768,20 +36768,20 @@ HIDDEN _sk_from_srgb_dst_sse2
.globl _sk_from_srgb_dst_sse2
FUNCTION(_sk_from_srgb_dst_sse2)
_sk_from_srgb_dst_sse2:
- .byte 68,15,40,5,228,5,1,0 // movaps 0x105e4(%rip),%xmm8 # 2c3b0 <_sk_overlay_sse2_8bit+0xf94>
+ .byte 68,15,40,5,36,16,1,0 // movaps 0x11024(%rip),%xmm8 # 2cdf0 <_sk_overlay_sse2_8bit+0x1018>
.byte 68,15,40,236 // movaps %xmm4,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,220 // movaps %xmm4,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,92,5,1,0 // movaps 0x1055c(%rip),%xmm9 # 2c340 <_sk_overlay_sse2_8bit+0xf24>
+ .byte 68,15,40,13,156,15,1,0 // movaps 0x10f9c(%rip),%xmm9 # 2cd80 <_sk_overlay_sse2_8bit+0xfa8>
.byte 68,15,40,244 // movaps %xmm4,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,204,5,1,0 // movaps 0x105cc(%rip),%xmm10 # 2c3c0 <_sk_overlay_sse2_8bit+0xfa4>
+ .byte 68,15,40,21,12,16,1,0 // movaps 0x1100c(%rip),%xmm10 # 2ce00 <_sk_overlay_sse2_8bit+0x1028>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,204,5,1,0 // movaps 0x105cc(%rip),%xmm11 # 2c3d0 <_sk_overlay_sse2_8bit+0xfb4>
+ .byte 68,15,40,29,12,16,1,0 // movaps 0x1100c(%rip),%xmm11 # 2ce10 <_sk_overlay_sse2_8bit+0x1038>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,208,5,1,0 // movaps 0x105d0(%rip),%xmm12 # 2c3e0 <_sk_overlay_sse2_8bit+0xfc4>
+ .byte 68,15,40,37,16,16,1,0 // movaps 0x11010(%rip),%xmm12 # 2ce20 <_sk_overlay_sse2_8bit+0x1048>
.byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4
.byte 68,15,84,236 // andps %xmm4,%xmm13
.byte 65,15,85,230 // andnps %xmm14,%xmm4
@@ -36818,22 +36818,22 @@ HIDDEN _sk_to_srgb_sse2
FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 68,15,82,232 // rsqrtps %xmm0,%xmm13
- .byte 68,15,40,5,93,5,1,0 // movaps 0x1055d(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xfd4>
+ .byte 68,15,40,5,157,15,1,0 // movaps 0x10f9d(%rip),%xmm8 # 2ce30 <_sk_overlay_sse2_8bit+0x1058>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,13,93,5,1,0 // movaps 0x1055d(%rip),%xmm9 # 2c400 <_sk_overlay_sse2_8bit+0xfe4>
+ .byte 68,15,40,13,157,15,1,0 // movaps 0x10f9d(%rip),%xmm9 # 2ce40 <_sk_overlay_sse2_8bit+0x1068>
.byte 69,15,40,253 // movaps %xmm13,%xmm15
.byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,40,21,93,5,1,0 // movaps 0x1055d(%rip),%xmm10 # 2c410 <_sk_overlay_sse2_8bit+0xff4>
+ .byte 68,15,40,21,157,15,1,0 // movaps 0x10f9d(%rip),%xmm10 # 2ce50 <_sk_overlay_sse2_8bit+0x1078>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,40,29,93,5,1,0 // movaps 0x1055d(%rip),%xmm11 # 2c420 <_sk_overlay_sse2_8bit+0x1004>
+ .byte 68,15,40,29,157,15,1,0 // movaps 0x10f9d(%rip),%xmm11 # 2ce60 <_sk_overlay_sse2_8bit+0x1088>
.byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 68,15,40,37,97,5,1,0 // movaps 0x10561(%rip),%xmm12 # 2c430 <_sk_overlay_sse2_8bit+0x1014>
+ .byte 68,15,40,37,161,15,1,0 // movaps 0x10fa1(%rip),%xmm12 # 2ce70 <_sk_overlay_sse2_8bit+0x1098>
.byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 69,15,83,237 // rcpps %xmm13,%xmm13
.byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,61,93,5,1,0 // movaps 0x1055d(%rip),%xmm15 # 2c440 <_sk_overlay_sse2_8bit+0x1024>
+ .byte 68,15,40,61,157,15,1,0 // movaps 0x10f9d(%rip),%xmm15 # 2ce80 <_sk_overlay_sse2_8bit+0x10a8>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,197 // andnps %xmm13,%xmm0
@@ -36885,7 +36885,7 @@ _sk_rgb_to_hsl_sse2:
.byte 68,15,93,216 // minps %xmm0,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,32,3,1,0 // movaps 0x10320(%rip),%xmm13 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,45,96,13,1,0 // movaps 0x10d60(%rip),%xmm13 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -36894,30 +36894,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,134,4,1,0 // andps 0x10486(%rip),%xmm14 # 2c450 <_sk_overlay_sse2_8bit+0x1034>
+ .byte 68,15,84,53,198,14,1,0 // andps 0x10ec6(%rip),%xmm14 # 2ce90 <_sk_overlay_sse2_8bit+0x10b8>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,121,4,1,0 // movaps 0x10479(%rip),%xmm12 # 2c460 <_sk_overlay_sse2_8bit+0x1044>
+ .byte 68,15,40,37,185,14,1,0 // movaps 0x10eb9(%rip),%xmm12 # 2cea0 <_sk_overlay_sse2_8bit+0x10c8>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,117,4,1,0 // addps 0x10475(%rip),%xmm8 # 2c470 <_sk_overlay_sse2_8bit+0x1054>
+ .byte 68,15,88,5,181,14,1,0 // addps 0x10eb5(%rip),%xmm8 # 2ceb0 <_sk_overlay_sse2_8bit+0x10d8>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,102,4,1,0 // mulps 0x10466(%rip),%xmm0 # 2c480 <_sk_overlay_sse2_8bit+0x1064>
+ .byte 15,89,5,166,14,1,0 // mulps 0x10ea6(%rip),%xmm0 # 2cec0 <_sk_overlay_sse2_8bit+0x10e8>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,105,2,1,0 // movaps 0x10269(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,13,169,12,1,0 // movaps 0x10ca9(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -36941,7 +36941,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,24,2,1,0 // movaps 0x10218(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,13,88,12,1,0 // movaps 0x10c58(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -36958,28 +36958,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,193,3,1,0 // movaps 0x103c1(%rip),%xmm0 # 2c490 <_sk_overlay_sse2_8bit+0x1074>
+ .byte 15,40,5,1,14,1,0 // movaps 0x10e01(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x10f8>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,217,1,1,0 // andps 0x101d9(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,84,29,25,12,1,0 // andps 0x10c19(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,171,3,1,0 // movaps 0x103ab(%rip),%xmm13 # 2c4a0 <_sk_overlay_sse2_8bit+0x1084>
+ .byte 68,15,40,45,235,13,1,0 // movaps 0x10deb(%rip),%xmm13 # 2cee0 <_sk_overlay_sse2_8bit+0x1108>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,107,3,1,0 // movaps 0x1036b(%rip),%xmm2 # 2c480 <_sk_overlay_sse2_8bit+0x1064>
+ .byte 15,40,21,171,13,1,0 // movaps 0x10dab(%rip),%xmm2 # 2cec0 <_sk_overlay_sse2_8bit+0x10e8>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,43,3,1,0 // movaps 0x1032b(%rip),%xmm1 # 2c450 <_sk_overlay_sse2_8bit+0x1034>
+ .byte 15,40,13,107,13,1,0 // movaps 0x10d6b(%rip),%xmm1 # 2ce90 <_sk_overlay_sse2_8bit+0x10b8>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,65,3,1,0 // movaps 0x10341(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x1054>
+ .byte 15,40,45,129,13,1,0 // movaps 0x10d81(%rip),%xmm5 # 2ceb0 <_sk_overlay_sse2_8bit+0x10d8>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -37002,7 +37002,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,54,1,1,0 // andps 0x10136(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,84,29,118,11,1,0 // andps 0x10b76(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -37032,12 +37032,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,174,2,1,0 // addps 0x102ae(%rip),%xmm6 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 15,88,53,238,12,1,0 // addps 0x10cee(%rip),%xmm6 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,169,0,1,0 // andps 0x100a9(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,84,29,233,10,1,0 // andps 0x10ae9(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -37105,9 +37105,9 @@ _sk_scale_u8_sse2:
.byte 102,71,15,110,4,16 // movd (%r8,%r10,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,124,0,1,0 // pand 0x1007c(%rip),%xmm8 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,68,15,219,5,188,10,1,0 // pand 0x10abc(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,192,1,1,0 // mulps 0x101c0(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,89,5,0,12,1,0 // mulps 0x10c00(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -37152,17 +37152,17 @@ _sk_scale_565_sse2:
.byte 15,133,173,0,0,0 // jne 1c43d <_sk_scale_565_sse2+0xcc>
.byte 243,71,15,126,20,80 // movq (%r8,%r10,2),%xmm10
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
- .byte 102,68,15,111,5,44,1,1,0 // movdqa 0x1012c(%rip),%xmm8 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,68,15,111,5,108,11,1,0 // movdqa 0x10b6c(%rip),%xmm8 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,69,15,219,194 // pand %xmm10,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,43,1,1,0 // mulps 0x1012b(%rip),%xmm8 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,68,15,111,13,50,1,1,0 // movdqa 0x10132(%rip),%xmm9 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 68,15,89,5,107,11,1,0 // mulps 0x10b6b(%rip),%xmm8 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,68,15,111,13,114,11,1,0 // movdqa 0x10b72(%rip),%xmm9 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,69,15,219,202 // pand %xmm10,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,49,1,1,0 // mulps 0x10131(%rip),%xmm9 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,68,15,219,21,56,1,1,0 // pand 0x10138(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 68,15,89,13,113,11,1,0 // mulps 0x10b71(%rip),%xmm9 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,68,15,219,21,120,11,1,0 // pand 0x10b78(%rip),%xmm10 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,60,1,1,0 // mulps 0x1013c(%rip),%xmm10 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 68,15,89,21,124,11,1,0 // mulps 0x10b7c(%rip),%xmm10 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 68,15,40,219 // movaps %xmm3,%xmm11
.byte 68,15,194,223,1 // cmpltps %xmm7,%xmm11
.byte 69,15,40,225 // movaps %xmm9,%xmm12
@@ -37243,9 +37243,9 @@ _sk_lerp_u8_sse2:
.byte 102,71,15,110,4,16 // movd (%r8,%r10,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,115,254,0,0 // pand 0xfe73(%rip),%xmm8 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,68,15,219,5,179,8,1,0 // pand 0x108b3(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,183,255,0,0 // mulps 0xffb7(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,89,5,247,9,1,0 // mulps 0x109f7(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -37297,17 +37297,17 @@ _sk_lerp_565_sse2:
.byte 15,133,173,0,0,0 // jne 1c65d <_sk_lerp_565_sse2+0xcc>
.byte 243,71,15,126,4,80 // movq (%r8,%r10,2),%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,111,13,12,255,0,0 // movdqa 0xff0c(%rip),%xmm9 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,68,15,111,13,76,9,1,0 // movdqa 0x1094c(%rip),%xmm9 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,69,15,219,200 // pand %xmm8,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,11,255,0,0 // mulps 0xff0b(%rip),%xmm9 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,68,15,111,21,18,255,0,0 // movdqa 0xff12(%rip),%xmm10 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 68,15,89,13,75,9,1,0 // mulps 0x1094b(%rip),%xmm9 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,68,15,111,21,82,9,1,0 // movdqa 0x10952(%rip),%xmm10 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,69,15,219,208 // pand %xmm8,%xmm10
.byte 69,15,91,218 // cvtdq2ps %xmm10,%xmm11
- .byte 68,15,89,29,17,255,0,0 // mulps 0xff11(%rip),%xmm11 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,68,15,219,5,24,255,0,0 // pand 0xff18(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 68,15,89,29,81,9,1,0 // mulps 0x10951(%rip),%xmm11 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,68,15,219,5,88,9,1,0 // pand 0x10958(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,28,255,0,0 // mulps 0xff1c(%rip),%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 68,15,89,5,92,9,1,0 // mulps 0x1095c(%rip),%xmm8 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 68,15,40,211 // movaps %xmm3,%xmm10
.byte 68,15,194,215,1 // cmpltps %xmm7,%xmm10
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -37364,7 +37364,7 @@ _sk_load_tables_sse2:
.byte 243,69,15,111,12,144 // movdqu (%r8,%rdx,4),%xmm9
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,68,15,111,5,156,252,0,0 // movdqa 0xfc9c(%rip),%xmm8 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,68,15,111,5,220,6,1,0 // movdqa 0x106dc(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -37420,7 +37420,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,229,252,0,0 // mulps 0xfce5(%rip),%xmm3 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,29,37,7,1,0 // mulps 0x10725(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -37460,7 +37460,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,190,252,0,0 // movdqa 0xfcbe(%rip),%xmm10 # 2c530 <_sk_overlay_sse2_8bit+0x1114>
+ .byte 102,68,15,111,21,254,6,1,0 // movdqa 0x106fe(%rip),%xmm10 # 2cf70 <_sk_overlay_sse2_8bit+0x1198>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -37522,7 +37522,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,185,251,0,0 // mulps 0xfbb9(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0x1134>
+ .byte 15,89,29,249,5,1,0 // mulps 0x105f9(%rip),%xmm3 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -37563,7 +37563,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,252,250,0,0 // movdqa 0xfafc(%rip),%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0x1114>
+ .byte 102,68,15,111,5,60,5,1,0 // movdqa 0x1053c(%rip),%xmm8 # 2cf70 <_sk_overlay_sse2_8bit+0x1198>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -37619,7 +37619,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,135,247,0,0 // movaps 0xf787(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,199,1,1,0 // movaps 0x101c7(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 255,224 // jmpq *%rax
@@ -37651,7 +37651,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,244,247,0,0 // movaps 0xf7f4(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,5,52,2,1,0 // movaps 0x10234(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,126,192 // movq %xmm0,%r8
@@ -37679,7 +37679,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,158,248,0,0 // movaps 0xf89e(%rip),%xmm10 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,21,222,2,1,0 // movaps 0x102de(%rip),%xmm10 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -37798,7 +37798,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,218,246,0,0 // movaps 0xf6da(%rip),%xmm10 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,21,26,1,1,0 // movaps 0x1011a(%rip),%xmm10 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -37996,15 +37996,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,184,244,0,0 // mulps 0xf4b8(%rip),%xmm9 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 68,15,84,21,192,244,0,0 // andps 0xf4c0(%rip),%xmm10 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 68,15,86,21,216,241,0,0 // orps 0xf1d8(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
- .byte 68,15,88,13,192,244,0,0 // addps 0xf4c0(%rip),%xmm9 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
- .byte 68,15,40,37,200,244,0,0 // movaps 0xf4c8(%rip),%xmm12 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,89,13,248,254,0,0 // mulps 0xfef8(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 68,15,84,21,0,255,0,0 // andps 0xff00(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 68,15,86,21,24,252,0,0 // orps 0xfc18(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,13,0,255,0,0 // addps 0xff00(%rip),%xmm9 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 68,15,40,37,8,255,0,0 // movaps 0xff08(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,200,244,0,0 // addps 0xf4c8(%rip),%xmm10 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
- .byte 68,15,40,37,208,244,0,0 // movaps 0xf4d0(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,88,21,8,255,0,0 // addps 0xff08(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 68,15,40,37,16,255,0,0 // movaps 0xff10(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -38012,22 +38012,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,170,241,0,0 // movaps 0xf1aa(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,21,234,251,0,0 // movaps 0xfbea(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,158,244,0,0 // addps 0xf49e(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
- .byte 68,15,40,37,166,244,0,0 // movaps 0xf4a6(%rip),%xmm12 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 68,15,88,13,222,254,0,0 // addps 0xfede(%rip),%xmm9 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 68,15,40,37,230,254,0,0 // movaps 0xfee6(%rip),%xmm12 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,166,244,0,0 // movaps 0xf4a6(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 68,15,40,37,230,254,0,0 // movaps 0xfee6(%rip),%xmm12 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,170,244,0,0 // movaps 0xf4aa(%rip),%xmm13 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 68,15,40,45,234,254,0,0 // movaps 0xfeea(%rip),%xmm13 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,170,244,0,0 // mulps 0xf4aa(%rip),%xmm13 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 68,15,89,45,234,254,0,0 // mulps 0xfeea(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -38063,15 +38063,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,122,243,0,0 // mulps 0xf37a(%rip),%xmm9 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 68,15,84,21,130,243,0,0 // andps 0xf382(%rip),%xmm10 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 68,15,86,21,154,240,0,0 // orps 0xf09a(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
- .byte 68,15,88,13,130,243,0,0 // addps 0xf382(%rip),%xmm9 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
- .byte 68,15,40,37,138,243,0,0 // movaps 0xf38a(%rip),%xmm12 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,89,13,186,253,0,0 // mulps 0xfdba(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 68,15,84,21,194,253,0,0 // andps 0xfdc2(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 68,15,86,21,218,250,0,0 // orps 0xfada(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,13,194,253,0,0 // addps 0xfdc2(%rip),%xmm9 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 68,15,40,37,202,253,0,0 // movaps 0xfdca(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,138,243,0,0 // addps 0xf38a(%rip),%xmm10 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
- .byte 68,15,40,37,146,243,0,0 // movaps 0xf392(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,88,21,202,253,0,0 // addps 0xfdca(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 68,15,40,37,210,253,0,0 // movaps 0xfdd2(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -38079,22 +38079,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,108,240,0,0 // movaps 0xf06c(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,21,172,250,0,0 // movaps 0xfaac(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,96,243,0,0 // addps 0xf360(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
- .byte 68,15,40,37,104,243,0,0 // movaps 0xf368(%rip),%xmm12 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 68,15,88,13,160,253,0,0 // addps 0xfda0(%rip),%xmm9 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 68,15,40,37,168,253,0,0 // movaps 0xfda8(%rip),%xmm12 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,104,243,0,0 // movaps 0xf368(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 68,15,40,37,168,253,0,0 // movaps 0xfda8(%rip),%xmm12 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,108,243,0,0 // movaps 0xf36c(%rip),%xmm13 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 68,15,40,45,172,253,0,0 // movaps 0xfdac(%rip),%xmm13 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,108,243,0,0 // mulps 0xf36c(%rip),%xmm13 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 68,15,89,45,172,253,0,0 // mulps 0xfdac(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -38130,15 +38130,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,60,242,0,0 // mulps 0xf23c(%rip),%xmm9 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 68,15,84,21,68,242,0,0 // andps 0xf244(%rip),%xmm10 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 68,15,86,21,92,239,0,0 // orps 0xef5c(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
- .byte 68,15,88,13,68,242,0,0 // addps 0xf244(%rip),%xmm9 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
- .byte 68,15,40,37,76,242,0,0 // movaps 0xf24c(%rip),%xmm12 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,89,13,124,252,0,0 // mulps 0xfc7c(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 68,15,84,21,132,252,0,0 // andps 0xfc84(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 68,15,86,21,156,249,0,0 // orps 0xf99c(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,13,132,252,0,0 // addps 0xfc84(%rip),%xmm9 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 68,15,40,37,140,252,0,0 // movaps 0xfc8c(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,76,242,0,0 // addps 0xf24c(%rip),%xmm10 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
- .byte 68,15,40,37,84,242,0,0 // movaps 0xf254(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,88,21,140,252,0,0 // addps 0xfc8c(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 68,15,40,37,148,252,0,0 // movaps 0xfc94(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -38146,22 +38146,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,46,239,0,0 // movaps 0xef2e(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,21,110,249,0,0 // movaps 0xf96e(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,34,242,0,0 // addps 0xf222(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
- .byte 68,15,40,37,42,242,0,0 // movaps 0xf22a(%rip),%xmm12 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 68,15,88,13,98,252,0,0 // addps 0xfc62(%rip),%xmm9 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 68,15,40,37,106,252,0,0 // movaps 0xfc6a(%rip),%xmm12 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,42,242,0,0 // movaps 0xf22a(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 68,15,40,37,106,252,0,0 // movaps 0xfc6a(%rip),%xmm12 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,46,242,0,0 // movaps 0xf22e(%rip),%xmm13 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 68,15,40,45,110,252,0,0 // movaps 0xfc6e(%rip),%xmm13 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,46,242,0,0 // mulps 0xf22e(%rip),%xmm13 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 68,15,89,45,110,252,0,0 // mulps 0xfc6e(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -38197,15 +38197,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,254,240,0,0 // mulps 0xf0fe(%rip),%xmm9 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 68,15,84,21,6,241,0,0 // andps 0xf106(%rip),%xmm10 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 68,15,86,21,30,238,0,0 // orps 0xee1e(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
- .byte 68,15,88,13,6,241,0,0 // addps 0xf106(%rip),%xmm9 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
- .byte 68,15,40,37,14,241,0,0 // movaps 0xf10e(%rip),%xmm12 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,89,13,62,251,0,0 // mulps 0xfb3e(%rip),%xmm9 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 68,15,84,21,70,251,0,0 // andps 0xfb46(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 68,15,86,21,94,248,0,0 // orps 0xf85e(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
+ .byte 68,15,88,13,70,251,0,0 // addps 0xfb46(%rip),%xmm9 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
+ .byte 68,15,40,37,78,251,0,0 // movaps 0xfb4e(%rip),%xmm12 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,14,241,0,0 // addps 0xf10e(%rip),%xmm10 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
- .byte 68,15,40,37,22,241,0,0 // movaps 0xf116(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,88,21,78,251,0,0 // addps 0xfb4e(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
+ .byte 68,15,40,37,86,251,0,0 // movaps 0xfb56(%rip),%xmm12 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -38213,22 +38213,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,240,237,0,0 // movaps 0xedf0(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,21,48,248,0,0 // movaps 0xf830(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,228,240,0,0 // addps 0xf0e4(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
- .byte 68,15,40,37,236,240,0,0 // movaps 0xf0ec(%rip),%xmm12 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 68,15,88,13,36,251,0,0 // addps 0xfb24(%rip),%xmm9 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
+ .byte 68,15,40,37,44,251,0,0 // movaps 0xfb2c(%rip),%xmm12 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,236,240,0,0 // movaps 0xf0ec(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 68,15,40,37,44,251,0,0 // movaps 0xfb2c(%rip),%xmm12 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,240,240,0,0 // movaps 0xf0f0(%rip),%xmm13 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 68,15,40,45,48,251,0,0 // movaps 0xfb30(%rip),%xmm13 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,240,240,0,0 // mulps 0xf0f0(%rip),%xmm13 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 68,15,89,45,48,251,0,0 // mulps 0xfb30(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -38253,19 +38253,19 @@ _sk_gamma_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,251,239,0,0 // mulps 0xeffb(%rip),%xmm0 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 15,84,21,4,240,0,0 // andps 0xf004(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 68,15,40,53,28,237,0,0 // movaps 0xed1c(%rip),%xmm14 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 15,89,5,59,250,0,0 // mulps 0xfa3b(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 15,84,21,68,250,0,0 // andps 0xfa44(%rip),%xmm2 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 68,15,40,53,92,247,0,0 // movaps 0xf75c(%rip),%xmm14 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,86,214 // orps %xmm14,%xmm2
- .byte 68,15,40,37,0,240,0,0 // movaps 0xf000(%rip),%xmm12 # 2c590 <_sk_overlay_sse2_8bit+0x1174>
+ .byte 68,15,40,37,64,250,0,0 // movaps 0xfa40(%rip),%xmm12 # 2cfd0 <_sk_overlay_sse2_8bit+0x11f8>
.byte 65,15,88,196 // addps %xmm12,%xmm0
- .byte 68,15,40,29,4,240,0,0 // movaps 0xf004(%rip),%xmm11 # 2c5a0 <_sk_overlay_sse2_8bit+0x1184>
+ .byte 68,15,40,29,68,250,0,0 // movaps 0xfa44(%rip),%xmm11 # 2cfe0 <_sk_overlay_sse2_8bit+0x1208>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,21,2,240,0,0 // movaps 0xf002(%rip),%xmm10 # 2c5b0 <_sk_overlay_sse2_8bit+0x1194>
+ .byte 68,15,40,21,66,250,0,0 // movaps 0xfa42(%rip),%xmm10 # 2cff0 <_sk_overlay_sse2_8bit+0x1218>
.byte 65,15,88,210 // addps %xmm10,%xmm2
- .byte 68,15,40,45,6,240,0,0 // movaps 0xf006(%rip),%xmm13 # 2c5c0 <_sk_overlay_sse2_8bit+0x11a4>
+ .byte 68,15,40,45,70,250,0,0 // movaps 0xfa46(%rip),%xmm13 # 2d000 <_sk_overlay_sse2_8bit+0x1228>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -38277,27 +38277,27 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,226,1 // cmpltps %xmm2,%xmm4
- .byte 68,15,40,13,214,236,0,0 // movaps 0xecd6(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,13,22,247,0,0 // movaps 0xf716(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 65,15,84,225 // andps %xmm9,%xmm4
.byte 15,92,212 // subps %xmm4,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,210,239,0,0 // movaps 0xefd2(%rip),%xmm6 # 2c5d0 <_sk_overlay_sse2_8bit+0x11b4>
+ .byte 15,40,53,18,250,0,0 // movaps 0xfa12(%rip),%xmm6 # 2d010 <_sk_overlay_sse2_8bit+0x1238>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,232,239,0,0 // movaps 0xefe8(%rip),%xmm7 # 2c5f0 <_sk_overlay_sse2_8bit+0x11d4>
+ .byte 15,40,61,40,250,0,0 // movaps 0xfa28(%rip),%xmm7 # 2d030 <_sk_overlay_sse2_8bit+0x1258>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,200,239,0,0 // movaps 0xefc8(%rip),%xmm4 # 2c5e0 <_sk_overlay_sse2_8bit+0x11c4>
+ .byte 15,40,37,8,250,0,0 // movaps 0xfa08(%rip),%xmm4 # 2d020 <_sk_overlay_sse2_8bit+0x1248>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,218,239,0,0 // movaps 0xefda(%rip),%xmm15 # 2c600 <_sk_overlay_sse2_8bit+0x11e4>
+ .byte 68,15,40,61,26,250,0,0 // movaps 0xfa1a(%rip),%xmm15 # 2d040 <_sk_overlay_sse2_8bit+0x1268>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,54,239,0,0 // mulps 0xef36(%rip),%xmm0 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 15,84,13,63,239,0,0 // andps 0xef3f(%rip),%xmm1 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
+ .byte 15,89,5,118,249,0,0 // mulps 0xf976(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 15,84,13,127,249,0,0 // andps 0xf97f(%rip),%xmm1 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
.byte 65,15,86,206 // orps %xmm14,%xmm1
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
@@ -38327,9 +38327,9 @@ _sk_gamma_sse2:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,197,238,0,0 // mulps 0xeec5(%rip),%xmm0 # 2c570 <_sk_overlay_sse2_8bit+0x1154>
- .byte 15,84,29,206,238,0,0 // andps 0xeece(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0x1164>
- .byte 15,86,29,231,235,0,0 // orps 0xebe7(%rip),%xmm3 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 15,89,5,5,249,0,0 // mulps 0xf905(%rip),%xmm0 # 2cfb0 <_sk_overlay_sse2_8bit+0x11d8>
+ .byte 15,84,29,14,249,0,0 // andps 0xf90e(%rip),%xmm3 # 2cfc0 <_sk_overlay_sse2_8bit+0x11e8>
+ .byte 15,86,29,39,246,0,0 // orps 0xf627(%rip),%xmm3 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
.byte 65,15,92,195 // subps %xmm11,%xmm0
@@ -38351,7 +38351,7 @@ _sk_gamma_sse2:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,4,239,0,0 // movaps 0xef04(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0x11f4>
+ .byte 15,40,5,68,249,0,0 // movaps 0xf944(%rip),%xmm0 # 2d050 <_sk_overlay_sse2_8bit+0x1278>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -38370,29 +38370,29 @@ HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,217,238,0,0 // mulps 0xeed9(%rip),%xmm0 # 2c620 <_sk_overlay_sse2_8bit+0x1204>
- .byte 68,15,40,5,81,236,0,0 // movaps 0xec51(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 15,89,5,25,249,0,0 // mulps 0xf919(%rip),%xmm0 # 2d060 <_sk_overlay_sse2_8bit+0x1288>
+ .byte 68,15,40,5,145,246,0,0 // movaps 0xf691(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,213,238,0,0 // movaps 0xeed5(%rip),%xmm9 # 2c630 <_sk_overlay_sse2_8bit+0x1214>
+ .byte 68,15,40,13,21,249,0,0 // movaps 0xf915(%rip),%xmm9 # 2d070 <_sk_overlay_sse2_8bit+0x1298>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,210,238,0,0 // addps 0xeed2(%rip),%xmm0 # 2c640 <_sk_overlay_sse2_8bit+0x1224>
- .byte 15,89,5,219,238,0,0 // mulps 0xeedb(%rip),%xmm0 # 2c650 <_sk_overlay_sse2_8bit+0x1234>
- .byte 15,89,13,228,238,0,0 // mulps 0xeee4(%rip),%xmm1 # 2c660 <_sk_overlay_sse2_8bit+0x1244>
+ .byte 15,88,5,18,249,0,0 // addps 0xf912(%rip),%xmm0 # 2d080 <_sk_overlay_sse2_8bit+0x12a8>
+ .byte 15,89,5,27,249,0,0 // mulps 0xf91b(%rip),%xmm0 # 2d090 <_sk_overlay_sse2_8bit+0x12b8>
+ .byte 15,89,13,36,249,0,0 // mulps 0xf924(%rip),%xmm1 # 2d0a0 <_sk_overlay_sse2_8bit+0x12c8>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,234,238,0,0 // mulps 0xeeea(%rip),%xmm2 # 2c670 <_sk_overlay_sse2_8bit+0x1254>
+ .byte 15,89,21,42,249,0,0 // mulps 0xf92a(%rip),%xmm2 # 2d0b0 <_sk_overlay_sse2_8bit+0x12d8>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,223,238,0,0 // movaps 0xeedf(%rip),%xmm2 # 2c680 <_sk_overlay_sse2_8bit+0x1264>
+ .byte 15,40,21,31,249,0,0 // movaps 0xf91f(%rip),%xmm2 # 2d0c0 <_sk_overlay_sse2_8bit+0x12e8>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,222,238,0,0 // movaps 0xeede(%rip),%xmm10 # 2c690 <_sk_overlay_sse2_8bit+0x1274>
+ .byte 68,15,40,21,30,249,0,0 // movaps 0xf91e(%rip),%xmm10 # 2d0d0 <_sk_overlay_sse2_8bit+0x12f8>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,226,238,0,0 // movaps 0xeee2(%rip),%xmm11 # 2c6a0 <_sk_overlay_sse2_8bit+0x1284>
+ .byte 68,15,40,29,34,249,0,0 // movaps 0xf922(%rip),%xmm11 # 2d0e0 <_sk_overlay_sse2_8bit+0x1308>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -38416,8 +38416,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,146,238,0,0 // mulps 0xee92(%rip),%xmm8 # 2c6b0 <_sk_overlay_sse2_8bit+0x1294>
- .byte 15,89,21,155,238,0,0 // mulps 0xee9b(%rip),%xmm2 # 2c6c0 <_sk_overlay_sse2_8bit+0x12a4>
+ .byte 68,15,89,5,210,248,0,0 // mulps 0xf8d2(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x1318>
+ .byte 15,89,21,219,248,0,0 // mulps 0xf8db(%rip),%xmm2 # 2d100 <_sk_overlay_sse2_8bit+0x1328>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -38437,9 +38437,9 @@ _sk_load_a8_sse2:
.byte 102,67,15,110,4,16 // movd (%r8,%r10,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,21,235,0,0 // pand 0xeb15(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,219,5,85,245,0,0 // pand 0xf555(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,91,236,0,0 // mulps 0xec5b(%rip),%xmm3 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,29,155,246,0,0 // mulps 0xf69b(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
@@ -38482,9 +38482,9 @@ _sk_load_a8_dst_sse2:
.byte 102,67,15,110,36,16 // movd (%r8,%r10,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,129,234,0,0 // pand 0xea81(%rip),%xmm4 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,219,37,193,244,0,0 // pand 0xf4c1(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,199,235,0,0 // mulps 0xebc7(%rip),%xmm7 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,61,7,246,0,0 // mulps 0xf607(%rip),%xmm7 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
@@ -38550,7 +38550,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,214,234,0,0 // mulps 0xead6(%rip),%xmm3 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,29,22,245,0,0 // mulps 0xf516(%rip),%xmm3 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -38567,7 +38567,7 @@ _sk_store_a8_sse2:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
- .byte 68,15,40,5,140,233,0,0 // movaps 0xe98c(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,5,204,243,0,0 // movaps 0xf3cc(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -38593,7 +38593,7 @@ _sk_store_a8_sse2:
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 67,136,68,16,2 // mov %al,0x2(%r8,%r10,1)
- .byte 102,68,15,219,5,239,232,0,0 // pand 0xe8ef(%rip),%xmm8 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,68,15,219,5,47,243,0,0 // pand 0xf32f(%rip),%xmm8 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,68,15,126,192 // movd %xmm8,%eax
@@ -38619,11 +38619,11 @@ _sk_load_g8_sse2:
.byte 102,67,15,110,4,16 // movd (%r8,%r10,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,154,232,0,0 // pand 0xe89a(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,219,5,218,242,0,0 // pand 0xf2da(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,224,233,0,0 // mulps 0xe9e0(%rip),%xmm0 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,5,32,244,0,0 // mulps 0xf420(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,215,231,0,0 // movaps 0xe7d7(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,23,242,0,0 // movaps 0xf217(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -38664,11 +38664,11 @@ _sk_load_g8_dst_sse2:
.byte 102,67,15,110,36,16 // movd (%r8,%r10,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,3,232,0,0 // pand 0xe803(%rip),%xmm4 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,219,37,67,242,0,0 // pand 0xf243(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,73,233,0,0 // mulps 0xe949(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,37,137,243,0,0 // mulps 0xf389(%rip),%xmm4 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,64,231,0,0 // movaps 0xe740(%rip),%xmm7 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,61,128,241,0,0 // movaps 0xf180(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
@@ -38732,9 +38732,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,85,232,0,0 // mulps 0xe855(%rip),%xmm0 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 15,89,5,149,242,0,0 // mulps 0xf295(%rip),%xmm0 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,76,230,0,0 // movaps 0xe64c(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,140,240,0,0 // movaps 0xf08c(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -38754,19 +38754,19 @@ _sk_load_565_sse2:
.byte 117,83 // jne 1dcea <_sk_load_565_sse2+0x6e>
.byte 243,67,15,126,20,80 // movq (%r8,%r10,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,39,232,0,0 // movdqa 0xe827(%rip),%xmm0 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,15,111,5,103,242,0,0 // movdqa 0xf267(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,41,232,0,0 // mulps 0xe829(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,15,111,13,49,232,0,0 // movdqa 0xe831(%rip),%xmm1 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 15,89,5,105,242,0,0 // mulps 0xf269(%rip),%xmm0 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,15,111,13,113,242,0,0 // movdqa 0xf271(%rip),%xmm1 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,51,232,0,0 // mulps 0xe833(%rip),%xmm1 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,15,219,21,59,232,0,0 // pand 0xe83b(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 15,89,13,115,242,0,0 // mulps 0xf273(%rip),%xmm1 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,15,219,21,123,242,0,0 // pand 0xf27b(%rip),%xmm2 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,65,232,0,0 // mulps 0xe841(%rip),%xmm2 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 15,89,21,129,242,0,0 // mulps 0xf281(%rip),%xmm2 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,216,229,0,0 // movaps 0xe5d8(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,24,240,0,0 // movaps 0xf018(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
@@ -38803,19 +38803,19 @@ _sk_load_565_dst_sse2:
.byte 117,83 // jne 1dda5 <_sk_load_565_dst_sse2+0x6e>
.byte 243,67,15,126,52,80 // movq (%r8,%r10,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,37,108,231,0,0 // movdqa 0xe76c(%rip),%xmm4 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,15,111,37,172,241,0,0 // movdqa 0xf1ac(%rip),%xmm4 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,110,231,0,0 // mulps 0xe76e(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,15,111,45,118,231,0,0 // movdqa 0xe776(%rip),%xmm5 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 15,89,37,174,241,0,0 // mulps 0xf1ae(%rip),%xmm4 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,15,111,45,182,241,0,0 // movdqa 0xf1b6(%rip),%xmm5 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,120,231,0,0 // mulps 0xe778(%rip),%xmm5 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,15,219,53,128,231,0,0 // pand 0xe780(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 15,89,45,184,241,0,0 // mulps 0xf1b8(%rip),%xmm5 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,15,219,53,192,241,0,0 // pand 0xf1c0(%rip),%xmm6 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,134,231,0,0 // mulps 0xe786(%rip),%xmm6 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 15,89,53,198,241,0,0 // mulps 0xf1c6(%rip),%xmm6 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,29,229,0,0 // movaps 0xe51d(%rip),%xmm7 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,61,93,239,0,0 // movaps 0xef5d(%rip),%xmm7 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
@@ -38869,19 +38869,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,88,230,0,0 // movdqa 0xe658(%rip),%xmm0 # 2c4d0 <_sk_overlay_sse2_8bit+0x10b4>
+ .byte 102,15,111,5,152,240,0,0 // movdqa 0xf098(%rip),%xmm0 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,90,230,0,0 // mulps 0xe65a(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x10c4>
- .byte 102,15,111,13,98,230,0,0 // movdqa 0xe662(%rip),%xmm1 # 2c4f0 <_sk_overlay_sse2_8bit+0x10d4>
+ .byte 15,89,5,154,240,0,0 // mulps 0xf09a(%rip),%xmm0 # 2cf20 <_sk_overlay_sse2_8bit+0x1148>
+ .byte 102,15,111,13,162,240,0,0 // movdqa 0xf0a2(%rip),%xmm1 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,100,230,0,0 // mulps 0xe664(%rip),%xmm1 # 2c500 <_sk_overlay_sse2_8bit+0x10e4>
- .byte 102,15,219,21,108,230,0,0 // pand 0xe66c(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0x10f4>
+ .byte 15,89,13,164,240,0,0 // mulps 0xf0a4(%rip),%xmm1 # 2cf40 <_sk_overlay_sse2_8bit+0x1168>
+ .byte 102,15,219,21,172,240,0,0 // pand 0xf0ac(%rip),%xmm2 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,114,230,0,0 // mulps 0xe672(%rip),%xmm2 # 2c520 <_sk_overlay_sse2_8bit+0x1104>
+ .byte 15,89,21,178,240,0,0 // mulps 0xf0b2(%rip),%xmm2 # 2cf60 <_sk_overlay_sse2_8bit+0x1188>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,9,228,0,0 // movaps 0xe409(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,73,238,0,0 // movaps 0xee49(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_sse2
@@ -38895,12 +38895,12 @@ _sk_store_565_sse2:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
- .byte 68,15,40,5,9,232,0,0 // movaps 0xe809(%rip),%xmm8 # 2c6e0 <_sk_overlay_sse2_8bit+0x12c4>
+ .byte 68,15,40,5,73,242,0,0 // movaps 0xf249(%rip),%xmm8 # 2d120 <_sk_overlay_sse2_8bit+0x1348>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,254,231,0,0 // movaps 0xe7fe(%rip),%xmm10 # 2c6f0 <_sk_overlay_sse2_8bit+0x12d4>
+ .byte 68,15,40,21,62,242,0,0 // movaps 0xf23e(%rip),%xmm10 # 2d130 <_sk_overlay_sse2_8bit+0x1358>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -38949,21 +38949,21 @@ _sk_load_4444_sse2:
.byte 117,98 // jne 1dff5 <_sk_load_4444_sse2+0x7d>
.byte 243,67,15,126,28,80 // movq (%r8,%r10,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,91,231,0,0 // movdqa 0xe75b(%rip),%xmm0 # 2c700 <_sk_overlay_sse2_8bit+0x12e4>
+ .byte 102,15,111,5,155,241,0,0 // movdqa 0xf19b(%rip),%xmm0 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,93,231,0,0 // mulps 0xe75d(%rip),%xmm0 # 2c710 <_sk_overlay_sse2_8bit+0x12f4>
- .byte 102,15,111,13,101,231,0,0 // movdqa 0xe765(%rip),%xmm1 # 2c720 <_sk_overlay_sse2_8bit+0x1304>
+ .byte 15,89,5,157,241,0,0 // mulps 0xf19d(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
+ .byte 102,15,111,13,165,241,0,0 // movdqa 0xf1a5(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,103,231,0,0 // mulps 0xe767(%rip),%xmm1 # 2c730 <_sk_overlay_sse2_8bit+0x1314>
- .byte 102,15,111,21,111,231,0,0 // movdqa 0xe76f(%rip),%xmm2 # 2c740 <_sk_overlay_sse2_8bit+0x1324>
+ .byte 15,89,13,167,241,0,0 // mulps 0xf1a7(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
+ .byte 102,15,111,21,175,241,0,0 // movdqa 0xf1af(%rip),%xmm2 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,113,231,0,0 // mulps 0xe771(%rip),%xmm2 # 2c750 <_sk_overlay_sse2_8bit+0x1334>
- .byte 102,15,219,29,121,231,0,0 // pand 0xe779(%rip),%xmm3 # 2c760 <_sk_overlay_sse2_8bit+0x1344>
+ .byte 15,89,21,177,241,0,0 // mulps 0xf1b1(%rip),%xmm2 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
+ .byte 102,15,219,29,185,241,0,0 // pand 0xf1b9(%rip),%xmm3 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,127,231,0,0 // mulps 0xe77f(%rip),%xmm3 # 2c770 <_sk_overlay_sse2_8bit+0x1354>
+ .byte 15,89,29,191,241,0,0 // mulps 0xf1bf(%rip),%xmm3 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
@@ -39001,21 +39001,21 @@ _sk_load_4444_dst_sse2:
.byte 117,98 // jne 1e0bf <_sk_load_4444_dst_sse2+0x7d>
.byte 243,67,15,126,60,80 // movq (%r8,%r10,2),%xmm7
.byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
- .byte 102,15,111,37,145,230,0,0 // movdqa 0xe691(%rip),%xmm4 # 2c700 <_sk_overlay_sse2_8bit+0x12e4>
+ .byte 102,15,111,37,209,240,0,0 // movdqa 0xf0d1(%rip),%xmm4 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,147,230,0,0 // mulps 0xe693(%rip),%xmm4 # 2c710 <_sk_overlay_sse2_8bit+0x12f4>
- .byte 102,15,111,45,155,230,0,0 // movdqa 0xe69b(%rip),%xmm5 # 2c720 <_sk_overlay_sse2_8bit+0x1304>
+ .byte 15,89,37,211,240,0,0 // mulps 0xf0d3(%rip),%xmm4 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
+ .byte 102,15,111,45,219,240,0,0 // movdqa 0xf0db(%rip),%xmm5 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,157,230,0,0 // mulps 0xe69d(%rip),%xmm5 # 2c730 <_sk_overlay_sse2_8bit+0x1314>
- .byte 102,15,111,53,165,230,0,0 // movdqa 0xe6a5(%rip),%xmm6 # 2c740 <_sk_overlay_sse2_8bit+0x1324>
+ .byte 15,89,45,221,240,0,0 // mulps 0xf0dd(%rip),%xmm5 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
+ .byte 102,15,111,53,229,240,0,0 // movdqa 0xf0e5(%rip),%xmm6 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,167,230,0,0 // mulps 0xe6a7(%rip),%xmm6 # 2c750 <_sk_overlay_sse2_8bit+0x1334>
- .byte 102,15,219,61,175,230,0,0 // pand 0xe6af(%rip),%xmm7 # 2c760 <_sk_overlay_sse2_8bit+0x1344>
+ .byte 15,89,53,231,240,0,0 // mulps 0xf0e7(%rip),%xmm6 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
+ .byte 102,15,219,61,239,240,0,0 // pand 0xf0ef(%rip),%xmm7 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,181,230,0,0 // mulps 0xe6b5(%rip),%xmm7 # 2c770 <_sk_overlay_sse2_8bit+0x1354>
+ .byte 15,89,61,245,240,0,0 // mulps 0xf0f5(%rip),%xmm7 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,137,249 // mov %edi,%r9d
@@ -39070,21 +39070,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,110,229,0,0 // movdqa 0xe56e(%rip),%xmm0 # 2c700 <_sk_overlay_sse2_8bit+0x12e4>
+ .byte 102,15,111,5,174,239,0,0 // movdqa 0xefae(%rip),%xmm0 # 2d140 <_sk_overlay_sse2_8bit+0x1368>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,112,229,0,0 // mulps 0xe570(%rip),%xmm0 # 2c710 <_sk_overlay_sse2_8bit+0x12f4>
- .byte 102,15,111,13,120,229,0,0 // movdqa 0xe578(%rip),%xmm1 # 2c720 <_sk_overlay_sse2_8bit+0x1304>
+ .byte 15,89,5,176,239,0,0 // mulps 0xefb0(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x1378>
+ .byte 102,15,111,13,184,239,0,0 // movdqa 0xefb8(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x1388>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,122,229,0,0 // mulps 0xe57a(%rip),%xmm1 # 2c730 <_sk_overlay_sse2_8bit+0x1314>
- .byte 102,15,111,21,130,229,0,0 // movdqa 0xe582(%rip),%xmm2 # 2c740 <_sk_overlay_sse2_8bit+0x1324>
+ .byte 15,89,13,186,239,0,0 // mulps 0xefba(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1398>
+ .byte 102,15,111,21,194,239,0,0 // movdqa 0xefc2(%rip),%xmm2 # 2d180 <_sk_overlay_sse2_8bit+0x13a8>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,132,229,0,0 // mulps 0xe584(%rip),%xmm2 # 2c750 <_sk_overlay_sse2_8bit+0x1334>
- .byte 102,15,219,29,140,229,0,0 // pand 0xe58c(%rip),%xmm3 # 2c760 <_sk_overlay_sse2_8bit+0x1344>
+ .byte 15,89,21,196,239,0,0 // mulps 0xefc4(%rip),%xmm2 # 2d190 <_sk_overlay_sse2_8bit+0x13b8>
+ .byte 102,15,219,29,204,239,0,0 // pand 0xefcc(%rip),%xmm3 # 2d1a0 <_sk_overlay_sse2_8bit+0x13c8>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,146,229,0,0 // mulps 0xe592(%rip),%xmm3 # 2c770 <_sk_overlay_sse2_8bit+0x1354>
+ .byte 15,89,29,210,239,0,0 // mulps 0xefd2(%rip),%xmm3 # 2d1b0 <_sk_overlay_sse2_8bit+0x13d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -39099,7 +39099,7 @@ _sk_store_4444_sse2:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,210 // movslq %edx,%r10
- .byte 68,15,40,5,128,229,0,0 // movaps 0xe580(%rip),%xmm8 # 2c780 <_sk_overlay_sse2_8bit+0x1364>
+ .byte 68,15,40,5,192,239,0,0 // movaps 0xefc0(%rip),%xmm8 # 2d1c0 <_sk_overlay_sse2_8bit+0x13e8>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -39157,11 +39157,11 @@ _sk_load_8888_sse2:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,98 // jne 1e333 <_sk_load_8888_sse2+0x7e>
.byte 243,69,15,111,12,128 // movdqu (%r8,%rax,4),%xmm9
- .byte 102,15,111,21,145,224,0,0 // movdqa 0xe091(%rip),%xmm2 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,21,209,234,0,0 // movdqa 0xead1(%rip),%xmm2 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,205,225,0,0 // movaps 0xe1cd(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,13,236,0,0 // movaps 0xec0d(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39208,11 +39208,11 @@ _sk_load_8888_dst_sse2:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,98 // jne 1e3f2 <_sk_load_8888_dst_sse2+0x7e>
.byte 243,69,15,111,12,128 // movdqu (%r8,%rax,4),%xmm9
- .byte 102,15,111,53,210,223,0,0 // movdqa 0xdfd2(%rip),%xmm6 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,53,18,234,0,0 // movdqa 0xea12(%rip),%xmm6 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,65,15,111,225 // movdqa %xmm9,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,14,225,0,0 // movaps 0xe10e(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,78,235,0,0 // movaps 0xeb4e(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -39276,11 +39276,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,136 // movd (%r8,%r9,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,188,222,0,0 // movdqa 0xdebc(%rip),%xmm2 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,21,252,232,0,0 // movdqa 0xe8fc(%rip),%xmm2 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,248,223,0,0 // movaps 0xdff8(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,56,234,0,0 // movaps 0xea38(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39309,7 +39309,7 @@ _sk_store_8888_sse2:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,121,222,0,0 // movaps 0xde79(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,5,185,232,0,0 // movaps 0xe8b9(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -39361,11 +39361,11 @@ _sk_load_bgra_sse2:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,98 // jne 1e63b <_sk_load_bgra_sse2+0x7e>
.byte 243,69,15,111,12,128 // movdqu (%r8,%rax,4),%xmm9
- .byte 102,15,111,5,137,221,0,0 // movdqa 0xdd89(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,5,201,231,0,0 // movdqa 0xe7c9(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,197,222,0,0 // movaps 0xdec5(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,5,233,0,0 // movaps 0xe905(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39412,11 +39412,11 @@ _sk_load_bgra_dst_sse2:
.byte 72,133,255 // test %rdi,%rdi
.byte 117,98 // jne 1e6fa <_sk_load_bgra_dst_sse2+0x7e>
.byte 243,69,15,111,12,128 // movdqu (%r8,%rax,4),%xmm9
- .byte 102,15,111,37,202,220,0,0 // movdqa 0xdcca(%rip),%xmm4 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,37,10,231,0,0 // movdqa 0xe70a(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 68,15,40,5,6,222,0,0 // movaps 0xde06(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,70,232,0,0 // movaps 0xe846(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -39480,11 +39480,11 @@ _sk_gather_bgra_sse2:
.byte 102,67,15,110,12,136 // movd (%r8,%r9,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,5,180,219,0,0 // movdqa 0xdbb4(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0xf54>
+ .byte 102,15,111,5,244,229,0,0 // movdqa 0xe5f4(%rip),%xmm0 # 2cdb0 <_sk_overlay_sse2_8bit+0xfd8>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,240,220,0,0 // movaps 0xdcf0(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0x10a4>
+ .byte 68,15,40,5,48,231,0,0 // movaps 0xe730(%rip),%xmm8 # 2cf00 <_sk_overlay_sse2_8bit+0x1128>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39513,7 +39513,7 @@ _sk_store_bgra_sse2:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,113,219,0,0 // movaps 0xdb71(%rip),%xmm8 # 2c3a0 <_sk_overlay_sse2_8bit+0xf84>
+ .byte 68,15,40,5,177,229,0,0 // movaps 0xe5b1(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1008>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -39575,7 +39575,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,105,222,0,0 // movdqa 0xde69(%rip),%xmm9 # 2c790 <_sk_overlay_sse2_8bit+0x1374>
+ .byte 102,68,15,111,13,169,232,0,0 // movdqa 0xe8a9(%rip),%xmm9 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -39583,11 +39583,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,94,222,0,0 // movdqa 0xde5e(%rip),%xmm11 # 2c7b0 <_sk_overlay_sse2_8bit+0x1394>
+ .byte 102,68,15,111,29,158,232,0,0 // movdqa 0xe89e(%rip),%xmm11 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,96,222,0,0 // movdqa 0xde60(%rip),%xmm12 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
+ .byte 102,68,15,111,37,160,232,0,0 // movdqa 0xe8a0(%rip),%xmm12 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,3,224,0,0 // movdqa 0xe003(%rip),%xmm3 # 2c970 <_sk_overlay_sse2_8bit+0x1554>
+ .byte 102,15,111,29,67,234,0,0 // movdqa 0xea43(%rip),%xmm3 # 2d3b0 <_sk_overlay_sse2_8bit+0x15d8>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -39671,7 +39671,7 @@ _sk_load_f16_dst_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,238 // movdqa %xmm14,%xmm5
.byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5
- .byte 102,68,15,111,13,169,220,0,0 // movdqa 0xdca9(%rip),%xmm9 # 2c790 <_sk_overlay_sse2_8bit+0x1374>
+ .byte 102,68,15,111,13,233,230,0,0 // movdqa 0xe6e9(%rip),%xmm9 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,219,225 // pand %xmm9,%xmm4
.byte 102,15,239,236 // pxor %xmm4,%xmm5
@@ -39679,11 +39679,11 @@ _sk_load_f16_dst_sse2:
.byte 102,68,15,111,237 // movdqa %xmm5,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,236 // por %xmm4,%xmm13
- .byte 102,68,15,111,29,158,220,0,0 // movdqa 0xdc9e(%rip),%xmm11 # 2c7b0 <_sk_overlay_sse2_8bit+0x1394>
+ .byte 102,68,15,111,29,222,230,0,0 // movdqa 0xe6de(%rip),%xmm11 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,160,220,0,0 // movdqa 0xdca0(%rip),%xmm12 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
+ .byte 102,68,15,111,37,224,230,0,0 // movdqa 0xe6e0(%rip),%xmm12 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
.byte 102,65,15,239,236 // pxor %xmm12,%xmm5
- .byte 102,15,111,61,67,222,0,0 // movdqa 0xde43(%rip),%xmm7 # 2c970 <_sk_overlay_sse2_8bit+0x1554>
+ .byte 102,15,111,61,131,232,0,0 // movdqa 0xe883(%rip),%xmm7 # 2d3b0 <_sk_overlay_sse2_8bit+0x15d8>
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4
.byte 102,65,15,223,229 // pandn %xmm13,%xmm4
@@ -39782,7 +39782,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,163,218,0,0 // movdqa 0xdaa3(%rip),%xmm9 # 2c790 <_sk_overlay_sse2_8bit+0x1374>
+ .byte 102,68,15,111,13,227,228,0,0 // movdqa 0xe4e3(%rip),%xmm9 # 2d1d0 <_sk_overlay_sse2_8bit+0x13f8>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -39790,11 +39790,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,152,218,0,0 // movdqa 0xda98(%rip),%xmm11 # 2c7b0 <_sk_overlay_sse2_8bit+0x1394>
+ .byte 102,68,15,111,29,216,228,0,0 // movdqa 0xe4d8(%rip),%xmm11 # 2d1f0 <_sk_overlay_sse2_8bit+0x1418>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,154,218,0,0 // movdqa 0xda9a(%rip),%xmm12 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
+ .byte 102,68,15,111,37,218,228,0,0 // movdqa 0xe4da(%rip),%xmm12 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,61,220,0,0 // movdqa 0xdc3d(%rip),%xmm3 # 2c970 <_sk_overlay_sse2_8bit+0x1554>
+ .byte 102,15,111,29,125,230,0,0 // movdqa 0xe67d(%rip),%xmm3 # 2d3b0 <_sk_overlay_sse2_8bit+0x15d8>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -39852,17 +39852,17 @@ _sk_store_f16_sse2:
.byte 73,193,224,3 // shl $0x3,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,147,217,0,0 // movdqa 0xd993(%rip),%xmm10 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
+ .byte 102,68,15,111,21,211,227,0,0 // movdqa 0xe3d3(%rip),%xmm10 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,69,15,219,226 // pand %xmm10,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,236 // pxor %xmm12,%xmm13
- .byte 102,68,15,111,13,134,217,0,0 // movdqa 0xd986(%rip),%xmm9 # 2c7d0 <_sk_overlay_sse2_8bit+0x13b4>
+ .byte 102,68,15,111,13,198,227,0,0 // movdqa 0xe3c6(%rip),%xmm9 # 2d210 <_sk_overlay_sse2_8bit+0x1438>
.byte 102,65,15,114,212,16 // psrld $0x10,%xmm12
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,29,119,217,0,0 // movdqa 0xd977(%rip),%xmm11 # 2c7e0 <_sk_overlay_sse2_8bit+0x13c4>
+ .byte 102,68,15,111,29,183,227,0,0 // movdqa 0xe3b7(%rip),%xmm11 # 2d220 <_sk_overlay_sse2_8bit+0x1448>
.byte 102,69,15,235,227 // por %xmm11,%xmm12
.byte 102,69,15,254,229 // paddd %xmm13,%xmm12
.byte 102,65,15,114,244,16 // pslld $0x10,%xmm12
@@ -39960,7 +39960,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,38,213,0,0 // movaps 0xd526(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0x1134>
+ .byte 68,15,40,5,102,223,0,0 // movaps 0xdf66(%rip),%xmm8 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -40036,7 +40036,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,13,236,211,0,0 // movaps 0xd3ec(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0x1134>
+ .byte 68,15,40,13,44,222,0,0 // movaps 0xde2c(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x11b8>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -40053,7 +40053,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,19,209,0,0 // movaps 0xd113(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,83,219,0,0 // movaps 0xdb53(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,64 // movd (%r8,%rax,2),%xmm2
.byte 102,65,15,196,84,64,4,2 // pinsrw $0x2,0x4(%r8,%rax,2),%xmm2
@@ -40087,7 +40087,7 @@ _sk_store_u16_be_sse2:
.byte 77,1,192 // add %r8,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 73,99,193 // movslq %r9d,%rax
- .byte 68,15,40,21,188,213,0,0 // movaps 0xd5bc(%rip),%xmm10 # 2c7f0 <_sk_overlay_sse2_8bit+0x13d4>
+ .byte 68,15,40,21,252,223,0,0 // movaps 0xdffc(%rip),%xmm10 # 2d230 <_sk_overlay_sse2_8bit+0x1458>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -40326,7 +40326,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,41,205,0,0 // andps 0xcd29(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,84,21,105,215,0,0 // andps 0xd769(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -40352,7 +40352,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,207,204,0,0 // andps 0xcccf(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,84,21,15,215,0,0 // andps 0xd70f(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -40378,13 +40378,13 @@ _sk_mirror_x_sse2:
.byte 65,15,92,193 // subps %xmm9,%xmm0
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,12,194,0,0 // mulss 0xc20c(%rip),%xmm11 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 243,68,15,89,29,200,203,0,0 // mulss 0xcbc8(%rip),%xmm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,85,204,0,0 // andps 0xcc55(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,84,29,149,214,0,0 // andps 0xd695(%rip),%xmm11 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -40413,13 +40413,13 @@ _sk_mirror_y_sse2:
.byte 65,15,92,201 // subps %xmm9,%xmm1
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,135,193,0,0 // mulss 0xc187(%rip),%xmm11 # 2b858 <_sk_overlay_sse2_8bit+0x43c>
+ .byte 243,68,15,89,29,67,203,0,0 // mulss 0xcb43(%rip),%xmm11 # 2c214 <_sk_overlay_sse2_8bit+0x43c>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,208,203,0,0 // andps 0xcbd0(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,84,29,16,214,0,0 // andps 0xd610(%rip),%xmm11 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -40442,7 +40442,7 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,135,203,0,0 // minps 0xcb87(%rip),%xmm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,93,5,199,213,0,0 // minps 0xd5c7(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -40455,7 +40455,7 @@ _sk_repeat_x_1_sse2:
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,84,13,101,203,0,0 // andps 0xcb65(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,84,13,165,213,0,0 // andps 0xd5a5(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -40465,14 +40465,14 @@ HIDDEN _sk_mirror_x_1_sse2
.globl _sk_mirror_x_1_sse2
FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
- .byte 68,15,40,5,177,203,0,0 // movaps 0xcbb1(%rip),%xmm8 # 2c320 <_sk_overlay_sse2_8bit+0xf04>
+ .byte 68,15,40,5,241,213,0,0 // movaps 0xd5f1(%rip),%xmm8 # 2cd60 <_sk_overlay_sse2_8bit+0xf88>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,37,203,0,0 // movaps 0xcb25(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,13,101,213,0,0 // movaps 0xd565(%rip),%xmm9 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,43,203,0,0 // andps 0xcb2b(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,84,13,107,213,0,0 // andps 0xd56b(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,88,210 // addps %xmm10,%xmm10
@@ -40488,10 +40488,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,65,208,0,0 // mulps 0xd041(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x13e4>
- .byte 15,89,13,74,208,0,0 // mulps 0xd04a(%rip),%xmm1 # 2c810 <_sk_overlay_sse2_8bit+0x13f4>
+ .byte 15,89,5,129,218,0,0 // mulps 0xda81(%rip),%xmm0 # 2d240 <_sk_overlay_sse2_8bit+0x1468>
+ .byte 15,89,13,138,218,0,0 // mulps 0xda8a(%rip),%xmm1 # 2d250 <_sk_overlay_sse2_8bit+0x1478>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,80,208,0,0 // mulps 0xd050(%rip),%xmm3 # 2c820 <_sk_overlay_sse2_8bit+0x1404>
+ .byte 15,89,29,144,218,0,0 // mulps 0xda90(%rip),%xmm3 # 2d260 <_sk_overlay_sse2_8bit+0x1488>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -40903,15 +40903,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2
.globl _sk_gauss_a_to_rgba_sse2
FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
- .byte 15,40,5,31,202,0,0 // movaps 0xca1f(%rip),%xmm0 # 2c830 <_sk_overlay_sse2_8bit+0x1414>
+ .byte 15,40,5,95,212,0,0 // movaps 0xd45f(%rip),%xmm0 # 2d270 <_sk_overlay_sse2_8bit+0x1498>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,37,202,0,0 // addps 0xca25(%rip),%xmm0 # 2c840 <_sk_overlay_sse2_8bit+0x1424>
+ .byte 15,88,5,101,212,0,0 // addps 0xd465(%rip),%xmm0 # 2d280 <_sk_overlay_sse2_8bit+0x14a8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,43,202,0,0 // addps 0xca2b(%rip),%xmm0 # 2c850 <_sk_overlay_sse2_8bit+0x1434>
+ .byte 15,88,5,107,212,0,0 // addps 0xd46b(%rip),%xmm0 # 2d290 <_sk_overlay_sse2_8bit+0x14b8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,49,202,0,0 // addps 0xca31(%rip),%xmm0 # 2c860 <_sk_overlay_sse2_8bit+0x1444>
+ .byte 15,88,5,113,212,0,0 // addps 0xd471(%rip),%xmm0 # 2d2a0 <_sk_overlay_sse2_8bit+0x14c8>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,55,202,0,0 // addps 0xca37(%rip),%xmm0 # 2c870 <_sk_overlay_sse2_8bit+0x1454>
+ .byte 15,88,5,119,212,0,0 // addps 0xd477(%rip),%xmm0 # 2d2b0 <_sk_overlay_sse2_8bit+0x14d8>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -40931,7 +40931,7 @@ _sk_gradient_sse2:
.byte 73,255,200 // dec %r8
.byte 73,131,193,4 // add $0x4,%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,101,196,0,0 // movaps 0xc465(%rip),%xmm2 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 15,40,21,165,206,0,0 // movaps 0xcea5(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 243,65,15,16,25 // movss (%r9),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -41079,29 +41079,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,196,199,0,0 // movaps 0xc7c4(%rip),%xmm13 # 2c880 <_sk_overlay_sse2_8bit+0x1464>
+ .byte 68,15,40,45,4,210,0,0 // movaps 0xd204(%rip),%xmm13 # 2d2c0 <_sk_overlay_sse2_8bit+0x14e8>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,200,199,0,0 // addps 0xc7c8(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1474>
+ .byte 68,15,88,45,8,210,0,0 // addps 0xd208(%rip),%xmm13 # 2d2d0 <_sk_overlay_sse2_8bit+0x14f8>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,204,199,0,0 // addps 0xc7cc(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1484>
+ .byte 68,15,88,45,12,210,0,0 // addps 0xd20c(%rip),%xmm13 # 2d2e0 <_sk_overlay_sse2_8bit+0x1508>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,208,199,0,0 // addps 0xc7d0(%rip),%xmm13 # 2c8b0 <_sk_overlay_sse2_8bit+0x1494>
+ .byte 68,15,88,45,16,210,0,0 // addps 0xd210(%rip),%xmm13 # 2d2f0 <_sk_overlay_sse2_8bit+0x1518>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,207,199,0,0 // movaps 0xc7cf(%rip),%xmm10 # 2c8c0 <_sk_overlay_sse2_8bit+0x14a4>
+ .byte 68,15,40,21,15,210,0,0 // movaps 0xd20f(%rip),%xmm10 # 2d300 <_sk_overlay_sse2_8bit+0x1528>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,146,193,0,0 // movaps 0xc192(%rip),%xmm10 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,21,210,203,0,0 // movaps 0xcbd2(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,145,193,0,0 // movaps 0xc191(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,21,209,203,0,0 // movaps 0xcbd1(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -41136,7 +41136,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,56,199,0,0 // mulps 0xc738(%rip),%xmm9 # 2c8d0 <_sk_overlay_sse2_8bit+0x14b4>
+ .byte 68,15,89,13,120,209,0,0 // mulps 0xd178(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -41144,7 +41144,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,35,199,0,0 // mulps 0xc723(%rip),%xmm10 # 2c8e0 <_sk_overlay_sse2_8bit+0x14c4>
+ .byte 68,15,89,21,99,209,0,0 // mulps 0xd163(%rip),%xmm10 # 2d320 <_sk_overlay_sse2_8bit+0x1548>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -41153,8 +41153,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,219,197,0,0 // xorps 0xc5db(%rip),%xmm9 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
- .byte 68,15,89,5,179,192,0,0 // mulps 0xc0b3(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,87,13,27,208,0,0 // xorps 0xd01b(%rip),%xmm9 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 68,15,89,5,243,202,0,0 // mulps 0xcaf3(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -41175,7 +41175,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,154,198,0,0 // mulps 0xc69a(%rip),%xmm9 # 2c8d0 <_sk_overlay_sse2_8bit+0x14b4>
+ .byte 68,15,89,13,218,208,0,0 // mulps 0xd0da(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -41183,7 +41183,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,133,198,0,0 // mulps 0xc685(%rip),%xmm10 # 2c8e0 <_sk_overlay_sse2_8bit+0x14c4>
+ .byte 68,15,89,21,197,208,0,0 // mulps 0xd0c5(%rip),%xmm10 # 2d320 <_sk_overlay_sse2_8bit+0x1548>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -41192,8 +41192,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,61,197,0,0 // xorps 0xc53d(%rip),%xmm9 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
- .byte 68,15,89,5,21,192,0,0 // mulps 0xc015(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,87,13,125,207,0,0 // xorps 0xcf7d(%rip),%xmm9 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
+ .byte 68,15,89,5,85,202,0,0 // mulps 0xca55(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -41211,7 +41211,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,13,198,0,0 // mulps 0xc60d(%rip),%xmm9 # 2c8d0 <_sk_overlay_sse2_8bit+0x14b4>
+ .byte 68,15,89,13,77,208,0,0 // mulps 0xd04d(%rip),%xmm9 # 2d310 <_sk_overlay_sse2_8bit+0x1538>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -41219,7 +41219,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,217,196,0,0 // xorps 0xc4d9(%rip),%xmm0 # 2c7c0 <_sk_overlay_sse2_8bit+0x13a4>
+ .byte 15,87,5,25,207,0,0 // xorps 0xcf19(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x1428>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41262,7 +41262,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,79,191,0,0 // movaps 0xbf4f(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,5,143,201,0,0 // movaps 0xc98f(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -41270,7 +41270,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,74,191,0,0 // movaps 0xbf4a(%rip),%xmm12 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 68,15,40,37,138,201,0,0 // movaps 0xc98a(%rip),%xmm12 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -41317,8 +41317,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,227,196,0,0 // addps 0xc4e3(%rip),%xmm0 # 2c8f0 <_sk_overlay_sse2_8bit+0x14d4>
- .byte 68,15,40,13,171,190,0,0 // movaps 0xbeab(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,5,35,207,0,0 // addps 0xcf23(%rip),%xmm0 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
+ .byte 68,15,40,13,235,200,0,0 // movaps 0xc8eb(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41331,7 +41331,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,106,190,0,0 // addps 0xbe6a(%rip),%xmm0 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 15,88,5,170,200,0,0 // addps 0xc8aa(%rip),%xmm0 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41343,8 +41343,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,156,196,0,0 // addps 0xc49c(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x14d4>
- .byte 68,15,40,13,100,190,0,0 // movaps 0xbe64(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,13,220,206,0,0 // addps 0xcedc(%rip),%xmm1 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
+ .byte 68,15,40,13,164,200,0,0 // movaps 0xc8a4(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41357,7 +41357,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,34,190,0,0 // addps 0xbe22(%rip),%xmm1 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 15,88,13,98,200,0,0 // addps 0xc862(%rip),%xmm1 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41369,13 +41369,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,101,196,0,0 // addps 0xc465(%rip),%xmm0 # 2c900 <_sk_overlay_sse2_8bit+0x14e4>
- .byte 68,15,40,13,29,190,0,0 // movaps 0xbe1d(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,5,165,206,0,0 // addps 0xcea5(%rip),%xmm0 # 2d340 <_sk_overlay_sse2_8bit+0x1568>
+ .byte 68,15,40,13,93,200,0,0 // movaps 0xc85d(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,89,196,0,0 // mulps 0xc459(%rip),%xmm9 # 2c910 <_sk_overlay_sse2_8bit+0x14f4>
- .byte 68,15,88,13,241,191,0,0 // addps 0xbff1(%rip),%xmm9 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 68,15,89,13,153,206,0,0 // mulps 0xce99(%rip),%xmm9 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
+ .byte 68,15,88,13,49,202,0,0 // addps 0xca31(%rip),%xmm9 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41388,16 +41388,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,16,196,0,0 // addps 0xc410(%rip),%xmm0 # 2c8f0 <_sk_overlay_sse2_8bit+0x14d4>
- .byte 68,15,40,13,216,189,0,0 // movaps 0xbdd8(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,5,80,206,0,0 // addps 0xce50(%rip),%xmm0 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
+ .byte 68,15,40,13,24,200,0,0 // movaps 0xc818(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,44,196,0,0 // movaps 0xc42c(%rip),%xmm8 # 2c920 <_sk_overlay_sse2_8bit+0x1504>
+ .byte 68,15,40,5,108,206,0,0 // movaps 0xce6c(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,48,196,0,0 // addps 0xc430(%rip),%xmm8 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 68,15,88,5,112,206,0,0 // addps 0xce70(%rip),%xmm8 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,148,189,0,0 // addps 0xbd94(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,88,5,212,199,0,0 // addps 0xc7d4(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,40,196,0,0 // addps 0xc428(%rip),%xmm8 # 2c940 <_sk_overlay_sse2_8bit+0x1524>
+ .byte 68,15,88,5,104,206,0,0 // addps 0xce68(%rip),%xmm8 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41407,17 +41407,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,114,189,0,0 // movaps 0xbd72(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,5,178,199,0,0 // movaps 0xc7b2(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,222,195,0,0 // movaps 0xc3de(%rip),%xmm10 # 2c920 <_sk_overlay_sse2_8bit+0x1504>
+ .byte 68,15,40,21,30,206,0,0 // movaps 0xce1e(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,226,195,0,0 // addps 0xc3e2(%rip),%xmm10 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 68,15,88,21,34,206,0,0 // addps 0xce22(%rip),%xmm10 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,222,195,0,0 // addps 0xc3de(%rip),%xmm10 # 2c940 <_sk_overlay_sse2_8bit+0x1524>
+ .byte 68,15,88,21,30,206,0,0 // addps 0xce1e(%rip),%xmm10 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41429,11 +41429,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,177,195,0,0 // addps 0xc3b1(%rip),%xmm0 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 15,88,5,241,205,0,0 // addps 0xcdf1(%rip),%xmm0 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,129,195,0,0 // mulps 0xc381(%rip),%xmm8 # 2c910 <_sk_overlay_sse2_8bit+0x14f4>
- .byte 68,15,88,5,25,191,0,0 // addps 0xbf19(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 68,15,89,5,193,205,0,0 // mulps 0xcdc1(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
+ .byte 68,15,88,5,89,201,0,0 // addps 0xc959(%rip),%xmm8 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41446,13 +41446,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,71,195,0,0 // addps 0xc347(%rip),%xmm1 # 2c900 <_sk_overlay_sse2_8bit+0x14e4>
- .byte 68,15,40,13,255,188,0,0 // movaps 0xbcff(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,13,135,205,0,0 // addps 0xcd87(%rip),%xmm1 # 2d340 <_sk_overlay_sse2_8bit+0x1568>
+ .byte 68,15,40,13,63,199,0,0 // movaps 0xc73f(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,59,195,0,0 // mulps 0xc33b(%rip),%xmm9 # 2c910 <_sk_overlay_sse2_8bit+0x14f4>
- .byte 68,15,88,13,211,190,0,0 // addps 0xbed3(%rip),%xmm9 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 68,15,89,13,123,205,0,0 // mulps 0xcd7b(%rip),%xmm9 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
+ .byte 68,15,88,13,19,201,0,0 // addps 0xc913(%rip),%xmm9 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41465,16 +41465,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,241,194,0,0 // addps 0xc2f1(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x14d4>
- .byte 68,15,40,13,185,188,0,0 // movaps 0xbcb9(%rip),%xmm9 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,88,13,49,205,0,0 // addps 0xcd31(%rip),%xmm1 # 2d330 <_sk_overlay_sse2_8bit+0x1558>
+ .byte 68,15,40,13,249,198,0,0 // movaps 0xc6f9(%rip),%xmm9 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,13,195,0,0 // movaps 0xc30d(%rip),%xmm8 # 2c920 <_sk_overlay_sse2_8bit+0x1504>
+ .byte 68,15,40,5,77,205,0,0 // movaps 0xcd4d(%rip),%xmm8 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,17,195,0,0 // addps 0xc311(%rip),%xmm8 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 68,15,88,5,81,205,0,0 // addps 0xcd51(%rip),%xmm8 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,117,188,0,0 // addps 0xbc75(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,88,5,181,198,0,0 // addps 0xc6b5(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,9,195,0,0 // addps 0xc309(%rip),%xmm8 # 2c940 <_sk_overlay_sse2_8bit+0x1524>
+ .byte 68,15,88,5,73,205,0,0 // addps 0xcd49(%rip),%xmm8 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41484,17 +41484,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,83,188,0,0 // movaps 0xbc53(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0xe84>
+ .byte 68,15,40,5,147,198,0,0 // movaps 0xc693(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0xf08>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,190,194,0,0 // movaps 0xc2be(%rip),%xmm10 # 2c920 <_sk_overlay_sse2_8bit+0x1504>
+ .byte 68,15,40,21,254,204,0,0 // movaps 0xccfe(%rip),%xmm10 # 2d360 <_sk_overlay_sse2_8bit+0x1588>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,194,194,0,0 // addps 0xc2c2(%rip),%xmm10 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 68,15,88,21,2,205,0,0 // addps 0xcd02(%rip),%xmm10 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,190,194,0,0 // addps 0xc2be(%rip),%xmm10 # 2c940 <_sk_overlay_sse2_8bit+0x1524>
+ .byte 68,15,88,21,254,204,0,0 // addps 0xccfe(%rip),%xmm10 # 2d380 <_sk_overlay_sse2_8bit+0x15a8>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41506,11 +41506,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,144,194,0,0 // addps 0xc290(%rip),%xmm1 # 2c930 <_sk_overlay_sse2_8bit+0x1514>
+ .byte 15,88,13,208,204,0,0 // addps 0xccd0(%rip),%xmm1 # 2d370 <_sk_overlay_sse2_8bit+0x1598>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,96,194,0,0 // mulps 0xc260(%rip),%xmm8 # 2c910 <_sk_overlay_sse2_8bit+0x14f4>
- .byte 68,15,88,5,248,189,0,0 // addps 0xbdf8(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x1094>
+ .byte 68,15,89,5,160,204,0,0 // mulps 0xcca0(%rip),%xmm8 # 2d350 <_sk_overlay_sse2_8bit+0x1578>
+ .byte 68,15,88,5,56,200,0,0 // addps 0xc838(%rip),%xmm8 # 2cef0 <_sk_overlay_sse2_8bit+0x1118>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41656,7 +41656,7 @@ _sk_clut_3D_sse2:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,65,15,111,198 // movdqa %xmm14,%xmm0
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,45,159,192,0,0 // movdqa 0xc09f(%rip),%xmm5 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,45,223,202,0,0 // movdqa 0xcadf(%rip),%xmm5 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
@@ -41679,7 +41679,7 @@ _sk_clut_3D_sse2:
.byte 15,20,241 // unpcklps %xmm1,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,162,185,0,0 // paddd 0xb9a2(%rip),%xmm1 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,254,13,226,195,0,0 // paddd 0xc3e2(%rip),%xmm1 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -41696,7 +41696,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,253 // unpcklps %xmm5,%xmm7
.byte 15,20,249 // unpcklps %xmm1,%xmm7
- .byte 102,15,254,5,118,185,0,0 // paddd 0xb976(%rip),%xmm0 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,254,5,182,195,0,0 // paddd 0xc3b6(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,200 // movq %xmm1,%r8
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -41713,7 +41713,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,200 // unpcklps %xmm0,%xmm1
- .byte 15,40,45,139,191,0,0 // movaps 0xbf8b(%rip),%xmm5 # 2c950 <_sk_overlay_sse2_8bit+0x1534>
+ .byte 15,40,45,203,201,0,0 // movaps 0xc9cb(%rip),%xmm5 # 2d390 <_sk_overlay_sse2_8bit+0x15b8>
.byte 15,88,229 // addps %xmm5,%xmm4
.byte 15,41,100,36,192 // movaps %xmm4,-0x40(%rsp)
.byte 68,15,88,213 // addps %xmm5,%xmm10
@@ -41728,7 +41728,7 @@ _sk_clut_3D_sse2:
.byte 102,15,127,68,36,160 // movdqa %xmm0,-0x60(%rsp)
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,15,111,5,84,191,0,0 // movdqa 0xbf54(%rip),%xmm0 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,5,148,201,0,0 // movdqa 0xc994(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
.byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
.byte 102,15,244,224 // pmuludq %xmm0,%xmm4
@@ -41750,7 +41750,7 @@ _sk_clut_3D_sse2:
.byte 15,20,227 // unpcklps %xmm3,%xmm4
.byte 15,20,229 // unpcklps %xmm5,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 102,15,254,29,91,184,0,0 // paddd 0xb85b(%rip),%xmm3 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,254,29,155,194,0,0 // paddd 0xc29b(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,112,235,78 // pshufd $0x4e,%xmm3,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -41767,7 +41767,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,4,131 // movss (%r11,%r8,4),%xmm0
.byte 15,20,216 // unpcklps %xmm0,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
- .byte 102,15,254,21,47,184,0,0 // paddd 0xb82f(%rip),%xmm2 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,254,21,111,194,0,0 // paddd 0xc26f(%rip),%xmm2 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
.byte 102,73,15,126,192 // movq %xmm0,%r8
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -41829,7 +41829,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,193 // unpcklps %xmm1,%xmm8
.byte 68,15,20,199 // unpcklps %xmm7,%xmm8
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,21,247,182,0,0 // movdqa 0xb6f7(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,111,21,55,193,0,0 // movdqa 0xc137(%rip),%xmm10 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,112,249,78 // pshufd $0x4e,%xmm1,%xmm7
.byte 102,73,15,126,248 // movq %xmm7,%r8
@@ -41847,7 +41847,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,111,45,198,182,0,0 // movdqa 0xb6c6(%rip),%xmm5 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,111,45,6,193,0,0 // movdqa 0xc106(%rip),%xmm5 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
@@ -41905,7 +41905,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 68,15,20,223 // unpcklps %xmm7,%xmm11
.byte 68,15,20,221 // unpcklps %xmm5,%xmm11
- .byte 102,15,111,45,189,181,0,0 // movdqa 0xb5bd(%rip),%xmm5 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,111,45,253,191,0,0 // movdqa 0xbffd(%rip),%xmm5 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,254,245 // paddd %xmm5,%xmm6
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,112,238,78 // pshufd $0x4e,%xmm6,%xmm5
@@ -41952,7 +41952,7 @@ _sk_clut_3D_sse2:
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,5,93,187,0,0 // movdqa 0xbb5d(%rip),%xmm0 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,5,157,197,0,0 // movdqa 0xc59d(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
.byte 102,15,112,217,232 // pshufd $0xe8,%xmm1,%xmm3
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
@@ -41974,7 +41974,7 @@ _sk_clut_3D_sse2:
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,202 // unpcklps %xmm2,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,111,5,101,180,0,0 // movdqa 0xb465(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,111,5,165,190,0,0 // movdqa 0xbea5(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
@@ -42050,7 +42050,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,4,131 // movss (%r11,%r8,4),%xmm0
.byte 15,20,240 // unpcklps %xmm0,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,29,47,179,0,0 // paddd 0xb32f(%rip),%xmm3 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,254,29,111,189,0,0 // paddd 0xbd6f(%rip),%xmm3 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
.byte 102,73,15,126,192 // movq %xmm0,%r8
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -42101,7 +42101,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,40,178,0,0 // paddd 0xb228(%rip),%xmm1 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,254,13,104,188,0,0 // paddd 0xbc68(%rip),%xmm1 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,208 // movq %xmm2,%r8
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -42118,7 +42118,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,20,131 // movss (%r11,%r8,4),%xmm2
.byte 68,15,20,242 // unpcklps %xmm2,%xmm14
.byte 68,15,20,241 // unpcklps %xmm1,%xmm14
- .byte 102,15,254,5,250,177,0,0 // paddd 0xb1fa(%rip),%xmm0 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,254,5,58,188,0,0 // paddd 0xbc3a(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,200 // movq %xmm1,%r8
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -42156,7 +42156,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,37,41,177,0,0 // movdqa 0xb129(%rip),%xmm4 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,111,37,105,187,0,0 // movdqa 0xbb69(%rip),%xmm4 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,254,226 // paddd %xmm2,%xmm4
.byte 102,15,112,204,78 // pshufd $0x4e,%xmm4,%xmm1
.byte 102,73,15,126,200 // movq %xmm1,%r8
@@ -42174,7 +42174,7 @@ _sk_clut_3D_sse2:
.byte 243,67,15,16,36,131 // movss (%r11,%r8,4),%xmm4
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,249,176,0,0 // paddd 0xb0f9(%rip),%xmm2 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,254,21,57,187,0,0 // paddd 0xbb39(%rip),%xmm2 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -42325,7 +42325,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,209 // paddd %xmm1,%xmm2
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,254,218 // paddd %xmm2,%xmm3
- .byte 102,68,15,111,21,227,180,0,0 // movdqa 0xb4e3(%rip),%xmm10 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,68,15,111,21,35,191,0,0 // movdqa 0xbf23(%rip),%xmm10 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,112,235,245 // pshufd $0xf5,%xmm3,%xmm5
.byte 102,65,15,244,218 // pmuludq %xmm10,%xmm3
.byte 102,15,112,227,232 // pshufd $0xe8,%xmm3,%xmm4
@@ -42348,7 +42348,7 @@ _sk_clut_4D_sse2:
.byte 15,20,222 // unpcklps %xmm6,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
- .byte 102,15,254,45,228,173,0,0 // paddd 0xade4(%rip),%xmm5 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,254,45,36,184,0,0 // paddd 0xb824(%rip),%xmm5 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,112,245,78 // pshufd $0x4e,%xmm5,%xmm6
.byte 102,73,15,126,240 // movq %xmm6,%r8
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -42365,7 +42365,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 15,20,247 // unpcklps %xmm7,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,37,184,173,0,0 // paddd 0xadb8(%rip),%xmm4 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,254,37,248,183,0,0 // paddd 0xb7f8(%rip),%xmm4 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -42382,7 +42382,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 15,20,239 // unpcklps %xmm7,%xmm5
.byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,40,61,205,179,0,0 // movaps 0xb3cd(%rip),%xmm7 # 2c950 <_sk_overlay_sse2_8bit+0x1534>
+ .byte 15,40,61,13,190,0,0 // movaps 0xbe0d(%rip),%xmm7 # 2d390 <_sk_overlay_sse2_8bit+0x15b8>
.byte 68,15,88,199 // addps %xmm7,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 68,15,88,207 // addps %xmm7,%xmm9
@@ -42420,7 +42420,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,234 // unpcklps %xmm2,%xmm13
.byte 68,15,20,239 // unpcklps %xmm7,%xmm13
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
- .byte 102,15,254,21,147,172,0,0 // paddd 0xac93(%rip),%xmm2 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,254,21,211,182,0,0 // paddd 0xb6d3(%rip),%xmm2 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,248 // movq %xmm7,%r8
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -42437,7 +42437,7 @@ _sk_clut_4D_sse2:
.byte 243,71,15,16,12,131 // movss (%r11,%r8,4),%xmm9
.byte 65,15,20,209 // unpcklps %xmm9,%xmm2
.byte 15,20,215 // unpcklps %xmm7,%xmm2
- .byte 102,15,254,5,102,172,0,0 // paddd 0xac66(%rip),%xmm0 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,254,5,166,182,0,0 // paddd 0xb6a6(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,112,248,78 // pshufd $0x4e,%xmm0,%xmm7
.byte 102,73,15,126,248 // movq %xmm7,%r8
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -42478,7 +42478,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
.byte 102,15,254,92,36,160 // paddd -0x60(%rsp),%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,68,15,111,53,32,178,0,0 // movdqa 0xb220(%rip),%xmm14 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,68,15,111,53,96,188,0,0 // movdqa 0xbc60(%rip),%xmm14 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3
.byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
.byte 102,65,15,244,230 // pmuludq %xmm14,%xmm4
@@ -42499,7 +42499,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,228 // unpcklps %xmm4,%xmm12
.byte 68,15,20,229 // unpcklps %xmm5,%xmm12
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,111,61,40,171,0,0 // movdqa 0xab28(%rip),%xmm7 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,111,61,104,181,0,0 // movdqa 0xb568(%rip),%xmm7 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,254,231 // paddd %xmm7,%xmm4
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
@@ -42517,7 +42517,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 15,20,244 // unpcklps %xmm4,%xmm6
- .byte 102,68,15,111,5,247,170,0,0 // movdqa 0xaaf7(%rip),%xmm8 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,68,15,111,5,55,181,0,0 // movdqa 0xb537(%rip),%xmm8 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,65,15,254,216 // paddd %xmm8,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
@@ -42631,7 +42631,7 @@ _sk_clut_4D_sse2:
.byte 102,68,15,111,108,36,160 // movdqa -0x60(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,94,175,0,0 // movdqa 0xaf5e(%rip),%xmm3 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,29,158,185,0,0 // movdqa 0xb99e(%rip),%xmm3 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -42653,7 +42653,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,205 // unpcklps %xmm5,%xmm9
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,100,168,0,0 // movdqa 0xa864(%rip),%xmm3 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,111,29,164,178,0,0 // movdqa 0xb2a4(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5
.byte 102,73,15,126,232 // movq %xmm5,%r8
@@ -42761,7 +42761,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,211 // movdqa %xmm11,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
.byte 102,15,112,218,245 // pshufd $0xf5,%xmm2,%xmm3
- .byte 102,15,111,5,28,173,0,0 // movdqa 0xad1c(%rip),%xmm0 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,5,92,183,0,0 // movdqa 0xb75c(%rip),%xmm0 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
.byte 102,15,112,250,232 // pshufd $0xe8,%xmm2,%xmm7
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
@@ -42782,7 +42782,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,203 // unpcklps %xmm3,%xmm9
.byte 102,15,111,215 // movdqa %xmm7,%xmm2
- .byte 102,15,111,5,38,166,0,0 // movdqa 0xa626(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,111,5,102,176,0,0 // movdqa 0xb066(%rip),%xmm0 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
.byte 102,73,15,126,216 // movq %xmm3,%r8
@@ -42800,7 +42800,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,28,131 // movss (%r11,%r8,4),%xmm3
.byte 15,20,243 // unpcklps %xmm3,%xmm6
.byte 15,20,242 // unpcklps %xmm2,%xmm6
- .byte 102,68,15,111,45,245,165,0,0 // movdqa 0xa5f5(%rip),%xmm13 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,68,15,111,45,53,176,0,0 // movdqa 0xb035(%rip),%xmm13 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,65,15,254,253 // paddd %xmm13,%xmm7
.byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2
.byte 102,73,15,126,208 // movq %xmm2,%r8
@@ -42820,7 +42820,7 @@ _sk_clut_4D_sse2:
.byte 15,20,250 // unpcklps %xmm2,%xmm7
.byte 102,68,15,254,220 // paddd %xmm4,%xmm11
.byte 102,65,15,112,219,245 // pshufd $0xf5,%xmm11,%xmm3
- .byte 102,15,111,37,9,172,0,0 // movdqa 0xac09(%rip),%xmm4 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,37,73,182,0,0 // movdqa 0xb649(%rip),%xmm4 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,68,15,244,220 // pmuludq %xmm4,%xmm11
.byte 102,65,15,112,211,232 // pshufd $0xe8,%xmm11,%xmm2
.byte 102,15,244,220 // pmuludq %xmm4,%xmm3
@@ -42921,7 +42921,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,202 // movdqa %xmm10,%xmm1
.byte 102,15,254,200 // paddd %xmm0,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,72,170,0,0 // movdqa 0xaa48(%rip),%xmm3 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,29,136,180,0,0 // movdqa 0xb488(%rip),%xmm3 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -42943,7 +42943,7 @@ _sk_clut_4D_sse2:
.byte 15,20,212 // unpcklps %xmm4,%xmm2
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
- .byte 102,15,111,61,79,163,0,0 // movdqa 0xa34f(%rip),%xmm7 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,111,61,143,173,0,0 // movdqa 0xad8f(%rip),%xmm7 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,254,223 // paddd %xmm7,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
@@ -42961,7 +42961,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,44,131 // movss (%r11,%r8,4),%xmm5
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,20,220 // unpcklps %xmm4,%xmm3
- .byte 102,68,15,111,13,30,163,0,0 // movdqa 0xa31e(%rip),%xmm9 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,68,15,111,13,94,173,0,0 // movdqa 0xad5e(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,73,15,126,224 // movq %xmm4,%r8
@@ -43073,7 +43073,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,246 // unpcklps %xmm6,%xmm14
.byte 68,15,20,243 // unpcklps %xmm3,%xmm14
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
- .byte 102,68,15,111,21,8,161,0,0 // movdqa 0xa108(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,111,21,72,171,0,0 // movdqa 0xab48(%rip),%xmm10 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,65,15,254,218 // paddd %xmm10,%xmm3
.byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6
.byte 102,73,15,126,240 // movq %xmm6,%r8
@@ -43194,7 +43194,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,116,36,160 // movdqa -0x60(%rsp),%xmm6
.byte 102,15,254,198 // paddd %xmm6,%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,29,123,165,0,0 // movdqa 0xa57b(%rip),%xmm3 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,29,187,175,0,0 // movdqa 0xafbb(%rip),%xmm3 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,244,195 // pmuludq %xmm3,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
@@ -43216,7 +43216,7 @@ _sk_clut_4D_sse2:
.byte 15,20,195 // unpcklps %xmm3,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,68,15,111,5,129,158,0,0 // movdqa 0x9e81(%rip),%xmm8 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,68,15,111,5,193,168,0,0 // movdqa 0xa8c1(%rip),%xmm8 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,65,15,254,200 // paddd %xmm8,%xmm1
.byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3
.byte 102,73,15,126,216 // movq %xmm3,%r8
@@ -43322,7 +43322,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,124,36,128 // paddd -0x80(%rsp),%xmm7
.byte 102,15,254,247 // paddd %xmm7,%xmm6
.byte 102,15,112,206,245 // pshufd $0xf5,%xmm6,%xmm1
- .byte 102,15,111,21,59,163,0,0 // movdqa 0xa33b(%rip),%xmm2 # 2c960 <_sk_overlay_sse2_8bit+0x1544>
+ .byte 102,15,111,21,123,173,0,0 // movdqa 0xad7b(%rip),%xmm2 # 2d3a0 <_sk_overlay_sse2_8bit+0x15c8>
.byte 102,15,244,242 // pmuludq %xmm2,%xmm6
.byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -43344,7 +43344,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,65,156,0,0 // paddd 0x9c41(%rip),%xmm1 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,254,13,129,166,0,0 // paddd 0xa681(%rip),%xmm1 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,208 // movq %xmm2,%r8
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -43400,7 +43400,7 @@ _sk_clut_4D_sse2:
.byte 243,67,15,16,60,131 // movss (%r11,%r8,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,53,65,155,0,0 // movdqa 0x9b41(%rip),%xmm6 # 2c2d0 <_sk_overlay_sse2_8bit+0xeb4>
+ .byte 102,15,111,53,129,165,0,0 // movdqa 0xa581(%rip),%xmm6 # 2cd10 <_sk_overlay_sse2_8bit+0xf38>
.byte 102,15,254,242 // paddd %xmm2,%xmm6
.byte 102,15,112,206,78 // pshufd $0x4e,%xmm6,%xmm1
.byte 102,73,15,126,200 // movq %xmm1,%r8
@@ -43418,7 +43418,7 @@ _sk_clut_4D_sse2:
.byte 243,71,15,16,60,131 // movss (%r11,%r8,4),%xmm15
.byte 65,15,20,207 // unpcklps %xmm15,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,16,155,0,0 // paddd 0x9b10(%rip),%xmm2 # 2c2f0 <_sk_overlay_sse2_8bit+0xed4>
+ .byte 102,15,254,21,80,165,0,0 // paddd 0xa550(%rip),%xmm2 # 2cd30 <_sk_overlay_sse2_8bit+0xf58>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,248 // movq %xmm7,%r8
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -43480,7 +43480,7 @@ _sk_clut_4D_sse2:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,243,153,0,0 // movaps 0x99f3(%rip),%xmm3 # 2c2c0 <_sk_overlay_sse2_8bit+0xea4>
+ .byte 15,40,29,51,164,0,0 // movaps 0xa433(%rip),%xmm3 # 2cd00 <_sk_overlay_sse2_8bit+0xf28>
.byte 15,40,100,36,112 // movaps 0x70(%rsp),%xmm4
.byte 15,40,172,36,128,0,0,0 // movaps 0x80(%rsp),%xmm5
.byte 15,40,180,36,144,0,0,0 // movaps 0x90(%rsp),%xmm6
@@ -43568,7 +43568,7 @@ HIDDEN _sk_set_rgb_hsw_8bit
FUNCTION(_sk_set_rgb_hsw_8bit)
_sk_set_rgb_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 197,250,16,37,229,142,0,0 // vmovss 0x8ee5(%rip),%xmm4 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 197,250,16,37,161,152,0,0 // vmovss 0x98a1(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 197,218,89,40 // vmulss (%rax),%xmm4,%xmm5
.byte 196,97,250,44,197 // vcvttss2si %xmm5,%r8
.byte 197,218,89,104,4 // vmulss 0x4(%rax),%xmm4,%xmm5
@@ -43581,7 +43581,7 @@ _sk_set_rgb_hsw_8bit:
.byte 68,9,200 // or %r9d,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,88,228 // vpbroadcastd %xmm4,%ymm4
- .byte 197,253,111,45,130,148,0,0 // vmovdqa 0x9482(%rip),%ymm5 # 2be60 <_sk_overlay_sse2_8bit+0xa44>
+ .byte 197,253,111,45,66,158,0,0 // vmovdqa 0x9e42(%rip),%ymm5 # 2c820 <_sk_overlay_sse2_8bit+0xa48>
.byte 197,245,219,205 // vpand %ymm5,%ymm1,%ymm1
.byte 197,253,219,197 // vpand %ymm5,%ymm0,%ymm0
.byte 197,221,235,192 // vpor %ymm0,%ymm4,%ymm0
@@ -43593,10 +43593,10 @@ HIDDEN _sk_premul_hsw_8bit
.globl _sk_premul_hsw_8bit
FUNCTION(_sk_premul_hsw_8bit)
_sk_premul_hsw_8bit:
- .byte 197,253,111,37,134,148,0,0 // vmovdqa 0x9486(%rip),%ymm4 # 2be80 <_sk_overlay_sse2_8bit+0xa64>
+ .byte 197,253,111,37,70,158,0,0 // vmovdqa 0x9e46(%rip),%ymm4 # 2c840 <_sk_overlay_sse2_8bit+0xa68>
.byte 196,226,125,0,236 // vpshufb %ymm4,%ymm0,%ymm5
.byte 196,226,117,0,228 // vpshufb %ymm4,%ymm1,%ymm4
- .byte 197,253,111,53,148,148,0,0 // vmovdqa 0x9494(%rip),%ymm6 # 2bea0 <_sk_overlay_sse2_8bit+0xa84>
+ .byte 197,253,111,53,84,158,0,0 // vmovdqa 0x9e54(%rip),%ymm6 # 2c860 <_sk_overlay_sse2_8bit+0xa88>
.byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4
.byte 197,213,235,238 // vpor %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -43636,7 +43636,7 @@ HIDDEN _sk_swap_rb_hsw_8bit
.globl _sk_swap_rb_hsw_8bit
FUNCTION(_sk_swap_rb_hsw_8bit)
_sk_swap_rb_hsw_8bit:
- .byte 197,253,111,37,12,148,0,0 // vmovdqa 0x940c(%rip),%ymm4 # 2bec0 <_sk_overlay_sse2_8bit+0xaa4>
+ .byte 197,253,111,37,204,157,0,0 // vmovdqa 0x9dcc(%rip),%ymm4 # 2c880 <_sk_overlay_sse2_8bit+0xaa8>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43986,7 +43986,7 @@ _sk_load_bgra_hsw_8bit:
.byte 117,35 // jne 22f8b <_sk_load_bgra_hsw_8bit+0x3f>
.byte 196,129,126,111,76,152,32 // vmovdqu 0x20(%r8,%r11,4),%ymm1
.byte 196,129,126,111,4,152 // vmovdqu (%r8,%r11,4),%ymm0
- .byte 197,253,111,37,99,143,0,0 // vmovdqa 0x8f63(%rip),%ymm4 # 2bee0 <_sk_overlay_sse2_8bit+0xac4>
+ .byte 197,253,111,37,35,153,0,0 // vmovdqa 0x9923(%rip),%ymm4 # 2c8a0 <_sk_overlay_sse2_8bit+0xac8>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44101,7 +44101,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 117,35 // jne 2313f <_sk_load_bgra_dst_hsw_8bit+0x3f>
.byte 196,129,126,111,92,152,32 // vmovdqu 0x20(%r8,%r11,4),%ymm3
.byte 196,129,126,111,20,152 // vmovdqu (%r8,%r11,4),%ymm2
- .byte 197,253,111,37,207,141,0,0 // vmovdqa 0x8dcf(%rip),%ymm4 # 2bf00 <_sk_overlay_sse2_8bit+0xae4>
+ .byte 197,253,111,37,143,151,0,0 // vmovdqa 0x978f(%rip),%ymm4 # 2c8c0 <_sk_overlay_sse2_8bit+0xae8>
.byte 196,226,109,0,212 // vpshufb %ymm4,%ymm2,%ymm2
.byte 196,226,101,0,220 // vpshufb %ymm4,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44212,7 +44212,7 @@ _sk_store_bgra_hsw_8bit:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 197,253,111,37,77,140,0,0 // vmovdqa 0x8c4d(%rip),%ymm4 # 2bf20 <_sk_overlay_sse2_8bit+0xb04>
+ .byte 197,253,111,37,13,150,0,0 // vmovdqa 0x960d(%rip),%ymm4 # 2c8e0 <_sk_overlay_sse2_8bit+0xb08>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 72,133,255 // test %rdi,%rdi
@@ -44294,6 +44294,266 @@ _sk_store_bgra_hsw_8bit:
.byte 255 // (bad)
.byte 255 // .byte 0xff
+HIDDEN _sk_store_565_hsw_8bit
+.globl _sk_store_565_hsw_8bit
+FUNCTION(_sk_store_565_hsw_8bit)
+_sk_store_565_hsw_8bit:
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,72,8 // movslq 0x8(%rax),%r9
+ .byte 76,99,193 // movslq %ecx,%r8
+ .byte 77,15,175,193 // imul %r9,%r8
+ .byte 77,1,192 // add %r8,%r8
+ .byte 76,3,0 // add (%rax),%r8
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 197,253,111,37,230,148,0,0 // vmovdqa 0x94e6(%rip),%ymm4 # 2c900 <_sk_overlay_sse2_8bit+0xb28>
+ .byte 197,253,219,236 // vpand %ymm4,%ymm0,%ymm5
+ .byte 197,245,219,228 // vpand %ymm4,%ymm1,%ymm4
+ .byte 197,221,114,244,8 // vpslld $0x8,%ymm4,%ymm4
+ .byte 197,213,114,245,8 // vpslld $0x8,%ymm5,%ymm5
+ .byte 197,253,111,53,236,148,0,0 // vmovdqa 0x94ec(%rip),%ymm6 # 2c920 <_sk_overlay_sse2_8bit+0xb48>
+ .byte 197,253,219,254 // vpand %ymm6,%ymm0,%ymm7
+ .byte 197,245,219,246 // vpand %ymm6,%ymm1,%ymm6
+ .byte 197,205,114,214,5 // vpsrld $0x5,%ymm6,%ymm6
+ .byte 197,197,114,215,5 // vpsrld $0x5,%ymm7,%ymm7
+ .byte 197,125,111,5,242,148,0,0 // vmovdqa 0x94f2(%rip),%ymm8 # 2c940 <_sk_overlay_sse2_8bit+0xb68>
+ .byte 196,65,117,219,200 // vpand %ymm8,%ymm1,%ymm9
+ .byte 196,65,125,219,192 // vpand %ymm8,%ymm0,%ymm8
+ .byte 196,193,61,114,208,19 // vpsrld $0x13,%ymm8,%ymm8
+ .byte 196,193,53,114,209,19 // vpsrld $0x13,%ymm9,%ymm9
+ .byte 197,213,235,239 // vpor %ymm7,%ymm5,%ymm5
+ .byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4
+ .byte 196,193,93,235,225 // vpor %ymm9,%ymm4,%ymm4
+ .byte 196,193,85,235,232 // vpor %ymm8,%ymm5,%ymm5
+ .byte 197,253,111,53,226,148,0,0 // vmovdqa 0x94e2(%rip),%ymm6 # 2c960 <_sk_overlay_sse2_8bit+0xb88>
+ .byte 196,226,85,0,238 // vpshufb %ymm6,%ymm5,%ymm5
+ .byte 196,227,253,0,237,232 // vpermq $0xe8,%ymm5,%ymm5
+ .byte 196,226,93,0,230 // vpshufb %ymm6,%ymm4,%ymm4
+ .byte 196,227,253,0,228,232 // vpermq $0xe8,%ymm4,%ymm4
+ .byte 196,227,85,56,228,1 // vinserti128 $0x1,%xmm4,%ymm5,%ymm4
+ .byte 72,133,255 // test %rdi,%rdi
+ .byte 117,10 // jne 234a9 <_sk_store_565_hsw_8bit+0xad>
+ .byte 196,129,126,127,36,88 // vmovdqu %ymm4,(%r8,%r11,2)
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,137,249 // mov %edi,%r9d
+ .byte 65,128,225,15 // and $0xf,%r9b
+ .byte 65,254,201 // dec %r9b
+ .byte 65,128,249,14 // cmp $0xe,%r9b
+ .byte 119,236 // ja 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 69,15,182,201 // movzbl %r9b,%r9d
+ .byte 76,141,21,176,0,0,0 // lea 0xb0(%rip),%r10 # 23574 <_sk_store_565_hsw_8bit+0x178>
+ .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
+ .byte 76,1,208 // add %r10,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 196,131,121,21,36,88,0 // vpextrw $0x0,%xmm4,(%r8,%r11,2)
+ .byte 235,207 // jmp 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 196,131,121,21,100,88,4,2 // vpextrw $0x2,%xmm4,0x4(%r8,%r11,2)
+ .byte 196,129,121,126,36,88 // vmovd %xmm4,(%r8,%r11,2)
+ .byte 235,191 // jmp 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 196,131,121,21,100,88,12,6 // vpextrw $0x6,%xmm4,0xc(%r8,%r11,2)
+ .byte 196,131,121,21,100,88,10,5 // vpextrw $0x5,%xmm4,0xa(%r8,%r11,2)
+ .byte 196,131,121,21,100,88,8,4 // vpextrw $0x4,%xmm4,0x8(%r8,%r11,2)
+ .byte 196,129,121,214,36,88 // vmovq %xmm4,(%r8,%r11,2)
+ .byte 235,159 // jmp 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
+ .byte 196,131,121,21,108,88,20,2 // vpextrw $0x2,%xmm5,0x14(%r8,%r11,2)
+ .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
+ .byte 196,131,121,21,108,88,18,1 // vpextrw $0x1,%xmm5,0x12(%r8,%r11,2)
+ .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
+ .byte 196,131,121,21,108,88,16,0 // vpextrw $0x0,%xmm5,0x10(%r8,%r11,2)
+ .byte 235,55 // jmp 23569 <_sk_store_565_hsw_8bit+0x16d>
+ .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
+ .byte 196,131,121,21,108,88,28,6 // vpextrw $0x6,%xmm5,0x1c(%r8,%r11,2)
+ .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
+ .byte 196,131,121,21,108,88,26,5 // vpextrw $0x5,%xmm5,0x1a(%r8,%r11,2)
+ .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
+ .byte 196,131,121,21,108,88,24,4 // vpextrw $0x4,%xmm5,0x18(%r8,%r11,2)
+ .byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
+ .byte 196,129,121,214,108,88,16 // vmovq %xmm5,0x10(%r8,%r11,2)
+ .byte 196,129,122,127,36,88 // vmovdqu %xmm4,(%r8,%r11,2)
+ .byte 233,49,255,255,255 // jmpq 234a5 <_sk_store_565_hsw_8bit+0xa9>
+ .byte 89 // pop %rcx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,106,255 // ljmp *-0x1(%rdx)
+ .byte 255 // (bad)
+ .byte 255,98,255 // jmpq *-0x1(%rdx)
+ .byte 255 // (bad)
+ .byte 255,138,255,255,255,130 // decl -0x7d000001(%rdx)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 122,255 // jp 23589 <_sk_store_565_hsw_8bit+0x18d>
+ .byte 255 // (bad)
+ .byte 255,114,255 // pushq -0x1(%rdx)
+ .byte 255 // (bad)
+ .byte 255,245 // push %rbp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,174,255,255,255,160 // ljmp *-0x5f000001(%rsi)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,146,255,255,255,232 // callq *-0x17000001(%rdx)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 218,255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,204 // dec %esp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 190 // .byte 0xbe
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
+HIDDEN _sk_load_565_dst_hsw_8bit
+.globl _sk_load_565_dst_hsw_8bit
+FUNCTION(_sk_load_565_dst_hsw_8bit)
+_sk_load_565_dst_hsw_8bit:
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,72,8 // movslq 0x8(%rax),%r9
+ .byte 76,99,193 // movslq %ecx,%r8
+ .byte 77,15,175,193 // imul %r9,%r8
+ .byte 77,1,192 // add %r8,%r8
+ .byte 76,3,0 // add (%rax),%r8
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 72,133,255 // test %rdi,%rdi
+ .byte 15,133,222,0,0,0 // jne 236ad <_sk_load_565_dst_hsw_8bit+0xfd>
+ .byte 196,129,126,111,20,88 // vmovdqu (%r8,%r11,2),%ymm2
+ .byte 196,227,125,57,211,1 // vextracti128 $0x1,%ymm2,%xmm3
+ .byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
+ .byte 196,226,125,51,210 // vpmovzxwd %xmm2,%ymm2
+ .byte 196,226,125,88,37,162,140,0,0 // vpbroadcastd 0x8ca2(%rip),%ymm4 # 2c290 <_sk_overlay_sse2_8bit+0x4b8>
+ .byte 197,237,219,236 // vpand %ymm4,%ymm2,%ymm5
+ .byte 197,229,219,228 // vpand %ymm4,%ymm3,%ymm4
+ .byte 197,221,114,212,8 // vpsrld $0x8,%ymm4,%ymm4
+ .byte 197,213,114,213,8 // vpsrld $0x8,%ymm5,%ymm5
+ .byte 196,226,125,88,53,151,140,0,0 // vpbroadcastd 0x8c97(%rip),%ymm6 # 2c2a0 <_sk_overlay_sse2_8bit+0x4c8>
+ .byte 197,237,219,254 // vpand %ymm6,%ymm2,%ymm7
+ .byte 197,229,219,246 // vpand %ymm6,%ymm3,%ymm6
+ .byte 197,205,114,246,19 // vpslld $0x13,%ymm6,%ymm6
+ .byte 197,197,114,247,19 // vpslld $0x13,%ymm7,%ymm7
+ .byte 197,213,235,239 // vpor %ymm7,%ymm5,%ymm5
+ .byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4
+ .byte 197,205,114,212,5 // vpsrld $0x5,%ymm4,%ymm6
+ .byte 197,197,114,213,5 // vpsrld $0x5,%ymm5,%ymm7
+ .byte 196,98,125,88,5,114,141,0,0 // vpbroadcastd 0x8d72(%rip),%ymm8 # 2c3a8 <_sk_overlay_sse2_8bit+0x5d0>
+ .byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
+ .byte 196,193,77,219,240 // vpand %ymm8,%ymm6,%ymm6
+ .byte 196,98,125,88,5,79,140,0,0 // vpbroadcastd 0x8c4f(%rip),%ymm8 # 2c298 <_sk_overlay_sse2_8bit+0x4c0>
+ .byte 196,65,101,219,200 // vpand %ymm8,%ymm3,%ymm9
+ .byte 196,65,109,219,192 // vpand %ymm8,%ymm2,%ymm8
+ .byte 196,193,61,114,240,5 // vpslld $0x5,%ymm8,%ymm8
+ .byte 196,193,53,114,241,5 // vpslld $0x5,%ymm9,%ymm9
+ .byte 196,98,125,88,21,68,141,0,0 // vpbroadcastd 0x8d44(%rip),%ymm10 # 2c3ac <_sk_overlay_sse2_8bit+0x5d4>
+ .byte 196,193,101,219,218 // vpand %ymm10,%ymm3,%ymm3
+ .byte 196,193,109,219,210 // vpand %ymm10,%ymm2,%ymm2
+ .byte 197,237,114,210,1 // vpsrld $0x1,%ymm2,%ymm2
+ .byte 197,229,114,211,1 // vpsrld $0x1,%ymm3,%ymm3
+ .byte 196,193,101,235,217 // vpor %ymm9,%ymm3,%ymm3
+ .byte 196,193,109,235,208 // vpor %ymm8,%ymm2,%ymm2
+ .byte 196,98,125,88,5,33,141,0,0 // vpbroadcastd 0x8d21(%rip),%ymm8 # 2c3b0 <_sk_overlay_sse2_8bit+0x5d8>
+ .byte 197,237,235,213 // vpor %ymm5,%ymm2,%ymm2
+ .byte 197,229,235,220 // vpor %ymm4,%ymm3,%ymm3
+ .byte 196,193,109,235,208 // vpor %ymm8,%ymm2,%ymm2
+ .byte 197,197,235,210 // vpor %ymm2,%ymm7,%ymm2
+ .byte 196,193,101,235,216 // vpor %ymm8,%ymm3,%ymm3
+ .byte 197,205,235,219 // vpor %ymm3,%ymm6,%ymm3
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,137,249 // mov %edi,%r9d
+ .byte 65,128,225,15 // and $0xf,%r9b
+ .byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
+ .byte 65,254,201 // dec %r9b
+ .byte 65,128,249,14 // cmp $0xe,%r9b
+ .byte 15,135,16,255,255,255 // ja 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 69,15,182,201 // movzbl %r9b,%r9d
+ .byte 76,141,21,28,1,0,0 // lea 0x11c(%rip),%r10 # 237ec <_sk_load_565_dst_hsw_8bit+0x23c>
+ .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
+ .byte 76,1,208 // add %r10,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
+ .byte 197,249,110,208 // vmovd %eax,%xmm2
+ .byte 233,238,254,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,129,105,196,92,88,4,2 // vpinsrw $0x2,0x4(%r8,%r11,2),%xmm2,%xmm3
+ .byte 196,227,101,56,210,1 // vinserti128 $0x1,%xmm2,%ymm3,%ymm2
+ .byte 196,129,121,110,28,88 // vmovd (%r8,%r11,2),%xmm3
+ .byte 196,227,109,2,211,1 // vpblendd $0x1,%ymm3,%ymm2,%ymm2
+ .byte 233,203,254,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,129,105,196,92,88,12,6 // vpinsrw $0x6,0xc(%r8,%r11,2),%xmm2,%xmm3
+ .byte 196,227,101,56,210,1 // vinserti128 $0x1,%xmm2,%ymm3,%ymm2
+ .byte 196,129,105,196,92,88,10,5 // vpinsrw $0x5,0xa(%r8,%r11,2),%xmm2,%xmm3
+ .byte 196,227,109,2,211,15 // vpblendd $0xf,%ymm3,%ymm2,%ymm2
+ .byte 196,129,105,196,92,88,8,4 // vpinsrw $0x4,0x8(%r8,%r11,2),%xmm2,%xmm3
+ .byte 196,227,109,2,211,15 // vpblendd $0xf,%ymm3,%ymm2,%ymm2
+ .byte 196,129,122,126,28,88 // vmovq (%r8,%r11,2),%xmm3
+ .byte 196,227,109,2,211,3 // vpblendd $0x3,%ymm3,%ymm2,%ymm2
+ .byte 233,140,254,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,129,105,196,92,88,20,2 // vpinsrw $0x2,0x14(%r8,%r11,2),%xmm2,%xmm3
+ .byte 196,227,109,56,211,1 // vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ .byte 196,227,125,57,211,1 // vextracti128 $0x1,%ymm2,%xmm3
+ .byte 196,129,97,196,92,88,18,1 // vpinsrw $0x1,0x12(%r8,%r11,2),%xmm3,%xmm3
+ .byte 196,227,109,56,211,1 // vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ .byte 196,227,125,57,211,1 // vextracti128 $0x1,%ymm2,%xmm3
+ .byte 196,129,97,196,92,88,16,0 // vpinsrw $0x0,0x10(%r8,%r11,2),%xmm3,%xmm3
+ .byte 196,227,109,56,211,1 // vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ .byte 196,129,122,111,28,88 // vmovdqu (%r8,%r11,2),%xmm3
+ .byte 196,227,101,2,210,240 // vpblendd $0xf0,%ymm2,%ymm3,%ymm2
+ .byte 233,65,254,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,129,105,196,92,88,28,6 // vpinsrw $0x6,0x1c(%r8,%r11,2),%xmm2,%xmm3
+ .byte 196,227,109,56,211,1 // vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ .byte 196,227,125,57,211,1 // vextracti128 $0x1,%ymm2,%xmm3
+ .byte 196,129,97,196,92,88,26,5 // vpinsrw $0x5,0x1a(%r8,%r11,2),%xmm3,%xmm3
+ .byte 196,227,109,56,211,1 // vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ .byte 196,227,125,57,211,1 // vextracti128 $0x1,%ymm2,%xmm3
+ .byte 196,129,97,196,92,88,24,4 // vpinsrw $0x4,0x18(%r8,%r11,2),%xmm3,%xmm3
+ .byte 196,227,109,56,211,1 // vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ .byte 196,129,122,126,92,88,16 // vmovq 0x10(%r8,%r11,2),%xmm3
+ .byte 196,129,122,111,36,88 // vmovdqu (%r8,%r11,2),%xmm4
+ .byte 196,227,93,56,219,1 // vinserti128 $0x1,%xmm3,%ymm4,%ymm3
+ .byte 196,227,101,2,210,192 // vpblendd $0xc0,%ymm2,%ymm3,%ymm2
+ .byte 233,233,253,255,255 // jmpq 235d5 <_sk_load_565_dst_hsw_8bit+0x25>
+ .byte 237 // in (%dx),%eax
+ .byte 254 // (bad)
+ .byte 255 // (bad)
+ .byte 255,13,255,255,255,251 // decl -0x4000001(%rip) # fffffffffc0237f4 <_sk_overlay_sse2_8bit+0xfffffffffbff7a1c>
+ .byte 254 // (bad)
+ .byte 255 // (bad)
+ .byte 255,76,255,255 // decl -0x1(%rdi,%rdi,8)
+ .byte 255 // (bad)
+ .byte 62,255 // ds (bad)
+ .byte 255 // (bad)
+ .byte 255,48 // pushq (%rax)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,30 // lcall *(%rsi)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,151,255,255,255,131 // callq *-0x7c000001(%rdi)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,111,255 // ljmp *-0x1(%rdi)
+ .byte 255 // (bad)
+ .byte 255,93,255 // lcall *-0x1(%rbp)
+ .byte 255 // (bad)
+ .byte 255,226 // jmpq *%rdx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,206 // dec %esi
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 186,255,255,255,168 // mov $0xa8ffffff,%edx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
HIDDEN _sk_load_a8_hsw_8bit
.globl _sk_load_a8_hsw_8bit
FUNCTION(_sk_load_a8_hsw_8bit)
@@ -44305,7 +44565,7 @@ _sk_load_a8_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 23437 <_sk_load_a8_hsw_8bit+0x3b>
+ .byte 117,35 // jne 23863 <_sk_load_a8_hsw_8bit+0x3b>
.byte 196,129,122,111,4,24 // vmovdqu (%r8,%r11,1),%xmm0
.byte 197,249,112,200,78 // vpshufd $0x4e,%xmm0,%xmm1
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
@@ -44319,35 +44579,35 @@ _sk_load_a8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,207 // ja 2341a <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 119,207 // ja 23846 <_sk_load_a8_hsw_8bit+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 23518 <_sk_load_a8_hsw_8bit+0x11c>
+ .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 23944 <_sk_load_a8_hsw_8bit+0x11c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,176 // jmp 2341a <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 235,176 // jmp 23846 <_sk_load_a8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm0,%xmm0
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 235,147 // jmp 2341a <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 235,147 // jmp 23846 <_sk_load_a8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm0,%xmm0
.byte 196,129,121,110,12,24 // vmovd (%r8,%r11,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,102,255,255,255 // jmpq 2341a <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 233,102,255,255,255 // jmpq 23846 <_sk_load_a8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm0,%xmm0
.byte 196,129,122,126,12,24 // vmovq (%r8,%r11,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,57,255,255,255 // jmpq 2341a <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 233,57,255,255,255 // jmpq 23846 <_sk_load_a8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm0,%xmm0
@@ -44355,7 +44615,7 @@ _sk_load_a8_hsw_8bit:
.byte 196,129,122,126,12,24 // vmovq (%r8,%r11,1),%xmm1
.byte 196,131,113,34,76,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,4,255,255,255 // jmpq 2341a <_sk_load_a8_hsw_8bit+0x1e>
+ .byte 233,4,255,255,255 // jmpq 23846 <_sk_load_a8_hsw_8bit+0x1e>
.byte 102,144 // xchg %ax,%ax
.byte 71,255 // rex.RXB (bad)
.byte 255 // (bad)
@@ -44367,7 +44627,7 @@ _sk_load_a8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 123,255 // jnp 2352d <_sk_load_a8_hsw_8bit+0x131>
+ .byte 123,255 // jnp 23959 <_sk_load_a8_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,111,255 // ljmp *-0x1(%rdi)
.byte 255 // (bad)
@@ -44403,7 +44663,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 2358f <_sk_load_a8_dst_hsw_8bit+0x3b>
+ .byte 117,35 // jne 239bb <_sk_load_a8_dst_hsw_8bit+0x3b>
.byte 196,129,122,111,20,24 // vmovdqu (%r8,%r11,1),%xmm2
.byte 197,249,112,218,78 // vpshufd $0x4e,%xmm2,%xmm3
.byte 196,226,125,49,219 // vpmovzxbd %xmm3,%ymm3
@@ -44417,35 +44677,35 @@ _sk_load_a8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,207 // ja 23572 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 119,207 // ja 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 23670 <_sk_load_a8_dst_hsw_8bit+0x11c>
+ .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 23a9c <_sk_load_a8_dst_hsw_8bit+0x11c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,176 // jmp 23572 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 235,176 // jmp 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm2,%xmm2
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 235,147 // jmp 23572 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 235,147 // jmp 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm2,%xmm2
.byte 196,129,121,110,28,24 // vmovd (%r8,%r11,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,102,255,255,255 // jmpq 23572 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 233,102,255,255,255 // jmpq 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm2,%xmm2
.byte 196,129,122,126,28,24 // vmovq (%r8,%r11,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,57,255,255,255 // jmpq 23572 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 233,57,255,255,255 // jmpq 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm2,%xmm2
@@ -44453,7 +44713,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 196,129,122,126,28,24 // vmovq (%r8,%r11,1),%xmm3
.byte 196,131,97,34,92,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,4,255,255,255 // jmpq 23572 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ .byte 233,4,255,255,255 // jmpq 2399e <_sk_load_a8_dst_hsw_8bit+0x1e>
.byte 102,144 // xchg %ax,%ax
.byte 71,255 // rex.RXB (bad)
.byte 255 // (bad)
@@ -44465,7 +44725,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 123,255 // jnp 23685 <_sk_load_a8_dst_hsw_8bit+0x131>
+ .byte 123,255 // jnp 23ab1 <_sk_load_a8_dst_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,111,255 // ljmp *-0x1(%rdi)
.byte 255 // (bad)
@@ -44500,17 +44760,17 @@ _sk_store_a8_hsw_8bit:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 197,253,111,37,121,136,0,0 // vmovdqa 0x8879(%rip),%ymm4 # 2bf40 <_sk_overlay_sse2_8bit+0xb24>
+ .byte 197,253,111,37,141,142,0,0 // vmovdqa 0x8e8d(%rip),%ymm4 # 2c980 <_sk_overlay_sse2_8bit+0xba8>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,227,253,0,237,232 // vpermq $0xe8,%ymm5,%ymm5
- .byte 197,249,111,53,166,146,0,0 // vmovdqa 0x92a6(%rip),%xmm6 # 2c980 <_sk_overlay_sse2_8bit+0x1564>
+ .byte 197,249,111,53,186,152,0,0 // vmovdqa 0x98ba(%rip),%xmm6 # 2d3c0 <_sk_overlay_sse2_8bit+0x15e8>
.byte 196,226,81,0,238 // vpshufb %xmm6,%xmm5,%xmm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,227,253,0,228,232 // vpermq $0xe8,%ymm4,%ymm4
.byte 196,226,89,0,230 // vpshufb %xmm6,%xmm4,%xmm4
.byte 197,217,108,229 // vpunpcklqdq %xmm5,%xmm4,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,10 // jne 23702 <_sk_store_a8_hsw_8bit+0x56>
+ .byte 117,10 // jne 23b2e <_sk_store_a8_hsw_8bit+0x56>
.byte 196,129,122,127,36,24 // vmovdqu %xmm4,(%r8,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -44518,34 +44778,34 @@ _sk_store_a8_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,236 // ja 236fe <_sk_store_a8_hsw_8bit+0x52>
+ .byte 119,236 // ja 23b2a <_sk_store_a8_hsw_8bit+0x52>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,139,0,0,0 // lea 0x8b(%rip),%r10 # 237a8 <_sk_store_a8_hsw_8bit+0xfc>
+ .byte 76,141,21,139,0,0,0 // lea 0x8b(%rip),%r10 # 23bd4 <_sk_store_a8_hsw_8bit+0xfc>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,131,121,20,36,24,0 // vpextrb $0x0,%xmm4,(%r8,%r11,1)
- .byte 235,207 // jmp 236fe <_sk_store_a8_hsw_8bit+0x52>
+ .byte 235,207 // jmp 23b2a <_sk_store_a8_hsw_8bit+0x52>
.byte 196,131,121,20,100,24,2,2 // vpextrb $0x2,%xmm4,0x2(%r8,%r11,1)
.byte 196,131,121,21,36,24,0 // vpextrw $0x0,%xmm4,(%r8,%r11,1)
- .byte 235,190 // jmp 236fe <_sk_store_a8_hsw_8bit+0x52>
+ .byte 235,190 // jmp 23b2a <_sk_store_a8_hsw_8bit+0x52>
.byte 196,131,121,20,100,24,6,6 // vpextrb $0x6,%xmm4,0x6(%r8,%r11,1)
.byte 196,131,121,20,100,24,5,5 // vpextrb $0x5,%xmm4,0x5(%r8,%r11,1)
.byte 196,131,121,20,100,24,4,4 // vpextrb $0x4,%xmm4,0x4(%r8,%r11,1)
.byte 196,129,121,126,36,24 // vmovd %xmm4,(%r8,%r11,1)
- .byte 235,158 // jmp 236fe <_sk_store_a8_hsw_8bit+0x52>
+ .byte 235,158 // jmp 23b2a <_sk_store_a8_hsw_8bit+0x52>
.byte 196,131,121,20,100,24,10,10 // vpextrb $0xa,%xmm4,0xa(%r8,%r11,1)
.byte 196,131,121,20,100,24,9,9 // vpextrb $0x9,%xmm4,0x9(%r8,%r11,1)
.byte 196,131,121,20,100,24,8,8 // vpextrb $0x8,%xmm4,0x8(%r8,%r11,1)
- .byte 235,32 // jmp 2379a <_sk_store_a8_hsw_8bit+0xee>
+ .byte 235,32 // jmp 23bc6 <_sk_store_a8_hsw_8bit+0xee>
.byte 196,131,121,20,100,24,14,14 // vpextrb $0xe,%xmm4,0xe(%r8,%r11,1)
.byte 196,131,121,20,100,24,13,13 // vpextrb $0xd,%xmm4,0xd(%r8,%r11,1)
.byte 196,131,121,20,100,24,12,12 // vpextrb $0xc,%xmm4,0xc(%r8,%r11,1)
.byte 196,131,121,22,100,24,8,2 // vpextrd $0x2,%xmm4,0x8(%r8,%r11,1)
.byte 196,129,121,214,36,24 // vmovq %xmm4,(%r8,%r11,1)
- .byte 233,89,255,255,255 // jmpq 236fe <_sk_store_a8_hsw_8bit+0x52>
+ .byte 233,89,255,255,255 // jmpq 23b2a <_sk_store_a8_hsw_8bit+0x52>
.byte 15,31,0 // nopl (%rax)
- .byte 126,255 // jle 237a9 <_sk_store_a8_hsw_8bit+0xfd>
+ .byte 126,255 // jle 23bd5 <_sk_store_a8_hsw_8bit+0xfd>
.byte 255 // (bad)
.byte 255,143,255,255,255,135 // decl -0x78000001(%rdi)
.byte 255 // (bad)
@@ -44591,15 +44851,15 @@ _sk_load_g8_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,61 // jne 23839 <_sk_load_g8_hsw_8bit+0x55>
+ .byte 117,61 // jne 23c65 <_sk_load_g8_hsw_8bit+0x55>
.byte 196,129,122,111,4,24 // vmovdqu (%r8,%r11,1),%xmm0
.byte 196,226,125,49,200 // vpmovzxbd %xmm0,%ymm1
.byte 197,249,112,192,78 // vpshufd $0x4e,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
- .byte 196,226,125,88,37,210,129,0,0 // vpbroadcastd 0x81d2(%rip),%ymm4 # 2b9ec <_sk_overlay_sse2_8bit+0x5d0>
+ .byte 196,226,125,88,37,110,135,0,0 // vpbroadcastd 0x876e(%rip),%ymm4 # 2c3b4 <_sk_overlay_sse2_8bit+0x5dc>
.byte 196,226,125,64,236 // vpmulld %ymm4,%ymm0,%ymm5
.byte 196,226,117,64,196 // vpmulld %ymm4,%ymm1,%ymm0
- .byte 196,226,125,88,13,195,129,0,0 // vpbroadcastd 0x81c3(%rip),%ymm1 # 2b9f0 <_sk_overlay_sse2_8bit+0x5d4>
+ .byte 196,226,125,88,13,87,135,0,0 // vpbroadcastd 0x8757(%rip),%ymm1 # 2c3b0 <_sk_overlay_sse2_8bit+0x5d8>
.byte 197,253,235,193 // vpor %ymm1,%ymm0,%ymm0
.byte 197,213,235,201 // vpor %ymm1,%ymm5,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44609,35 +44869,35 @@ _sk_load_g8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,181 // ja 23802 <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 119,181 // ja 23c2e <_sk_load_g8_hsw_8bit+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,196,0,0,0 // lea 0xc4(%rip),%r10 # 2391c <_sk_load_g8_hsw_8bit+0x138>
+ .byte 76,141,21,196,0,0,0 // lea 0xc4(%rip),%r10 # 23d48 <_sk_load_g8_hsw_8bit+0x138>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,150 // jmp 23802 <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 235,150 // jmp 23c2e <_sk_load_g8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm0,%xmm0
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,118,255,255,255 // jmpq 23802 <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 233,118,255,255,255 // jmpq 23c2e <_sk_load_g8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm0,%xmm0
.byte 196,129,121,110,12,24 // vmovd (%r8,%r11,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,73,255,255,255 // jmpq 23802 <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 233,73,255,255,255 // jmpq 23c2e <_sk_load_g8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm0,%xmm0
.byte 196,129,122,126,12,24 // vmovq (%r8,%r11,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,28,255,255,255 // jmpq 23802 <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 233,28,255,255,255 // jmpq 23c2e <_sk_load_g8_hsw_8bit+0x1e>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,131,121,32,68,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm0,%xmm0
.byte 196,131,121,32,68,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm0,%xmm0
@@ -44645,7 +44905,7 @@ _sk_load_g8_hsw_8bit:
.byte 196,129,122,126,12,24 // vmovq (%r8,%r11,1),%xmm1
.byte 196,131,113,34,76,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,231,254,255,255 // jmpq 23802 <_sk_load_g8_hsw_8bit+0x1e>
+ .byte 233,231,254,255,255 // jmpq 23c2e <_sk_load_g8_hsw_8bit+0x1e>
.byte 144 // nop
.byte 69,255 // rex.RB (bad)
.byte 255 // (bad)
@@ -44655,7 +44915,7 @@ _sk_load_g8_hsw_8bit:
.byte 255,140,255,255,255,132,255 // decl -0x7b0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 124,255 // jl 23931 <_sk_load_g8_hsw_8bit+0x14d>
+ .byte 124,255 // jl 23d5d <_sk_load_g8_hsw_8bit+0x14d>
.byte 255 // (bad)
.byte 255,112,255 // pushq -0x1(%rax)
.byte 255 // (bad)
@@ -44691,15 +44951,15 @@ _sk_load_g8_dst_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,61 // jne 239ad <_sk_load_g8_dst_hsw_8bit+0x55>
+ .byte 117,61 // jne 23dd9 <_sk_load_g8_dst_hsw_8bit+0x55>
.byte 196,129,122,111,20,24 // vmovdqu (%r8,%r11,1),%xmm2
.byte 196,226,125,49,218 // vpmovzxbd %xmm2,%ymm3
.byte 197,249,112,210,78 // vpshufd $0x4e,%xmm2,%xmm2
.byte 196,226,125,49,210 // vpmovzxbd %xmm2,%ymm2
- .byte 196,226,125,88,37,94,128,0,0 // vpbroadcastd 0x805e(%rip),%ymm4 # 2b9ec <_sk_overlay_sse2_8bit+0x5d0>
+ .byte 196,226,125,88,37,250,133,0,0 // vpbroadcastd 0x85fa(%rip),%ymm4 # 2c3b4 <_sk_overlay_sse2_8bit+0x5dc>
.byte 196,226,109,64,236 // vpmulld %ymm4,%ymm2,%ymm5
.byte 196,226,101,64,212 // vpmulld %ymm4,%ymm3,%ymm2
- .byte 196,226,125,88,29,79,128,0,0 // vpbroadcastd 0x804f(%rip),%ymm3 # 2b9f0 <_sk_overlay_sse2_8bit+0x5d4>
+ .byte 196,226,125,88,29,227,133,0,0 // vpbroadcastd 0x85e3(%rip),%ymm3 # 2c3b0 <_sk_overlay_sse2_8bit+0x5d8>
.byte 197,237,235,211 // vpor %ymm3,%ymm2,%ymm2
.byte 197,213,235,219 // vpor %ymm3,%ymm5,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44709,35 +44969,35 @@ _sk_load_g8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,181 // ja 23976 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 119,181 // ja 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,196,0,0,0 // lea 0xc4(%rip),%r10 # 23a90 <_sk_load_g8_dst_hsw_8bit+0x138>
+ .byte 76,141,21,196,0,0,0 // lea 0xc4(%rip),%r10 # 23ebc <_sk_load_g8_dst_hsw_8bit+0x138>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,150 // jmp 23976 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 235,150 // jmp 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm2,%xmm2
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,118,255,255,255 // jmpq 23976 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 233,118,255,255,255 // jmpq 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm2,%xmm2
.byte 196,129,121,110,28,24 // vmovd (%r8,%r11,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,73,255,255,255 // jmpq 23976 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 233,73,255,255,255 // jmpq 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm2,%xmm2
.byte 196,129,122,126,28,24 // vmovq (%r8,%r11,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,28,255,255,255 // jmpq 23976 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 233,28,255,255,255 // jmpq 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,131,105,32,84,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm2,%xmm2
.byte 196,131,105,32,84,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm2,%xmm2
@@ -44745,7 +45005,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 196,129,122,126,28,24 // vmovq (%r8,%r11,1),%xmm3
.byte 196,131,97,34,92,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,231,254,255,255 // jmpq 23976 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ .byte 233,231,254,255,255 // jmpq 23da2 <_sk_load_g8_dst_hsw_8bit+0x1e>
.byte 144 // nop
.byte 69,255 // rex.RB (bad)
.byte 255 // (bad)
@@ -44755,7 +45015,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 255,140,255,255,255,132,255 // decl -0x7b0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 124,255 // jl 23aa5 <_sk_load_g8_dst_hsw_8bit+0x14d>
+ .byte 124,255 // jl 23ed1 <_sk_load_g8_dst_hsw_8bit+0x14d>
.byte 255 // (bad)
.byte 255,112,255 // pushq -0x1(%rax)
.byte 255 // (bad)
@@ -44792,10 +45052,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,222,0,0,0 // jne 23bca <_sk_srcover_rgba_8888_hsw_8bit+0xfe>
+ .byte 15,133,222,0,0,0 // jne 23ff6 <_sk_srcover_rgba_8888_hsw_8bit+0xfe>
.byte 196,1,126,111,76,152,32 // vmovdqu 0x20(%r8,%r11,4),%ymm9
.byte 196,1,126,111,28,152 // vmovdqu (%r8,%r11,4),%ymm11
- .byte 197,253,111,53,95,132,0,0 // vmovdqa 0x845f(%rip),%ymm6 # 2bf60 <_sk_overlay_sse2_8bit+0xb44>
+ .byte 197,253,111,53,115,138,0,0 // vmovdqa 0x8a73(%rip),%ymm6 # 2c9a0 <_sk_overlay_sse2_8bit+0xbc8>
.byte 196,226,117,0,254 // vpshufb %ymm6,%ymm1,%ymm7
.byte 196,226,125,0,246 // vpshufb %ymm6,%ymm0,%ymm6
.byte 196,66,125,48,195 // vpmovzxbw %xmm11,%ymm8
@@ -44833,7 +45093,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 197,221,252,224 // vpaddb %ymm0,%ymm4,%ymm4
.byte 197,213,252,233 // vpaddb %ymm1,%ymm5,%ymm5
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,78 // jne 23c07 <_sk_srcover_rgba_8888_hsw_8bit+0x13b>
+ .byte 117,78 // jne 24033 <_sk_srcover_rgba_8888_hsw_8bit+0x13b>
.byte 196,129,126,127,36,152 // vmovdqu %ymm4,(%r8,%r11,4)
.byte 196,129,126,127,108,152,32 // vmovdqu %ymm5,0x20(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44844,26 +45104,26 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,65,37,239,219 // vpxor %ymm11,%ymm11,%ymm11
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,17,255,255,255 // ja 23af9 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 15,135,17,255,255,255 // ja 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,237,1,0,0 // lea 0x1ed(%rip),%r10 # 23de0 <_sk_srcover_rgba_8888_hsw_8bit+0x314>
+ .byte 76,141,21,237,1,0,0 // lea 0x1ed(%rip),%r10 # 2420c <_sk_srcover_rgba_8888_hsw_8bit+0x314>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,121,110,28,152 // vmovd (%r8,%r11,4),%xmm11
- .byte 233,242,254,255,255 // jmpq 23af9 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 233,242,254,255,255 // jmpq 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,175 // ja 23bc6 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 119,175 // ja 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 76,141,13,250,1,0,0 // lea 0x1fa(%rip),%r9 # 23e1c <_sk_srcover_rgba_8888_hsw_8bit+0x350>
+ .byte 76,141,13,250,1,0,0 // lea 0x1fa(%rip),%r9 # 24248 <_sk_srcover_rgba_8888_hsw_8bit+0x350>
.byte 73,99,4,129 // movslq (%r9,%rax,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
.byte 196,129,121,126,36,152 // vmovd %xmm4,(%r8,%r11,4)
- .byte 235,147 // jmp 23bc6 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 235,147 // jmp 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 196,129,121,110,100,152,8 // vmovd 0x8(%r8,%r11,4),%xmm4
.byte 196,226,121,89,236 // vpbroadcastq %xmm4,%xmm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -44871,7 +45131,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,130,121,53,52,152 // vpmovzxdq (%r8,%r11,4),%xmm6
.byte 197,249,112,246,232 // vpshufd $0xe8,%xmm6,%xmm6
.byte 196,99,37,2,222,3 // vpblendd $0x3,%ymm6,%ymm11,%ymm11
- .byte 233,153,254,255,255 // jmpq 23af9 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 233,153,254,255,255 // jmpq 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 196,129,121,110,100,152,24 // vmovd 0x18(%r8,%r11,4),%xmm4
.byte 196,226,125,89,236 // vpbroadcastq %xmm4,%ymm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -44884,7 +45144,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,37,56,222,1 // vinserti128 $0x1,%xmm6,%ymm11,%ymm11
.byte 196,129,122,111,52,152 // vmovdqu (%r8,%r11,4),%xmm6
.byte 196,67,77,2,219,240 // vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- .byte 233,73,254,255,255 // jmpq 23af9 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 233,73,254,255,255 // jmpq 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 196,129,121,110,100,152,40 // vmovd 0x28(%r8,%r11,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -44893,7 +45153,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,53,2,205,15 // vpblendd $0xf,%ymm5,%ymm9,%ymm9
.byte 196,129,121,110,108,152,32 // vmovd 0x20(%r8,%r11,4),%xmm5
.byte 196,99,53,2,205,1 // vpblendd $0x1,%ymm5,%ymm9,%ymm9
- .byte 233,13,254,255,255 // jmpq 23af3 <_sk_srcover_rgba_8888_hsw_8bit+0x27>
+ .byte 233,13,254,255,255 // jmpq 23f1f <_sk_srcover_rgba_8888_hsw_8bit+0x27>
.byte 196,129,121,110,100,152,56 // vmovd 0x38(%r8,%r11,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -44907,10 +45167,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,1,126,111,28,152 // vmovdqu (%r8,%r11,4),%ymm11
.byte 196,129,122,111,116,152,32 // vmovdqu 0x20(%r8,%r11,4),%xmm6
.byte 196,67,77,2,201,240 // vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- .byte 233,189,253,255,255 // jmpq 23af9 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ .byte 233,189,253,255,255 // jmpq 23f25 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
.byte 196,131,121,22,100,152,8,2 // vpextrd $0x2,%xmm4,0x8(%r8,%r11,4)
.byte 196,129,121,214,36,152 // vmovq %xmm4,(%r8,%r11,4)
- .byte 233,119,254,255,255 // jmpq 23bc6 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 233,119,254,255,255 // jmpq 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,131,121,22,108,152,24,2 // vpextrd $0x2,%xmm5,0x18(%r8,%r11,4)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -44918,12 +45178,12 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,129,121,126,108,152,16 // vmovd %xmm5,0x10(%r8,%r11,4)
.byte 196,129,122,127,36,152 // vmovdqu %xmm4,(%r8,%r11,4)
- .byte 233,67,254,255,255 // jmpq 23bc6 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 233,67,254,255,255 // jmpq 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 196,131,121,22,108,152,40,2 // vpextrd $0x2,%xmm5,0x28(%r8,%r11,4)
.byte 196,131,121,22,108,152,36,1 // vpextrd $0x1,%xmm5,0x24(%r8,%r11,4)
.byte 196,129,121,126,108,152,32 // vmovd %xmm5,0x20(%r8,%r11,4)
.byte 196,129,126,127,36,152 // vmovdqu %ymm4,(%r8,%r11,4)
- .byte 233,33,254,255,255 // jmpq 23bc6 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 233,33,254,255,255 // jmpq 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
.byte 196,131,121,22,116,152,56,2 // vpextrd $0x2,%xmm6,0x38(%r8,%r11,4)
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
@@ -44932,7 +45192,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,129,121,126,116,152,48 // vmovd %xmm6,0x30(%r8,%r11,4)
.byte 196,129,126,127,36,152 // vmovdqu %ymm4,(%r8,%r11,4)
.byte 196,129,122,127,108,152,32 // vmovdqu %xmm5,0x20(%r8,%r11,4)
- .byte 233,230,253,255,255 // jmpq 23bc6 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ .byte 233,230,253,255,255 // jmpq 23ff2 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
.byte 28,254 // sbb $0xfe,%al
.byte 255 // (bad)
.byte 255,106,254 // ljmp *-0x2(%rdx)
@@ -44985,7 +45245,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 126,255 // jle 23e39 <_sk_srcover_rgba_8888_hsw_8bit+0x36d>
+ .byte 126,255 // jle 24265 <_sk_srcover_rgba_8888_hsw_8bit+0x36d>
.byte 255 // (bad)
.byte 255,119,255 // pushq -0x1(%rdi)
.byte 255 // (bad)
@@ -45007,7 +45267,7 @@ FUNCTION(_sk_scale_1_float_hsw_8bit)
_sk_scale_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,34,122,0,0 // vmulss 0x7a22(%rip),%xmm4,%xmm4 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 197,218,89,37,178,127,0,0 // vmulss 0x7fb2(%rip),%xmm4,%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -45017,7 +45277,7 @@ _sk_scale_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,37,229,128,0,0 // vpand 0x80e5(%rip),%ymm4,%ymm4 # 2bf80 <_sk_overlay_sse2_8bit+0xb64>
+ .byte 197,221,219,37,249,134,0,0 // vpand 0x86f9(%rip),%ymm4,%ymm4 # 2c9c0 <_sk_overlay_sse2_8bit+0xbe8>
.byte 197,221,213,249 // vpmullw %ymm1,%ymm4,%ymm7
.byte 197,93,213,198 // vpmullw %ymm6,%ymm4,%ymm8
.byte 197,93,213,200 // vpmullw %ymm0,%ymm4,%ymm9
@@ -45050,12 +45310,12 @@ _sk_scale_u8_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,191,0,0,0 // jne 23fce <_sk_scale_u8_hsw_8bit+0xdb>
+ .byte 15,133,191,0,0,0 // jne 243fa <_sk_scale_u8_hsw_8bit+0xdb>
.byte 196,129,122,111,36,24 // vmovdqu (%r8,%r11,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,116,128,0,0 // vmovdqa 0x8074(%rip),%ymm6 # 2bfa0 <_sk_overlay_sse2_8bit+0xb84>
+ .byte 197,253,111,53,136,134,0,0 // vmovdqa 0x8688(%rip),%ymm6 # 2c9e0 <_sk_overlay_sse2_8bit+0xc08>
.byte 196,226,93,0,230 // vpshufb %ymm6,%ymm4,%ymm4
.byte 196,226,85,0,238 // vpshufb %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -45095,35 +45355,35 @@ _sk_scale_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,47,255,255,255 // ja 23f15 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 15,135,47,255,255,255 // ja 24341 <_sk_scale_u8_hsw_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,199,0,0,0 // lea 0xc7(%rip),%r10 # 240b8 <_sk_scale_u8_hsw_8bit+0x1c5>
+ .byte 76,141,21,199,0,0,0 // lea 0xc7(%rip),%r10 # 244e4 <_sk_scale_u8_hsw_8bit+0x1c5>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,13,255,255,255 // jmpq 23f15 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,13,255,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm4,%xmm4
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,237,254,255,255 // jmpq 23f15 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,237,254,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm4,%xmm4
.byte 196,129,121,110,44,24 // vmovd (%r8,%r11,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,192,254,255,255 // jmpq 23f15 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,192,254,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm4,%xmm4
.byte 196,129,122,126,44,24 // vmovq (%r8,%r11,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,147,254,255,255 // jmpq 23f15 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,147,254,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm4,%xmm4
@@ -45131,7 +45391,7 @@ _sk_scale_u8_hsw_8bit:
.byte 196,129,122,126,44,24 // vmovq (%r8,%r11,1),%xmm5
.byte 196,131,81,34,108,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,94,254,255,255 // jmpq 23f15 <_sk_scale_u8_hsw_8bit+0x22>
+ .byte 233,94,254,255,255 // jmpq 24341 <_sk_scale_u8_hsw_8bit+0x22>
.byte 144 // nop
.byte 66,255 // rex.X (bad)
.byte 255 // (bad)
@@ -45141,7 +45401,7 @@ _sk_scale_u8_hsw_8bit:
.byte 255,140,255,255,255,132,255 // decl -0x7b0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 124,255 // jl 240cd <_sk_scale_u8_hsw_8bit+0x1da>
+ .byte 124,255 // jl 244f9 <_sk_scale_u8_hsw_8bit+0x1da>
.byte 255 // (bad)
.byte 255,112,255 // pushq -0x1(%rax)
.byte 255 // (bad)
@@ -45172,7 +45432,7 @@ FUNCTION(_sk_lerp_1_float_hsw_8bit)
_sk_lerp_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,134,119,0,0 // vmulss 0x7786(%rip),%xmm4,%xmm4 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 197,218,89,37,22,125,0,0 // vmulss 0x7d16(%rip),%xmm4,%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -45182,7 +45442,7 @@ _sk_lerp_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,61,137,126,0,0 // vpand 0x7e89(%rip),%ymm4,%ymm7 # 2bfc0 <_sk_overlay_sse2_8bit+0xba4>
+ .byte 197,221,219,61,157,132,0,0 // vpand 0x849d(%rip),%ymm4,%ymm7 # 2ca00 <_sk_overlay_sse2_8bit+0xc28>
.byte 197,69,213,193 // vpmullw %ymm1,%ymm7,%ymm8
.byte 197,69,213,206 // vpmullw %ymm6,%ymm7,%ymm9
.byte 197,69,213,208 // vpmullw %ymm0,%ymm7,%ymm10
@@ -45246,12 +45506,12 @@ _sk_lerp_u8_hsw_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,106,1,0,0 // jne 243aa <_sk_lerp_u8_hsw_8bit+0x186>
+ .byte 15,133,106,1,0,0 // jne 247d6 <_sk_lerp_u8_hsw_8bit+0x186>
.byte 196,129,122,111,36,24 // vmovdqu (%r8,%r11,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,131,125,0,0 // vmovdqa 0x7d83(%rip),%ymm6 # 2bfe0 <_sk_overlay_sse2_8bit+0xbc4>
+ .byte 197,253,111,53,151,131,0,0 // vmovdqa 0x8397(%rip),%ymm6 # 2ca20 <_sk_overlay_sse2_8bit+0xc48>
.byte 196,98,93,0,206 // vpshufb %ymm6,%ymm4,%ymm9
.byte 196,98,85,0,222 // vpshufb %ymm6,%ymm5,%ymm11
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -45326,35 +45586,35 @@ _sk_lerp_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,132,254,255,255 // ja 24246 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 15,135,132,254,255,255 // ja 24672 <_sk_lerp_u8_hsw_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,199,0,0,0 // lea 0xc7(%rip),%r10 # 24494 <_sk_lerp_u8_hsw_8bit+0x270>
+ .byte 76,141,21,199,0,0,0 // lea 0xc7(%rip),%r10 # 248c0 <_sk_lerp_u8_hsw_8bit+0x270>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,98,254,255,255 // jmpq 24246 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,98,254,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,2,2 // vpinsrb $0x2,0x2(%r8,%r11,1),%xmm4,%xmm4
.byte 67,15,183,4,24 // movzwl (%r8,%r11,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,66,254,255,255 // jmpq 24246 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,66,254,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,6,6 // vpinsrb $0x6,0x6(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,5,5 // vpinsrb $0x5,0x5(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,4,4 // vpinsrb $0x4,0x4(%r8,%r11,1),%xmm4,%xmm4
.byte 196,129,121,110,44,24 // vmovd (%r8,%r11,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,21,254,255,255 // jmpq 24246 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,21,254,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,10,10 // vpinsrb $0xa,0xa(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,9,9 // vpinsrb $0x9,0x9(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,8,8 // vpinsrb $0x8,0x8(%r8,%r11,1),%xmm4,%xmm4
.byte 196,129,122,126,44,24 // vmovq (%r8,%r11,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,232,253,255,255 // jmpq 24246 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,232,253,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,131,89,32,100,24,14,14 // vpinsrb $0xe,0xe(%r8,%r11,1),%xmm4,%xmm4
.byte 196,131,89,32,100,24,13,13 // vpinsrb $0xd,0xd(%r8,%r11,1),%xmm4,%xmm4
@@ -45362,7 +45622,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 196,129,122,126,44,24 // vmovq (%r8,%r11,1),%xmm5
.byte 196,131,81,34,108,24,8,2 // vpinsrd $0x2,0x8(%r8,%r11,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,179,253,255,255 // jmpq 24246 <_sk_lerp_u8_hsw_8bit+0x22>
+ .byte 233,179,253,255,255 // jmpq 24672 <_sk_lerp_u8_hsw_8bit+0x22>
.byte 144 // nop
.byte 66,255 // rex.X (bad)
.byte 255 // (bad)
@@ -45372,7 +45632,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 255,140,255,255,255,132,255 // decl -0x7b0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 124,255 // jl 244a9 <_sk_lerp_u8_hsw_8bit+0x285>
+ .byte 124,255 // jl 248d5 <_sk_lerp_u8_hsw_8bit+0x285>
.byte 255 // (bad)
.byte 255,112,255 // pushq -0x1(%rax)
.byte 255 // (bad)
@@ -45420,7 +45680,7 @@ HIDDEN _sk_black_color_hsw_8bit
FUNCTION(_sk_black_color_hsw_8bit)
_sk_black_color_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,253,116,0,0 // vbroadcastss 0x74fd(%rip),%ymm0 # 2b9f0 <_sk_overlay_sse2_8bit+0x5d4>
+ .byte 196,226,125,24,5,145,122,0,0 // vbroadcastss 0x7a91(%rip),%ymm0 # 2c3b0 <_sk_overlay_sse2_8bit+0x5d8>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 255,224 // jmpq *%rax
@@ -45446,7 +45706,7 @@ HIDDEN _sk_srcatop_hsw_8bit
.globl _sk_srcatop_hsw_8bit
FUNCTION(_sk_srcatop_hsw_8bit)
_sk_srcatop_hsw_8bit:
- .byte 197,125,111,5,231,122,0,0 // vmovdqa 0x7ae7(%rip),%ymm8 # 2c000 <_sk_overlay_sse2_8bit+0xbe4>
+ .byte 197,125,111,5,251,128,0,0 // vmovdqa 0x80fb(%rip),%ymm8 # 2ca40 <_sk_overlay_sse2_8bit+0xc68>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,232 // vpshufb %ymm8,%ymm2,%ymm5
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -45523,7 +45783,7 @@ HIDDEN _sk_dstatop_hsw_8bit
.globl _sk_dstatop_hsw_8bit
FUNCTION(_sk_dstatop_hsw_8bit)
_sk_dstatop_hsw_8bit:
- .byte 197,125,111,5,162,121,0,0 // vmovdqa 0x79a2(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0xc04>
+ .byte 197,125,111,5,182,127,0,0 // vmovdqa 0x7fb6(%rip),%ymm8 # 2ca60 <_sk_overlay_sse2_8bit+0xc88>
.byte 196,194,117,0,224 // vpshufb %ymm8,%ymm1,%ymm4
.byte 196,194,125,0,232 // vpshufb %ymm8,%ymm0,%ymm5
.byte 196,98,125,48,210 // vpmovzxbw %xmm2,%ymm10
@@ -45600,7 +45860,7 @@ HIDDEN _sk_srcin_hsw_8bit
.globl _sk_srcin_hsw_8bit
FUNCTION(_sk_srcin_hsw_8bit)
_sk_srcin_hsw_8bit:
- .byte 197,253,111,37,89,120,0,0 // vmovdqa 0x7859(%rip),%ymm4 # 2c040 <_sk_overlay_sse2_8bit+0xc24>
+ .byte 197,253,111,37,109,126,0,0 // vmovdqa 0x7e6d(%rip),%ymm4 # 2ca80 <_sk_overlay_sse2_8bit+0xca8>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -45640,7 +45900,7 @@ HIDDEN _sk_dstin_hsw_8bit
.globl _sk_dstin_hsw_8bit
FUNCTION(_sk_dstin_hsw_8bit)
_sk_dstin_hsw_8bit:
- .byte 197,253,111,37,207,119,0,0 // vmovdqa 0x77cf(%rip),%ymm4 # 2c060 <_sk_overlay_sse2_8bit+0xc44>
+ .byte 197,253,111,37,227,125,0,0 // vmovdqa 0x7de3(%rip),%ymm4 # 2caa0 <_sk_overlay_sse2_8bit+0xcc8>
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,125,48,226 // vpmovzxbw %xmm2,%ymm4
@@ -45680,7 +45940,7 @@ HIDDEN _sk_srcout_hsw_8bit
.globl _sk_srcout_hsw_8bit
FUNCTION(_sk_srcout_hsw_8bit)
_sk_srcout_hsw_8bit:
- .byte 197,253,111,37,67,119,0,0 // vmovdqa 0x7743(%rip),%ymm4 # 2c080 <_sk_overlay_sse2_8bit+0xc64>
+ .byte 197,253,111,37,87,125,0,0 // vmovdqa 0x7d57(%rip),%ymm4 # 2cac0 <_sk_overlay_sse2_8bit+0xce8>
.byte 196,226,109,0,236 // vpshufb %ymm4,%ymm2,%ymm5
.byte 196,226,101,0,228 // vpshufb %ymm4,%ymm3,%ymm4
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -45723,7 +45983,7 @@ HIDDEN _sk_dstout_hsw_8bit
.globl _sk_dstout_hsw_8bit
FUNCTION(_sk_dstout_hsw_8bit)
_sk_dstout_hsw_8bit:
- .byte 197,253,111,37,173,118,0,0 // vmovdqa 0x76ad(%rip),%ymm4 # 2c0a0 <_sk_overlay_sse2_8bit+0xc84>
+ .byte 197,253,111,37,193,124,0,0 // vmovdqa 0x7cc1(%rip),%ymm4 # 2cae0 <_sk_overlay_sse2_8bit+0xd08>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -45766,7 +46026,7 @@ HIDDEN _sk_srcover_hsw_8bit
.globl _sk_srcover_hsw_8bit
FUNCTION(_sk_srcover_hsw_8bit)
_sk_srcover_hsw_8bit:
- .byte 197,253,111,37,21,118,0,0 // vmovdqa 0x7615(%rip),%ymm4 # 2c0c0 <_sk_overlay_sse2_8bit+0xca4>
+ .byte 197,253,111,37,41,124,0,0 // vmovdqa 0x7c29(%rip),%ymm4 # 2cb00 <_sk_overlay_sse2_8bit+0xd28>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,98,125,48,202 // vpmovzxbw %xmm2,%ymm9
@@ -45810,7 +46070,7 @@ HIDDEN _sk_dstover_hsw_8bit
.globl _sk_dstover_hsw_8bit
FUNCTION(_sk_dstover_hsw_8bit)
_sk_dstover_hsw_8bit:
- .byte 197,253,111,37,118,117,0,0 // vmovdqa 0x7576(%rip),%ymm4 # 2c0e0 <_sk_overlay_sse2_8bit+0xcc4>
+ .byte 197,253,111,37,138,123,0,0 // vmovdqa 0x7b8a(%rip),%ymm4 # 2cb20 <_sk_overlay_sse2_8bit+0xd48>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,98,125,48,200 // vpmovzxbw %xmm0,%ymm9
@@ -45893,7 +46153,7 @@ FUNCTION(_sk_multiply_hsw_8bit)
_sk_multiply_hsw_8bit:
.byte 197,253,111,243 // vmovdqa %ymm3,%ymm6
.byte 197,253,111,218 // vmovdqa %ymm2,%ymm3
- .byte 197,125,111,13,55,116,0,0 // vmovdqa 0x7437(%rip),%ymm9 # 2c100 <_sk_overlay_sse2_8bit+0xce4>
+ .byte 197,125,111,13,75,122,0,0 // vmovdqa 0x7a4b(%rip),%ymm9 # 2cb40 <_sk_overlay_sse2_8bit+0xd68>
.byte 196,194,101,0,225 // vpshufb %ymm9,%ymm3,%ymm4
.byte 196,194,77,0,233 // vpshufb %ymm9,%ymm6,%ymm5
.byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -46037,7 +46297,7 @@ HIDDEN _sk_xor__hsw_8bit
.globl _sk_xor__hsw_8bit
FUNCTION(_sk_xor__hsw_8bit)
_sk_xor__hsw_8bit:
- .byte 197,125,111,13,197,113,0,0 // vmovdqa 0x71c5(%rip),%ymm9 # 2c120 <_sk_overlay_sse2_8bit+0xd04>
+ .byte 197,125,111,13,217,119,0,0 // vmovdqa 0x77d9(%rip),%ymm9 # 2cb60 <_sk_overlay_sse2_8bit+0xd88>
.byte 196,194,109,0,225 // vpshufb %ymm9,%ymm2,%ymm4
.byte 196,194,101,0,249 // vpshufb %ymm9,%ymm3,%ymm7
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -46125,7 +46385,7 @@ HIDDEN _sk_darken_hsw_8bit
.globl _sk_darken_hsw_8bit
FUNCTION(_sk_darken_hsw_8bit)
_sk_darken_hsw_8bit:
- .byte 197,125,111,5,103,112,0,0 // vmovdqa 0x7067(%rip),%ymm8 # 2c140 <_sk_overlay_sse2_8bit+0xd24>
+ .byte 197,125,111,5,123,118,0,0 // vmovdqa 0x767b(%rip),%ymm8 # 2cb80 <_sk_overlay_sse2_8bit+0xda8>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -46198,7 +46458,7 @@ _sk_darken_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,172,103,0,0 // vpbroadcastd 0x67ac(%rip),%ymm4 # 2b9f4 <_sk_overlay_sse2_8bit+0x5d8>
+ .byte 196,226,125,88,37,68,109,0,0 // vpbroadcastd 0x6d44(%rip),%ymm4 # 2c3b8 <_sk_overlay_sse2_8bit+0x5e0>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46208,7 +46468,7 @@ HIDDEN _sk_lighten_hsw_8bit
.globl _sk_lighten_hsw_8bit
FUNCTION(_sk_lighten_hsw_8bit)
_sk_lighten_hsw_8bit:
- .byte 197,125,111,5,0,111,0,0 // vmovdqa 0x6f00(%rip),%ymm8 # 2c160 <_sk_overlay_sse2_8bit+0xd44>
+ .byte 197,125,111,5,20,117,0,0 // vmovdqa 0x7514(%rip),%ymm8 # 2cba0 <_sk_overlay_sse2_8bit+0xdc8>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -46281,7 +46541,7 @@ _sk_lighten_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,37,102,0,0 // vpbroadcastd 0x6625(%rip),%ymm4 # 2b9f4 <_sk_overlay_sse2_8bit+0x5d8>
+ .byte 196,226,125,88,37,189,107,0,0 // vpbroadcastd 0x6bbd(%rip),%ymm4 # 2c3b8 <_sk_overlay_sse2_8bit+0x5e0>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46321,7 +46581,7 @@ _sk_exclusion_hsw_8bit:
.byte 196,227,77,56,252,1 // vinserti128 $0x1,%xmm4,%ymm6,%ymm7
.byte 196,227,77,70,228,49 // vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
.byte 197,197,103,228 // vpackuswb %ymm4,%ymm7,%ymm4
- .byte 197,253,111,53,2,109,0,0 // vmovdqa 0x6d02(%rip),%ymm6 # 2c180 <_sk_overlay_sse2_8bit+0xd64>
+ .byte 197,253,111,53,22,115,0,0 // vmovdqa 0x7316(%rip),%ymm6 # 2cbc0 <_sk_overlay_sse2_8bit+0xde8>
.byte 197,221,219,254 // vpand %ymm6,%ymm4,%ymm7
.byte 197,213,219,246 // vpand %ymm6,%ymm5,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -46337,7 +46597,7 @@ HIDDEN _sk_difference_hsw_8bit
.globl _sk_difference_hsw_8bit
FUNCTION(_sk_difference_hsw_8bit)
_sk_difference_hsw_8bit:
- .byte 197,125,111,5,246,108,0,0 // vmovdqa 0x6cf6(%rip),%ymm8 # 2c1a0 <_sk_overlay_sse2_8bit+0xd84>
+ .byte 197,125,111,5,10,115,0,0 // vmovdqa 0x730a(%rip),%ymm8 # 2cbe0 <_sk_overlay_sse2_8bit+0xe08>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -46404,7 +46664,7 @@ _sk_difference_hsw_8bit:
.byte 197,197,103,237 // vpackuswb %ymm5,%ymm7,%ymm5
.byte 197,181,218,228 // vpminub %ymm4,%ymm9,%ymm4
.byte 197,165,218,237 // vpminub %ymm5,%ymm11,%ymm5
- .byte 197,253,111,53,192,107,0,0 // vmovdqa 0x6bc0(%rip),%ymm6 # 2c1c0 <_sk_overlay_sse2_8bit+0xda4>
+ .byte 197,253,111,53,212,113,0,0 // vmovdqa 0x71d4(%rip),%ymm6 # 2cc00 <_sk_overlay_sse2_8bit+0xe28>
.byte 197,213,219,254 // vpand %ymm6,%ymm5,%ymm7
.byte 197,221,219,246 // vpand %ymm6,%ymm4,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -46429,7 +46689,7 @@ _sk_hardlight_hsw_8bit:
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
.byte 196,98,125,48,196 // vpmovzxbw %xmm4,%ymm8
.byte 197,126,127,68,36,96 // vmovdqu %ymm8,0x60(%rsp)
- .byte 197,253,111,45,131,107,0,0 // vmovdqa 0x6b83(%rip),%ymm5 # 2c1e0 <_sk_overlay_sse2_8bit+0xdc4>
+ .byte 197,253,111,45,151,113,0,0 // vmovdqa 0x7197(%rip),%ymm5 # 2cc20 <_sk_overlay_sse2_8bit+0xe48>
.byte 196,226,125,0,229 // vpshufb %ymm5,%ymm0,%ymm4
.byte 196,226,117,0,205 // vpshufb %ymm5,%ymm1,%ymm1
.byte 196,227,125,57,200,1 // vextracti128 $0x1,%ymm1,%xmm0
@@ -46455,10 +46715,10 @@ _sk_hardlight_hsw_8bit:
.byte 197,253,117,193 // vpcmpeqw %ymm1,%ymm0,%ymm0
.byte 197,254,127,132,36,128,0,0,0 // vmovdqu %ymm0,0x80(%rsp)
.byte 197,253,111,226 // vmovdqa %ymm2,%ymm4
- .byte 197,125,111,37,241,106,0,0 // vmovdqa 0x6af1(%rip),%ymm12 # 2c1e0 <_sk_overlay_sse2_8bit+0xdc4>
+ .byte 197,125,111,37,5,113,0,0 // vmovdqa 0x7105(%rip),%ymm12 # 2cc20 <_sk_overlay_sse2_8bit+0xe48>
.byte 196,66,93,0,196 // vpshufb %ymm12,%ymm4,%ymm8
.byte 196,194,125,48,208 // vpmovzxbw %xmm8,%ymm2
- .byte 196,226,125,121,5,254,106,0,0 // vpbroadcastw 0x6afe(%rip),%ymm0 # 2c200 <_sk_overlay_sse2_8bit+0xde4>
+ .byte 196,226,125,121,5,18,113,0,0 // vpbroadcastw 0x7112(%rip),%ymm0 # 2cc40 <_sk_overlay_sse2_8bit+0xe68>
.byte 197,109,239,232 // vpxor %ymm0,%ymm2,%ymm13
.byte 197,149,213,207 // vpmullw %ymm7,%ymm13,%ymm1
.byte 197,254,127,140,36,224,0,0,0 // vmovdqu %ymm1,0xe0(%rsp)
@@ -46558,7 +46818,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,254,111,116,36,160 // vmovdqu -0x60(%rsp),%ymm6
.byte 197,205,253,116,36,192 // vpaddw -0x40(%rsp),%ymm6,%ymm6
.byte 196,193,53,253,252 // vpaddw %ymm12,%ymm9,%ymm7
- .byte 196,98,125,121,5,0,105,0,0 // vpbroadcastw 0x6900(%rip),%ymm8 # 2c202 <_sk_overlay_sse2_8bit+0xde6>
+ .byte 196,98,125,121,5,20,111,0,0 // vpbroadcastw 0x6f14(%rip),%ymm8 # 2cc42 <_sk_overlay_sse2_8bit+0xe6a>
.byte 196,193,93,253,224 // vpaddw %ymm8,%ymm4,%ymm4
.byte 197,229,253,220 // vpaddw %ymm4,%ymm3,%ymm3
.byte 196,193,85,253,224 // vpaddw %ymm8,%ymm5,%ymm4
@@ -46567,7 +46827,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,213,104,0,0 // vpbroadcastw 0x68d5(%rip),%ymm4 # 2c204 <_sk_overlay_sse2_8bit+0xde8>
+ .byte 196,226,125,121,37,233,110,0,0 // vpbroadcastw 0x6ee9(%rip),%ymm4 # 2cc44 <_sk_overlay_sse2_8bit+0xe6c>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,237,228,212 // vpmulhuw %ymm4,%ymm2,%ymm2
@@ -46594,7 +46854,7 @@ FUNCTION(_sk_overlay_hsw_8bit)
_sk_overlay_hsw_8bit:
.byte 72,129,236,152,1,0,0 // sub $0x198,%rsp
.byte 197,252,17,140,36,64,1,0,0 // vmovups %ymm1,0x140(%rsp)
- .byte 197,253,111,45,120,104,0,0 // vmovdqa 0x6878(%rip),%ymm5 # 2c220 <_sk_overlay_sse2_8bit+0xe04>
+ .byte 197,253,111,45,140,110,0,0 // vmovdqa 0x6e8c(%rip),%ymm5 # 2cc60 <_sk_overlay_sse2_8bit+0xe88>
.byte 197,253,111,226 // vmovdqa %ymm2,%ymm4
.byte 196,227,125,57,225,1 // vextracti128 $0x1,%ymm4,%xmm1
.byte 196,98,125,48,193 // vpmovzxbw %xmm1,%ymm8
@@ -46629,7 +46889,7 @@ _sk_overlay_hsw_8bit:
.byte 197,93,117,251 // vpcmpeqw %ymm3,%ymm4,%ymm15
.byte 197,253,111,216 // vmovdqa %ymm0,%ymm3
.byte 196,226,125,48,227 // vpmovzxbw %xmm3,%ymm4
- .byte 196,226,125,121,5,210,103,0,0 // vpbroadcastw 0x67d2(%rip),%ymm0 # 2c240 <_sk_overlay_sse2_8bit+0xe24>
+ .byte 196,226,125,121,5,230,109,0,0 // vpbroadcastw 0x6de6(%rip),%ymm0 # 2cc80 <_sk_overlay_sse2_8bit+0xea8>
.byte 197,117,239,232 // vpxor %ymm0,%ymm1,%ymm13
.byte 197,21,213,212 // vpmullw %ymm4,%ymm13,%ymm10
.byte 197,126,127,148,36,192,0,0,0 // vmovdqu %ymm10,0xc0(%rsp)
@@ -46730,7 +46990,7 @@ _sk_overlay_hsw_8bit:
.byte 197,254,111,116,36,192 // vmovdqu -0x40(%rsp),%ymm6
.byte 197,205,253,116,36,224 // vpaddw -0x20(%rsp),%ymm6,%ymm6
.byte 196,193,29,253,253 // vpaddw %ymm13,%ymm12,%ymm7
- .byte 196,98,125,121,5,221,101,0,0 // vpbroadcastw 0x65dd(%rip),%ymm8 # 2c242 <_sk_overlay_sse2_8bit+0xe26>
+ .byte 196,98,125,121,5,241,107,0,0 // vpbroadcastw 0x6bf1(%rip),%ymm8 # 2cc82 <_sk_overlay_sse2_8bit+0xeaa>
.byte 196,193,109,253,208 // vpaddw %ymm8,%ymm2,%ymm2
.byte 197,229,253,210 // vpaddw %ymm2,%ymm3,%ymm2
.byte 196,193,85,253,216 // vpaddw %ymm8,%ymm5,%ymm3
@@ -46739,7 +46999,7 @@ _sk_overlay_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,178,101,0,0 // vpbroadcastw 0x65b2(%rip),%ymm4 # 2c244 <_sk_overlay_sse2_8bit+0xe28>
+ .byte 196,226,125,121,37,198,107,0,0 // vpbroadcastw 0x6bc6(%rip),%ymm4 # 2cc84 <_sk_overlay_sse2_8bit+0xeac>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,229,228,220 // vpmulhuw %ymm4,%ymm3,%ymm3
@@ -46782,13 +47042,13 @@ _sk_start_pipeline_sse41_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,192 // mov %rcx,-0x40(%rbp)
.byte 72,57,203 // cmp %rcx,%rbx
- .byte 115,83 // jae 25d76 <_sk_start_pipeline_sse41_8bit+0x82>
+ .byte 115,83 // jae 261a2 <_sk_start_pipeline_sse41_8bit+0x82>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,200 // mov %rax,-0x38(%rbp)
.byte 76,57,125,200 // cmp %r15,-0x38(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,35 // ja 25d5c <_sk_start_pipeline_sse41_8bit+0x68>
+ .byte 119,35 // ja 26188 <_sk_start_pipeline_sse41_8bit+0x68>
.byte 76,139,101,208 // mov -0x30(%rbp),%r12
.byte 49,255 // xor %edi,%edi
.byte 76,137,246 // mov %r14,%rsi
@@ -46799,16 +47059,16 @@ _sk_start_pipeline_sse41_8bit:
.byte 73,131,196,16 // add $0x10,%r12
.byte 77,57,252 // cmp %r15,%r12
.byte 73,137,212 // mov %rdx,%r12
- .byte 118,225 // jbe 25d3d <_sk_start_pipeline_sse41_8bit+0x49>
+ .byte 118,225 // jbe 26169 <_sk_start_pipeline_sse41_8bit+0x49>
.byte 76,137,255 // mov %r15,%rdi
.byte 72,41,215 // sub %rdx,%rdi
- .byte 116,9 // je 25d6d <_sk_start_pipeline_sse41_8bit+0x79>
+ .byte 116,9 // je 26199 <_sk_start_pipeline_sse41_8bit+0x79>
.byte 76,137,246 // mov %r14,%rsi
.byte 72,137,217 // mov %rbx,%rcx
.byte 65,255,213 // callq *%r13
.byte 72,255,195 // inc %rbx
.byte 72,59,93,192 // cmp -0x40(%rbp),%rbx
- .byte 117,185 // jne 25d2f <_sk_start_pipeline_sse41_8bit+0x3b>
+ .byte 117,185 // jne 2615b <_sk_start_pipeline_sse41_8bit+0x3b>
.byte 72,131,196,24 // add $0x18,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -46840,7 +47100,7 @@ HIDDEN _sk_set_rgb_sse41_8bit
FUNCTION(_sk_set_rgb_sse41_8bit)
_sk_set_rgb_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,228,90,0,0 // movss 0x5ae4(%rip),%xmm4 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,16,37,116,96,0,0 // movss 0x6074(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,76,15,44,197 // cvttss2si %xmm5,%r8
@@ -46855,7 +47115,7 @@ _sk_set_rgb_sse41_8bit:
.byte 68,9,200 // or %r9d,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,169,107,0,0 // movdqa 0x6ba9(%rip),%xmm5 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 102,15,111,45,189,113,0,0 // movdqa 0x71bd(%rip),%xmm5 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -46869,12 +47129,12 @@ FUNCTION(_sk_premul_sse41_8bit)
_sk_premul_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,149,107,0,0 // movdqa 0x6b95(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,5,169,113,0,0 // movdqa 0x71a9(%rip),%xmm0 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
- .byte 102,15,111,5,107,107,0,0 // movdqa 0x6b6b(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 102,15,111,5,127,113,0,0 // movdqa 0x717f(%rip),%xmm0 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -46907,7 +47167,7 @@ HIDDEN _sk_swap_rb_sse41_8bit
.globl _sk_swap_rb_sse41_8bit
FUNCTION(_sk_swap_rb_sse41_8bit)
_sk_swap_rb_sse41_8bit:
- .byte 102,15,111,37,8,107,0,0 // movdqa 0x6b08(%rip),%xmm4 # 2c9b0 <_sk_overlay_sse2_8bit+0x1594>
+ .byte 102,15,111,37,28,113,0,0 // movdqa 0x711c(%rip),%xmm4 # 2d3f0 <_sk_overlay_sse2_8bit+0x1618>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46935,7 +47195,7 @@ _sk_load_8888_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 25ef3 <_sk_load_8888_sse41_8bit+0x2d>
+ .byte 117,17 // jne 2631f <_sk_load_8888_sse41_8bit+0x2d>
.byte 243,67,15,111,76,152,16 // movdqu 0x10(%r8,%r11,4),%xmm1
.byte 243,67,15,111,4,152 // movdqu (%r8,%r11,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46946,24 +47206,24 @@ _sk_load_8888_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,228 // ja 25eef <_sk_load_8888_sse41_8bit+0x29>
+ .byte 119,228 // ja 2631b <_sk_load_8888_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 25f64 <_sk_load_8888_sse41_8bit+0x9e>
+ .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 26390 <_sk_load_8888_sse41_8bit+0x9e>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,110,4,152 // movd (%r8,%r11,4),%xmm0
- .byte 235,200 // jmp 25eef <_sk_load_8888_sse41_8bit+0x29>
+ .byte 235,200 // jmp 2631b <_sk_load_8888_sse41_8bit+0x29>
.byte 102,67,15,110,68,152,8 // movd 0x8(%r8,%r11,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,174 // jmp 25eef <_sk_load_8888_sse41_8bit+0x29>
+ .byte 235,174 // jmp 2631b <_sk_load_8888_sse41_8bit+0x29>
.byte 102,67,15,110,68,152,24 // movd 0x18(%r8,%r11,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,67,15,58,34,76,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm1
.byte 102,67,15,58,34,76,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm1
- .byte 235,136 // jmp 25ee9 <_sk_load_8888_sse41_8bit+0x23>
+ .byte 235,136 // jmp 26315 <_sk_load_8888_sse41_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -46975,7 +47235,7 @@ _sk_load_8888_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,221 // jmpq ffffffffde025f7c <_sk_overlay_sse2_8bit+0xffffffffddffab60>
+ .byte 233,255,255,255,221 // jmpq ffffffffde0263a8 <_sk_overlay_sse2_8bit+0xffffffffddffa5d0>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -46992,7 +47252,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 25fad <_sk_load_8888_dst_sse41_8bit+0x2d>
+ .byte 117,17 // jne 263d9 <_sk_load_8888_dst_sse41_8bit+0x2d>
.byte 243,67,15,111,92,152,16 // movdqu 0x10(%r8,%r11,4),%xmm3
.byte 243,67,15,111,20,152 // movdqu (%r8,%r11,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47003,24 +47263,24 @@ _sk_load_8888_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,228 // ja 25fa9 <_sk_load_8888_dst_sse41_8bit+0x29>
+ .byte 119,228 // ja 263d5 <_sk_load_8888_dst_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 2601c <_sk_load_8888_dst_sse41_8bit+0x9c>
+ .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 26448 <_sk_load_8888_dst_sse41_8bit+0x9c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,110,20,152 // movd (%r8,%r11,4),%xmm2
- .byte 235,200 // jmp 25fa9 <_sk_load_8888_dst_sse41_8bit+0x29>
+ .byte 235,200 // jmp 263d5 <_sk_load_8888_dst_sse41_8bit+0x29>
.byte 102,67,15,110,84,152,8 // movd 0x8(%r8,%r11,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,174 // jmp 25fa9 <_sk_load_8888_dst_sse41_8bit+0x29>
+ .byte 235,174 // jmp 263d5 <_sk_load_8888_dst_sse41_8bit+0x29>
.byte 102,67,15,110,84,152,24 // movd 0x18(%r8,%r11,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,67,15,58,34,92,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm3
.byte 102,67,15,58,34,92,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm3
- .byte 235,136 // jmp 25fa3 <_sk_load_8888_dst_sse41_8bit+0x23>
+ .byte 235,136 // jmp 263cf <_sk_load_8888_dst_sse41_8bit+0x23>
.byte 144 // nop
.byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp
.byte 255 // (bad)
@@ -47032,7 +47292,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 26031 <_sk_load_8888_dst_sse41_8bit+0xb1>
+ .byte 235,255 // jmp 2645d <_sk_load_8888_dst_sse41_8bit+0xb1>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 223,255 // (bad)
@@ -47051,7 +47311,7 @@ _sk_store_8888_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 26065 <_sk_store_8888_sse41_8bit+0x2d>
+ .byte 117,17 // jne 26491 <_sk_store_8888_sse41_8bit+0x2d>
.byte 243,67,15,127,4,152 // movdqu %xmm0,(%r8,%r11,4)
.byte 243,67,15,127,76,152,16 // movdqu %xmm1,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47060,22 +47320,22 @@ _sk_store_8888_sse41_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 26061 <_sk_store_8888_sse41_8bit+0x29>
+ .byte 119,236 // ja 2648d <_sk_store_8888_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,68,0,0,0 // lea 0x44(%rip),%r10 # 260c4 <_sk_store_8888_sse41_8bit+0x8c>
+ .byte 76,141,21,68,0,0,0 // lea 0x44(%rip),%r10 # 264f0 <_sk_store_8888_sse41_8bit+0x8c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,126,4,152 // movd %xmm0,(%r8,%r11,4)
- .byte 235,208 // jmp 26061 <_sk_store_8888_sse41_8bit+0x29>
+ .byte 235,208 // jmp 2648d <_sk_store_8888_sse41_8bit+0x29>
.byte 102,67,15,58,22,68,152,8,2 // pextrd $0x2,%xmm0,0x8(%r8,%r11,4)
.byte 102,67,15,214,4,152 // movq %xmm0,(%r8,%r11,4)
- .byte 235,191 // jmp 26061 <_sk_store_8888_sse41_8bit+0x29>
+ .byte 235,191 // jmp 2648d <_sk_store_8888_sse41_8bit+0x29>
.byte 102,67,15,58,22,76,152,24,2 // pextrd $0x2,%xmm1,0x18(%r8,%r11,4)
.byte 102,67,15,58,22,76,152,20,1 // pextrd $0x1,%xmm1,0x14(%r8,%r11,4)
.byte 102,67,15,126,76,152,16 // movd %xmm1,0x10(%r8,%r11,4)
.byte 243,67,15,127,4,152 // movdqu %xmm0,(%r8,%r11,4)
- .byte 235,158 // jmp 26061 <_sk_store_8888_sse41_8bit+0x29>
+ .byte 235,158 // jmp 2648d <_sk_store_8888_sse41_8bit+0x29>
.byte 144 // nop
.byte 197,255,255 // (bad)
.byte 255,214 // callq *%rsi
@@ -47110,10 +47370,10 @@ _sk_load_bgra_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 2611f <_sk_load_bgra_sse41_8bit+0x3f>
+ .byte 117,35 // jne 2654b <_sk_load_bgra_sse41_8bit+0x3f>
.byte 243,67,15,111,76,152,16 // movdqu 0x10(%r8,%r11,4),%xmm1
.byte 243,67,15,111,4,152 // movdqu (%r8,%r11,4),%xmm0
- .byte 102,15,111,37,159,104,0,0 // movdqa 0x689f(%rip),%xmm4 # 2c9b0 <_sk_overlay_sse2_8bit+0x1594>
+ .byte 102,15,111,37,179,110,0,0 // movdqa 0x6eb3(%rip),%xmm4 # 2d3f0 <_sk_overlay_sse2_8bit+0x1618>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47124,24 +47384,24 @@ _sk_load_bgra_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,210 // ja 26109 <_sk_load_bgra_sse41_8bit+0x29>
+ .byte 119,210 // ja 26535 <_sk_load_bgra_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 26190 <_sk_load_bgra_sse41_8bit+0xb0>
+ .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 265bc <_sk_load_bgra_sse41_8bit+0xb0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,110,4,152 // movd (%r8,%r11,4),%xmm0
- .byte 235,182 // jmp 26109 <_sk_load_bgra_sse41_8bit+0x29>
+ .byte 235,182 // jmp 26535 <_sk_load_bgra_sse41_8bit+0x29>
.byte 102,67,15,110,68,152,8 // movd 0x8(%r8,%r11,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,156 // jmp 26109 <_sk_load_bgra_sse41_8bit+0x29>
+ .byte 235,156 // jmp 26535 <_sk_load_bgra_sse41_8bit+0x29>
.byte 102,67,15,110,68,152,24 // movd 0x18(%r8,%r11,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,67,15,58,34,76,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm1
.byte 102,67,15,58,34,76,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm1
- .byte 233,115,255,255,255 // jmpq 26103 <_sk_load_bgra_sse41_8bit+0x23>
+ .byte 233,115,255,255,255 // jmpq 2652f <_sk_load_bgra_sse41_8bit+0x23>
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -47154,7 +47414,7 @@ _sk_load_bgra_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,221 // jmpq ffffffffde0261a8 <_sk_overlay_sse2_8bit+0xffffffffddffad8c>
+ .byte 233,255,255,255,221 // jmpq ffffffffde0265d4 <_sk_overlay_sse2_8bit+0xffffffffddffa7fc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -47171,10 +47431,10 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,35 // jne 261eb <_sk_load_bgra_dst_sse41_8bit+0x3f>
+ .byte 117,35 // jne 26617 <_sk_load_bgra_dst_sse41_8bit+0x3f>
.byte 243,67,15,111,92,152,16 // movdqu 0x10(%r8,%r11,4),%xmm3
.byte 243,67,15,111,20,152 // movdqu (%r8,%r11,4),%xmm2
- .byte 102,15,111,37,211,103,0,0 // movdqa 0x67d3(%rip),%xmm4 # 2c9b0 <_sk_overlay_sse2_8bit+0x1594>
+ .byte 102,15,111,37,231,109,0,0 // movdqa 0x6de7(%rip),%xmm4 # 2d3f0 <_sk_overlay_sse2_8bit+0x1618>
.byte 102,15,56,0,212 // pshufb %xmm4,%xmm2
.byte 102,15,56,0,220 // pshufb %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47185,24 +47445,24 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,210 // ja 261d5 <_sk_load_bgra_dst_sse41_8bit+0x29>
+ .byte 119,210 // ja 26601 <_sk_load_bgra_dst_sse41_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 2625c <_sk_load_bgra_dst_sse41_8bit+0xb0>
+ .byte 76,141,21,78,0,0,0 // lea 0x4e(%rip),%r10 # 26688 <_sk_load_bgra_dst_sse41_8bit+0xb0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,110,20,152 // movd (%r8,%r11,4),%xmm2
- .byte 235,182 // jmp 261d5 <_sk_load_bgra_dst_sse41_8bit+0x29>
+ .byte 235,182 // jmp 26601 <_sk_load_bgra_dst_sse41_8bit+0x29>
.byte 102,67,15,110,84,152,8 // movd 0x8(%r8,%r11,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,156 // jmp 261d5 <_sk_load_bgra_dst_sse41_8bit+0x29>
+ .byte 235,156 // jmp 26601 <_sk_load_bgra_dst_sse41_8bit+0x29>
.byte 102,67,15,110,84,152,24 // movd 0x18(%r8,%r11,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,67,15,58,34,92,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm3
.byte 102,67,15,58,34,92,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm3
- .byte 233,115,255,255,255 // jmpq 261cf <_sk_load_bgra_dst_sse41_8bit+0x23>
+ .byte 233,115,255,255,255 // jmpq 265fb <_sk_load_bgra_dst_sse41_8bit+0x23>
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -47215,7 +47475,7 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,221 // jmpq ffffffffde026274 <_sk_overlay_sse2_8bit+0xffffffffddffae58>
+ .byte 233,255,255,255,221 // jmpq ffffffffde0266a0 <_sk_overlay_sse2_8bit+0xffffffffddffa8c8>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -47231,13 +47491,13 @@ _sk_store_bgra_sse41_8bit:
.byte 73,193,224,2 // shl $0x2,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 102,15,111,53,25,103,0,0 // movdqa 0x6719(%rip),%xmm6 # 2c9b0 <_sk_overlay_sse2_8bit+0x1594>
+ .byte 102,15,111,53,45,109,0,0 // movdqa 0x6d2d(%rip),%xmm6 # 2d3f0 <_sk_overlay_sse2_8bit+0x1618>
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,56,0,238 // pshufb %xmm6,%xmm5
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,230 // pshufb %xmm6,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 262bf <_sk_store_bgra_sse41_8bit+0x47>
+ .byte 117,17 // jne 266eb <_sk_store_bgra_sse41_8bit+0x47>
.byte 243,67,15,127,36,152 // movdqu %xmm4,(%r8,%r11,4)
.byte 243,67,15,127,108,152,16 // movdqu %xmm5,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47246,22 +47506,22 @@ _sk_store_bgra_sse41_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 262bb <_sk_store_bgra_sse41_8bit+0x43>
+ .byte 119,236 // ja 266e7 <_sk_store_bgra_sse41_8bit+0x43>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,70,0,0,0 // lea 0x46(%rip),%r10 # 26320 <_sk_store_bgra_sse41_8bit+0xa8>
+ .byte 76,141,21,70,0,0,0 // lea 0x46(%rip),%r10 # 2674c <_sk_store_bgra_sse41_8bit+0xa8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,126,36,152 // movd %xmm4,(%r8,%r11,4)
- .byte 235,208 // jmp 262bb <_sk_store_bgra_sse41_8bit+0x43>
+ .byte 235,208 // jmp 266e7 <_sk_store_bgra_sse41_8bit+0x43>
.byte 102,67,15,58,22,100,152,8,2 // pextrd $0x2,%xmm4,0x8(%r8,%r11,4)
.byte 102,67,15,214,36,152 // movq %xmm4,(%r8,%r11,4)
- .byte 235,191 // jmp 262bb <_sk_store_bgra_sse41_8bit+0x43>
+ .byte 235,191 // jmp 266e7 <_sk_store_bgra_sse41_8bit+0x43>
.byte 102,67,15,58,22,108,152,24,2 // pextrd $0x2,%xmm5,0x18(%r8,%r11,4)
.byte 102,67,15,58,22,108,152,20,1 // pextrd $0x1,%xmm5,0x14(%r8,%r11,4)
.byte 102,67,15,126,108,152,16 // movd %xmm5,0x10(%r8,%r11,4)
.byte 243,67,15,127,36,152 // movdqu %xmm4,(%r8,%r11,4)
- .byte 235,158 // jmp 262bb <_sk_store_bgra_sse41_8bit+0x43>
+ .byte 235,158 // jmp 266e7 <_sk_store_bgra_sse41_8bit+0x43>
.byte 15,31,0 // nopl (%rax)
.byte 195 // retq
.byte 255 // (bad)
@@ -47287,6 +47547,196 @@ _sk_store_bgra_sse41_8bit:
.byte 255 // (bad)
.byte 255 // .byte 0xff
+HIDDEN _sk_store_565_sse41_8bit
+.globl _sk_store_565_sse41_8bit
+FUNCTION(_sk_store_565_sse41_8bit)
+_sk_store_565_sse41_8bit:
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,72,8 // movslq 0x8(%rax),%r9
+ .byte 76,99,193 // movslq %ecx,%r8
+ .byte 77,15,175,193 // imul %r9,%r8
+ .byte 77,1,192 // add %r8,%r8
+ .byte 76,3,0 // add (%rax),%r8
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 102,68,15,111,13,121,108,0,0 // movdqa 0x6c79(%rip),%xmm9 # 2d400 <_sk_overlay_sse2_8bit+0x1628>
+ .byte 102,68,15,111,193 // movdqa %xmm1,%xmm8
+ .byte 102,69,15,219,193 // pand %xmm9,%xmm8
+ .byte 102,68,15,219,200 // pand %xmm0,%xmm9
+ .byte 102,65,15,114,241,8 // pslld $0x8,%xmm9
+ .byte 102,65,15,114,240,8 // pslld $0x8,%xmm8
+ .byte 102,15,111,37,102,108,0,0 // movdqa 0x6c66(%rip),%xmm4 # 2d410 <_sk_overlay_sse2_8bit+0x1638>
+ .byte 102,15,111,249 // movdqa %xmm1,%xmm7
+ .byte 102,15,219,252 // pand %xmm4,%xmm7
+ .byte 102,15,219,224 // pand %xmm0,%xmm4
+ .byte 102,15,114,212,5 // psrld $0x5,%xmm4
+ .byte 102,15,114,215,5 // psrld $0x5,%xmm7
+ .byte 102,15,111,53,88,108,0,0 // movdqa 0x6c58(%rip),%xmm6 # 2d420 <_sk_overlay_sse2_8bit+0x1648>
+ .byte 102,15,111,232 // movdqa %xmm0,%xmm5
+ .byte 102,15,219,238 // pand %xmm6,%xmm5
+ .byte 102,15,219,241 // pand %xmm1,%xmm6
+ .byte 102,15,114,214,19 // psrld $0x13,%xmm6
+ .byte 102,15,114,213,19 // psrld $0x13,%xmm5
+ .byte 102,65,15,235,248 // por %xmm8,%xmm7
+ .byte 102,65,15,235,225 // por %xmm9,%xmm4
+ .byte 102,15,235,229 // por %xmm5,%xmm4
+ .byte 102,15,235,254 // por %xmm6,%xmm7
+ .byte 102,15,111,45,56,108,0,0 // movdqa 0x6c38(%rip),%xmm5 # 2d430 <_sk_overlay_sse2_8bit+0x1658>
+ .byte 102,15,56,0,253 // pshufb %xmm5,%xmm7
+ .byte 102,15,56,0,229 // pshufb %xmm5,%xmm4
+ .byte 102,15,108,231 // punpcklqdq %xmm7,%xmm4
+ .byte 72,133,255 // test %rdi,%rdi
+ .byte 117,10 // jne 26815 <_sk_store_565_sse41_8bit+0xad>
+ .byte 243,67,15,127,36,88 // movdqu %xmm4,(%r8,%r11,2)
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,137,249 // mov %edi,%r9d
+ .byte 65,128,225,7 // and $0x7,%r9b
+ .byte 65,254,201 // dec %r9b
+ .byte 65,128,249,6 // cmp $0x6,%r9b
+ .byte 119,236 // ja 26811 <_sk_store_565_sse41_8bit+0xa9>
+ .byte 69,15,182,201 // movzbl %r9b,%r9d
+ .byte 76,141,21,72,0,0,0 // lea 0x48(%rip),%r10 # 26878 <_sk_store_565_sse41_8bit+0x110>
+ .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
+ .byte 76,1,208 // add %r10,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 102,67,15,58,21,36,88,0 // pextrw $0x0,%xmm4,(%r8,%r11,2)
+ .byte 235,206 // jmp 26811 <_sk_store_565_sse41_8bit+0xa9>
+ .byte 102,67,15,58,21,100,88,4,2 // pextrw $0x2,%xmm4,0x4(%r8,%r11,2)
+ .byte 102,67,15,126,36,88 // movd %xmm4,(%r8,%r11,2)
+ .byte 235,189 // jmp 26811 <_sk_store_565_sse41_8bit+0xa9>
+ .byte 102,67,15,58,21,100,88,12,6 // pextrw $0x6,%xmm4,0xc(%r8,%r11,2)
+ .byte 102,67,15,58,21,100,88,10,5 // pextrw $0x5,%xmm4,0xa(%r8,%r11,2)
+ .byte 102,67,15,58,21,100,88,8,4 // pextrw $0x4,%xmm4,0x8(%r8,%r11,2)
+ .byte 102,67,15,214,36,88 // movq %xmm4,(%r8,%r11,2)
+ .byte 235,154 // jmp 26811 <_sk_store_565_sse41_8bit+0xa9>
+ .byte 144 // nop
+ .byte 193,255,255 // sar $0xff,%edi
+ .byte 255,212 // callq *%rsp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,203 // dec %ebx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,247 // push %rdi
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 238 // out %al,(%dx)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,229 // jmpq *%rbp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 220,255 // fdivr %st,%st(7)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
+HIDDEN _sk_load_565_dst_sse41_8bit
+.globl _sk_load_565_dst_sse41_8bit
+FUNCTION(_sk_load_565_dst_sse41_8bit)
+_sk_load_565_dst_sse41_8bit:
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,72,8 // movslq 0x8(%rax),%r9
+ .byte 76,99,193 // movslq %ecx,%r8
+ .byte 77,15,175,193 // imul %r9,%r8
+ .byte 77,1,192 // add %r8,%r8
+ .byte 76,3,0 // add (%rax),%r8
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 72,133,255 // test %rdi,%rdi
+ .byte 15,133,216,0,0,0 // jne 2698b <_sk_load_565_dst_sse41_8bit+0xf7>
+ .byte 243,67,15,111,28,88 // movdqu (%r8,%r11,2),%xmm3
+ .byte 102,15,239,228 // pxor %xmm4,%xmm4
+ .byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
+ .byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
+ .byte 102,15,111,53,66,102,0,0 // movdqa 0x6642(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,250 // movdqa %xmm2,%xmm7
+ .byte 102,15,219,254 // pand %xmm6,%xmm7
+ .byte 102,15,219,243 // pand %xmm3,%xmm6
+ .byte 102,15,114,214,8 // psrld $0x8,%xmm6
+ .byte 102,15,114,215,8 // psrld $0x8,%xmm7
+ .byte 102,15,111,45,100,102,0,0 // movdqa 0x6664(%rip),%xmm5 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 102,15,111,226 // movdqa %xmm2,%xmm4
+ .byte 102,15,219,229 // pand %xmm5,%xmm4
+ .byte 102,15,219,235 // pand %xmm3,%xmm5
+ .byte 102,15,114,245,19 // pslld $0x13,%xmm5
+ .byte 102,15,114,244,19 // pslld $0x13,%xmm4
+ .byte 102,15,235,231 // por %xmm7,%xmm4
+ .byte 102,15,235,238 // por %xmm6,%xmm5
+ .byte 102,15,111,53,30,102,0,0 // movdqa 0x661e(%rip),%xmm6 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 102,15,111,251 // movdqa %xmm3,%xmm7
+ .byte 102,15,219,254 // pand %xmm6,%xmm7
+ .byte 102,15,114,247,5 // pslld $0x5,%xmm7
+ .byte 102,68,15,111,5,40,107,0,0 // movdqa 0x6b28(%rip),%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0x1678>
+ .byte 102,65,15,219,216 // pand %xmm8,%xmm3
+ .byte 102,15,114,211,1 // psrld $0x1,%xmm3
+ .byte 102,15,235,223 // por %xmm7,%xmm3
+ .byte 102,15,235,221 // por %xmm5,%xmm3
+ .byte 102,15,114,213,5 // psrld $0x5,%xmm5
+ .byte 102,15,219,242 // pand %xmm2,%xmm6
+ .byte 102,15,114,246,5 // pslld $0x5,%xmm6
+ .byte 102,65,15,219,208 // pand %xmm8,%xmm2
+ .byte 102,15,114,210,1 // psrld $0x1,%xmm2
+ .byte 102,15,235,214 // por %xmm6,%xmm2
+ .byte 102,15,235,212 // por %xmm4,%xmm2
+ .byte 102,15,114,212,5 // psrld $0x5,%xmm4
+ .byte 102,15,111,53,217,106,0,0 // movdqa 0x6ad9(%rip),%xmm6 # 2d440 <_sk_overlay_sse2_8bit+0x1668>
+ .byte 102,15,219,230 // pand %xmm6,%xmm4
+ .byte 102,15,219,238 // pand %xmm6,%xmm5
+ .byte 102,15,111,53,89,106,0,0 // movdqa 0x6a59(%rip),%xmm6 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,235,214 // por %xmm6,%xmm2
+ .byte 102,15,235,212 // por %xmm4,%xmm2
+ .byte 102,15,235,222 // por %xmm6,%xmm3
+ .byte 102,15,235,221 // por %xmm5,%xmm3
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,137,249 // mov %edi,%r9d
+ .byte 65,128,225,7 // and $0x7,%r9b
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
+ .byte 65,254,201 // dec %r9b
+ .byte 65,128,249,6 // cmp $0x6,%r9b
+ .byte 15,135,22,255,255,255 // ja 268b9 <_sk_load_565_dst_sse41_8bit+0x25>
+ .byte 69,15,182,201 // movzbl %r9b,%r9d
+ .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # 26a10 <_sk_load_565_dst_sse41_8bit+0x17c>
+ .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
+ .byte 76,1,208 // add %r10,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
+ .byte 102,15,110,216 // movd %eax,%xmm3
+ .byte 233,244,254,255,255 // jmpq 268b9 <_sk_load_565_dst_sse41_8bit+0x25>
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
+ .byte 102,67,15,196,92,88,4,2 // pinsrw $0x2,0x4(%r8,%r11,2),%xmm3
+ .byte 102,67,15,110,20,88 // movd (%r8,%r11,2),%xmm2
+ .byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
+ .byte 233,215,254,255,255 // jmpq 268b9 <_sk_load_565_dst_sse41_8bit+0x25>
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
+ .byte 102,67,15,196,92,88,12,6 // pinsrw $0x6,0xc(%r8,%r11,2),%xmm3
+ .byte 102,67,15,196,92,88,10,5 // pinsrw $0x5,0xa(%r8,%r11,2),%xmm3
+ .byte 102,67,15,196,92,88,8,4 // pinsrw $0x4,0x8(%r8,%r11,2),%xmm3
+ .byte 243,67,15,126,20,88 // movq (%r8,%r11,2),%xmm2
+ .byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
+ .byte 233,170,254,255,255 // jmpq 268b9 <_sk_load_565_dst_sse41_8bit+0x25>
+ .byte 144 // nop
+ .byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,193 // inc %ecx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,181,255,255,255,238 // pushq -0x11000001(%rbp)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,230 // jmpq *%rsi
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 222,255 // fdivrp %st,%st(7)
+ .byte 255 // (bad)
+ .byte 255,210 // callq *%rdx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
HIDDEN _sk_load_a8_sse41_8bit
.globl _sk_load_a8_sse41_8bit
FUNCTION(_sk_load_a8_sse41_8bit)
@@ -47298,9 +47748,9 @@ _sk_load_a8_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,42 // jne 2637e <_sk_load_a8_sse41_8bit+0x42>
+ .byte 117,42 // jne 26a6e <_sk_load_a8_sse41_8bit+0x42>
.byte 102,67,15,56,48,12,24 // pmovzxbw (%r8,%r11,1),%xmm1
- .byte 102,15,219,13,237,94,0,0 // pand 0x5eed(%rip),%xmm1 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,13,61,98,0,0 // pand 0x623d(%rip),%xmm1 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -47313,15 +47763,15 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 2635b <_sk_load_a8_sse41_8bit+0x1f>
+ .byte 119,201 // ja 26a4b <_sk_load_a8_sse41_8bit+0x1f>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26414 <_sk_load_a8_sse41_8bit+0xd8>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26b04 <_sk_load_a8_sse41_8bit+0xd8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,170 // jmp 2635b <_sk_load_a8_sse41_8bit+0x1f>
+ .byte 235,170 // jmp 26a4b <_sk_load_a8_sse41_8bit+0x1f>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -47329,7 +47779,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 235,133 // jmp 2635b <_sk_load_a8_sse41_8bit+0x1f>
+ .byte 235,133 // jmp 26a4b <_sk_load_a8_sse41_8bit+0x1f>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -47340,7 +47790,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,67,15,110,4,24 // movd (%r8,%r11,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,74,255,255,255 // jmpq 2635b <_sk_load_a8_sse41_8bit+0x1f>
+ .byte 233,74,255,255,255 // jmpq 26a4b <_sk_load_a8_sse41_8bit+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -47372,9 +47822,9 @@ _sk_load_a8_dst_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,42 // jne 26472 <_sk_load_a8_dst_sse41_8bit+0x42>
+ .byte 117,42 // jne 26b62 <_sk_load_a8_dst_sse41_8bit+0x42>
.byte 102,67,15,56,48,28,24 // pmovzxbw (%r8,%r11,1),%xmm3
- .byte 102,15,219,29,249,93,0,0 // pand 0x5df9(%rip),%xmm3 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,29,73,97,0,0 // pand 0x6149(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -47387,15 +47837,15 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 2644f <_sk_load_a8_dst_sse41_8bit+0x1f>
+ .byte 119,201 // ja 26b3f <_sk_load_a8_dst_sse41_8bit+0x1f>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26508 <_sk_load_a8_dst_sse41_8bit+0xd8>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26bf8 <_sk_load_a8_dst_sse41_8bit+0xd8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,170 // jmp 2644f <_sk_load_a8_dst_sse41_8bit+0x1f>
+ .byte 235,170 // jmp 26b3f <_sk_load_a8_dst_sse41_8bit+0x1f>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -47403,7 +47853,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 235,133 // jmp 2644f <_sk_load_a8_dst_sse41_8bit+0x1f>
+ .byte 235,133 // jmp 26b3f <_sk_load_a8_dst_sse41_8bit+0x1f>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -47414,7 +47864,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,67,15,110,20,24 // movd (%r8,%r11,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,74,255,255,255 // jmpq 2644f <_sk_load_a8_dst_sse41_8bit+0x1f>
+ .byte 233,74,255,255,255 // jmpq 26b3f <_sk_load_a8_dst_sse41_8bit+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -47445,15 +47895,15 @@ _sk_store_a8_sse41_8bit:
.byte 77,15,175,193 // imul %r9,%r8
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
- .byte 102,15,111,45,129,100,0,0 // movdqa 0x6481(%rip),%xmm5 # 2c9c0 <_sk_overlay_sse2_8bit+0x15a4>
+ .byte 102,15,111,45,49,104,0,0 // movdqa 0x6831(%rip),%xmm5 # 2d460 <_sk_overlay_sse2_8bit+0x1688>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,245 // pshufb %xmm5,%xmm6
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,229 // pshufb %xmm5,%xmm4
.byte 102,15,108,230 // punpcklqdq %xmm6,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,19 // jne 2656d <_sk_store_a8_sse41_8bit+0x49>
- .byte 102,15,56,0,37,29,100,0,0 // pshufb 0x641d(%rip),%xmm4 # 2c980 <_sk_overlay_sse2_8bit+0x1564>
+ .byte 117,19 // jne 26c5d <_sk_store_a8_sse41_8bit+0x49>
+ .byte 102,15,56,0,37,109,103,0,0 // pshufb 0x676d(%rip),%xmm4 # 2d3c0 <_sk_overlay_sse2_8bit+0x15e8>
.byte 102,67,15,214,36,24 // movq %xmm4,(%r8,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -47461,24 +47911,24 @@ _sk_store_a8_sse41_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 26569 <_sk_store_a8_sse41_8bit+0x45>
+ .byte 119,236 // ja 26c59 <_sk_store_a8_sse41_8bit+0x45>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,92,0,0,0 // lea 0x5c(%rip),%r10 # 265e4 <_sk_store_a8_sse41_8bit+0xc0>
+ .byte 76,141,21,92,0,0,0 // lea 0x5c(%rip),%r10 # 26cd4 <_sk_store_a8_sse41_8bit+0xc0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,58,20,36,24,0 // pextrb $0x0,%xmm4,(%r8,%r11,1)
- .byte 235,206 // jmp 26569 <_sk_store_a8_sse41_8bit+0x45>
+ .byte 235,206 // jmp 26c59 <_sk_store_a8_sse41_8bit+0x45>
.byte 102,67,15,58,20,100,24,2,4 // pextrb $0x4,%xmm4,0x2(%r8,%r11,1)
- .byte 102,15,56,0,37,179,92,0,0 // pshufb 0x5cb3(%rip),%xmm4 # 2c260 <_sk_overlay_sse2_8bit+0xe44>
+ .byte 102,15,56,0,37,3,96,0,0 // pshufb 0x6003(%rip),%xmm4 # 2cca0 <_sk_overlay_sse2_8bit+0xec8>
.byte 102,67,15,58,21,36,24,0 // pextrw $0x0,%xmm4,(%r8,%r11,1)
- .byte 235,178 // jmp 26569 <_sk_store_a8_sse41_8bit+0x45>
+ .byte 235,178 // jmp 26c59 <_sk_store_a8_sse41_8bit+0x45>
.byte 102,67,15,58,20,100,24,6,12 // pextrb $0xc,%xmm4,0x6(%r8,%r11,1)
.byte 102,67,15,58,20,100,24,5,10 // pextrb $0xa,%xmm4,0x5(%r8,%r11,1)
.byte 102,67,15,58,20,100,24,4,8 // pextrb $0x8,%xmm4,0x4(%r8,%r11,1)
- .byte 102,15,56,0,37,149,92,0,0 // pshufb 0x5c95(%rip),%xmm4 # 2c270 <_sk_overlay_sse2_8bit+0xe54>
+ .byte 102,15,56,0,37,229,95,0,0 // pshufb 0x5fe5(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0xed8>
.byte 102,67,15,126,36,24 // movd %xmm4,(%r8,%r11,1)
- .byte 235,134 // jmp 26569 <_sk_store_a8_sse41_8bit+0x45>
+ .byte 235,134 // jmp 26c59 <_sk_store_a8_sse41_8bit+0x45>
.byte 144 // nop
.byte 173 // lods %ds:(%rsi),%eax
.byte 255 // (bad)
@@ -47511,16 +47961,16 @@ _sk_load_g8_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne 2665a <_sk_load_g8_sse41_8bit+0x5a>
+ .byte 117,66 // jne 26d4a <_sk_load_g8_sse41_8bit+0x5a>
.byte 102,67,15,56,48,12,24 // pmovzxbw (%r8,%r11,1),%xmm1
- .byte 102,15,219,13,41,92,0,0 // pand 0x5c29(%rip),%xmm1 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,13,121,95,0,0 // pand 0x5f79(%rip),%xmm1 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
- .byte 102,15,111,37,148,99,0,0 // movdqa 0x6394(%rip),%xmm4 # 2c9d0 <_sk_overlay_sse2_8bit+0x15b4>
+ .byte 102,15,111,37,68,103,0,0 // movdqa 0x6744(%rip),%xmm4 # 2d470 <_sk_overlay_sse2_8bit+0x1698>
.byte 102,15,56,64,204 // pmulld %xmm4,%xmm1
.byte 102,15,56,64,196 // pmulld %xmm4,%xmm0
- .byte 102,15,111,37,66,99,0,0 // movdqa 0x6342(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 102,15,111,37,146,102,0,0 // movdqa 0x6692(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47530,15 +47980,15 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,177 // ja 2661f <_sk_load_g8_sse41_8bit+0x1f>
+ .byte 119,177 // ja 26d0f <_sk_load_g8_sse41_8bit+0x1f>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 266f0 <_sk_load_g8_sse41_8bit+0xf0>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26de0 <_sk_load_g8_sse41_8bit+0xf0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,146 // jmp 2661f <_sk_load_g8_sse41_8bit+0x1f>
+ .byte 235,146 // jmp 26d0f <_sk_load_g8_sse41_8bit+0x1f>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -47546,7 +47996,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 233,106,255,255,255 // jmpq 2661f <_sk_load_g8_sse41_8bit+0x1f>
+ .byte 233,106,255,255,255 // jmpq 26d0f <_sk_load_g8_sse41_8bit+0x1f>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -47557,7 +48007,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,67,15,110,4,24 // movd (%r8,%r11,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,47,255,255,255 // jmpq 2661f <_sk_load_g8_sse41_8bit+0x1f>
+ .byte 233,47,255,255,255 // jmpq 26d0f <_sk_load_g8_sse41_8bit+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -47589,16 +48039,16 @@ _sk_load_g8_dst_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,66 // jne 26766 <_sk_load_g8_dst_sse41_8bit+0x5a>
+ .byte 117,66 // jne 26e56 <_sk_load_g8_dst_sse41_8bit+0x5a>
.byte 102,67,15,56,48,28,24 // pmovzxbw (%r8,%r11,1),%xmm3
- .byte 102,15,219,29,29,91,0,0 // pand 0x5b1d(%rip),%xmm3 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,29,109,94,0,0 // pand 0x5e6d(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
- .byte 102,15,111,37,136,98,0,0 // movdqa 0x6288(%rip),%xmm4 # 2c9d0 <_sk_overlay_sse2_8bit+0x15b4>
+ .byte 102,15,111,37,56,102,0,0 // movdqa 0x6638(%rip),%xmm4 # 2d470 <_sk_overlay_sse2_8bit+0x1698>
.byte 102,15,56,64,220 // pmulld %xmm4,%xmm3
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
- .byte 102,15,111,37,54,98,0,0 // movdqa 0x6236(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 102,15,111,37,134,101,0,0 // movdqa 0x6586(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47608,15 +48058,15 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,177 // ja 2672b <_sk_load_g8_dst_sse41_8bit+0x1f>
+ .byte 119,177 // ja 26e1b <_sk_load_g8_dst_sse41_8bit+0x1f>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 267fc <_sk_load_g8_dst_sse41_8bit+0xf0>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 26eec <_sk_load_g8_dst_sse41_8bit+0xf0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,146 // jmp 2672b <_sk_load_g8_dst_sse41_8bit+0x1f>
+ .byte 235,146 // jmp 26e1b <_sk_load_g8_dst_sse41_8bit+0x1f>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -47624,7 +48074,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 233,106,255,255,255 // jmpq 2672b <_sk_load_g8_dst_sse41_8bit+0x1f>
+ .byte 233,106,255,255,255 // jmpq 26e1b <_sk_load_g8_dst_sse41_8bit+0x1f>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -47635,7 +48085,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,67,15,110,20,24 // movd (%r8,%r11,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,47,255,255,255 // jmpq 2672b <_sk_load_g8_dst_sse41_8bit+0x1f>
+ .byte 233,47,255,255,255 // jmpq 26e1b <_sk_load_g8_dst_sse41_8bit+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -47668,11 +48118,11 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,206,0,0,0 // jne 26906 <_sk_srcover_rgba_8888_sse41_8bit+0xee>
+ .byte 15,133,206,0,0,0 // jne 26ff6 <_sk_srcover_rgba_8888_sse41_8bit+0xee>
.byte 243,71,15,111,68,152,16 // movdqu 0x10(%r8,%r11,4),%xmm8
.byte 243,71,15,111,12,152 // movdqu (%r8,%r11,4),%xmm9
.byte 72,133,255 // test %rdi,%rdi
- .byte 102,15,111,37,80,97,0,0 // movdqa 0x6150(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,37,160,100,0,0 // movdqa 0x64a0(%rip),%xmm4 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,244 // pshufb %xmm4,%xmm6
.byte 102,15,111,248 // movdqa %xmm0,%xmm7
@@ -47706,7 +48156,7 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,68,15,248,204 // psubb %xmm4,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,78 // jne 26943 <_sk_srcover_rgba_8888_sse41_8bit+0x12b>
+ .byte 117,78 // jne 27033 <_sk_srcover_rgba_8888_sse41_8bit+0x12b>
.byte 243,71,15,127,12,152 // movdqu %xmm9,(%r8,%r11,4)
.byte 243,71,15,127,68,152,16 // movdqu %xmm8,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47717,44 +48167,44 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,33,255,255,255 // ja 26845 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ .byte 15,135,33,255,255,255 // ja 26f35 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,189,0,0,0 // lea 0xbd(%rip),%r10 # 269ec <_sk_srcover_rgba_8888_sse41_8bit+0x1d4>
+ .byte 76,141,21,189,0,0,0 // lea 0xbd(%rip),%r10 # 270dc <_sk_srcover_rgba_8888_sse41_8bit+0x1d4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,71,15,110,12,152 // movd (%r8,%r11,4),%xmm9
- .byte 233,2,255,255,255 // jmpq 26845 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ .byte 233,2,255,255,255 // jmpq 26f35 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,175 // ja 26902 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ .byte 119,175 // ja 26ff2 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 76,141,13,170,0,0,0 // lea 0xaa(%rip),%r9 # 26a08 <_sk_srcover_rgba_8888_sse41_8bit+0x1f0>
+ .byte 76,141,13,170,0,0,0 // lea 0xaa(%rip),%r9 # 270f8 <_sk_srcover_rgba_8888_sse41_8bit+0x1f0>
.byte 73,99,4,129 // movslq (%r9,%rax,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
.byte 102,71,15,126,12,152 // movd %xmm9,(%r8,%r11,4)
- .byte 235,147 // jmp 26902 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ .byte 235,147 // jmp 26ff2 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
.byte 102,67,15,110,100,152,8 // movd 0x8(%r8,%r11,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 243,67,15,126,36,152 // movq (%r8,%r11,4),%xmm4
.byte 102,68,15,58,14,204,15 // pblendw $0xf,%xmm4,%xmm9
- .byte 233,183,254,255,255 // jmpq 26845 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ .byte 233,183,254,255,255 // jmpq 26f35 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
.byte 102,67,15,110,100,152,24 // movd 0x18(%r8,%r11,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 102,71,15,58,34,68,152,20,1 // pinsrd $0x1,0x14(%r8,%r11,4),%xmm8
.byte 102,71,15,58,34,68,152,16,0 // pinsrd $0x0,0x10(%r8,%r11,4),%xmm8
- .byte 233,141,254,255,255 // jmpq 2683f <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ .byte 233,141,254,255,255 // jmpq 26f2f <_sk_srcover_rgba_8888_sse41_8bit+0x27>
.byte 102,71,15,58,22,76,152,8,2 // pextrd $0x2,%xmm9,0x8(%r8,%r11,4)
.byte 102,71,15,214,12,152 // movq %xmm9,(%r8,%r11,4)
- .byte 233,60,255,255,255 // jmpq 26902 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ .byte 233,60,255,255,255 // jmpq 26ff2 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
.byte 102,71,15,58,22,68,152,24,2 // pextrd $0x2,%xmm8,0x18(%r8,%r11,4)
.byte 102,71,15,58,22,68,152,20,1 // pextrd $0x1,%xmm8,0x14(%r8,%r11,4)
.byte 102,71,15,126,68,152,16 // movd %xmm8,0x10(%r8,%r11,4)
.byte 243,71,15,127,12,152 // movdqu %xmm9,(%r8,%r11,4)
- .byte 233,24,255,255,255 // jmpq 26902 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ .byte 233,24,255,255,255 // jmpq 26ff2 <_sk_srcover_rgba_8888_sse41_8bit+0xea>
.byte 102,144 // xchg %ax,%ax
.byte 76,255 // rex.WR (bad)
.byte 255 // (bad)
@@ -47796,7 +48246,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,78,78,0,0 // mulss 0x4e4e(%rip),%xmm0 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,89,5,26,81,0,0 // mulss 0x511a(%rip),%xmm0 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,68,15,56,48,197 // pmovzxbw %xmm5,%xmm8
@@ -47804,7 +48254,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,68,15,56,48,204 // pmovzxbw %xmm4,%xmm9
.byte 102,15,104,224 // punpckhbw %xmm0,%xmm4
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 102,15,56,0,53,126,95,0,0 // pshufb 0x5f7e(%rip),%xmm6 # 2c9e0 <_sk_overlay_sse2_8bit+0x15c4>
+ .byte 102,15,56,0,53,46,99,0,0 // pshufb 0x632e(%rip),%xmm6 # 2d480 <_sk_overlay_sse2_8bit+0x16a8>
.byte 102,15,111,206 // movdqa %xmm6,%xmm1
.byte 102,65,15,213,201 // pmullw %xmm9,%xmm1
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
@@ -47836,13 +48286,13 @@ _sk_scale_u8_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,160,0,0,0 // jne 26b6e <_sk_scale_u8_sse41_8bit+0xbc>
+ .byte 15,133,160,0,0,0 // jne 2725e <_sk_scale_u8_sse41_8bit+0xbc>
.byte 102,67,15,56,48,52,24 // pmovzxbw (%r8,%r11,1),%xmm6
- .byte 102,15,219,53,115,87,0,0 // pand 0x5773(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,53,195,90,0,0 // pand 0x5ac3(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
- .byte 102,15,56,0,61,1,95,0,0 // pshufb 0x5f01(%rip),%xmm7 # 2c9f0 <_sk_overlay_sse2_8bit+0x15d4>
- .byte 102,15,56,0,53,8,95,0,0 // pshufb 0x5f08(%rip),%xmm6 # 2ca00 <_sk_overlay_sse2_8bit+0x15e4>
+ .byte 102,15,56,0,61,177,98,0,0 // pshufb 0x62b1(%rip),%xmm7 # 2d490 <_sk_overlay_sse2_8bit+0x16b8>
+ .byte 102,15,56,0,53,184,98,0,0 // pshufb 0x62b8(%rip),%xmm6 # 2d4a0 <_sk_overlay_sse2_8bit+0x16c8>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -47874,15 +48324,15 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,79,255,255,255 // ja 26ad5 <_sk_scale_u8_sse41_8bit+0x23>
+ .byte 15,135,79,255,255,255 // ja 271c5 <_sk_scale_u8_sse41_8bit+0x23>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,123,0,0,0 // lea 0x7b(%rip),%r10 # 26c0c <_sk_scale_u8_sse41_8bit+0x15a>
+ .byte 76,141,21,123,0,0,0 // lea 0x7b(%rip),%r10 # 272fc <_sk_scale_u8_sse41_8bit+0x15a>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,45,255,255,255 // jmpq 26ad5 <_sk_scale_u8_sse41_8bit+0x23>
+ .byte 233,45,255,255,255 // jmpq 271c5 <_sk_scale_u8_sse41_8bit+0x23>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,2 // pinsrw $0x2,%eax,%xmm6
@@ -47890,7 +48340,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,3 // pblendw $0x3,%xmm4,%xmm6
- .byte 233,5,255,255,255 // jmpq 26ad5 <_sk_scale_u8_sse41_8bit+0x23>
+ .byte 233,5,255,255,255 // jmpq 271c5 <_sk_scale_u8_sse41_8bit+0x23>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,6 // pinsrw $0x6,%eax,%xmm6
@@ -47901,7 +48351,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,67,15,110,36,24 // movd (%r8,%r11,1),%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,202,254,255,255 // jmpq 26ad5 <_sk_scale_u8_sse41_8bit+0x23>
+ .byte 233,202,254,255,255 // jmpq 271c5 <_sk_scale_u8_sse41_8bit+0x23>
.byte 144 // nop
.byte 142,255 // mov %edi,%?
.byte 255 // (bad)
@@ -47909,7 +48359,7 @@ _sk_scale_u8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf026c1c <_sk_overlay_sse2_8bit+0xffffffffdeffb800>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf02730c <_sk_overlay_sse2_8bit+0xffffffffdeffb534>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -47926,7 +48376,7 @@ FUNCTION(_sk_lerp_1_float_sse41_8bit)
_sk_lerp_1_float_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,82,76,0,0 // mulss 0x4c52(%rip),%xmm4 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,89,37,30,79,0,0 // mulss 0x4f1e(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -47937,7 +48387,7 @@ _sk_lerp_1_float_sse41_8bit:
.byte 102,65,15,104,193 // punpckhbw %xmm9,%xmm0
.byte 102,68,15,56,48,217 // pmovzxbw %xmm1,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,56,0,61,159,93,0,0 // pshufb 0x5d9f(%rip),%xmm7 # 2ca10 <_sk_overlay_sse2_8bit+0x15f4>
+ .byte 102,15,56,0,61,79,97,0,0 // pshufb 0x614f(%rip),%xmm7 # 2d4b0 <_sk_overlay_sse2_8bit+0x16d8>
.byte 102,68,15,111,231 // movdqa %xmm7,%xmm12
.byte 102,69,15,213,227 // pmullw %xmm11,%xmm12
.byte 102,68,15,111,239 // movdqa %xmm7,%xmm13
@@ -47997,13 +48447,13 @@ _sk_lerp_u8_sse41_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,46,1,0,0 // jne 26e94 <_sk_lerp_u8_sse41_8bit+0x14a>
+ .byte 15,133,46,1,0,0 // jne 27584 <_sk_lerp_u8_sse41_8bit+0x14a>
.byte 102,67,15,56,48,60,24 // pmovzxbw (%r8,%r11,1),%xmm7
- .byte 102,15,219,61,219,84,0,0 // pand 0x54db(%rip),%xmm7 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,61,43,88,0,0 // pand 0x582b(%rip),%xmm7 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,105,92,0,0 // pshufb 0x5c69(%rip),%xmm6 # 2c9f0 <_sk_overlay_sse2_8bit+0x15d4>
- .byte 102,15,56,0,61,112,92,0,0 // pshufb 0x5c70(%rip),%xmm7 # 2ca00 <_sk_overlay_sse2_8bit+0x15e4>
+ .byte 102,15,56,0,53,25,96,0,0 // pshufb 0x6019(%rip),%xmm6 # 2d490 <_sk_overlay_sse2_8bit+0x16b8>
+ .byte 102,15,56,0,61,32,96,0,0 // pshufb 0x6020(%rip),%xmm7 # 2d4a0 <_sk_overlay_sse2_8bit+0x16c8>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -48064,15 +48514,15 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,193,254,255,255 // ja 26d6d <_sk_lerp_u8_sse41_8bit+0x23>
+ .byte 15,135,193,254,255,255 // ja 2745d <_sk_lerp_u8_sse41_8bit+0x23>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,125,0,0,0 // lea 0x7d(%rip),%r10 # 26f34 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ .byte 76,141,21,125,0,0,0 // lea 0x7d(%rip),%r10 # 27624 <_sk_lerp_u8_sse41_8bit+0x1ea>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,159,254,255,255 // jmpq 26d6d <_sk_lerp_u8_sse41_8bit+0x23>
+ .byte 233,159,254,255,255 // jmpq 2745d <_sk_lerp_u8_sse41_8bit+0x23>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,2 // pinsrw $0x2,%eax,%xmm7
@@ -48080,7 +48530,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,3 // pblendw $0x3,%xmm5,%xmm7
- .byte 233,119,254,255,255 // jmpq 26d6d <_sk_lerp_u8_sse41_8bit+0x23>
+ .byte 233,119,254,255,255 // jmpq 2745d <_sk_lerp_u8_sse41_8bit+0x23>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,6 // pinsrw $0x6,%eax,%xmm7
@@ -48091,7 +48541,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,67,15,110,44,24 // movd (%r8,%r11,1),%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,15 // pblendw $0xf,%xmm5,%xmm7
- .byte 233,60,254,255,255 // jmpq 26d6d <_sk_lerp_u8_sse41_8bit+0x23>
+ .byte 233,60,254,255,255 // jmpq 2745d <_sk_lerp_u8_sse41_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 140,255 // mov %?,%edi
.byte 255 // (bad)
@@ -48135,7 +48585,7 @@ HIDDEN _sk_black_color_sse41_8bit
FUNCTION(_sk_black_color_sse41_8bit)
_sk_black_color_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,35,90,0,0 // movaps 0x5a23(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 15,40,5,115,93,0,0 // movaps 0x5d73(%rip),%xmm0 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -48161,7 +48611,7 @@ HIDDEN _sk_srcatop_sse41_8bit
.globl _sk_srcatop_sse41_8bit
FUNCTION(_sk_srcatop_sse41_8bit)
_sk_srcatop_sse41_8bit:
- .byte 102,68,15,111,21,15,90,0,0 // movdqa 0x5a0f(%rip),%xmm10 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,68,15,111,21,95,93,0,0 // movdqa 0x5d5f(%rip),%xmm10 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,195 // pmovzxbw %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
@@ -48231,7 +48681,7 @@ HIDDEN _sk_dstatop_sse41_8bit
.globl _sk_dstatop_sse41_8bit
FUNCTION(_sk_dstatop_sse41_8bit)
_sk_dstatop_sse41_8bit:
- .byte 102,68,15,111,29,212,88,0,0 // movdqa 0x58d4(%rip),%xmm11 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,68,15,111,29,36,92,0,0 // movdqa 0x5c24(%rip),%xmm11 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,69,15,56,0,235 // pshufb %xmm11,%xmm13
.byte 102,68,15,111,248 // movdqa %xmm0,%xmm15
@@ -48303,7 +48753,7 @@ FUNCTION(_sk_srcin_sse41_8bit)
_sk_srcin_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,139,87,0,0 // movdqa 0x578b(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,5,219,90,0,0 // movdqa 0x5adb(%rip),%xmm0 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
@@ -48339,7 +48789,7 @@ HIDDEN _sk_dstin_sse41_8bit
FUNCTION(_sk_dstin_sse41_8bit)
_sk_dstin_sse41_8bit:
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,250,86,0,0 // movdqa 0x56fa(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,5,74,90,0,0 // movdqa 0x5a4a(%rip),%xmm0 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,15,56,0,200 // pshufb %xmm0,%xmm1
.byte 102,15,56,0,232 // pshufb %xmm0,%xmm5
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
@@ -48377,7 +48827,7 @@ FUNCTION(_sk_srcout_sse41_8bit)
_sk_srcout_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,97,86,0,0 // movdqa 0x5661(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,5,177,89,0,0 // movdqa 0x59b1(%rip),%xmm0 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -48415,7 +48865,7 @@ HIDDEN _sk_dstout_sse41_8bit
.globl _sk_dstout_sse41_8bit
FUNCTION(_sk_dstout_sse41_8bit)
_sk_dstout_sse41_8bit:
- .byte 102,15,111,37,200,85,0,0 // movdqa 0x55c8(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,37,24,89,0,0 // movdqa 0x5918(%rip),%xmm4 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,118,228 // pcmpeqd %xmm4,%xmm4
@@ -48455,7 +48905,7 @@ HIDDEN _sk_srcover_sse41_8bit
.globl _sk_srcover_sse41_8bit
FUNCTION(_sk_srcover_sse41_8bit)
_sk_srcover_sse41_8bit:
- .byte 102,15,111,53,39,85,0,0 // movdqa 0x5527(%rip),%xmm6 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,53,119,88,0,0 // movdqa 0x5877(%rip),%xmm6 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,68,15,56,0,222 // pshufb %xmm6,%xmm11
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
@@ -48496,7 +48946,7 @@ HIDDEN _sk_dstover_sse41_8bit
.globl _sk_dstover_sse41_8bit
FUNCTION(_sk_dstover_sse41_8bit)
_sk_dstover_sse41_8bit:
- .byte 102,68,15,111,5,119,84,0,0 // movdqa 0x5477(%rip),%xmm8 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,68,15,111,5,199,87,0,0 // movdqa 0x57c7(%rip),%xmm8 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,111,209 // movdqa %xmm1,%xmm10
.byte 102,68,15,56,48,201 // pmovzxbw %xmm1,%xmm9
.byte 102,15,252,203 // paddb %xmm3,%xmm1
@@ -48575,7 +49025,7 @@ _sk_multiply_sse41_8bit:
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,53,53,83,0,0 // movdqa 0x5335(%rip),%xmm14 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,68,15,111,53,133,86,0,0 // movdqa 0x5685(%rip),%xmm14 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,111,195 // movdqa %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,65,15,56,0,238 // pshufb %xmm14,%xmm5
@@ -48704,7 +49154,7 @@ HIDDEN _sk_xor__sse41_8bit
.globl _sk_xor__sse41_8bit
FUNCTION(_sk_xor__sse41_8bit)
_sk_xor__sse41_8bit:
- .byte 102,68,15,111,21,243,80,0,0 // movdqa 0x50f3(%rip),%xmm10 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,68,15,111,21,67,84,0,0 // movdqa 0x5443(%rip),%xmm10 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,111,226 // movdqa %xmm2,%xmm12
.byte 102,68,15,56,48,194 // pmovzxbw %xmm2,%xmm8
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
@@ -48786,7 +49236,7 @@ HIDDEN _sk_darken_sse41_8bit
FUNCTION(_sk_darken_sse41_8bit)
_sk_darken_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,154,79,0,0 // movdqa 0x4f9a(%rip),%xmm8 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,68,15,111,5,234,82,0,0 // movdqa 0x52ea(%rip),%xmm8 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -48853,7 +49303,7 @@ _sk_darken_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,206,78,0,0 // movaps 0x4ece(%rip),%xmm0 # 2ca20 <_sk_overlay_sse2_8bit+0x1604>
+ .byte 15,40,5,126,82,0,0 // movaps 0x527e(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48865,7 +49315,7 @@ HIDDEN _sk_lighten_sse41_8bit
FUNCTION(_sk_lighten_sse41_8bit)
_sk_lighten_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,43,78,0,0 // movdqa 0x4e2b(%rip),%xmm8 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,68,15,111,5,123,81,0,0 // movdqa 0x517b(%rip),%xmm8 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -48932,7 +49382,7 @@ _sk_lighten_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,95,77,0,0 // movaps 0x4d5f(%rip),%xmm0 # 2ca20 <_sk_overlay_sse2_8bit+0x1604>
+ .byte 15,40,5,15,81,0,0 // movaps 0x510f(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48972,7 +49422,7 @@ _sk_exclusion_sse41_8bit:
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,253 // packuswb %xmm5,%xmm7
.byte 102,15,103,230 // packuswb %xmm6,%xmm4
- .byte 102,15,111,45,181,76,0,0 // movdqa 0x4cb5(%rip),%xmm5 # 2ca20 <_sk_overlay_sse2_8bit+0x1604>
+ .byte 102,15,111,45,101,80,0,0 // movdqa 0x5065(%rip),%xmm5 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
.byte 102,15,248,204 // psubb %xmm4,%xmm1
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,15,219,239 // pand %xmm7,%xmm5
@@ -48987,7 +49437,7 @@ HIDDEN _sk_difference_sse41_8bit
FUNCTION(_sk_difference_sse41_8bit)
_sk_difference_sse41_8bit:
.byte 102,68,15,111,193 // movdqa %xmm1,%xmm8
- .byte 102,15,111,13,12,76,0,0 // movdqa 0x4c0c(%rip),%xmm1 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,13,92,79,0,0 // movdqa 0x4f5c(%rip),%xmm1 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -49025,7 +49475,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,254 // packuswb %xmm6,%xmm7
- .byte 102,15,111,37,81,75,0,0 // movdqa 0x4b51(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,37,161,78,0,0 // movdqa 0x4ea1(%rip),%xmm4 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,56,0,236 // pshufb %xmm4,%xmm5
.byte 102,69,15,104,236 // punpckhbw %xmm12,%xmm13
@@ -49050,7 +49500,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,103,241 // packuswb %xmm1,%xmm6
.byte 102,65,15,218,230 // pminub %xmm14,%xmm4
.byte 102,15,218,247 // pminub %xmm7,%xmm6
- .byte 102,15,111,13,84,75,0,0 // movdqa 0x4b54(%rip),%xmm1 # 2ca20 <_sk_overlay_sse2_8bit+0x1604>
+ .byte 102,15,111,13,4,79,0,0 // movdqa 0x4f04(%rip),%xmm1 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
.byte 102,68,15,248,198 // psubb %xmm6,%xmm8
.byte 102,15,219,241 // pand %xmm1,%xmm6
.byte 102,15,219,204 // pand %xmm4,%xmm1
@@ -49078,7 +49528,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,69,15,56,48,221 // pmovzxbw %xmm13,%xmm11
.byte 102,68,15,127,92,36,48 // movdqa %xmm11,0x30(%rsp)
- .byte 102,15,111,13,100,74,0,0 // movdqa 0x4a64(%rip),%xmm1 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,13,180,77,0,0 // movdqa 0x4db4(%rip),%xmm1 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,68,15,56,0,233 // pshufb %xmm1,%xmm13
.byte 102,69,15,56,48,197 // pmovzxbw %xmm13,%xmm8
@@ -49128,7 +49578,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,65,15,56,58,247 // pminuw %xmm15,%xmm6
.byte 102,15,117,240 // pcmpeqw %xmm0,%xmm6
.byte 102,15,127,116,36,64 // movdqa %xmm6,0x40(%rsp)
- .byte 102,15,111,53,20,66,0,0 // movdqa 0x4214(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,111,53,100,69,0,0 // movdqa 0x4564(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,15,213,196 // pmullw %xmm4,%xmm0
@@ -49239,7 +49689,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,68,15,253,68,36,160 // paddw -0x60(%rsp),%xmm8
.byte 102,15,253,124,36,128 // paddw -0x80(%rsp),%xmm7
- .byte 102,15,111,5,196,71,0,0 // movdqa 0x47c4(%rip),%xmm0 # 2ca30 <_sk_overlay_sse2_8bit+0x1614>
+ .byte 102,15,111,5,116,75,0,0 // movdqa 0x4b74(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0x16f8>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,68,15,253,219 // paddw %xmm3,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -49248,7 +49698,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,68,15,253,196 // paddw %xmm4,%xmm8
.byte 102,15,253,248 // paddw %xmm0,%xmm7
.byte 102,15,253,250 // paddw %xmm2,%xmm7
- .byte 102,15,111,5,168,71,0,0 // movdqa 0x47a8(%rip),%xmm0 # 2ca40 <_sk_overlay_sse2_8bit+0x1624>
+ .byte 102,15,111,5,88,75,0,0 // movdqa 0x4b58(%rip),%xmm0 # 2d4e0 <_sk_overlay_sse2_8bit+0x1708>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,248 // pmulhuw %xmm0,%xmm7
@@ -49283,7 +49733,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,65,15,56,48,206 // pmovzxbw %xmm14,%xmm1
.byte 102,15,127,140,36,144,0,0,0 // movdqa %xmm1,0x90(%rsp)
- .byte 102,15,111,13,110,70,0,0 // movdqa 0x466e(%rip),%xmm1 # 2c9a0 <_sk_overlay_sse2_8bit+0x1584>
+ .byte 102,15,111,13,190,73,0,0 // movdqa 0x49be(%rip),%xmm1 # 2d3e0 <_sk_overlay_sse2_8bit+0x1608>
.byte 102,68,15,56,0,249 // pshufb %xmm1,%xmm15
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,65,15,56,48,238 // pmovzxbw %xmm14,%xmm5
@@ -49335,7 +49785,7 @@ _sk_overlay_sse41_8bit:
.byte 102,65,15,56,58,221 // pminuw %xmm13,%xmm3
.byte 102,15,117,216 // pcmpeqw %xmm0,%xmm3
.byte 102,15,127,92,36,48 // movdqa %xmm3,0x30(%rsp)
- .byte 102,15,111,53,16,62,0,0 // movdqa 0x3e10(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,111,53,96,65,0,0 // movdqa 0x4160(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,15,213,196 // pmullw %xmm4,%xmm0
@@ -49444,7 +49894,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,68,15,253,4,36 // paddw (%rsp),%xmm8
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,204,67,0,0 // movdqa 0x43cc(%rip),%xmm0 # 2ca30 <_sk_overlay_sse2_8bit+0x1614>
+ .byte 102,15,111,5,124,71,0,0 // movdqa 0x477c(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0x16f8>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,69,15,253,217 // paddw %xmm9,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -49453,7 +49903,7 @@ _sk_overlay_sse41_8bit:
.byte 102,68,15,253,195 // paddw %xmm3,%xmm8
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,234 // paddw %xmm2,%xmm5
- .byte 102,15,111,5,176,67,0,0 // movdqa 0x43b0(%rip),%xmm0 # 2ca40 <_sk_overlay_sse2_8bit+0x1624>
+ .byte 102,15,111,5,96,71,0,0 // movdqa 0x4760(%rip),%xmm0 # 2d4e0 <_sk_overlay_sse2_8bit+0x1708>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
@@ -49496,13 +49946,13 @@ _sk_start_pipeline_sse2_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,192 // mov %rcx,-0x40(%rbp)
.byte 72,57,203 // cmp %rcx,%rbx
- .byte 115,83 // jae 2876a <_sk_start_pipeline_sse2_8bit+0x82>
+ .byte 115,83 // jae 28e5a <_sk_start_pipeline_sse2_8bit+0x82>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,200 // mov %rax,-0x38(%rbp)
.byte 76,57,125,200 // cmp %r15,-0x38(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,35 // ja 28750 <_sk_start_pipeline_sse2_8bit+0x68>
+ .byte 119,35 // ja 28e40 <_sk_start_pipeline_sse2_8bit+0x68>
.byte 76,139,101,208 // mov -0x30(%rbp),%r12
.byte 49,255 // xor %edi,%edi
.byte 76,137,246 // mov %r14,%rsi
@@ -49513,16 +49963,16 @@ _sk_start_pipeline_sse2_8bit:
.byte 73,131,196,16 // add $0x10,%r12
.byte 77,57,252 // cmp %r15,%r12
.byte 73,137,212 // mov %rdx,%r12
- .byte 118,225 // jbe 28731 <_sk_start_pipeline_sse2_8bit+0x49>
+ .byte 118,225 // jbe 28e21 <_sk_start_pipeline_sse2_8bit+0x49>
.byte 76,137,255 // mov %r15,%rdi
.byte 72,41,215 // sub %rdx,%rdi
- .byte 116,9 // je 28761 <_sk_start_pipeline_sse2_8bit+0x79>
+ .byte 116,9 // je 28e51 <_sk_start_pipeline_sse2_8bit+0x79>
.byte 76,137,246 // mov %r14,%rsi
.byte 72,137,217 // mov %rbx,%rcx
.byte 65,255,213 // callq *%r13
.byte 72,255,195 // inc %rbx
.byte 72,59,93,192 // cmp -0x40(%rbp),%rbx
- .byte 117,185 // jne 28723 <_sk_start_pipeline_sse2_8bit+0x3b>
+ .byte 117,185 // jne 28e13 <_sk_start_pipeline_sse2_8bit+0x3b>
.byte 72,131,196,24 // add $0x18,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -49554,7 +50004,7 @@ HIDDEN _sk_set_rgb_sse2_8bit
FUNCTION(_sk_set_rgb_sse2_8bit)
_sk_set_rgb_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,240,48,0,0 // movss 0x30f0(%rip),%xmm4 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,16,37,188,51,0,0 // movss 0x33bc(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,76,15,44,197 // cvttss2si %xmm5,%r8
@@ -49569,7 +50019,7 @@ _sk_set_rgb_sse2_8bit:
.byte 68,9,200 // or %r9d,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,181,65,0,0 // movdqa 0x41b5(%rip),%xmm5 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 102,15,111,45,5,69,0,0 // movdqa 0x4505(%rip),%xmm5 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -49594,7 +50044,7 @@ _sk_premul_sse2_8bit:
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 242,15,112,192,95 // pshuflw $0x5f,%xmm0,%xmm0
.byte 243,15,112,248,95 // pshufhw $0x5f,%xmm0,%xmm7
- .byte 102,15,111,5,89,65,0,0 // movdqa 0x4159(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 102,15,111,5,169,68,0,0 // movdqa 0x44a9(%rip),%xmm0 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -49674,7 +50124,7 @@ _sk_load_8888_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,16 // jne 28952 <_sk_load_8888_sse2_8bit+0x2c>
+ .byte 117,16 // jne 29042 <_sk_load_8888_sse2_8bit+0x2c>
.byte 67,15,16,76,152,16 // movups 0x10(%r8,%r11,4),%xmm1
.byte 102,67,15,16,4,152 // movupd (%r8,%r11,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -49685,18 +50135,18 @@ _sk_load_8888_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,228 // ja 2894e <_sk_load_8888_sse2_8bit+0x28>
+ .byte 119,228 // ja 2903e <_sk_load_8888_sse2_8bit+0x28>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # 289c8 <_sk_load_8888_sse2_8bit+0xa2>
+ .byte 76,141,21,83,0,0,0 // lea 0x53(%rip),%r10 # 290b8 <_sk_load_8888_sse2_8bit+0xa2>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,67,15,16,4,152 // movss (%r8,%r11,4),%xmm0
- .byte 235,200 // jmp 2894e <_sk_load_8888_sse2_8bit+0x28>
+ .byte 235,200 // jmp 2903e <_sk_load_8888_sse2_8bit+0x28>
.byte 102,67,15,110,68,152,8 // movd 0x8(%r8,%r11,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,67,15,18,4,152 // movlpd (%r8,%r11,4),%xmm0
- .byte 235,180 // jmp 2894e <_sk_load_8888_sse2_8bit+0x28>
+ .byte 235,180 // jmp 2903e <_sk_load_8888_sse2_8bit+0x28>
.byte 102,67,15,110,68,152,24 // movd 0x18(%r8,%r11,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,67,15,16,68,152,20 // movss 0x14(%r8,%r11,4),%xmm0
@@ -49705,7 +50155,7 @@ _sk_load_8888_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,67,15,16,68,152,16 // movss 0x10(%r8,%r11,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 235,131 // jmp 28948 <_sk_load_8888_sse2_8bit+0x22>
+ .byte 235,131 // jmp 29038 <_sk_load_8888_sse2_8bit+0x22>
.byte 15,31,0 // nopl (%rax)
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -49739,7 +50189,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,16 // jne 28a10 <_sk_load_8888_dst_sse2_8bit+0x2c>
+ .byte 117,16 // jne 29100 <_sk_load_8888_dst_sse2_8bit+0x2c>
.byte 67,15,16,92,152,16 // movups 0x10(%r8,%r11,4),%xmm3
.byte 102,67,15,16,20,152 // movupd (%r8,%r11,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -49750,18 +50200,18 @@ _sk_load_8888_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,228 // ja 28a0c <_sk_load_8888_dst_sse2_8bit+0x28>
+ .byte 119,228 // ja 290fc <_sk_load_8888_dst_sse2_8bit+0x28>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,81,0,0,0 // lea 0x51(%rip),%r10 # 28a84 <_sk_load_8888_dst_sse2_8bit+0xa0>
+ .byte 76,141,21,81,0,0,0 // lea 0x51(%rip),%r10 # 29174 <_sk_load_8888_dst_sse2_8bit+0xa0>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,67,15,16,20,152 // movss (%r8,%r11,4),%xmm2
- .byte 235,200 // jmp 28a0c <_sk_load_8888_dst_sse2_8bit+0x28>
+ .byte 235,200 // jmp 290fc <_sk_load_8888_dst_sse2_8bit+0x28>
.byte 102,67,15,110,84,152,8 // movd 0x8(%r8,%r11,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,67,15,18,20,152 // movlpd (%r8,%r11,4),%xmm2
- .byte 235,180 // jmp 28a0c <_sk_load_8888_dst_sse2_8bit+0x28>
+ .byte 235,180 // jmp 290fc <_sk_load_8888_dst_sse2_8bit+0x28>
.byte 102,67,15,110,84,152,24 // movd 0x18(%r8,%r11,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,67,15,16,84,152,20 // movss 0x14(%r8,%r11,4),%xmm2
@@ -49770,7 +50220,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,67,15,16,84,152,16 // movss 0x10(%r8,%r11,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 235,131 // jmp 28a06 <_sk_load_8888_dst_sse2_8bit+0x22>
+ .byte 235,131 // jmp 290f6 <_sk_load_8888_dst_sse2_8bit+0x22>
.byte 144 // nop
.byte 184,255,255,255,204 // mov $0xccffffff,%eax
.byte 255 // (bad)
@@ -49801,7 +50251,7 @@ _sk_store_8888_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 28acd <_sk_store_8888_sse2_8bit+0x2d>
+ .byte 117,17 // jne 291bd <_sk_store_8888_sse2_8bit+0x2d>
.byte 243,67,15,127,4,152 // movdqu %xmm0,(%r8,%r11,4)
.byte 243,67,15,127,76,152,16 // movdqu %xmm1,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -49810,25 +50260,25 @@ _sk_store_8888_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 28ac9 <_sk_store_8888_sse2_8bit+0x29>
+ .byte 119,236 // ja 291b9 <_sk_store_8888_sse2_8bit+0x29>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 28b34 <_sk_store_8888_sse2_8bit+0x94>
+ .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 29224 <_sk_store_8888_sse2_8bit+0x94>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,126,4,152 // movd %xmm0,(%r8,%r11,4)
- .byte 235,208 // jmp 28ac9 <_sk_store_8888_sse2_8bit+0x29>
+ .byte 235,208 // jmp 291b9 <_sk_store_8888_sse2_8bit+0x29>
.byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4
.byte 102,67,15,126,100,152,8 // movd %xmm4,0x8(%r8,%r11,4)
.byte 102,67,15,214,4,152 // movq %xmm0,(%r8,%r11,4)
- .byte 235,188 // jmp 28ac9 <_sk_store_8888_sse2_8bit+0x29>
+ .byte 235,188 // jmp 291b9 <_sk_store_8888_sse2_8bit+0x29>
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,67,15,126,100,152,24 // movd %xmm4,0x18(%r8,%r11,4)
.byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
.byte 102,67,15,126,100,152,20 // movd %xmm4,0x14(%r8,%r11,4)
.byte 102,67,15,126,76,152,16 // movd %xmm1,0x10(%r8,%r11,4)
.byte 243,67,15,127,4,152 // movdqu %xmm0,(%r8,%r11,4)
- .byte 235,149 // jmp 28ac9 <_sk_store_8888_sse2_8bit+0x29>
+ .byte 235,149 // jmp 291b9 <_sk_store_8888_sse2_8bit+0x29>
.byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp
.byte 255 // (bad)
.byte 255 // (bad)
@@ -49862,7 +50312,7 @@ _sk_load_bgra_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,92 // jne 28bc8 <_sk_load_bgra_sse2_8bit+0x78>
+ .byte 117,92 // jne 292b8 <_sk_load_bgra_sse2_8bit+0x78>
.byte 67,15,16,76,152,16 // movups 0x10(%r8,%r11,4),%xmm1
.byte 102,67,15,16,4,152 // movupd (%r8,%r11,4),%xmm0
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -49890,18 +50340,18 @@ _sk_load_bgra_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,152 // ja 28b78 <_sk_load_bgra_sse2_8bit+0x28>
+ .byte 119,152 // ja 29268 <_sk_load_bgra_sse2_8bit+0x28>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,89,0,0,0 // lea 0x59(%rip),%r10 # 28c44 <_sk_load_bgra_sse2_8bit+0xf4>
+ .byte 76,141,21,89,0,0,0 // lea 0x59(%rip),%r10 # 29334 <_sk_load_bgra_sse2_8bit+0xf4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,67,15,16,4,152 // movss (%r8,%r11,4),%xmm0
- .byte 233,121,255,255,255 // jmpq 28b78 <_sk_load_bgra_sse2_8bit+0x28>
+ .byte 233,121,255,255,255 // jmpq 29268 <_sk_load_bgra_sse2_8bit+0x28>
.byte 102,67,15,110,68,152,8 // movd 0x8(%r8,%r11,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,67,15,18,4,152 // movlpd (%r8,%r11,4),%xmm0
- .byte 233,98,255,255,255 // jmpq 28b78 <_sk_load_bgra_sse2_8bit+0x28>
+ .byte 233,98,255,255,255 // jmpq 29268 <_sk_load_bgra_sse2_8bit+0x28>
.byte 102,67,15,110,68,152,24 // movd 0x18(%r8,%r11,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,67,15,16,68,152,20 // movss 0x14(%r8,%r11,4),%xmm0
@@ -49910,7 +50360,7 @@ _sk_load_bgra_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,67,15,16,68,152,16 // movss 0x10(%r8,%r11,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 233,46,255,255,255 // jmpq 28b72 <_sk_load_bgra_sse2_8bit+0x22>
+ .byte 233,46,255,255,255 // jmpq 29262 <_sk_load_bgra_sse2_8bit+0x22>
.byte 176,255 // mov $0xff,%al
.byte 255 // (bad)
.byte 255,199 // inc %edi
@@ -49943,7 +50393,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,92 // jne 28cd8 <_sk_load_bgra_dst_sse2_8bit+0x78>
+ .byte 117,92 // jne 293c8 <_sk_load_bgra_dst_sse2_8bit+0x78>
.byte 67,15,16,92,152,16 // movups 0x10(%r8,%r11,4),%xmm3
.byte 102,67,15,16,20,152 // movupd (%r8,%r11,4),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -49971,18 +50421,18 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,152 // ja 28c88 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ .byte 119,152 // ja 29378 <_sk_load_bgra_dst_sse2_8bit+0x28>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,89,0,0,0 // lea 0x59(%rip),%r10 # 28d54 <_sk_load_bgra_dst_sse2_8bit+0xf4>
+ .byte 76,141,21,89,0,0,0 // lea 0x59(%rip),%r10 # 29444 <_sk_load_bgra_dst_sse2_8bit+0xf4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,67,15,16,20,152 // movss (%r8,%r11,4),%xmm2
- .byte 233,121,255,255,255 // jmpq 28c88 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ .byte 233,121,255,255,255 // jmpq 29378 <_sk_load_bgra_dst_sse2_8bit+0x28>
.byte 102,67,15,110,84,152,8 // movd 0x8(%r8,%r11,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,67,15,18,20,152 // movlpd (%r8,%r11,4),%xmm2
- .byte 233,98,255,255,255 // jmpq 28c88 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ .byte 233,98,255,255,255 // jmpq 29378 <_sk_load_bgra_dst_sse2_8bit+0x28>
.byte 102,67,15,110,84,152,24 // movd 0x18(%r8,%r11,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,67,15,16,84,152,20 // movss 0x14(%r8,%r11,4),%xmm2
@@ -49991,7 +50441,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,67,15,16,84,152,16 // movss 0x10(%r8,%r11,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 233,46,255,255,255 // jmpq 28c82 <_sk_load_bgra_dst_sse2_8bit+0x22>
+ .byte 233,46,255,255,255 // jmpq 29372 <_sk_load_bgra_dst_sse2_8bit+0x22>
.byte 176,255 // mov $0xff,%al
.byte 255 // (bad)
.byte 255,199 // inc %edi
@@ -50043,7 +50493,7 @@ _sk_store_bgra_sse2_8bit:
.byte 243,15,112,237,198 // pshufhw $0xc6,%xmm5,%xmm5
.byte 102,15,103,238 // packuswb %xmm6,%xmm5
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,17 // jne 28df1 <_sk_store_bgra_sse2_8bit+0x81>
+ .byte 117,17 // jne 294e1 <_sk_store_bgra_sse2_8bit+0x81>
.byte 243,67,15,127,44,152 // movdqu %xmm5,(%r8,%r11,4)
.byte 243,67,15,127,100,152,16 // movdqu %xmm4,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50052,25 +50502,25 @@ _sk_store_bgra_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 28ded <_sk_store_bgra_sse2_8bit+0x7d>
+ .byte 119,236 // ja 294dd <_sk_store_bgra_sse2_8bit+0x7d>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 28e58 <_sk_store_bgra_sse2_8bit+0xe8>
+ .byte 76,141,21,76,0,0,0 // lea 0x4c(%rip),%r10 # 29548 <_sk_store_bgra_sse2_8bit+0xe8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,67,15,126,44,152 // movd %xmm5,(%r8,%r11,4)
- .byte 235,208 // jmp 28ded <_sk_store_bgra_sse2_8bit+0x7d>
+ .byte 235,208 // jmp 294dd <_sk_store_bgra_sse2_8bit+0x7d>
.byte 102,15,112,229,78 // pshufd $0x4e,%xmm5,%xmm4
.byte 102,67,15,126,100,152,8 // movd %xmm4,0x8(%r8,%r11,4)
.byte 102,67,15,214,44,152 // movq %xmm5,(%r8,%r11,4)
- .byte 235,188 // jmp 28ded <_sk_store_bgra_sse2_8bit+0x7d>
+ .byte 235,188 // jmp 294dd <_sk_store_bgra_sse2_8bit+0x7d>
.byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6
.byte 102,67,15,126,116,152,24 // movd %xmm6,0x18(%r8,%r11,4)
.byte 102,15,112,244,229 // pshufd $0xe5,%xmm4,%xmm6
.byte 102,67,15,126,116,152,20 // movd %xmm6,0x14(%r8,%r11,4)
.byte 102,67,15,126,100,152,16 // movd %xmm4,0x10(%r8,%r11,4)
.byte 243,67,15,127,44,152 // movdqu %xmm5,(%r8,%r11,4)
- .byte 235,149 // jmp 28ded <_sk_store_bgra_sse2_8bit+0x7d>
+ .byte 235,149 // jmp 294dd <_sk_store_bgra_sse2_8bit+0x7d>
.byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp
.byte 255 // (bad)
.byte 255 // (bad)
@@ -50092,6 +50542,203 @@ _sk_store_bgra_sse2_8bit:
.byte 255 // (bad)
.byte 255 // .byte 0xff
+HIDDEN _sk_store_565_sse2_8bit
+.globl _sk_store_565_sse2_8bit
+FUNCTION(_sk_store_565_sse2_8bit)
+_sk_store_565_sse2_8bit:
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,72,8 // movslq 0x8(%rax),%r9
+ .byte 76,99,193 // movslq %ecx,%r8
+ .byte 77,15,175,193 // imul %r9,%r8
+ .byte 77,1,192 // add %r8,%r8
+ .byte 76,3,0 // add (%rax),%r8
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 102,68,15,111,13,125,62,0,0 // movdqa 0x3e7d(%rip),%xmm9 # 2d400 <_sk_overlay_sse2_8bit+0x1628>
+ .byte 102,68,15,111,193 // movdqa %xmm1,%xmm8
+ .byte 102,69,15,219,193 // pand %xmm9,%xmm8
+ .byte 102,68,15,219,200 // pand %xmm0,%xmm9
+ .byte 102,65,15,114,241,8 // pslld $0x8,%xmm9
+ .byte 102,65,15,114,240,8 // pslld $0x8,%xmm8
+ .byte 102,15,111,37,106,62,0,0 // movdqa 0x3e6a(%rip),%xmm4 # 2d410 <_sk_overlay_sse2_8bit+0x1638>
+ .byte 102,15,111,233 // movdqa %xmm1,%xmm5
+ .byte 102,15,219,236 // pand %xmm4,%xmm5
+ .byte 102,15,219,224 // pand %xmm0,%xmm4
+ .byte 102,15,114,212,5 // psrld $0x5,%xmm4
+ .byte 102,15,114,213,5 // psrld $0x5,%xmm5
+ .byte 102,15,111,61,92,62,0,0 // movdqa 0x3e5c(%rip),%xmm7 # 2d420 <_sk_overlay_sse2_8bit+0x1648>
+ .byte 102,15,111,240 // movdqa %xmm0,%xmm6
+ .byte 102,15,219,247 // pand %xmm7,%xmm6
+ .byte 102,15,219,249 // pand %xmm1,%xmm7
+ .byte 102,15,114,215,19 // psrld $0x13,%xmm7
+ .byte 102,15,114,214,19 // psrld $0x13,%xmm6
+ .byte 102,65,15,235,232 // por %xmm8,%xmm5
+ .byte 102,65,15,235,225 // por %xmm9,%xmm4
+ .byte 102,15,235,230 // por %xmm6,%xmm4
+ .byte 102,15,235,239 // por %xmm7,%xmm5
+ .byte 102,15,114,245,16 // pslld $0x10,%xmm5
+ .byte 102,15,114,229,16 // psrad $0x10,%xmm5
+ .byte 102,15,114,244,16 // pslld $0x10,%xmm4
+ .byte 102,15,114,228,16 // psrad $0x10,%xmm4
+ .byte 102,15,107,229 // packssdw %xmm5,%xmm4
+ .byte 72,133,255 // test %rdi,%rdi
+ .byte 117,10 // jne 29613 <_sk_store_565_sse2_8bit+0xaf>
+ .byte 243,67,15,127,36,88 // movdqu %xmm4,(%r8,%r11,2)
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,137,249 // mov %edi,%r9d
+ .byte 65,128,225,7 // and $0x7,%r9b
+ .byte 65,254,201 // dec %r9b
+ .byte 65,128,249,6 // cmp $0x6,%r9b
+ .byte 119,236 // ja 2960f <_sk_store_565_sse2_8bit+0xab>
+ .byte 69,15,182,201 // movzbl %r9b,%r9d
+ .byte 76,141,21,82,0,0,0 // lea 0x52(%rip),%r10 # 29680 <_sk_store_565_sse2_8bit+0x11c>
+ .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
+ .byte 76,1,208 // add %r10,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,67,137,4,88 // mov %ax,(%r8,%r11,2)
+ .byte 235,205 // jmp 2960f <_sk_store_565_sse2_8bit+0xab>
+ .byte 102,15,197,196,2 // pextrw $0x2,%xmm4,%eax
+ .byte 102,67,137,68,88,4 // mov %ax,0x4(%r8,%r11,2)
+ .byte 102,67,15,126,36,88 // movd %xmm4,(%r8,%r11,2)
+ .byte 235,186 // jmp 2960f <_sk_store_565_sse2_8bit+0xab>
+ .byte 102,15,197,196,6 // pextrw $0x6,%xmm4,%eax
+ .byte 102,67,137,68,88,12 // mov %ax,0xc(%r8,%r11,2)
+ .byte 102,15,197,196,5 // pextrw $0x5,%xmm4,%eax
+ .byte 102,67,137,68,88,10 // mov %ax,0xa(%r8,%r11,2)
+ .byte 102,15,197,196,4 // pextrw $0x4,%xmm4,%eax
+ .byte 102,67,137,68,88,8 // mov %ax,0x8(%r8,%r11,2)
+ .byte 102,67,15,214,36,88 // movq %xmm4,(%r8,%r11,2)
+ .byte 235,145 // jmp 2960f <_sk_store_565_sse2_8bit+0xab>
+ .byte 102,144 // xchg %ax,%ax
+ .byte 183,255 // mov $0xff,%bh
+ .byte 255 // (bad)
+ .byte 255,205 // dec %ebp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,194 // inc %edx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,246 // push %rsi
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 235,255 // jmp 29691 <_sk_store_565_sse2_8bit+0x12d>
+ .byte 255 // (bad)
+ .byte 255,224 // jmpq *%rax
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,213 // callq *%rbp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
+HIDDEN _sk_load_565_dst_sse2_8bit
+.globl _sk_load_565_dst_sse2_8bit
+FUNCTION(_sk_load_565_dst_sse2_8bit)
+_sk_load_565_dst_sse2_8bit:
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 76,99,72,8 // movslq 0x8(%rax),%r9
+ .byte 76,99,193 // movslq %ecx,%r8
+ .byte 77,15,175,193 // imul %r9,%r8
+ .byte 77,1,192 // add %r8,%r8
+ .byte 76,3,0 // add (%rax),%r8
+ .byte 76,99,218 // movslq %edx,%r11
+ .byte 72,133,255 // test %rdi,%rdi
+ .byte 15,133,219,0,0,0 // jne 29796 <_sk_load_565_dst_sse2_8bit+0xfa>
+ .byte 243,67,15,111,20,88 // movdqu (%r8,%r11,2),%xmm2
+ .byte 102,15,239,228 // pxor %xmm4,%xmm4
+ .byte 102,15,111,218 // movdqa %xmm2,%xmm3
+ .byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
+ .byte 102,15,97,212 // punpcklwd %xmm4,%xmm2
+ .byte 102,15,111,53,55,56,0,0 // movdqa 0x3837(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x1138>
+ .byte 102,15,111,250 // movdqa %xmm2,%xmm7
+ .byte 102,15,219,254 // pand %xmm6,%xmm7
+ .byte 102,15,219,243 // pand %xmm3,%xmm6
+ .byte 102,15,114,214,8 // psrld $0x8,%xmm6
+ .byte 102,15,114,215,8 // psrld $0x8,%xmm7
+ .byte 102,15,111,45,89,56,0,0 // movdqa 0x3859(%rip),%xmm5 # 2cf50 <_sk_overlay_sse2_8bit+0x1178>
+ .byte 102,15,111,226 // movdqa %xmm2,%xmm4
+ .byte 102,15,219,229 // pand %xmm5,%xmm4
+ .byte 102,15,219,235 // pand %xmm3,%xmm5
+ .byte 102,15,114,245,19 // pslld $0x13,%xmm5
+ .byte 102,15,114,244,19 // pslld $0x13,%xmm4
+ .byte 102,15,235,231 // por %xmm7,%xmm4
+ .byte 102,15,235,238 // por %xmm6,%xmm5
+ .byte 102,15,111,53,19,56,0,0 // movdqa 0x3813(%rip),%xmm6 # 2cf30 <_sk_overlay_sse2_8bit+0x1158>
+ .byte 102,15,111,251 // movdqa %xmm3,%xmm7
+ .byte 102,15,219,254 // pand %xmm6,%xmm7
+ .byte 102,15,114,247,5 // pslld $0x5,%xmm7
+ .byte 102,68,15,111,5,29,61,0,0 // movdqa 0x3d1d(%rip),%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0x1678>
+ .byte 102,65,15,219,216 // pand %xmm8,%xmm3
+ .byte 102,15,114,211,1 // psrld $0x1,%xmm3
+ .byte 102,15,235,223 // por %xmm7,%xmm3
+ .byte 102,15,235,221 // por %xmm5,%xmm3
+ .byte 102,15,114,213,5 // psrld $0x5,%xmm5
+ .byte 102,15,219,242 // pand %xmm2,%xmm6
+ .byte 102,15,114,246,5 // pslld $0x5,%xmm6
+ .byte 102,65,15,219,208 // pand %xmm8,%xmm2
+ .byte 102,15,114,210,1 // psrld $0x1,%xmm2
+ .byte 102,15,235,214 // por %xmm6,%xmm2
+ .byte 102,15,235,212 // por %xmm4,%xmm2
+ .byte 102,15,114,212,5 // psrld $0x5,%xmm4
+ .byte 102,15,111,53,206,60,0,0 // movdqa 0x3cce(%rip),%xmm6 # 2d440 <_sk_overlay_sse2_8bit+0x1668>
+ .byte 102,15,219,230 // pand %xmm6,%xmm4
+ .byte 102,15,219,238 // pand %xmm6,%xmm5
+ .byte 102,15,111,53,78,60,0,0 // movdqa 0x3c4e(%rip),%xmm6 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
+ .byte 102,15,235,214 // por %xmm6,%xmm2
+ .byte 102,15,235,212 // por %xmm4,%xmm2
+ .byte 102,15,235,222 // por %xmm6,%xmm3
+ .byte 102,15,235,221 // por %xmm5,%xmm3
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 65,137,249 // mov %edi,%r9d
+ .byte 65,128,225,7 // and $0x7,%r9b
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
+ .byte 65,254,201 // dec %r9b
+ .byte 65,128,249,6 // cmp $0x6,%r9b
+ .byte 15,135,19,255,255,255 // ja 296c1 <_sk_load_565_dst_sse2_8bit+0x25>
+ .byte 69,15,182,201 // movzbl %r9b,%r9d
+ .byte 76,141,21,91,0,0,0 // lea 0x5b(%rip),%r10 # 29814 <_sk_load_565_dst_sse2_8bit+0x178>
+ .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
+ .byte 76,1,208 // add %r10,%rax
+ .byte 255,224 // jmpq *%rax
+ .byte 67,15,183,4,88 // movzwl (%r8,%r11,2),%eax
+ .byte 102,15,110,208 // movd %eax,%xmm2
+ .byte 233,241,254,255,255 // jmpq 296c1 <_sk_load_565_dst_sse2_8bit+0x25>
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
+ .byte 102,67,15,196,84,88,4,2 // pinsrw $0x2,0x4(%r8,%r11,2),%xmm2
+ .byte 243,67,15,16,28,88 // movss (%r8,%r11,2),%xmm3
+ .byte 243,15,16,211 // movss %xmm3,%xmm2
+ .byte 233,214,254,255,255 // jmpq 296c1 <_sk_load_565_dst_sse2_8bit+0x25>
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
+ .byte 102,67,15,196,84,88,12,6 // pinsrw $0x6,0xc(%r8,%r11,2),%xmm2
+ .byte 102,67,15,196,84,88,10,5 // pinsrw $0x5,0xa(%r8,%r11,2),%xmm2
+ .byte 102,67,15,196,84,88,8,4 // pinsrw $0x4,0x8(%r8,%r11,2),%xmm2
+ .byte 102,67,15,18,20,88 // movlpd (%r8,%r11,2),%xmm2
+ .byte 233,175,254,255,255 // jmpq 296c1 <_sk_load_565_dst_sse2_8bit+0x25>
+ .byte 102,144 // xchg %ax,%ax
+ .byte 174 // scas %es:(%rdi),%al
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,200 // dec %eax
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 188,255,255,255,243 // mov $0xf3ffffff,%esp
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 235,255 // jmp 29825 <_sk_load_565_dst_sse2_8bit+0x189>
+ .byte 255 // (bad)
+ .byte 255,227 // jmpq *%rbx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,215 // callq *%rdi
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255 // .byte 0xff
+
HIDDEN _sk_load_a8_sse2_8bit
.globl _sk_load_a8_sse2_8bit
FUNCTION(_sk_load_a8_sse2_8bit)
@@ -50103,10 +50750,10 @@ _sk_load_a8_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,48 // jne 28ebc <_sk_load_a8_sse2_8bit+0x48>
+ .byte 117,48 // jne 29878 <_sk_load_a8_sse2_8bit+0x48>
.byte 243,67,15,126,4,24 // movq (%r8,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,219,5,178,51,0,0 // pand 0x33b2(%rip),%xmm0 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,5,54,52,0,0 // pand 0x3436(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -50120,15 +50767,15 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,198 // ja 28e96 <_sk_load_a8_sse2_8bit+0x22>
+ .byte 119,198 // ja 29852 <_sk_load_a8_sse2_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 28f4c <_sk_load_a8_sse2_8bit+0xd8>
+ .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 29908 <_sk_load_a8_sse2_8bit+0xd8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,167 // jmp 28e96 <_sk_load_a8_sse2_8bit+0x22>
+ .byte 235,167 // jmp 29852 <_sk_load_a8_sse2_8bit+0x22>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -50136,7 +50783,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 235,133 // jmp 28e96 <_sk_load_a8_sse2_8bit+0x22>
+ .byte 235,133 // jmp 29852 <_sk_load_a8_sse2_8bit+0x22>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -50147,7 +50794,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,67,15,110,12,24 // movd (%r8,%r11,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,77,255,255,255 // jmpq 28e96 <_sk_load_a8_sse2_8bit+0x22>
+ .byte 233,77,255,255,255 // jmpq 29852 <_sk_load_a8_sse2_8bit+0x22>
.byte 15,31,0 // nopl (%rax)
.byte 152 // cwtl
.byte 255 // (bad)
@@ -50181,10 +50828,10 @@ _sk_load_a8_dst_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,48 // jne 28fb0 <_sk_load_a8_dst_sse2_8bit+0x48>
+ .byte 117,48 // jne 2996c <_sk_load_a8_dst_sse2_8bit+0x48>
.byte 243,67,15,126,20,24 // movq (%r8,%r11,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,219,21,190,50,0,0 // pand 0x32be(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,21,66,51,0,0 // pand 0x3342(%rip),%xmm2 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -50198,15 +50845,15 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,198 // ja 28f8a <_sk_load_a8_dst_sse2_8bit+0x22>
+ .byte 119,198 // ja 29946 <_sk_load_a8_dst_sse2_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 29040 <_sk_load_a8_dst_sse2_8bit+0xd8>
+ .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 299fc <_sk_load_a8_dst_sse2_8bit+0xd8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 235,167 // jmp 28f8a <_sk_load_a8_dst_sse2_8bit+0x22>
+ .byte 235,167 // jmp 29946 <_sk_load_a8_dst_sse2_8bit+0x22>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -50214,7 +50861,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 235,133 // jmp 28f8a <_sk_load_a8_dst_sse2_8bit+0x22>
+ .byte 235,133 // jmp 29946 <_sk_load_a8_dst_sse2_8bit+0x22>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -50225,7 +50872,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,67,15,110,28,24 // movd (%r8,%r11,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,77,255,255,255 // jmpq 28f8a <_sk_load_a8_dst_sse2_8bit+0x22>
+ .byte 233,77,255,255,255 // jmpq 29946 <_sk_load_a8_dst_sse2_8bit+0x22>
.byte 15,31,0 // nopl (%rax)
.byte 152 // cwtl
.byte 255 // (bad)
@@ -50268,8 +50915,8 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,114,228,16 // psrad $0x10,%xmm4
.byte 102,15,107,229 // packssdw %xmm5,%xmm4
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,22 // jne 290b4 <_sk_store_a8_sse2_8bit+0x58>
- .byte 102,15,219,37,170,49,0,0 // pand 0x31aa(%rip),%xmm4 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 117,22 // jne 29a70 <_sk_store_a8_sse2_8bit+0x58>
+ .byte 102,15,219,37,46,50,0,0 // pand 0x322e(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,67,15,214,36,24 // movq %xmm4,(%r8,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50278,24 +50925,24 @@ _sk_store_a8_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 290b0 <_sk_store_a8_sse2_8bit+0x54>
+ .byte 119,236 // ja 29a6c <_sk_store_a8_sse2_8bit+0x54>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,133,0,0,0 // lea 0x85(%rip),%r10 # 29154 <_sk_store_a8_sse2_8bit+0xf8>
+ .byte 76,141,21,133,0,0,0 // lea 0x85(%rip),%r10 # 29b10 <_sk_store_a8_sse2_8bit+0xf8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,15,127,100,36,232 // movdqa %xmm4,-0x18(%rsp)
.byte 138,68,36,232 // mov -0x18(%rsp),%al
.byte 67,136,4,24 // mov %al,(%r8,%r11,1)
- .byte 235,200 // jmp 290b0 <_sk_store_a8_sse2_8bit+0x54>
+ .byte 235,200 // jmp 29a6c <_sk_store_a8_sse2_8bit+0x54>
.byte 102,15,127,100,36,216 // movdqa %xmm4,-0x28(%rsp)
.byte 138,68,36,220 // mov -0x24(%rsp),%al
.byte 67,136,68,24,2 // mov %al,0x2(%r8,%r11,1)
- .byte 102,15,219,37,81,49,0,0 // pand 0x3151(%rip),%xmm4 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,37,213,49,0,0 // pand 0x31d5(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,67,137,4,24 // mov %ax,(%r8,%r11,1)
- .byte 235,162 // jmp 290b0 <_sk_store_a8_sse2_8bit+0x54>
+ .byte 235,162 // jmp 29a6c <_sk_store_a8_sse2_8bit+0x54>
.byte 102,15,127,100,36,200 // movdqa %xmm4,-0x38(%rsp)
.byte 138,68,36,212 // mov -0x2c(%rsp),%al
.byte 67,136,68,24,6 // mov %al,0x6(%r8,%r11,1)
@@ -50305,10 +50952,10 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,127,100,36,168 // movdqa %xmm4,-0x58(%rsp)
.byte 138,68,36,176 // mov -0x50(%rsp),%al
.byte 67,136,68,24,4 // mov %al,0x4(%r8,%r11,1)
- .byte 102,15,219,37,13,49,0,0 // pand 0x310d(%rip),%xmm4 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,37,145,49,0,0 // pand 0x3191(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,67,15,126,36,24 // movd %xmm4,(%r8,%r11,1)
- .byte 233,94,255,255,255 // jmpq 290b0 <_sk_store_a8_sse2_8bit+0x54>
+ .byte 233,94,255,255,255 // jmpq 29a6c <_sk_store_a8_sse2_8bit+0x54>
.byte 102,144 // xchg %ax,%ax
.byte 132,255 // test %bh,%bh
.byte 255 // (bad)
@@ -50341,15 +50988,15 @@ _sk_load_g8_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,116 // jne 291fc <_sk_load_g8_sse2_8bit+0x8c>
+ .byte 117,116 // jne 29bb8 <_sk_load_g8_sse2_8bit+0x8c>
.byte 243,67,15,126,4,24 // movq (%r8,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,219,5,182,48,0,0 // pand 0x30b6(%rip),%xmm0 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,5,58,49,0,0 // pand 0x313a(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
- .byte 102,15,111,45,30,56,0,0 // movdqa 0x381e(%rip),%xmm5 # 2c9d0 <_sk_overlay_sse2_8bit+0x15b4>
+ .byte 102,15,111,45,2,57,0,0 // movdqa 0x3902(%rip),%xmm5 # 2d470 <_sk_overlay_sse2_8bit+0x1698>
.byte 102,15,112,240,245 // pshufd $0xf5,%xmm0,%xmm6
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,200,232 // pshufd $0xe8,%xmm0,%xmm1
@@ -50362,7 +51009,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,196 // punpckldq %xmm4,%xmm0
- .byte 102,15,111,37,160,55,0,0 // movdqa 0x37a0(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 102,15,111,37,36,56,0,0 // movdqa 0x3824(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50372,15 +51019,15 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,130 // ja 29192 <_sk_load_g8_sse2_8bit+0x22>
+ .byte 119,130 // ja 29b4e <_sk_load_g8_sse2_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 29290 <_sk_load_g8_sse2_8bit+0x120>
+ .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 29c4c <_sk_load_g8_sse2_8bit+0x120>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 233,96,255,255,255 // jmpq 29192 <_sk_load_g8_sse2_8bit+0x22>
+ .byte 233,96,255,255,255 // jmpq 29b4e <_sk_load_g8_sse2_8bit+0x22>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -50388,7 +51035,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 233,59,255,255,255 // jmpq 29192 <_sk_load_g8_sse2_8bit+0x22>
+ .byte 233,59,255,255,255 // jmpq 29b4e <_sk_load_g8_sse2_8bit+0x22>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -50399,7 +51046,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,67,15,110,12,24 // movd (%r8,%r11,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,3,255,255,255 // jmpq 29192 <_sk_load_g8_sse2_8bit+0x22>
+ .byte 233,3,255,255,255 // jmpq 29b4e <_sk_load_g8_sse2_8bit+0x22>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -50433,15 +51080,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 117,116 // jne 29338 <_sk_load_g8_dst_sse2_8bit+0x8c>
+ .byte 117,116 // jne 29cf4 <_sk_load_g8_dst_sse2_8bit+0x8c>
.byte 243,67,15,126,20,24 // movq (%r8,%r11,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,219,21,122,47,0,0 // pand 0x2f7a(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,21,254,47,0,0 // pand 0x2ffe(%rip),%xmm2 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,15,97,227 // punpcklwd %xmm3,%xmm4
.byte 102,15,105,211 // punpckhwd %xmm3,%xmm2
- .byte 102,15,111,45,226,54,0,0 // movdqa 0x36e2(%rip),%xmm5 # 2c9d0 <_sk_overlay_sse2_8bit+0x15b4>
+ .byte 102,15,111,45,198,55,0,0 // movdqa 0x37c6(%rip),%xmm5 # 2d470 <_sk_overlay_sse2_8bit+0x1698>
.byte 102,15,112,242,245 // pshufd $0xf5,%xmm2,%xmm6
.byte 102,15,244,213 // pmuludq %xmm5,%xmm2
.byte 102,15,112,218,232 // pshufd $0xe8,%xmm2,%xmm3
@@ -50454,7 +51101,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,212 // punpckldq %xmm4,%xmm2
- .byte 102,15,111,37,100,54,0,0 // movdqa 0x3664(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 102,15,111,37,232,54,0,0 // movdqa 0x36e8(%rip),%xmm4 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50464,15 +51111,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,130 // ja 292ce <_sk_load_g8_dst_sse2_8bit+0x22>
+ .byte 119,130 // ja 29c8a <_sk_load_g8_dst_sse2_8bit+0x22>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 293cc <_sk_load_g8_dst_sse2_8bit+0x120>
+ .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 29d88 <_sk_load_g8_dst_sse2_8bit+0x120>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,96,255,255,255 // jmpq 292ce <_sk_load_g8_dst_sse2_8bit+0x22>
+ .byte 233,96,255,255,255 // jmpq 29c8a <_sk_load_g8_dst_sse2_8bit+0x22>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -50480,7 +51127,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 233,59,255,255,255 // jmpq 292ce <_sk_load_g8_dst_sse2_8bit+0x22>
+ .byte 233,59,255,255,255 // jmpq 29c8a <_sk_load_g8_dst_sse2_8bit+0x22>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -50491,7 +51138,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,67,15,110,28,24 // movd (%r8,%r11,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,3,255,255,255 // jmpq 292ce <_sk_load_g8_dst_sse2_8bit+0x22>
+ .byte 233,3,255,255,255 // jmpq 29c8a <_sk_load_g8_dst_sse2_8bit+0x22>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -50526,7 +51173,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,253,0,0,0 // jne 29505 <_sk_srcover_rgba_8888_sse2_8bit+0x11d>
+ .byte 15,133,253,0,0,0 // jne 29ec1 <_sk_srcover_rgba_8888_sse2_8bit+0x11d>
.byte 71,15,16,68,152,16 // movups 0x10(%r8,%r11,4),%xmm8
.byte 102,71,15,16,12,152 // movupd (%r8,%r11,4),%xmm9
.byte 72,133,255 // test %rdi,%rdi
@@ -50575,7 +51222,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,68,15,248,207 // psubb %xmm7,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,78 // jne 29542 <_sk_srcover_rgba_8888_sse2_8bit+0x15a>
+ .byte 117,78 // jne 29efe <_sk_srcover_rgba_8888_sse2_8bit+0x15a>
.byte 243,71,15,127,12,152 // movdqu %xmm9,(%r8,%r11,4)
.byte 243,71,15,127,68,152,16 // movdqu %xmm8,0x10(%r8,%r11,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50586,30 +51233,30 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,241,254,255,255 // ja 29414 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ .byte 15,135,241,254,255,255 // ja 29dd0 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,210,0,0,0 // lea 0xd2(%rip),%r10 # 29600 <_sk_srcover_rgba_8888_sse2_8bit+0x218>
+ .byte 76,141,21,210,0,0,0 // lea 0xd2(%rip),%r10 # 29fbc <_sk_srcover_rgba_8888_sse2_8bit+0x218>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 243,71,15,16,12,152 // movss (%r8,%r11,4),%xmm9
- .byte 233,210,254,255,255 // jmpq 29414 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ .byte 233,210,254,255,255 // jmpq 29dd0 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
.byte 65,137,249 // mov %edi,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,175 // ja 29501 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ .byte 119,175 // ja 29ebd <_sk_srcover_rgba_8888_sse2_8bit+0x119>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 76,141,13,191,0,0,0 // lea 0xbf(%rip),%r9 # 2961c <_sk_srcover_rgba_8888_sse2_8bit+0x234>
+ .byte 76,141,13,191,0,0,0 // lea 0xbf(%rip),%r9 # 29fd8 <_sk_srcover_rgba_8888_sse2_8bit+0x234>
.byte 73,99,4,129 // movslq (%r9,%rax,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
.byte 102,71,15,126,12,152 // movd %xmm9,(%r8,%r11,4)
- .byte 235,147 // jmp 29501 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ .byte 235,147 // jmp 29ebd <_sk_srcover_rgba_8888_sse2_8bit+0x119>
.byte 102,67,15,110,100,152,8 // movd 0x8(%r8,%r11,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,71,15,18,12,152 // movlpd (%r8,%r11,4),%xmm9
- .byte 233,142,254,255,255 // jmpq 29414 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ .byte 233,142,254,255,255 // jmpq 29dd0 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
.byte 102,67,15,110,100,152,24 // movd 0x18(%r8,%r11,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 243,67,15,16,100,152,20 // movss 0x14(%r8,%r11,4),%xmm4
@@ -50618,24 +51265,24 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 68,15,40,196 // movaps %xmm4,%xmm8
.byte 243,67,15,16,100,152,16 // movss 0x10(%r8,%r11,4),%xmm4
.byte 243,68,15,16,196 // movss %xmm4,%xmm8
- .byte 233,85,254,255,255 // jmpq 2940e <_sk_srcover_rgba_8888_sse2_8bit+0x26>
+ .byte 233,85,254,255,255 // jmpq 29dca <_sk_srcover_rgba_8888_sse2_8bit+0x26>
.byte 102,65,15,112,225,78 // pshufd $0x4e,%xmm9,%xmm4
.byte 102,67,15,126,100,152,8 // movd %xmm4,0x8(%r8,%r11,4)
.byte 102,71,15,214,12,152 // movq %xmm9,(%r8,%r11,4)
- .byte 233,48,255,255,255 // jmpq 29501 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ .byte 233,48,255,255,255 // jmpq 29ebd <_sk_srcover_rgba_8888_sse2_8bit+0x119>
.byte 102,65,15,112,224,78 // pshufd $0x4e,%xmm8,%xmm4
.byte 102,67,15,126,100,152,24 // movd %xmm4,0x18(%r8,%r11,4)
.byte 102,65,15,112,224,229 // pshufd $0xe5,%xmm8,%xmm4
.byte 102,67,15,126,100,152,20 // movd %xmm4,0x14(%r8,%r11,4)
.byte 102,71,15,126,68,152,16 // movd %xmm8,0x10(%r8,%r11,4)
.byte 243,71,15,127,12,152 // movdqu %xmm9,(%r8,%r11,4)
- .byte 233,4,255,255,255 // jmpq 29501 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ .byte 233,4,255,255,255 // jmpq 29ebd <_sk_srcover_rgba_8888_sse2_8bit+0x119>
.byte 15,31,0 // nopl (%rax)
.byte 55 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 123,255 // jnp 29605 <_sk_srcover_rgba_8888_sse2_8bit+0x21d>
+ .byte 123,255 // jnp 29fc1 <_sk_srcover_rgba_8888_sse2_8bit+0x21d>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -50673,7 +51320,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,56,34,0,0 // mulss 0x2238(%rip),%xmm0 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,89,5,56,34,0,0 // mulss 0x2238(%rip),%xmm0 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
@@ -50685,7 +51332,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,15,96,246 // punpcklbw %xmm6,%xmm6
.byte 242,15,112,246,0 // pshuflw $0x0,%xmm6,%xmm6
.byte 102,15,112,246,80 // pshufd $0x50,%xmm6,%xmm6
- .byte 102,15,219,53,199,43,0,0 // pand 0x2bc7(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,53,75,44,0,0 // pand 0x2c4b(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,65,15,213,248 // pmullw %xmm8,%xmm7
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
@@ -50717,10 +51364,10 @@ _sk_scale_u8_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,239,0,0,0 // jne 297e4 <_sk_scale_u8_sse2_8bit+0x10b>
+ .byte 15,133,239,0,0,0 // jne 2a1a0 <_sk_scale_u8_sse2_8bit+0x10b>
.byte 243,67,15,126,36,24 // movq (%r8,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
- .byte 102,15,219,37,73,43,0,0 // pand 0x2b49(%rip),%xmm4 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,37,205,43,0,0 // pand 0x2bcd(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
.byte 102,65,15,105,232 // punpckhwd %xmm8,%xmm5
@@ -50774,15 +51421,15 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,3,255,255,255 // ja 296ff <_sk_scale_u8_sse2_8bit+0x26>
+ .byte 15,135,3,255,255,255 // ja 2a0bb <_sk_scale_u8_sse2_8bit+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 2987c <_sk_scale_u8_sse2_8bit+0x1a3>
+ .byte 76,141,21,117,0,0,0 // lea 0x75(%rip),%r10 # 2a238 <_sk_scale_u8_sse2_8bit+0x1a3>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 233,225,254,255,255 // jmpq 296ff <_sk_scale_u8_sse2_8bit+0x26>
+ .byte 233,225,254,255,255 // jmpq 2a0bb <_sk_scale_u8_sse2_8bit+0x26>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,2 // pinsrw $0x2,%eax,%xmm4
@@ -50790,7 +51437,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 243,15,16,229 // movss %xmm5,%xmm4
- .byte 233,188,254,255,255 // jmpq 296ff <_sk_scale_u8_sse2_8bit+0x26>
+ .byte 233,188,254,255,255 // jmpq 2a0bb <_sk_scale_u8_sse2_8bit+0x26>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,6 // pinsrw $0x6,%eax,%xmm4
@@ -50801,7 +51448,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,67,15,110,44,24 // movd (%r8,%r11,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,132,254,255,255 // jmpq 296ff <_sk_scale_u8_sse2_8bit+0x26>
+ .byte 233,132,254,255,255 // jmpq 2a0bb <_sk_scale_u8_sse2_8bit+0x26>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -50830,7 +51477,7 @@ FUNCTION(_sk_lerp_1_float_sse2_8bit)
_sk_lerp_1_float_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,226,31,0,0 // mulss 0x1fe2(%rip),%xmm4 # 2b888 <_sk_overlay_sse2_8bit+0x46c>
+ .byte 243,15,89,37,226,31,0,0 // mulss 0x1fe2(%rip),%xmm4 # 2c244 <_sk_overlay_sse2_8bit+0x46c>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -50843,7 +51490,7 @@ _sk_lerp_1_float_sse2_8bit:
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,69,15,96,217 // punpcklbw %xmm9,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,111,53,105,41,0,0 // movdqa 0x2969(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,111,53,237,41,0,0 // movdqa 0x29ed(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
.byte 102,15,213,225 // pmullw %xmm1,%xmm4
@@ -50907,10 +51554,10 @@ _sk_lerp_u8_sse2_8bit:
.byte 76,3,0 // add (%rax),%r8
.byte 76,99,218 // movslq %edx,%r11
.byte 72,133,255 // test %rdi,%rdi
- .byte 15,133,141,1,0,0 // jne 29b77 <_sk_lerp_u8_sse2_8bit+0x1a9>
+ .byte 15,133,141,1,0,0 // jne 2a533 <_sk_lerp_u8_sse2_8bit+0x1a9>
.byte 243,67,15,126,44,24 // movq (%r8,%r11,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
- .byte 102,15,219,45,84,40,0,0 // pand 0x2854(%rip),%xmm5 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,219,45,216,40,0,0 // pand 0x28d8(%rip),%xmm5 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,105,224 // punpckhwd %xmm8,%xmm4
@@ -50997,15 +51644,15 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,101,254,255,255 // ja 299f4 <_sk_lerp_u8_sse2_8bit+0x26>
+ .byte 15,135,101,254,255,255 // ja 2a3b0 <_sk_lerp_u8_sse2_8bit+0x26>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,118,0,0,0 // lea 0x76(%rip),%r10 # 29c10 <_sk_lerp_u8_sse2_8bit+0x242>
+ .byte 76,141,21,118,0,0,0 // lea 0x76(%rip),%r10 # 2a5cc <_sk_lerp_u8_sse2_8bit+0x242>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 67,15,182,4,24 // movzbl (%r8,%r11,1),%eax
.byte 102,15,110,232 // movd %eax,%xmm5
- .byte 233,67,254,255,255 // jmpq 299f4 <_sk_lerp_u8_sse2_8bit+0x26>
+ .byte 233,67,254,255,255 // jmpq 2a3b0 <_sk_lerp_u8_sse2_8bit+0x26>
.byte 67,15,182,68,24,2 // movzbl 0x2(%r8,%r11,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,2 // pinsrw $0x2,%eax,%xmm5
@@ -51013,7 +51660,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 243,15,16,236 // movss %xmm4,%xmm5
- .byte 233,30,254,255,255 // jmpq 299f4 <_sk_lerp_u8_sse2_8bit+0x26>
+ .byte 233,30,254,255,255 // jmpq 2a3b0 <_sk_lerp_u8_sse2_8bit+0x26>
.byte 67,15,182,68,24,6 // movzbl 0x6(%r8,%r11,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,6 // pinsrw $0x6,%eax,%xmm5
@@ -51024,7 +51671,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,67,15,110,36,24 // movd (%r8,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 242,15,16,236 // movsd %xmm4,%xmm5
- .byte 233,230,253,255,255 // jmpq 299f4 <_sk_lerp_u8_sse2_8bit+0x26>
+ .byte 233,230,253,255,255 // jmpq 2a3b0 <_sk_lerp_u8_sse2_8bit+0x26>
.byte 102,144 // xchg %ax,%ax
.byte 147 // xchg %eax,%ebx
.byte 255 // (bad)
@@ -51033,7 +51680,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 29c1d <_sk_lerp_u8_sse2_8bit+0x24f>
+ .byte 235,255 // jmp 2a5d9 <_sk_lerp_u8_sse2_8bit+0x24f>
.byte 255 // (bad)
.byte 255,224 // jmpq *%rax
.byte 255 // (bad)
@@ -51069,7 +51716,7 @@ HIDDEN _sk_black_color_sse2_8bit
FUNCTION(_sk_black_color_sse2_8bit)
_sk_black_color_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,71,45,0,0 // movaps 0x2d47(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1574>
+ .byte 15,40,5,203,45,0,0 // movaps 0x2dcb(%rip),%xmm0 # 2d3d0 <_sk_overlay_sse2_8bit+0x15f8>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -51970,7 +52617,7 @@ _sk_darken_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,215,30,0,0 // movdqa 0x1ed7(%rip),%xmm4 # 2ca20 <_sk_overlay_sse2_8bit+0x1604>
+ .byte 102,15,111,37,187,31,0,0 // movdqa 0x1fbb(%rip),%xmm4 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -52078,7 +52725,7 @@ _sk_lighten_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,235,28,0,0 // movdqa 0x1ceb(%rip),%xmm4 # 2ca20 <_sk_overlay_sse2_8bit+0x1604>
+ .byte 102,15,111,37,207,29,0,0 // movdqa 0x1dcf(%rip),%xmm4 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -52128,7 +52775,7 @@ _sk_exclusion_sse2_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,103,244 // packuswb %xmm4,%xmm6
.byte 102,15,103,239 // packuswb %xmm7,%xmm5
- .byte 102,15,111,37,30,28,0,0 // movdqa 0x1c1e(%rip),%xmm4 # 2ca20 <_sk_overlay_sse2_8bit+0x1604>
+ .byte 102,15,111,37,2,29,0,0 // movdqa 0x1d02(%rip),%xmm4 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
.byte 102,15,248,205 // psubb %xmm5,%xmm1
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,219,230 // pand %xmm6,%xmm4
@@ -52227,7 +52874,7 @@ _sk_difference_sse2_8bit:
.byte 102,65,15,103,244 // packuswb %xmm12,%xmm6
.byte 102,65,15,218,226 // pminub %xmm10,%xmm4
.byte 102,65,15,218,243 // pminub %xmm11,%xmm6
- .byte 102,15,111,45,91,26,0,0 // movdqa 0x1a5b(%rip),%xmm5 # 2ca20 <_sk_overlay_sse2_8bit+0x1604>
+ .byte 102,15,111,45,63,27,0,0 // movdqa 0x1b3f(%rip),%xmm5 # 2d4c0 <_sk_overlay_sse2_8bit+0x16e8>
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 102,15,219,236 // pand %xmm4,%xmm5
@@ -52324,7 +52971,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
.byte 102,69,15,217,211 // psubusw %xmm11,%xmm10
.byte 102,68,15,117,213 // pcmpeqw %xmm5,%xmm10
- .byte 102,15,111,45,198,16,0,0 // movdqa 0x10c6(%rip),%xmm5 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,111,45,74,17,0,0 // movdqa 0x114a(%rip),%xmm5 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
.byte 102,15,239,197 // pxor %xmm5,%xmm0
.byte 102,65,15,213,198 // pmullw %xmm14,%xmm0
@@ -52428,7 +53075,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,253,124,36,32 // paddw 0x20(%rsp),%xmm15
.byte 102,68,15,253,68,36,144 // paddw -0x70(%rsp),%xmm8
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,154,22,0,0 // movdqa 0x169a(%rip),%xmm0 # 2ca30 <_sk_overlay_sse2_8bit+0x1614>
+ .byte 102,15,111,5,126,23,0,0 // movdqa 0x177e(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0x16f8>
.byte 102,15,253,208 // paddw %xmm0,%xmm2
.byte 102,68,15,253,210 // paddw %xmm2,%xmm10
.byte 102,68,15,253,248 // paddw %xmm0,%xmm15
@@ -52437,7 +53084,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,69,15,253,200 // paddw %xmm8,%xmm9
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,233 // paddw %xmm1,%xmm5
- .byte 102,15,111,5,125,22,0,0 // movdqa 0x167d(%rip),%xmm0 # 2ca40 <_sk_overlay_sse2_8bit+0x1624>
+ .byte 102,15,111,5,97,23,0,0 // movdqa 0x1761(%rip),%xmm0 # 2d4e0 <_sk_overlay_sse2_8bit+0x1708>
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,200 // pmulhuw %xmm0,%xmm9
.byte 102,68,15,228,248 // pmulhuw %xmm0,%xmm15
@@ -52542,7 +53189,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,217,234 // psubusw %xmm2,%xmm5
.byte 102,15,117,236 // pcmpeqw %xmm4,%xmm5
.byte 102,15,127,108,36,32 // movdqa %xmm5,0x20(%rsp)
- .byte 102,15,111,53,150,12,0,0 // movdqa 0xc96(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0xe34>
+ .byte 102,15,111,53,26,13,0,0 // movdqa 0xd1a(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0xeb8>
.byte 102,15,111,194 // movdqa %xmm2,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,65,15,213,199 // pmullw %xmm15,%xmm0
@@ -52650,7 +53297,7 @@ _sk_overlay_sse2_8bit:
.byte 102,68,15,253,92,36,240 // paddw -0x10(%rsp),%xmm11
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
.byte 102,15,253,116,36,144 // paddw -0x70(%rsp),%xmm6
- .byte 102,15,111,5,89,18,0,0 // movdqa 0x1259(%rip),%xmm0 # 2ca30 <_sk_overlay_sse2_8bit+0x1614>
+ .byte 102,15,111,5,61,19,0,0 // movdqa 0x133d(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0x16f8>
.byte 102,68,15,253,224 // paddw %xmm0,%xmm12
.byte 102,68,15,253,227 // paddw %xmm3,%xmm12
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
@@ -52659,7 +53306,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,253,234 // paddw %xmm2,%xmm5
.byte 102,15,253,240 // paddw %xmm0,%xmm6
.byte 102,15,253,241 // paddw %xmm1,%xmm6
- .byte 102,15,111,5,61,18,0,0 // movdqa 0x123d(%rip),%xmm0 # 2ca40 <_sk_overlay_sse2_8bit+0x1624>
+ .byte 102,15,111,5,33,19,0,0 // movdqa 0x1321(%rip),%xmm0 # 2d4e0 <_sk_overlay_sse2_8bit+0x1708>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
@@ -52693,14 +53340,14 @@ BALIGN4
.byte 252 // cld
.byte 190,0,0,128,191 // mov $0xbf800000,%esi
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2b8bc <.literal4+0x64>
+ .byte 224,64 // loopne 2c278 <.literal4+0x64>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 2b8c5 <.literal4+0x6d>
+ .byte 71,225,61 // rex.RXB loope 2c281 <.literal4+0x6d>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2b8cf <.literal4+0x77>
+ .byte 127,67 // jg 2c28b <.literal4+0x77>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,92,143,50,63 // sbbl $0x3f,0x328f5c3d(%rsi)
.byte 10,215 // or %bh,%dl
@@ -52733,7 +53380,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2b8e5 <.literal4+0x8d>
+ .byte 224,7 // loopne 2c2a1 <.literal4+0x8d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -52744,8 +53391,8 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 2b8f8 <.literal4+0xa0>
- .byte 119,115 // ja 2b96d <.literal4+0x115>
+ .byte 127,0 // jg 2c2b4 <.literal4+0xa0>
+ .byte 119,115 // ja 2c329 <.literal4+0x115>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -52768,12 +53415,12 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2b983 <.literal4+0x12b>
+ .byte 118,63 // jbe 2c33f <.literal4+0x12b>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2b992 <.literal4+0x13a>
+ .byte 124,66 // jl 2c34e <.literal4+0x13a>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -52783,9 +53430,9 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 2b9b5 <.literal4+0x15d>
+ .byte 112,65 // jo 2c371 <.literal4+0x15d>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2b9bf <.literal4+0x167>
+ .byte 127,71 // jg 2c37b <.literal4+0x167>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,89 // ds pop %rcx
@@ -52812,15 +53459,15 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,0,0 // addb $0x0,(%rax)
.byte 0,191,0,0,192,191 // add %bh,-0x40400000(%rdi)
- .byte 114,28 // jb 2b9de <.literal4+0x186>
+ .byte 114,28 // jb 2c39a <.literal4+0x186>
.byte 199 // (bad)
.byte 62,0,0 // add %al,%ds:(%rax)
.byte 192,63,85 // sarb $0x55,(%rdi)
.byte 85 // push %rbp
.byte 149 // xchg %eax,%ebp
.byte 191,57,142,99,61 // mov $0x3d638e39,%edi
- .byte 114,249 // jb 2b9cb <.literal4+0x173>
- .byte 127,63 // jg 2ba13 <_sk_overlay_sse2_8bit+0x5f7>
+ .byte 114,249 // jb 2c387 <.literal4+0x173>
+ .byte 127,63 // jg 2c3cf <_sk_overlay_sse2_8bit+0x5f7>
.byte 3,0 // add (%rax),%eax
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,4 // add %al,0x4000000(%rax)
@@ -52828,12 +53475,15 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,56,0 // cmpb $0x0,(%rax)
.byte 64,254 // rex (bad)
- .byte 255,1 // incl (%rcx)
- .byte 1,1 // add %eax,(%rcx)
+ .byte 255,7 // incl (%rdi)
+ .byte 0,7 // add %al,(%rdi)
.byte 0,0 // add %al,(%rax)
+ .byte 12,0 // or $0x0,%al
.byte 0,0 // add %al,(%rax)
- .byte 255 // (bad)
- .byte 255 // (bad)
+ .byte 0,0 // add %al,(%rax)
+ .byte 255,1 // incl (%rcx)
+ .byte 1,1 // add %eax,(%rcx)
+ .byte 0,255 // add %bh,%bh
.byte 255 // (bad)
.byte 255,0 // incl (%rax)
@@ -52881,16 +53531,16 @@ BALIGN32
.byte 0,1 // add %al,(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02ba68 <_sk_overlay_sse2_8bit+0xa00064c>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c428 <_sk_overlay_sse2_8bit+0xa000650>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202ba70 <_sk_overlay_sse2_8bit+0x12000654>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c430 <_sk_overlay_sse2_8bit+0x12000658>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02ba78 <_sk_overlay_sse2_8bit+0x1a00065c>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c438 <_sk_overlay_sse2_8bit+0x1a000660>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302ba80 <_sk_overlay_sse2_8bit+0x3000664>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c440 <_sk_overlay_sse2_8bit+0x3000668>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -52933,16 +53583,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bac8 <_sk_overlay_sse2_8bit+0xa0006ac>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c488 <_sk_overlay_sse2_8bit+0xa0006b0>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bad0 <_sk_overlay_sse2_8bit+0x120006b4>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c490 <_sk_overlay_sse2_8bit+0x120006b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bad8 <_sk_overlay_sse2_8bit+0x1a0006bc>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c498 <_sk_overlay_sse2_8bit+0x1a0006c0>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bae0 <_sk_overlay_sse2_8bit+0x30006c4>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c4a0 <_sk_overlay_sse2_8bit+0x30006c8>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -52985,16 +53635,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bb28 <_sk_overlay_sse2_8bit+0xa00070c>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c4e8 <_sk_overlay_sse2_8bit+0xa000710>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bb30 <_sk_overlay_sse2_8bit+0x12000714>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c4f0 <_sk_overlay_sse2_8bit+0x12000718>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bb38 <_sk_overlay_sse2_8bit+0x1a00071c>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c4f8 <_sk_overlay_sse2_8bit+0x1a000720>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bb40 <_sk_overlay_sse2_8bit+0x3000724>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c500 <_sk_overlay_sse2_8bit+0x3000728>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53037,16 +53687,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bb88 <_sk_overlay_sse2_8bit+0xa00076c>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c548 <_sk_overlay_sse2_8bit+0xa000770>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bb90 <_sk_overlay_sse2_8bit+0x12000774>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c550 <_sk_overlay_sse2_8bit+0x12000778>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bb98 <_sk_overlay_sse2_8bit+0x1a00077c>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c558 <_sk_overlay_sse2_8bit+0x1a000780>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bba0 <_sk_overlay_sse2_8bit+0x3000784>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c560 <_sk_overlay_sse2_8bit+0x3000788>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53089,16 +53739,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bbe8 <_sk_overlay_sse2_8bit+0xa0007cc>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c5a8 <_sk_overlay_sse2_8bit+0xa0007d0>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bbf0 <_sk_overlay_sse2_8bit+0x120007d4>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c5b0 <_sk_overlay_sse2_8bit+0x120007d8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bbf8 <_sk_overlay_sse2_8bit+0x1a0007dc>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c5b8 <_sk_overlay_sse2_8bit+0x1a0007e0>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bc00 <_sk_overlay_sse2_8bit+0x30007e4>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c5c0 <_sk_overlay_sse2_8bit+0x30007e8>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53141,16 +53791,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bc48 <_sk_overlay_sse2_8bit+0xa00082c>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c608 <_sk_overlay_sse2_8bit+0xa000830>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bc50 <_sk_overlay_sse2_8bit+0x12000834>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c610 <_sk_overlay_sse2_8bit+0x12000838>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bc58 <_sk_overlay_sse2_8bit+0x1a00083c>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c618 <_sk_overlay_sse2_8bit+0x1a000840>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bc60 <_sk_overlay_sse2_8bit+0x3000844>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c620 <_sk_overlay_sse2_8bit+0x3000848>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53193,16 +53843,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bca8 <_sk_overlay_sse2_8bit+0xa00088c>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c668 <_sk_overlay_sse2_8bit+0xa000890>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bcb0 <_sk_overlay_sse2_8bit+0x12000894>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c670 <_sk_overlay_sse2_8bit+0x12000898>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bcb8 <_sk_overlay_sse2_8bit+0x1a00089c>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c678 <_sk_overlay_sse2_8bit+0x1a0008a0>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bcc0 <_sk_overlay_sse2_8bit+0x30008a4>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c680 <_sk_overlay_sse2_8bit+0x30008a8>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53245,16 +53895,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bd08 <_sk_overlay_sse2_8bit+0xa0008ec>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c6c8 <_sk_overlay_sse2_8bit+0xa0008f0>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bd10 <_sk_overlay_sse2_8bit+0x120008f4>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202c6d0 <_sk_overlay_sse2_8bit+0x120008f8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bd18 <_sk_overlay_sse2_8bit+0x1a0008fc>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02c6d8 <_sk_overlay_sse2_8bit+0x1a000900>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bd20 <_sk_overlay_sse2_8bit+0x3000904>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302c6e0 <_sk_overlay_sse2_8bit+0x3000908>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53517,7 +54167,64 @@ BALIGN32
.byte 5,4,7,10,9 // add $0x90a0704,%eax
.byte 8,11 // or %cl,(%rbx)
.byte 14 // (bad)
- .byte 13,12,15,3,255 // or $0xff030f0c,%eax
+ .byte 13,12,15,248,0 // or $0xf80f0c,%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 248 // clc
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 252 // cld
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 248 // clc
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,4,5,8,9,12,13 // add %eax,0xd0c0908(,%rax,1)
+ .byte 128,128,128,128,128,128,128 // addb $0x80,-0x7f7f7f80(%rax)
+ .byte 128,0,1 // addb $0x1,(%rax)
+ .byte 4,5 // add $0x5,%al
+ .byte 8,9 // or %cl,(%rcx)
+ .byte 12,13 // or $0xd,%al
+ .byte 128,128,128,128,128,128,128 // addb $0x80,-0x7f7f7f80(%rax)
+ .byte 128,3,255 // addb $0xff,(%rbx)
.byte 7 // (bad)
.byte 255,11 // decl (%rbx)
.byte 255,15 // decl (%rdi)
@@ -54121,11 +54828,11 @@ BALIGN16
.byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%rax)
.byte 191,0,0,224,64 // mov $0x40e00000,%edi
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2c378 <.literal16+0x128>
+ .byte 224,64 // loopne 2cdb8 <.literal16+0x128>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2c37c <.literal16+0x12c>
+ .byte 224,64 // loopne 2cdbc <.literal16+0x12c>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2c380 <.literal16+0x130>
+ .byte 224,64 // loopne 2cdc0 <.literal16+0x130>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -54145,13 +54852,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2c3a1 <.literal16+0x151>
+ .byte 71,225,61 // rex.RXB loope 2cde1 <.literal16+0x151>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2c3a5 <.literal16+0x155>
+ .byte 71,225,61 // rex.RXB loope 2cde5 <.literal16+0x155>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2c3a9 <.literal16+0x159>
+ .byte 71,225,61 // rex.RXB loope 2cde9 <.literal16+0x159>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2c3ad <.literal16+0x15d>
+ .byte 71,225,61 // rex.RXB loope 2cded <.literal16+0x15d>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -54162,10 +54869,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c388 <_sk_overlay_sse2_8bit+0xa000f6c>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02cdc8 <_sk_overlay_sse2_8bit+0xa000ff0>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302c390 <_sk_overlay_sse2_8bit+0x3000f74>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302cdd0 <_sk_overlay_sse2_8bit+0x3000ff8>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -54180,11 +54887,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2c3eb <.literal16+0x19b>
+ .byte 127,67 // jg 2ce2b <.literal16+0x19b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2c3ef <.literal16+0x19f>
+ .byte 127,67 // jg 2ce2f <.literal16+0x19f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2c3f3 <.literal16+0x1a3>
+ .byte 127,67 // jg 2ce33 <.literal16+0x1a3>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi)
.byte 145 // xchg %eax,%ecx
@@ -54335,13 +55042,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2c4f9 <.literal16+0x2a9>
+ .byte 224,7 // loopne 2cf39 <.literal16+0x2a9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2c4fd <.literal16+0x2ad>
+ .byte 224,7 // loopne 2cf3d <.literal16+0x2ad>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2c501 <.literal16+0x2b1>
+ .byte 224,7 // loopne 2cf41 <.literal16+0x2b1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2c505 <.literal16+0x2b5>
+ .byte 224,7 // loopne 2cf45 <.literal16+0x2b5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -54401,17 +55108,17 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 2c584 <.literal16+0x334>
+ .byte 127,0 // jg 2cfc4 <.literal16+0x334>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2c588 <.literal16+0x338>
+ .byte 127,0 // jg 2cfc8 <.literal16+0x338>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2c58c <.literal16+0x33c>
+ .byte 127,0 // jg 2cfcc <.literal16+0x33c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2c590 <.literal16+0x340>
- .byte 119,115 // ja 2c605 <.literal16+0x3b5>
+ .byte 127,0 // jg 2cfd0 <.literal16+0x340>
+ .byte 119,115 // ja 2d045 <.literal16+0x3b5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -54422,7 +55129,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 2c569 <.literal16+0x319>
+ .byte 117,191 // jne 2cfa9 <.literal16+0x319>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -54434,7 +55141,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a605aa <_sk_overlay_sse2_8bit+0xffffffffe9a3518e>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a60fea <_sk_overlay_sse2_8bit+0xffffffffe9a35212>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -54524,16 +55231,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2c6f3 <.literal16+0x4a3>
+ .byte 118,63 // jbe 2d133 <.literal16+0x4a3>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2c6f7 <.literal16+0x4a7>
+ .byte 118,63 // jbe 2d137 <.literal16+0x4a7>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2c6fb <.literal16+0x4ab>
+ .byte 118,63 // jbe 2d13b <.literal16+0x4ab>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2c6ff <.literal16+0x4af>
+ .byte 118,63 // jbe 2d13f <.literal16+0x4af>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -54554,13 +55261,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2c736 <.literal16+0x4e6>
+ .byte 124,66 // jl 2d176 <.literal16+0x4e6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2c73a <.literal16+0x4ea>
+ .byte 124,66 // jl 2d17a <.literal16+0x4ea>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2c73e <.literal16+0x4ee>
+ .byte 124,66 // jl 2d17e <.literal16+0x4ee>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2c742 <.literal16+0x4f2>
+ .byte 124,66 // jl 2d182 <.literal16+0x4f2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -54606,13 +55313,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2c7c5 <.literal16+0x575>
+ .byte 112,65 // jo 2d205 <.literal16+0x575>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2c7c9 <.literal16+0x579>
+ .byte 112,65 // jo 2d209 <.literal16+0x579>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2c7cd <.literal16+0x57d>
+ .byte 112,65 // jo 2d20d <.literal16+0x57d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2c7d1 <.literal16+0x581>
+ .byte 112,65 // jo 2d211 <.literal16+0x581>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -54651,13 +55358,13 @@ BALIGN16
.byte 64,254 // rex (bad)
.byte 255,0 // incl (%rax)
.byte 255 // (bad)
- .byte 127,71 // jg 2c83b <.literal16+0x5eb>
+ .byte 127,71 // jg 2d27b <.literal16+0x5eb>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2c83f <.literal16+0x5ef>
+ .byte 127,71 // jg 2d27f <.literal16+0x5ef>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2c843 <.literal16+0x5f3>
+ .byte 127,71 // jg 2d283 <.literal16+0x5f3>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2c847 <.literal16+0x5f7>
+ .byte 127,71 // jg 2d287 <.literal16+0x5f7>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,208 // ds (bad)
@@ -54687,10 +55394,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2d94a <_sk_overlay_sse2_8bit+0x2dc0252e>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2e38a <_sk_overlay_sse2_8bit+0x2dc025b2>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 2c87c <.literal16+0x62c>
+ .byte 120,57 // js 2d2bc <.literal16+0x62c>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -54755,13 +55462,13 @@ BALIGN16
.byte 192,191,0,0,192,191,0 // sarb $0x0,-0x40400000(%rdi)
.byte 0,192 // add %al,%al
.byte 191,0,0,192,191 // mov $0xbfc00000,%edi
- .byte 114,28 // jb 2c92e <.literal16+0x6de>
+ .byte 114,28 // jb 2d36e <.literal16+0x6de>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2c932 <.literal16+0x6e2>
+ .byte 62,114,28 // jb,pt 2d372 <.literal16+0x6e2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2c936 <.literal16+0x6e6>
+ .byte 62,114,28 // jb,pt 2d376 <.literal16+0x6e6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2c93a <.literal16+0x6ea>
+ .byte 62,114,28 // jb,pt 2d37a <.literal16+0x6ea>
.byte 199 // (bad)
.byte 62,85 // ds push %rbp
.byte 85 // push %rbp
@@ -54780,15 +55487,15 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d665785 <_sk_overlay_sse2_8bit+0x3d63a369>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6661c5 <_sk_overlay_sse2_8bit+0x3d63a3ed>
.byte 57,142,99,61,114,249 // cmp %ecx,-0x68dc29d(%rsi)
- .byte 127,63 // jg 2c993 <.literal16+0x743>
- .byte 114,249 // jb 2c94f <.literal16+0x6ff>
- .byte 127,63 // jg 2c997 <.literal16+0x747>
- .byte 114,249 // jb 2c953 <.literal16+0x703>
- .byte 127,63 // jg 2c99b <.literal16+0x74b>
- .byte 114,249 // jb 2c957 <.literal16+0x707>
- .byte 127,63 // jg 2c99f <.literal16+0x74f>
+ .byte 127,63 // jg 2d3d3 <.literal16+0x743>
+ .byte 114,249 // jb 2d38f <.literal16+0x6ff>
+ .byte 127,63 // jg 2d3d7 <.literal16+0x747>
+ .byte 114,249 // jb 2d393 <.literal16+0x703>
+ .byte 127,63 // jg 2d3db <.literal16+0x74b>
+ .byte 114,249 // jb 2d397 <.literal16+0x707>
+ .byte 127,63 // jg 2d3df <.literal16+0x74f>
.byte 3,0 // add (%rax),%eax
.byte 0,0 // add %al,(%rax)
.byte 3,0 // add (%rax),%eax
@@ -54834,8 +55541,55 @@ BALIGN16
.byte 5,4,7,10,9 // add $0x90a0704,%eax
.byte 8,11 // or %cl,(%rbx)
.byte 14 // (bad)
- .byte 13,12,15,3,255 // or $0xff030f0c,%eax
- .byte 7 // (bad)
+ .byte 13,12,15,248,0 // or $0xf80f0c,%eax
+ .byte 0,0 // add %al,(%rax)
+ .byte 248 // clc
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 252 // cld
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 248 // clc
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 1,4,5,8,9,12,13 // add %eax,0xd0c0908(,%rax,1)
+ .byte 8,9 // or %cl,(%rcx)
+ .byte 12,13 // or $0xd,%al
+ .byte 12,13 // or $0xd,%al
+ .byte 14 // (bad)
+ .byte 15,7 // sysret
+ .byte 0,7 // add %al,(%rdi)
+ .byte 0,7 // add %al,(%rdi)
+ .byte 0,7 // add %al,(%rdi)
+ .byte 0,7 // add %al,(%rdi)
+ .byte 0,7 // add %al,(%rdi)
+ .byte 0,7 // add %al,(%rdi)
+ .byte 0,7 // add %al,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 12,0 // or $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 12,0 // or $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 12,0 // or $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 12,0 // or $0x0,%al
+ .byte 0,3 // add %al,(%rbx)
+ .byte 255,7 // incl (%rdi)
.byte 255,11 // decl (%rbx)
.byte 255,15 // decl (%rdi)
.byte 255,11 // decl (%rbx)
@@ -54895,14 +55649,14 @@ BALIGN16
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,0 // incl (%rax)
- .byte 127,0 // jg 2ca32 <.literal16+0x7e2>
- .byte 127,0 // jg 2ca34 <.literal16+0x7e4>
- .byte 127,0 // jg 2ca36 <.literal16+0x7e6>
- .byte 127,0 // jg 2ca38 <.literal16+0x7e8>
- .byte 127,0 // jg 2ca3a <.literal16+0x7ea>
- .byte 127,0 // jg 2ca3c <.literal16+0x7ec>
- .byte 127,0 // jg 2ca3e <.literal16+0x7ee>
- .byte 127,0 // jg 2ca40 <.literal16+0x7f0>
+ .byte 127,0 // jg 2d4d2 <.literal16+0x842>
+ .byte 127,0 // jg 2d4d4 <.literal16+0x844>
+ .byte 127,0 // jg 2d4d6 <.literal16+0x846>
+ .byte 127,0 // jg 2d4d8 <.literal16+0x848>
+ .byte 127,0 // jg 2d4da <.literal16+0x84a>
+ .byte 127,0 // jg 2d4dc <.literal16+0x84c>
+ .byte 127,0 // jg 2d4de <.literal16+0x84e>
+ .byte 127,0 // jg 2d4e0 <.literal16+0x850>
.byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%rax)
.byte 129 // .byte 0x81
.byte 128 // .byte 0x80
@@ -54997,9 +55751,9 @@ _sk_seed_shader_sse2:
.byte 102,15,110,2 // movd (%edx),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,144,156,204,0,0 // movaps 0xcc9c(%eax),%xmm2
+ .byte 15,40,144,140,207,0,0 // movaps 0xcf8c(%eax),%xmm2
.byte 15,88,194 // addps %xmm2,%xmm0
- .byte 15,88,128,172,204,0,0 // addps 0xccac(%eax),%xmm0
+ .byte 15,88,128,156,207,0,0 // addps 0xcf9c(%eax),%xmm0
.byte 102,15,110,74,4 // movd 0x4(%edx),%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
@@ -55011,7 +55765,7 @@ _sk_seed_shader_sse2:
.byte 15,41,82,32 // movaps %xmm2,0x20(%edx)
.byte 15,41,82,16 // movaps %xmm2,0x10(%edx)
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,144,188,204,0,0 // movaps 0xccbc(%eax),%xmm2
+ .byte 15,40,144,172,207,0,0 // movaps 0xcfac(%eax),%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 86 // push %esi
.byte 82 // push %edx
@@ -55038,20 +55792,20 @@ _sk_dither_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 102,15,110,32 // movd (%eax),%xmm4
.byte 102,15,112,236,0 // pshufd $0x0,%xmm4,%xmm5
- .byte 102,15,254,169,81,204,0,0 // paddd 0xcc51(%ecx),%xmm5
+ .byte 102,15,254,169,65,207,0,0 // paddd 0xcf41(%ecx),%xmm5
.byte 102,15,110,96,4 // movd 0x4(%eax),%xmm4
.byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7
.byte 102,15,239,253 // pxor %xmm5,%xmm7
- .byte 102,15,111,177,97,204,0,0 // movdqa 0xcc61(%ecx),%xmm6
+ .byte 102,15,111,177,81,207,0,0 // movdqa 0xcf51(%ecx),%xmm6
.byte 102,15,111,207 // movdqa %xmm7,%xmm1
.byte 102,15,219,206 // pand %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
- .byte 102,15,111,129,129,204,0,0 // movdqa 0xcc81(%ecx),%xmm0
+ .byte 102,15,111,129,113,207,0,0 // movdqa 0xcf71(%ecx),%xmm0
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,219,197 // pand %xmm5,%xmm0
- .byte 102,15,219,185,113,204,0,0 // pand 0xcc71(%ecx),%xmm7
- .byte 102,15,219,169,113,204,0,0 // pand 0xcc71(%ecx),%xmm5
+ .byte 102,15,219,185,97,207,0,0 // pand 0xcf61(%ecx),%xmm7
+ .byte 102,15,219,169,97,207,0,0 // pand 0xcf61(%ecx),%xmm5
.byte 102,15,114,246,4 // pslld $0x4,%xmm6
.byte 102,15,254,192 // paddd %xmm0,%xmm0
.byte 102,15,235,198 // por %xmm6,%xmm0
@@ -55066,8 +55820,8 @@ _sk_dither_sse2:
.byte 102,15,114,215,1 // psrld $0x1,%xmm7
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 15,91,196 // cvtdq2ps %xmm4,%xmm0
- .byte 15,89,129,145,204,0,0 // mulps 0xcc91(%ecx),%xmm0
- .byte 15,88,129,161,204,0,0 // addps 0xcca1(%ecx),%xmm0
+ .byte 15,89,129,129,207,0,0 // mulps 0xcf81(%ecx),%xmm0
+ .byte 15,88,129,145,207,0,0 // addps 0xcf91(%ecx),%xmm0
.byte 243,15,16,14 // movss (%esi),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -55135,7 +55889,7 @@ _sk_black_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,152,5,203,0,0 // movaps 0xcb05(%eax),%xmm3
+ .byte 15,40,152,245,205,0,0 // movaps 0xcdf5(%eax),%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -55158,7 +55912,7 @@ _sk_white_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,128,213,202,0,0 // movaps 0xcad5(%eax),%xmm0
+ .byte 15,40,128,197,205,0,0 // movaps 0xcdc5(%eax),%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -55248,7 +56002,7 @@ _sk_srcatop_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,170,38,202,0,0 // movaps 0xca26(%edx),%xmm5
+ .byte 15,40,170,22,205,0,0 // movaps 0xcd16(%edx),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
@@ -55287,7 +56041,7 @@ _sk_dstatop_sse2:
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,40,162,199,201,0,0 // movaps 0xc9c7(%edx),%xmm4
+ .byte 15,40,162,183,204,0,0 // movaps 0xccb7(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,198 // addps %xmm6,%xmm0
@@ -55371,7 +56125,7 @@ _sk_srcout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,6,201,0,0 // movaps 0xc906(%eax),%xmm4
+ .byte 15,40,160,246,203,0,0 // movaps 0xcbf6(%eax),%xmm4
.byte 15,92,98,64 // subps 0x40(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
@@ -55397,7 +56151,7 @@ _sk_dstout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,206,200,0,0 // movaps 0xc8ce(%eax),%xmm4
+ .byte 15,40,160,190,203,0,0 // movaps 0xcbbe(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,66,16 // movaps 0x10(%edx),%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -55427,7 +56181,7 @@ _sk_srcover_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,135,200,0,0 // movaps 0xc887(%eax),%xmm4
+ .byte 15,40,160,119,203,0,0 // movaps 0xcb77(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -55461,7 +56215,7 @@ _sk_dstover_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,106,64 // movaps 0x40(%edx),%xmm5
- .byte 15,40,160,55,200,0,0 // movaps 0xc837(%eax),%xmm4
+ .byte 15,40,160,39,203,0,0 // movaps 0xcb27(%eax),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,66,16 // addps 0x10(%edx),%xmm0
@@ -55517,7 +56271,7 @@ _sk_multiply_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
- .byte 15,40,129,184,199,0,0 // movaps 0xc7b8(%ecx),%xmm0
+ .byte 15,40,129,168,202,0,0 // movaps 0xcaa8(%ecx),%xmm0
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
@@ -55577,7 +56331,7 @@ _sk_plus__sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,88,66,16 // addps 0x10(%edx),%xmm0
- .byte 15,40,160,18,199,0,0 // movaps 0xc712(%eax),%xmm4
+ .byte 15,40,160,2,202,0,0 // movaps 0xca02(%eax),%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
.byte 15,88,74,32 // addps 0x20(%edx),%xmm1
.byte 15,93,204 // minps %xmm4,%xmm1
@@ -55649,7 +56403,7 @@ _sk_xor__sse2:
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
- .byte 15,40,154,100,198,0,0 // movaps 0xc664(%edx),%xmm3
+ .byte 15,40,154,84,201,0,0 // movaps 0xc954(%edx),%xmm3
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,89,198 // mulps %xmm6,%xmm0
@@ -55711,7 +56465,7 @@ _sk_darken_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,95,209 // maxps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,252,197,0,0 // movaps 0xc5fc(%edx),%xmm1
+ .byte 15,40,138,236,200,0,0 // movaps 0xc8ec(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -55760,7 +56514,7 @@ _sk_lighten_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,93,209 // minps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,124,197,0,0 // movaps 0xc57c(%edx),%xmm1
+ .byte 15,40,138,108,200,0,0 // movaps 0xc86c(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -55813,7 +56567,7 @@ _sk_difference_sse2:
.byte 15,93,214 // minps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,146,249,196,0,0 // movaps 0xc4f9(%edx),%xmm2
+ .byte 15,40,146,233,199,0,0 // movaps 0xc7e9(%edx),%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -55857,7 +56611,7 @@ _sk_exclusion_sse2:
.byte 15,89,202 // mulps %xmm2,%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
.byte 15,92,233 // subps %xmm1,%xmm5
- .byte 15,40,138,115,196,0,0 // movaps 0xc473(%edx),%xmm1
+ .byte 15,40,138,99,199,0,0 // movaps 0xc763(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,73,64 // mulps 0x40(%ecx),%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -55898,7 +56652,7 @@ _sk_colorburn_sse2:
.byte 15,93,198 // minps %xmm6,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
- .byte 15,40,177,244,195,0,0 // movaps 0xc3f4(%ecx),%xmm6
+ .byte 15,40,177,228,198,0,0 // movaps 0xc6e4(%ecx),%xmm6
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
@@ -56015,7 +56769,7 @@ _sk_colordodge_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
- .byte 15,40,145,107,194,0,0 // movaps 0xc26b(%ecx),%xmm2
+ .byte 15,40,145,91,197,0,0 // movaps 0xc55b(%ecx),%xmm2
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,40,250 // movaps %xmm2,%xmm7
@@ -56132,7 +56886,7 @@ _sk_hardlight_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
- .byte 15,40,145,10,193,0,0 // movaps 0xc10a(%ecx),%xmm2
+ .byte 15,40,145,250,195,0,0 // movaps 0xc3fa(%ecx),%xmm2
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,40,225 // movaps %xmm1,%xmm4
@@ -56242,7 +56996,7 @@ _sk_overlay_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
- .byte 15,40,161,191,191,0,0 // movaps 0xbfbf(%ecx),%xmm4
+ .byte 15,40,161,175,194,0,0 // movaps 0xc2af(%ecx),%xmm4
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
@@ -56370,17 +57124,17 @@ _sk_softlight_sse2:
.byte 232,0,0,0,0 // call f21 <_sk_softlight_sse2+0x52>
.byte 89 // pop %ecx
.byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,137,159,190,0,0 // movaps 0xbe9f(%ecx),%xmm1
+ .byte 15,40,137,143,193,0,0 // movaps 0xc18f(%ecx),%xmm1
.byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp)
.byte 15,88,193 // addps %xmm1,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,185,47,190,0,0 // movaps 0xbe2f(%ecx),%xmm7
+ .byte 15,40,185,31,193,0,0 // movaps 0xc11f(%ecx),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,82,242 // rsqrtps %xmm2,%xmm6
.byte 15,83,206 // rcpps %xmm6,%xmm1
.byte 15,92,202 // subps %xmm2,%xmm1
- .byte 15,40,161,175,190,0,0 // movaps 0xbeaf(%ecx),%xmm4
+ .byte 15,40,161,159,193,0,0 // movaps 0xc19f(%ecx),%xmm4
.byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp)
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
@@ -56586,7 +57340,7 @@ _sk_hue_sse2:
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 15,40,169,110,187,0,0 // movaps 0xbb6e(%ecx),%xmm5
+ .byte 15,40,169,94,190,0,0 // movaps 0xbe5e(%ecx),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
@@ -56619,17 +57373,17 @@ _sk_hue_sse2:
.byte 15,89,233 // mulps %xmm1,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,153,254,187,0,0 // movaps 0xbbfe(%ecx),%xmm3
+ .byte 15,40,153,238,190,0,0 // movaps 0xbeee(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,153,14,188,0,0 // movaps 0xbc0e(%ecx),%xmm3
+ .byte 15,40,153,254,190,0,0 // movaps 0xbefe(%ecx),%xmm3
.byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,40,137,110,187,0,0 // movaps 0xbb6e(%ecx),%xmm1
+ .byte 15,40,137,94,190,0,0 // movaps 0xbe5e(%ecx),%xmm1
.byte 15,92,77,184 // subps -0x48(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
@@ -56639,7 +57393,7 @@ _sk_hue_sse2:
.byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
- .byte 15,40,169,30,188,0,0 // movaps 0xbc1e(%ecx),%xmm5
+ .byte 15,40,169,14,191,0,0 // movaps 0xbf0e(%ecx),%xmm5
.byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,88,207 // addps %xmm7,%xmm1
.byte 15,94,212 // divps %xmm4,%xmm2
@@ -56832,17 +57586,17 @@ _sk_saturation_sse2:
.byte 15,89,253 // mulps %xmm5,%xmm7
.byte 232,0,0,0,0 // call 1536 <_sk_saturation_sse2+0xb0>
.byte 89 // pop %ecx
- .byte 15,40,153,170,184,0,0 // movaps 0xb8aa(%ecx),%xmm3
+ .byte 15,40,153,154,187,0,0 // movaps 0xbb9a(%ecx),%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
.byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,153,186,184,0,0 // movaps 0xb8ba(%ecx),%xmm3
+ .byte 15,40,153,170,187,0,0 // movaps 0xbbaa(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,129,26,184,0,0 // movaps 0xb81a(%ecx),%xmm0
+ .byte 15,40,129,10,187,0,0 // movaps 0xbb0a(%ecx),%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 15,92,69,216 // subps -0x28(%ebp),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -56854,7 +57608,7 @@ _sk_saturation_sse2:
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,129,202,184,0,0 // movaps 0xb8ca(%ecx),%xmm0
+ .byte 15,40,129,186,187,0,0 // movaps 0xbbba(%ecx),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
@@ -57013,16 +57767,16 @@ _sk_color_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,16 // movaps 0x10(%eax),%xmm2
.byte 15,40,72,32 // movaps 0x20(%eax),%xmm1
- .byte 15,40,177,79,182,0,0 // movaps 0xb64f(%ecx),%xmm6
+ .byte 15,40,177,63,185,0,0 // movaps 0xb93f(%ecx),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,153,95,182,0,0 // movaps 0xb65f(%ecx),%xmm3
+ .byte 15,40,153,79,185,0,0 // movaps 0xb94f(%ecx),%xmm3
.byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 15,40,129,191,181,0,0 // movaps 0xb5bf(%ecx),%xmm0
+ .byte 15,40,129,175,184,0,0 // movaps 0xb8af(%ecx),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,69,200 // subps -0x38(%ebp),%xmm0
.byte 15,89,208 // mulps %xmm0,%xmm2
@@ -57032,7 +57786,7 @@ _sk_color_sse2:
.byte 15,40,80,48 // movaps 0x30(%eax),%xmm2
.byte 15,89,194 // mulps %xmm2,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
- .byte 15,40,137,111,182,0,0 // movaps 0xb66f(%ecx),%xmm1
+ .byte 15,40,137,95,185,0,0 // movaps 0xb95f(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,40,88,64 // movaps 0x40(%eax),%xmm3
@@ -57191,18 +57945,18 @@ _sk_luminosity_sse2:
.byte 232,0,0,0,0 // call 19f4 <_sk_luminosity_sse2+0x11>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 15,40,161,236,179,0,0 // movaps 0xb3ec(%ecx),%xmm4
+ .byte 15,40,161,220,182,0,0 // movaps 0xb6dc(%ecx),%xmm4
.byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,161,252,179,0,0 // movaps 0xb3fc(%ecx),%xmm4
+ .byte 15,40,161,236,182,0,0 // movaps 0xb6ec(%ecx),%xmm4
.byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,161,92,179,0,0 // movaps 0xb35c(%ecx),%xmm4
+ .byte 15,40,161,76,182,0,0 // movaps 0xb64c(%ecx),%xmm4
.byte 15,40,252 // movaps %xmm4,%xmm7
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -57212,7 +57966,7 @@ _sk_luminosity_sse2:
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,41,189,104,255,255,255 // movaps %xmm7,-0x98(%ebp)
.byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,40,137,12,180,0,0 // movaps 0xb40c(%ecx),%xmm1
+ .byte 15,40,137,252,182,0,0 // movaps 0xb6fc(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,213 // addps %xmm5,%xmm2
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
@@ -57388,7 +58142,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 139,49 // mov (%ecx),%esi
.byte 15,133,224,0,0,0 // jne 1d61 <_sk_srcover_rgba_8888_sse2+0x119>
.byte 243,15,111,20,178 // movdqu (%edx,%esi,4),%xmm2
- .byte 102,15,111,167,177,177,0,0 // movdqa 0xb1b1(%edi),%xmm4
+ .byte 102,15,111,167,161,180,0,0 // movdqa 0xb4a1(%edi),%xmm4
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
@@ -57399,9 +58153,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,219,252 // pand %xmm4,%xmm7
.byte 15,91,229 // cvtdq2ps %xmm5,%xmm4
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,175,241,176,0,0 // movaps 0xb0f1(%edi),%xmm5
+ .byte 15,40,175,225,179,0,0 // movaps 0xb3e1(%edi),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
- .byte 15,40,143,193,177,0,0 // movaps 0xb1c1(%edi),%xmm1
+ .byte 15,40,143,177,180,0,0 // movaps 0xb4b1(%edi),%xmm1
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
@@ -57515,7 +58269,7 @@ _sk_clamp_1_sse2:
.byte 232,0,0,0,0 // call 1e0b <_sk_clamp_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,69,175,0,0 // movaps 0xaf45(%eax),%xmm4
+ .byte 15,40,160,53,178,0,0 // movaps 0xb235(%eax),%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
.byte 15,93,204 // minps %xmm4,%xmm1
.byte 15,93,212 // minps %xmm4,%xmm2
@@ -57539,7 +58293,7 @@ _sk_clamp_a_sse2:
.byte 232,0,0,0,0 // call 1e3e <_sk_clamp_a_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,93,152,18,175,0,0 // minps 0xaf12(%eax),%xmm3
+ .byte 15,93,152,2,178,0,0 // minps 0xb202(%eax),%xmm3
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -57564,7 +58318,7 @@ _sk_clamp_a_dst_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,98,64 // movaps 0x40(%edx),%xmm4
- .byte 15,93,160,226,174,0,0 // minps 0xaee2(%eax),%xmm4
+ .byte 15,93,160,210,177,0,0 // minps 0xb1d2(%eax),%xmm4
.byte 15,41,98,64 // movaps %xmm4,0x40(%edx)
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,93,236 // minps %xmm4,%xmm5
@@ -57638,7 +58392,7 @@ _sk_invert_sse2:
.byte 232,0,0,0,0 // call 1f19 <_sk_invert_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,55,174,0,0 // movaps 0xae37(%eax),%xmm4
+ .byte 15,40,160,39,177,0,0 // movaps 0xb127(%eax),%xmm4
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
@@ -57761,7 +58515,7 @@ _sk_unpremul_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,40,168,57,173,0,0 // movaps 0xad39(%eax),%xmm5
+ .byte 15,40,168,41,176,0,0 // movaps 0xb029(%eax),%xmm5
.byte 15,94,235 // divps %xmm3,%xmm5
.byte 15,194,227,4 // cmpneqps %xmm3,%xmm4
.byte 15,84,229 // andps %xmm5,%xmm4
@@ -57792,19 +58546,19 @@ _sk_from_srgb_sse2:
.byte 88 // pop %eax
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,201 // mulps %xmm1,%xmm1
- .byte 15,40,160,127,173,0,0 // movaps 0xad7f(%eax),%xmm4
+ .byte 15,40,160,111,176,0,0 // movaps 0xb06f(%eax),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,176,223,173,0,0 // movaps 0xaddf(%eax),%xmm6
+ .byte 15,40,176,207,176,0,0 // movaps 0xb0cf(%eax),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,176,207,173,0,0 // movaps 0xadcf(%eax),%xmm6
+ .byte 15,40,176,191,176,0,0 // movaps 0xb0bf(%eax),%xmm6
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,184,239,173,0,0 // movaps 0xadef(%eax),%xmm7
+ .byte 15,40,184,223,176,0,0 // movaps 0xb0df(%eax),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,184,255,173,0,0 // movaps 0xadff(%eax),%xmm7
+ .byte 15,40,184,239,176,0,0 // movaps 0xb0ef(%eax),%xmm7
.byte 15,194,215,1 // cmpltps %xmm7,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -57864,18 +58618,18 @@ _sk_from_srgb_dst_sse2:
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,40,161,164,172,0,0 // movaps 0xaca4(%ecx),%xmm4
+ .byte 15,40,161,148,175,0,0 // movaps 0xaf94(%ecx),%xmm4
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,177,4,173,0,0 // movaps 0xad04(%ecx),%xmm6
+ .byte 15,40,177,244,175,0,0 // movaps 0xaff4(%ecx),%xmm6
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,169,244,172,0,0 // movaps 0xacf4(%ecx),%xmm5
+ .byte 15,40,169,228,175,0,0 // movaps 0xafe4(%ecx),%xmm5
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,185,20,173,0,0 // movaps 0xad14(%ecx),%xmm7
+ .byte 15,40,185,4,176,0,0 // movaps 0xb004(%ecx),%xmm7
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,153,36,173,0,0 // movaps 0xad24(%ecx),%xmm3
+ .byte 15,40,153,20,176,0,0 // movaps 0xb014(%ecx),%xmm3
.byte 15,194,203,1 // cmpltps %xmm3,%xmm1
.byte 15,84,209 // andps %xmm1,%xmm2
.byte 15,85,200 // andnps %xmm0,%xmm1
@@ -57937,25 +58691,25 @@ _sk_to_srgb_sse2:
.byte 232,0,0,0,0 // call 2227 <_sk_to_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,82,218 // rsqrtps %xmm2,%xmm3
- .byte 15,40,160,89,172,0,0 // movaps 0xac59(%eax),%xmm4
+ .byte 15,40,160,73,175,0,0 // movaps 0xaf49(%eax),%xmm4
.byte 15,40,235 // movaps %xmm3,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,40,128,105,172,0,0 // movaps 0xac69(%eax),%xmm0
+ .byte 15,40,128,89,175,0,0 // movaps 0xaf59(%eax),%xmm0
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,40,128,121,172,0,0 // movaps 0xac79(%eax),%xmm0
+ .byte 15,40,128,105,175,0,0 // movaps 0xaf69(%eax),%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,128,137,172,0,0 // movaps 0xac89(%eax),%xmm0
+ .byte 15,40,128,121,175,0,0 // movaps 0xaf79(%eax),%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 15,88,216 // addps %xmm0,%xmm3
.byte 15,83,195 // rcpps %xmm3,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,168,73,172,0,0 // movaps 0xac49(%eax),%xmm5
+ .byte 15,40,168,57,175,0,0 // movaps 0xaf39(%eax),%xmm5
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,152,153,172,0,0 // movaps 0xac99(%eax),%xmm3
+ .byte 15,40,152,137,175,0,0 // movaps 0xaf89(%eax),%xmm3
.byte 15,194,211,1 // cmpltps %xmm3,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -58026,14 +58780,14 @@ _sk_rgb_to_hsl_sse2:
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
- .byte 15,40,136,50,170,0,0 // movaps 0xaa32(%eax),%xmm1
+ .byte 15,40,136,34,173,0,0 // movaps 0xad22(%eax),%xmm1
.byte 15,94,200 // divps %xmm0,%xmm1
.byte 15,40,199 // movaps %xmm7,%xmm0
.byte 15,92,194 // subps %xmm2,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,168,178,171,0,0 // andps 0xabb2(%eax),%xmm5
+ .byte 15,84,168,162,174,0,0 // andps 0xaea2(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,196,0 // cmpeqps %xmm4,%xmm0
@@ -58043,9 +58797,9 @@ _sk_rgb_to_hsl_sse2:
.byte 15,92,231 // subps %xmm7,%xmm4
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,89,225 // mulps %xmm1,%xmm4
- .byte 15,40,136,194,171,0,0 // movaps 0xabc2(%eax),%xmm1
+ .byte 15,40,136,178,174,0,0 // movaps 0xaeb2(%eax),%xmm1
.byte 15,88,209 // addps %xmm1,%xmm2
- .byte 15,88,160,210,171,0,0 // addps 0xabd2(%eax),%xmm4
+ .byte 15,88,160,194,174,0,0 // addps 0xaec2(%eax),%xmm4
.byte 15,84,214 // andps %xmm6,%xmm2
.byte 15,85,244 // andnps %xmm4,%xmm6
.byte 15,86,242 // orps %xmm2,%xmm6
@@ -58057,7 +58811,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,194,226,4 // cmpneqps %xmm2,%xmm4
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 15,40,168,18,170,0,0 // movaps 0xaa12(%eax),%xmm5
+ .byte 15,40,168,2,173,0,0 // movaps 0xad02(%eax),%xmm5
.byte 15,92,202 // subps %xmm2,%xmm1
.byte 15,40,211 // movaps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
@@ -58067,7 +58821,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,86,233 // orps %xmm1,%xmm5
.byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
.byte 15,94,205 // divps %xmm5,%xmm1
- .byte 15,89,128,226,171,0,0 // mulps 0xabe2(%eax),%xmm0
+ .byte 15,89,128,210,174,0,0 // mulps 0xaed2(%eax),%xmm0
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,84,204 // andps %xmm4,%xmm1
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -58092,7 +58846,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
.byte 232,0,0,0,0 // call 2419 <_sk_hsl_to_rgb_sse2+0x19>
.byte 88 // pop %eax
- .byte 15,40,160,23,169,0,0 // movaps 0xa917(%eax),%xmm4
+ .byte 15,40,160,7,172,0,0 // movaps 0xac07(%eax),%xmm4
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,194,218,2 // cmpleps %xmm2,%xmm3
@@ -58105,13 +58859,13 @@ _sk_hsl_to_rgb_sse2:
.byte 15,84,243 // andps %xmm3,%xmm6
.byte 15,85,217 // andnps %xmm1,%xmm3
.byte 15,86,222 // orps %xmm6,%xmm3
- .byte 15,40,168,247,170,0,0 // movaps 0xaaf7(%eax),%xmm5
+ .byte 15,40,168,231,173,0,0 // movaps 0xade7(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 243,15,91,205 // cvttps2dq %xmm5,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,193,1 // cmpltps %xmm1,%xmm0
- .byte 15,40,176,55,169,0,0 // movaps 0xa937(%eax),%xmm6
+ .byte 15,40,176,39,172,0,0 // movaps 0xac27(%eax),%xmm6
.byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp)
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,200 // subps %xmm0,%xmm1
@@ -58121,19 +58875,19 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,40,184,7,171,0,0 // movaps 0xab07(%eax),%xmm7
+ .byte 15,40,184,247,173,0,0 // movaps 0xadf7(%eax),%xmm7
.byte 15,41,189,88,255,255,255 // movaps %xmm7,-0xa8(%ebp)
.byte 15,194,253,2 // cmpleps %xmm5,%xmm7
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,204 // movaps %xmm4,%xmm1
.byte 15,194,205,2 // cmpleps %xmm5,%xmm1
- .byte 15,40,160,231,170,0,0 // movaps 0xaae7(%eax),%xmm4
+ .byte 15,40,160,215,173,0,0 // movaps 0xadd7(%eax),%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,194,229,2 // cmpleps %xmm5,%xmm4
- .byte 15,40,176,183,170,0,0 // movaps 0xaab7(%eax),%xmm6
+ .byte 15,40,176,167,173,0,0 // movaps 0xada7(%eax),%xmm6
.byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,128,215,170,0,0 // movaps 0xaad7(%eax),%xmm0
+ .byte 15,40,128,199,173,0,0 // movaps 0xadc7(%eax),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
@@ -58159,18 +58913,18 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,194,200,1 // cmpltps %xmm0,%xmm1
- .byte 15,84,136,55,169,0,0 // andps 0xa937(%eax),%xmm1
+ .byte 15,84,136,39,172,0,0 // andps 0xac27(%eax),%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,40,128,7,171,0,0 // movaps 0xab07(%eax),%xmm0
+ .byte 15,40,128,247,173,0,0 // movaps 0xadf7(%eax),%xmm0
.byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,40,152,23,169,0,0 // movaps 0xa917(%eax),%xmm3
+ .byte 15,40,152,7,172,0,0 // movaps 0xac07(%eax),%xmm3
.byte 15,194,217,2 // cmpleps %xmm1,%xmm3
- .byte 15,40,160,231,170,0,0 // movaps 0xaae7(%eax),%xmm4
+ .byte 15,40,160,215,173,0,0 // movaps 0xadd7(%eax),%xmm4
.byte 15,194,225,2 // cmpleps %xmm1,%xmm4
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,168,215,170,0,0 // movaps 0xaad7(%eax),%xmm5
+ .byte 15,40,168,199,173,0,0 // movaps 0xadc7(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,239 // mulps %xmm7,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
@@ -58190,7 +58944,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
.byte 15,85,252 // andnps %xmm4,%xmm7
.byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 15,88,152,23,171,0,0 // addps 0xab17(%eax),%xmm3
+ .byte 15,88,152,7,174,0,0 // addps 0xae07(%eax),%xmm3
.byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
@@ -58292,9 +59046,9 @@ _sk_scale_u8_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,125,167,0,0 // pand 0xa77d(%edx),%xmm4
+ .byte 102,15,219,162,109,170,0,0 // pand 0xaa6d(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,173,168,0,0 // mulps 0xa8ad(%edx),%xmm4
+ .byte 15,89,162,157,171,0,0 // mulps 0xab9d(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
@@ -58360,17 +59114,17 @@ _sk_scale_565_sse2:
.byte 15,133,157,0,0,0 // jne 280b <_sk_scale_565_sse2+0xd8>
.byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,162,3,168,0,0 // movdqa 0xa803(%edx),%xmm4
+ .byte 102,15,111,162,243,170,0,0 // movdqa 0xaaf3(%edx),%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,212 // cvtdq2ps %xmm4,%xmm2
- .byte 15,89,146,19,168,0,0 // mulps 0xa813(%edx),%xmm2
- .byte 102,15,111,170,35,168,0,0 // movdqa 0xa823(%edx),%xmm5
+ .byte 15,89,146,3,171,0,0 // mulps 0xab03(%edx),%xmm2
+ .byte 102,15,111,170,19,171,0,0 // movdqa 0xab13(%edx),%xmm5
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,51,168,0,0 // mulps 0xa833(%edx),%xmm5
- .byte 102,15,219,178,67,168,0,0 // pand 0xa843(%edx),%xmm6
+ .byte 15,89,170,35,171,0,0 // mulps 0xab23(%edx),%xmm5
+ .byte 102,15,219,178,51,171,0,0 // pand 0xab33(%edx),%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,83,168,0,0 // mulps 0xa853(%edx),%xmm6
+ .byte 15,89,178,67,171,0,0 // mulps 0xab43(%edx),%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,93,254 // minps %xmm6,%xmm7
.byte 15,40,226 // movaps %xmm2,%xmm4
@@ -58484,9 +59238,9 @@ _sk_lerp_u8_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,86,165,0,0 // pand 0xa556(%edx),%xmm4
+ .byte 102,15,219,162,70,168,0,0 // pand 0xa846(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,134,166,0,0 // mulps 0xa686(%edx),%xmm4
+ .byte 15,89,162,118,169,0,0 // mulps 0xa976(%edx),%xmm4
.byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
.byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
.byte 15,92,197 // subps %xmm5,%xmm0
@@ -58564,17 +59318,17 @@ _sk_lerp_565_sse2:
.byte 15,133,211,0,0,0 // jne 2a98 <_sk_lerp_565_sse2+0x113>
.byte 243,15,126,44,126 // movq (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
- .byte 102,15,111,162,172,165,0,0 // movdqa 0xa5ac(%edx),%xmm4
+ .byte 102,15,111,162,156,168,0,0 // movdqa 0xa89c(%edx),%xmm4
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 15,91,204 // cvtdq2ps %xmm4,%xmm1
- .byte 15,89,138,188,165,0,0 // mulps 0xa5bc(%edx),%xmm1
- .byte 102,15,111,178,204,165,0,0 // movdqa 0xa5cc(%edx),%xmm6
+ .byte 15,89,138,172,168,0,0 // mulps 0xa8ac(%edx),%xmm1
+ .byte 102,15,111,178,188,168,0,0 // movdqa 0xa8bc(%edx),%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,220,165,0,0 // mulps 0xa5dc(%edx),%xmm6
- .byte 102,15,219,170,236,165,0,0 // pand 0xa5ec(%edx),%xmm5
+ .byte 15,89,178,204,168,0,0 // mulps 0xa8cc(%edx),%xmm6
+ .byte 102,15,219,170,220,168,0,0 // pand 0xa8dc(%edx),%xmm5
.byte 15,91,213 // cvtdq2ps %xmm5,%xmm2
- .byte 15,89,146,252,165,0,0 // mulps 0xa5fc(%edx),%xmm2
+ .byte 15,89,146,236,168,0,0 // mulps 0xa8ec(%edx),%xmm2
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,254 // movaps %xmm6,%xmm7
@@ -58662,7 +59416,7 @@ _sk_load_tables_sse2:
.byte 139,30 // mov (%esi),%ebx
.byte 15,133,19,1,0,0 // jne 2c18 <_sk_load_tables_sse2+0x139>
.byte 243,15,111,28,187 // movdqu (%ebx,%edi,4),%xmm3
- .byte 102,15,111,146,35,163,0,0 // movdqa 0xa323(%edx),%xmm2
+ .byte 102,15,111,146,19,166,0,0 // movdqa 0xa613(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
@@ -58718,7 +59472,7 @@ _sk_load_tables_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,83,164,0,0 // mulps 0xa453(%edx),%xmm3
+ .byte 15,89,154,67,167,0,0 // mulps 0xa743(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,194 // mov %eax,%edx
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -58865,7 +59619,7 @@ _sk_load_tables_u16_be_sse2:
.byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3
.byte 102,15,97,223 // punpcklwd %xmm7,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,85,163,0,0 // mulps 0xa355(%edx),%xmm3
+ .byte 15,89,154,69,166,0,0 // mulps 0xa645(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,193 // mov %eax,%ecx
.byte 141,65,8 // lea 0x8(%ecx),%eax
@@ -59004,7 +59758,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 141,65,8 // lea 0x8(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 139,85,240 // mov -0x10(%ebp),%edx
- .byte 15,40,162,245,158,0,0 // movaps 0x9ef5(%edx),%xmm4
+ .byte 15,40,162,229,161,0,0 // movaps 0xa1e5(%edx),%xmm4
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 80 // push %eax
@@ -59049,7 +59803,7 @@ _sk_byte_tables_sse2:
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
- .byte 15,40,162,182,157,0,0 // movaps 0x9db6(%edx),%xmm4
+ .byte 15,40,162,166,160,0,0 // movaps 0xa0a6(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
@@ -59071,7 +59825,7 @@ _sk_byte_tables_sse2:
.byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0
.byte 139,65,4 // mov 0x4(%ecx),%eax
.byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0
- .byte 15,40,170,214,158,0,0 // movaps 0x9ed6(%edx),%xmm5
+ .byte 15,40,170,198,161,0,0 // movaps 0xa1c6(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -59201,7 +59955,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0
.byte 139,121,4 // mov 0x4(%ecx),%edi
.byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0
- .byte 15,40,170,214,156,0,0 // movaps 0x9cd6(%edx),%xmm5
+ .byte 15,40,170,198,159,0,0 // movaps 0x9fc6(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -59457,15 +60211,15 @@ _sk_parametric_r_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,135,154,0,0 // mulps 0x9a87(%edx),%xmm5
- .byte 15,84,178,151,154,0,0 // andps 0x9a97(%edx),%xmm6
- .byte 15,86,178,247,151,0,0 // orps 0x97f7(%edx),%xmm6
- .byte 15,88,170,167,154,0,0 // addps 0x9aa7(%edx),%xmm5
- .byte 15,40,186,183,154,0,0 // movaps 0x9ab7(%edx),%xmm7
+ .byte 15,89,170,119,157,0,0 // mulps 0x9d77(%edx),%xmm5
+ .byte 15,84,178,135,157,0,0 // andps 0x9d87(%edx),%xmm6
+ .byte 15,86,178,231,154,0,0 // orps 0x9ae7(%edx),%xmm6
+ .byte 15,88,170,151,157,0,0 // addps 0x9d97(%edx),%xmm5
+ .byte 15,40,186,167,157,0,0 // movaps 0x9da7(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,199,154,0,0 // addps 0x9ac7(%edx),%xmm6
- .byte 15,40,186,215,154,0,0 // movaps 0x9ad7(%edx),%xmm7
+ .byte 15,88,178,183,157,0,0 // addps 0x9db7(%edx),%xmm6
+ .byte 15,40,186,199,157,0,0 // movaps 0x9dc7(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -59475,21 +60229,21 @@ _sk_parametric_r_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,23,152,0,0 // movaps 0x9817(%edx),%xmm6
+ .byte 15,40,178,7,155,0,0 // movaps 0x9b07(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,231,154,0,0 // addps 0x9ae7(%edx),%xmm5
- .byte 15,40,186,247,154,0,0 // movaps 0x9af7(%edx),%xmm7
+ .byte 15,88,170,215,157,0,0 // addps 0x9dd7(%edx),%xmm5
+ .byte 15,40,186,231,157,0,0 // movaps 0x9de7(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,7,155,0,0 // movaps 0x9b07(%edx),%xmm7
+ .byte 15,40,186,247,157,0,0 // movaps 0x9df7(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,23,155,0,0 // movaps 0x9b17(%edx),%xmm0
+ .byte 15,40,130,7,158,0,0 // movaps 0x9e07(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,39,155,0,0 // mulps 0x9b27(%edx),%xmm0
+ .byte 15,89,130,23,158,0,0 // mulps 0x9e17(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -59543,15 +60297,15 @@ _sk_parametric_g_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,80,153,0,0 // mulps 0x9950(%edx),%xmm5
- .byte 15,84,178,96,153,0,0 // andps 0x9960(%edx),%xmm6
- .byte 15,86,178,192,150,0,0 // orps 0x96c0(%edx),%xmm6
- .byte 15,88,170,112,153,0,0 // addps 0x9970(%edx),%xmm5
- .byte 15,40,186,128,153,0,0 // movaps 0x9980(%edx),%xmm7
+ .byte 15,89,170,64,156,0,0 // mulps 0x9c40(%edx),%xmm5
+ .byte 15,84,178,80,156,0,0 // andps 0x9c50(%edx),%xmm6
+ .byte 15,86,178,176,153,0,0 // orps 0x99b0(%edx),%xmm6
+ .byte 15,88,170,96,156,0,0 // addps 0x9c60(%edx),%xmm5
+ .byte 15,40,186,112,156,0,0 // movaps 0x9c70(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,144,153,0,0 // addps 0x9990(%edx),%xmm6
- .byte 15,40,186,160,153,0,0 // movaps 0x99a0(%edx),%xmm7
+ .byte 15,88,178,128,156,0,0 // addps 0x9c80(%edx),%xmm6
+ .byte 15,40,186,144,156,0,0 // movaps 0x9c90(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -59561,21 +60315,21 @@ _sk_parametric_g_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,224,150,0,0 // movaps 0x96e0(%edx),%xmm6
+ .byte 15,40,178,208,153,0,0 // movaps 0x99d0(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,176,153,0,0 // addps 0x99b0(%edx),%xmm5
- .byte 15,40,186,192,153,0,0 // movaps 0x99c0(%edx),%xmm7
+ .byte 15,88,170,160,156,0,0 // addps 0x9ca0(%edx),%xmm5
+ .byte 15,40,186,176,156,0,0 // movaps 0x9cb0(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,208,153,0,0 // movaps 0x99d0(%edx),%xmm7
+ .byte 15,40,186,192,156,0,0 // movaps 0x9cc0(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,224,153,0,0 // movaps 0x99e0(%edx),%xmm0
+ .byte 15,40,130,208,156,0,0 // movaps 0x9cd0(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,240,153,0,0 // mulps 0x99f0(%edx),%xmm0
+ .byte 15,89,130,224,156,0,0 // mulps 0x9ce0(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -59628,15 +60382,15 @@ _sk_parametric_b_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,28,152,0,0 // mulps 0x981c(%edx),%xmm5
- .byte 15,84,178,44,152,0,0 // andps 0x982c(%edx),%xmm6
- .byte 15,86,178,140,149,0,0 // orps 0x958c(%edx),%xmm6
- .byte 15,88,170,60,152,0,0 // addps 0x983c(%edx),%xmm5
- .byte 15,40,186,76,152,0,0 // movaps 0x984c(%edx),%xmm7
+ .byte 15,89,170,12,155,0,0 // mulps 0x9b0c(%edx),%xmm5
+ .byte 15,84,178,28,155,0,0 // andps 0x9b1c(%edx),%xmm6
+ .byte 15,86,178,124,152,0,0 // orps 0x987c(%edx),%xmm6
+ .byte 15,88,170,44,155,0,0 // addps 0x9b2c(%edx),%xmm5
+ .byte 15,40,186,60,155,0,0 // movaps 0x9b3c(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,92,152,0,0 // addps 0x985c(%edx),%xmm6
- .byte 15,40,186,108,152,0,0 // movaps 0x986c(%edx),%xmm7
+ .byte 15,88,178,76,155,0,0 // addps 0x9b4c(%edx),%xmm6
+ .byte 15,40,186,92,155,0,0 // movaps 0x9b5c(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -59646,21 +60400,21 @@ _sk_parametric_b_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,172,149,0,0 // movaps 0x95ac(%edx),%xmm6
+ .byte 15,40,178,156,152,0,0 // movaps 0x989c(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,124,152,0,0 // addps 0x987c(%edx),%xmm5
- .byte 15,40,186,140,152,0,0 // movaps 0x988c(%edx),%xmm7
+ .byte 15,88,170,108,155,0,0 // addps 0x9b6c(%edx),%xmm5
+ .byte 15,40,186,124,155,0,0 // movaps 0x9b7c(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,156,152,0,0 // movaps 0x989c(%edx),%xmm7
+ .byte 15,40,186,140,155,0,0 // movaps 0x9b8c(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,172,152,0,0 // movaps 0x98ac(%edx),%xmm0
+ .byte 15,40,130,156,155,0,0 // movaps 0x9b9c(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,188,152,0,0 // mulps 0x98bc(%edx),%xmm0
+ .byte 15,89,130,172,155,0,0 // mulps 0x9bac(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -59713,15 +60467,15 @@ _sk_parametric_a_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,232,150,0,0 // mulps 0x96e8(%edx),%xmm5
- .byte 15,84,178,248,150,0,0 // andps 0x96f8(%edx),%xmm6
- .byte 15,86,178,88,148,0,0 // orps 0x9458(%edx),%xmm6
- .byte 15,88,170,8,151,0,0 // addps 0x9708(%edx),%xmm5
- .byte 15,40,186,24,151,0,0 // movaps 0x9718(%edx),%xmm7
+ .byte 15,89,170,216,153,0,0 // mulps 0x99d8(%edx),%xmm5
+ .byte 15,84,178,232,153,0,0 // andps 0x99e8(%edx),%xmm6
+ .byte 15,86,178,72,151,0,0 // orps 0x9748(%edx),%xmm6
+ .byte 15,88,170,248,153,0,0 // addps 0x99f8(%edx),%xmm5
+ .byte 15,40,186,8,154,0,0 // movaps 0x9a08(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,40,151,0,0 // addps 0x9728(%edx),%xmm6
- .byte 15,40,186,56,151,0,0 // movaps 0x9738(%edx),%xmm7
+ .byte 15,88,178,24,154,0,0 // addps 0x9a18(%edx),%xmm6
+ .byte 15,40,186,40,154,0,0 // movaps 0x9a28(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -59731,21 +60485,21 @@ _sk_parametric_a_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,120,148,0,0 // movaps 0x9478(%edx),%xmm6
+ .byte 15,40,178,104,151,0,0 // movaps 0x9768(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,72,151,0,0 // addps 0x9748(%edx),%xmm5
- .byte 15,40,186,88,151,0,0 // movaps 0x9758(%edx),%xmm7
+ .byte 15,88,170,56,154,0,0 // addps 0x9a38(%edx),%xmm5
+ .byte 15,40,186,72,154,0,0 // movaps 0x9a48(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,104,151,0,0 // movaps 0x9768(%edx),%xmm7
+ .byte 15,40,186,88,154,0,0 // movaps 0x9a58(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,120,151,0,0 // movaps 0x9778(%edx),%xmm0
+ .byte 15,40,130,104,154,0,0 // movaps 0x9a68(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,136,151,0,0 // mulps 0x9788(%edx),%xmm0
+ .byte 15,89,130,120,154,0,0 // mulps 0x9a78(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -59780,15 +60534,15 @@ _sk_gamma_sse2:
.byte 232,0,0,0,0 // call 3a09 <_sk_gamma_sse2+0x12>
.byte 88 // pop %eax
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,128,183,149,0,0 // mulps 0x95b7(%eax),%xmm0
- .byte 15,84,152,199,149,0,0 // andps 0x95c7(%eax),%xmm3
- .byte 15,86,152,39,147,0,0 // orps 0x9327(%eax),%xmm3
- .byte 15,88,128,215,149,0,0 // addps 0x95d7(%eax),%xmm0
+ .byte 15,89,128,167,152,0,0 // mulps 0x98a7(%eax),%xmm0
+ .byte 15,84,152,183,152,0,0 // andps 0x98b7(%eax),%xmm3
+ .byte 15,86,152,23,150,0,0 // orps 0x9617(%eax),%xmm3
+ .byte 15,88,128,199,152,0,0 // addps 0x98c7(%eax),%xmm0
.byte 15,40,227 // movaps %xmm3,%xmm4
- .byte 15,89,160,231,149,0,0 // mulps 0x95e7(%eax),%xmm4
+ .byte 15,89,160,215,152,0,0 // mulps 0x98d7(%eax),%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,88,152,247,149,0,0 // addps 0x95f7(%eax),%xmm3
- .byte 15,40,160,7,150,0,0 // movaps 0x9607(%eax),%xmm4
+ .byte 15,88,152,231,152,0,0 // addps 0x98e7(%eax),%xmm3
+ .byte 15,40,160,247,152,0,0 // movaps 0x98f7(%eax),%xmm4
.byte 15,94,227 // divps %xmm3,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 139,77,12 // mov 0xc(%ebp),%ecx
@@ -59801,30 +60555,30 @@ _sk_gamma_sse2:
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,227,1 // cmpltps %xmm3,%xmm4
- .byte 15,84,160,71,147,0,0 // andps 0x9347(%eax),%xmm4
+ .byte 15,84,160,55,150,0,0 // andps 0x9637(%eax),%xmm4
.byte 15,92,220 // subps %xmm4,%xmm3
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
- .byte 15,88,128,23,150,0,0 // addps 0x9617(%eax),%xmm0
- .byte 15,40,176,55,150,0,0 // movaps 0x9637(%eax),%xmm6
+ .byte 15,88,128,7,153,0,0 // addps 0x9907(%eax),%xmm0
+ .byte 15,40,176,39,153,0,0 // movaps 0x9927(%eax),%xmm6
.byte 15,92,244 // subps %xmm4,%xmm6
- .byte 15,40,168,39,150,0,0 // movaps 0x9627(%eax),%xmm5
+ .byte 15,40,168,23,153,0,0 // movaps 0x9917(%eax),%xmm5
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,40,152,71,150,0,0 // movaps 0x9647(%eax),%xmm3
+ .byte 15,40,152,55,153,0,0 // movaps 0x9937(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,94,230 // divps %xmm6,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,128,183,149,0,0 // mulps 0x95b7(%eax),%xmm0
- .byte 15,84,136,199,149,0,0 // andps 0x95c7(%eax),%xmm1
- .byte 15,86,136,39,147,0,0 // orps 0x9327(%eax),%xmm1
- .byte 15,88,128,215,149,0,0 // addps 0x95d7(%eax),%xmm0
+ .byte 15,89,128,167,152,0,0 // mulps 0x98a7(%eax),%xmm0
+ .byte 15,84,136,183,152,0,0 // andps 0x98b7(%eax),%xmm1
+ .byte 15,86,136,23,150,0,0 // orps 0x9617(%eax),%xmm1
+ .byte 15,88,128,199,152,0,0 // addps 0x98c7(%eax),%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
- .byte 15,89,176,231,149,0,0 // mulps 0x95e7(%eax),%xmm6
+ .byte 15,89,176,215,152,0,0 // mulps 0x98d7(%eax),%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,136,247,149,0,0 // addps 0x95f7(%eax),%xmm1
- .byte 15,40,176,7,150,0,0 // movaps 0x9607(%eax),%xmm6
+ .byte 15,88,136,231,152,0,0 // addps 0x98e7(%eax),%xmm1
+ .byte 15,40,176,247,152,0,0 // movaps 0x98f7(%eax),%xmm6
.byte 15,94,241 // divps %xmm1,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -59832,12 +60586,12 @@ _sk_gamma_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,241,1 // cmpltps %xmm1,%xmm6
- .byte 15,84,176,71,147,0,0 // andps 0x9347(%eax),%xmm6
+ .byte 15,84,176,55,150,0,0 // andps 0x9637(%eax),%xmm6
.byte 15,92,206 // subps %xmm6,%xmm1
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,241 // subps %xmm1,%xmm6
- .byte 15,88,128,23,150,0,0 // addps 0x9617(%eax),%xmm0
- .byte 15,40,184,55,150,0,0 // movaps 0x9637(%eax),%xmm7
+ .byte 15,88,128,7,153,0,0 // addps 0x9907(%eax),%xmm0
+ .byte 15,40,184,39,153,0,0 // movaps 0x9927(%eax),%xmm7
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
@@ -59845,15 +60599,15 @@ _sk_gamma_sse2:
.byte 15,94,207 // divps %xmm7,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,128,183,149,0,0 // mulps 0x95b7(%eax),%xmm0
- .byte 15,84,144,199,149,0,0 // andps 0x95c7(%eax),%xmm2
- .byte 15,86,144,39,147,0,0 // orps 0x9327(%eax),%xmm2
- .byte 15,88,128,215,149,0,0 // addps 0x95d7(%eax),%xmm0
- .byte 15,40,176,231,149,0,0 // movaps 0x95e7(%eax),%xmm6
+ .byte 15,89,128,167,152,0,0 // mulps 0x98a7(%eax),%xmm0
+ .byte 15,84,144,183,152,0,0 // andps 0x98b7(%eax),%xmm2
+ .byte 15,86,144,23,150,0,0 // orps 0x9617(%eax),%xmm2
+ .byte 15,88,128,199,152,0,0 // addps 0x98c7(%eax),%xmm0
+ .byte 15,40,176,215,152,0,0 // movaps 0x98d7(%eax),%xmm6
.byte 15,89,242 // mulps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
- .byte 15,88,144,247,149,0,0 // addps 0x95f7(%eax),%xmm2
- .byte 15,40,176,7,150,0,0 // movaps 0x9607(%eax),%xmm6
+ .byte 15,88,144,231,152,0,0 // addps 0x98e7(%eax),%xmm2
+ .byte 15,40,176,247,152,0,0 // movaps 0x98f7(%eax),%xmm6
.byte 15,94,242 // divps %xmm2,%xmm6
.byte 15,92,198 // subps %xmm6,%xmm0
.byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0
@@ -59861,18 +60615,18 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,194,242,1 // cmpltps %xmm2,%xmm6
- .byte 15,84,176,71,147,0,0 // andps 0x9347(%eax),%xmm6
+ .byte 15,84,176,55,150,0,0 // andps 0x9637(%eax),%xmm6
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
- .byte 15,88,128,23,150,0,0 // addps 0x9617(%eax),%xmm0
+ .byte 15,88,128,7,153,0,0 // addps 0x9907(%eax),%xmm0
.byte 15,89,238 // mulps %xmm6,%xmm5
.byte 15,92,197 // subps %xmm5,%xmm0
- .byte 15,40,144,55,150,0,0 // movaps 0x9637(%eax),%xmm2
+ .byte 15,40,144,39,153,0,0 // movaps 0x9927(%eax),%xmm2
.byte 15,92,214 // subps %xmm6,%xmm2
.byte 15,94,218 // divps %xmm2,%xmm3
.byte 15,88,216 // addps %xmm0,%xmm3
- .byte 15,40,128,87,150,0,0 // movaps 0x9657(%eax),%xmm0
+ .byte 15,40,128,71,153,0,0 // movaps 0x9947(%eax),%xmm0
.byte 15,89,224 // mulps %xmm0,%xmm4
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,89,216 // mulps %xmm0,%xmm3
@@ -59901,29 +60655,29 @@ _sk_lab_to_xyz_sse2:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 232,0,0,0,0 // call 3bf1 <_sk_lab_to_xyz_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,89,144,127,148,0,0 // mulps 0x947f(%eax),%xmm2
- .byte 15,40,160,47,146,0,0 // movaps 0x922f(%eax),%xmm4
+ .byte 15,89,144,111,151,0,0 // mulps 0x976f(%eax),%xmm2
+ .byte 15,40,160,31,149,0,0 // movaps 0x951f(%eax),%xmm4
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,168,143,148,0,0 // movaps 0x948f(%eax),%xmm5
+ .byte 15,40,168,127,151,0,0 // movaps 0x977f(%eax),%xmm5
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,88,144,159,148,0,0 // addps 0x949f(%eax),%xmm2
- .byte 15,89,144,175,148,0,0 // mulps 0x94af(%eax),%xmm2
- .byte 15,89,136,191,148,0,0 // mulps 0x94bf(%eax),%xmm1
+ .byte 15,88,144,143,151,0,0 // addps 0x978f(%eax),%xmm2
+ .byte 15,89,144,159,151,0,0 // mulps 0x979f(%eax),%xmm2
+ .byte 15,89,136,175,151,0,0 // mulps 0x97af(%eax),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,89,152,207,148,0,0 // mulps 0x94cf(%eax),%xmm3
+ .byte 15,89,152,191,151,0,0 // mulps 0x97bf(%eax),%xmm3
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,152,223,148,0,0 // movaps 0x94df(%eax),%xmm3
+ .byte 15,40,152,207,151,0,0 // movaps 0x97cf(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,194,224,1 // cmpltps %xmm0,%xmm4
- .byte 15,40,176,239,148,0,0 // movaps 0x94ef(%eax),%xmm6
+ .byte 15,40,176,223,151,0,0 // movaps 0x97df(%eax),%xmm6
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,184,255,148,0,0 // movaps 0x94ff(%eax),%xmm7
+ .byte 15,40,184,239,151,0,0 // movaps 0x97ef(%eax),%xmm7
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,85,225 // andnps %xmm1,%xmm4
@@ -59948,8 +60702,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,85,221 // andnps %xmm5,%xmm3
.byte 15,86,216 // orps %xmm0,%xmm3
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,160,15,149,0,0 // mulps 0x950f(%eax),%xmm4
- .byte 15,89,152,31,149,0,0 // mulps 0x951f(%eax),%xmm3
+ .byte 15,89,160,255,151,0,0 // mulps 0x97ff(%eax),%xmm4
+ .byte 15,89,152,15,152,0,0 // mulps 0x980f(%eax),%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -59987,9 +60741,9 @@ _sk_load_a8_sse2:
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,47,145,0,0 // pand 0x912f(%edx),%xmm0
+ .byte 102,15,219,130,31,148,0,0 // pand 0x941f(%edx),%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,154,95,146,0,0 // mulps 0x925f(%edx),%xmm3
+ .byte 15,89,154,79,149,0,0 // mulps 0x954f(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -60054,9 +60808,9 @@ _sk_load_a8_dst_sse2:
.byte 102,15,110,36,55 // movd (%edi,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,91,144,0,0 // pand 0x905b(%edx),%xmm4
+ .byte 102,15,219,162,75,147,0,0 // pand 0x934b(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,139,145,0,0 // mulps 0x918b(%edx),%xmm4
+ .byte 15,89,162,123,148,0,0 // mulps 0x947b(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -60134,7 +60888,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,153,141,144,0,0 // mulps 0x908d(%ecx),%xmm3
+ .byte 15,89,153,125,147,0,0 // mulps 0x937d(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -60168,7 +60922,7 @@ _sk_store_a8_sse2:
.byte 15,175,81,4 // imul 0x4(%ecx),%edx
.byte 3,23 // add (%edi),%edx
.byte 139,89,8 // mov 0x8(%ecx),%ebx
- .byte 15,40,166,41,143,0,0 // movaps 0x8f29(%esi),%xmm4
+ .byte 15,40,166,25,146,0,0 // movaps 0x9219(%esi),%xmm4
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
@@ -60204,7 +60958,7 @@ _sk_store_a8_sse2:
.byte 138,93,208 // mov -0x30(%ebp),%bl
.byte 136,92,58,2 // mov %bl,0x2(%edx,%edi,1)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
- .byte 102,15,219,166,41,146,0,0 // pand 0x9229(%esi),%xmm4
+ .byte 102,15,219,166,25,149,0,0 // pand 0x9519(%esi),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
@@ -60241,12 +60995,12 @@ _sk_load_g8_sse2:
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,96,142,0,0 // pand 0x8e60(%edx),%xmm0
+ .byte 102,15,219,130,80,145,0,0 // pand 0x9150(%edx),%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,144,143,0,0 // mulps 0x8f90(%edx),%xmm0
+ .byte 15,89,130,128,146,0,0 // mulps 0x9280(%edx),%xmm0
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,160,141,0,0 // movaps 0x8da0(%edx),%xmm3
+ .byte 15,40,154,144,144,0,0 // movaps 0x9090(%edx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 86 // push %esi
@@ -60304,13 +61058,13 @@ _sk_load_g8_dst_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,180,141,0,0 // pand 0x8db4(%edx),%xmm4
+ .byte 102,15,219,162,164,144,0,0 // pand 0x90a4(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,228,142,0,0 // mulps 0x8ee4(%edx),%xmm4
+ .byte 15,89,162,212,145,0,0 // mulps 0x91d4(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
.byte 15,41,97,32 // movaps %xmm4,0x20(%ecx)
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,162,244,140,0,0 // movaps 0x8cf4(%edx),%xmm4
+ .byte 15,40,162,228,143,0,0 // movaps 0x8fe4(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -60389,10 +61143,10 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,188,141,0,0 // mulps 0x8dbc(%ecx),%xmm0
+ .byte 15,89,129,172,144,0,0 // mulps 0x90ac(%ecx),%xmm0
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,204,139,0,0 // movaps 0x8bcc(%ecx),%xmm3
+ .byte 15,40,153,188,142,0,0 // movaps 0x8ebc(%ecx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 82 // push %edx
@@ -60429,20 +61183,20 @@ _sk_load_565_sse2:
.byte 117,97 // jne 424d <_sk_load_565_sse2+0x8c>
.byte 243,15,126,20,126 // movq (%esi,%edi,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,129,141,0,0 // movdqa 0x8d81(%edx),%xmm0
+ .byte 102,15,111,130,113,144,0,0 // movdqa 0x9071(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,145,141,0,0 // mulps 0x8d91(%edx),%xmm0
- .byte 102,15,111,138,161,141,0,0 // movdqa 0x8da1(%edx),%xmm1
+ .byte 15,89,130,129,144,0,0 // mulps 0x9081(%edx),%xmm0
+ .byte 102,15,111,138,145,144,0,0 // movdqa 0x9091(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,177,141,0,0 // mulps 0x8db1(%edx),%xmm1
- .byte 102,15,219,146,193,141,0,0 // pand 0x8dc1(%edx),%xmm2
+ .byte 15,89,138,161,144,0,0 // mulps 0x90a1(%edx),%xmm1
+ .byte 102,15,219,146,177,144,0,0 // pand 0x90b1(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,209,141,0,0 // mulps 0x8dd1(%edx),%xmm2
+ .byte 15,89,146,193,144,0,0 // mulps 0x90c1(%edx),%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,129,139,0,0 // movaps 0x8b81(%edx),%xmm3
+ .byte 15,40,154,113,142,0,0 // movaps 0x8e71(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -60496,21 +61250,21 @@ _sk_load_565_dst_sse2:
.byte 117,113 // jne 432c <_sk_load_565_dst_sse2+0x9c>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,178,140,0,0 // movdqa 0x8cb2(%edx),%xmm5
+ .byte 102,15,111,170,162,143,0,0 // movdqa 0x8fa2(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,194,140,0,0 // mulps 0x8cc2(%edx),%xmm5
+ .byte 15,89,170,178,143,0,0 // mulps 0x8fb2(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,210,140,0,0 // movdqa 0x8cd2(%edx),%xmm5
+ .byte 102,15,111,170,194,143,0,0 // movdqa 0x8fc2(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,226,140,0,0 // mulps 0x8ce2(%edx),%xmm5
+ .byte 15,89,170,210,143,0,0 // mulps 0x8fd2(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,219,162,242,140,0,0 // pand 0x8cf2(%edx),%xmm4
+ .byte 102,15,219,162,226,143,0,0 // pand 0x8fe2(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,2,141,0,0 // mulps 0x8d02(%edx),%xmm4
+ .byte 15,89,162,242,143,0,0 // mulps 0x8ff2(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
- .byte 15,40,162,178,138,0,0 // movaps 0x8ab2(%edx),%xmm4
+ .byte 15,40,162,162,141,0,0 // movaps 0x8da2(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -60580,20 +61334,20 @@ _sk_gather_565_sse2:
.byte 102,15,196,209,3 // pinsrw $0x3,%ecx,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,102,139,0,0 // movdqa 0x8b66(%edx),%xmm0
+ .byte 102,15,111,130,86,142,0,0 // movdqa 0x8e56(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,118,139,0,0 // mulps 0x8b76(%edx),%xmm0
- .byte 102,15,111,138,134,139,0,0 // movdqa 0x8b86(%edx),%xmm1
+ .byte 15,89,130,102,142,0,0 // mulps 0x8e66(%edx),%xmm0
+ .byte 102,15,111,138,118,142,0,0 // movdqa 0x8e76(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,150,139,0,0 // mulps 0x8b96(%edx),%xmm1
- .byte 102,15,219,146,166,139,0,0 // pand 0x8ba6(%edx),%xmm2
+ .byte 15,89,138,134,142,0,0 // mulps 0x8e86(%edx),%xmm1
+ .byte 102,15,219,146,150,142,0,0 // pand 0x8e96(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,182,139,0,0 // mulps 0x8bb6(%edx),%xmm2
+ .byte 15,89,146,166,142,0,0 // mulps 0x8ea6(%edx),%xmm2
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,102,137,0,0 // movaps 0x8966(%edx),%xmm3
+ .byte 15,40,154,86,140,0,0 // movaps 0x8c56(%edx),%xmm3
.byte 81 // push %ecx
.byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,80,4 // call *0x4(%eax)
@@ -60621,8 +61375,8 @@ _sk_store_565_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,211,140,0,0 // movaps 0x8cd3(%edi),%xmm4
- .byte 15,40,175,227,140,0,0 // movaps 0x8ce3(%edi),%xmm5
+ .byte 15,40,167,195,143,0,0 // movaps 0x8fc3(%edi),%xmm4
+ .byte 15,40,175,211,143,0,0 // movaps 0x8fd3(%edi),%xmm5
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,89,244 // mulps %xmm4,%xmm6
@@ -60702,21 +61456,21 @@ _sk_load_4444_sse2:
.byte 117,112 // jne 45cc <_sk_load_4444_sse2+0x9b>
.byte 243,15,126,28,126 // movq (%esi,%edi,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,130,17,140,0,0 // movdqa 0x8c11(%edx),%xmm0
+ .byte 102,15,111,130,1,143,0,0 // movdqa 0x8f01(%edx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,33,140,0,0 // mulps 0x8c21(%edx),%xmm0
- .byte 102,15,111,138,49,140,0,0 // movdqa 0x8c31(%edx),%xmm1
+ .byte 15,89,130,17,143,0,0 // mulps 0x8f11(%edx),%xmm0
+ .byte 102,15,111,138,33,143,0,0 // movdqa 0x8f21(%edx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,65,140,0,0 // mulps 0x8c41(%edx),%xmm1
- .byte 102,15,111,146,81,140,0,0 // movdqa 0x8c51(%edx),%xmm2
+ .byte 15,89,138,49,143,0,0 // mulps 0x8f31(%edx),%xmm1
+ .byte 102,15,111,146,65,143,0,0 // movdqa 0x8f41(%edx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,97,140,0,0 // mulps 0x8c61(%edx),%xmm2
- .byte 102,15,219,154,113,140,0,0 // pand 0x8c71(%edx),%xmm3
+ .byte 15,89,146,81,143,0,0 // mulps 0x8f51(%edx),%xmm2
+ .byte 102,15,219,154,97,143,0,0 // pand 0x8f61(%edx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,129,140,0,0 // mulps 0x8c81(%edx),%xmm3
+ .byte 15,89,154,113,143,0,0 // mulps 0x8f71(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 82 // push %edx
@@ -60772,24 +61526,24 @@ _sk_load_4444_dst_sse2:
.byte 15,133,128,0,0,0 // jne 46be <_sk_load_4444_dst_sse2+0xaf>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,51,139,0,0 // movdqa 0x8b33(%edx),%xmm5
+ .byte 102,15,111,170,35,142,0,0 // movdqa 0x8e23(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,67,139,0,0 // mulps 0x8b43(%edx),%xmm5
+ .byte 15,89,170,51,142,0,0 // mulps 0x8e33(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,83,139,0,0 // movdqa 0x8b53(%edx),%xmm5
+ .byte 102,15,111,170,67,142,0,0 // movdqa 0x8e43(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,99,139,0,0 // mulps 0x8b63(%edx),%xmm5
+ .byte 15,89,170,83,142,0,0 // mulps 0x8e53(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,111,170,115,139,0,0 // movdqa 0x8b73(%edx),%xmm5
+ .byte 102,15,111,170,99,142,0,0 // movdqa 0x8e63(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,131,139,0,0 // mulps 0x8b83(%edx),%xmm5
+ .byte 15,89,170,115,142,0,0 // mulps 0x8e73(%edx),%xmm5
.byte 15,41,105,48 // movaps %xmm5,0x30(%ecx)
- .byte 102,15,219,162,147,139,0,0 // pand 0x8b93(%edx),%xmm4
+ .byte 102,15,219,162,131,142,0,0 // pand 0x8e83(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,163,139,0,0 // mulps 0x8ba3(%edx),%xmm4
+ .byte 15,89,162,147,142,0,0 // mulps 0x8e93(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -60859,21 +61613,21 @@ _sk_gather_4444_sse2:
.byte 89 // pop %ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,129,203,137,0,0 // movdqa 0x89cb(%ecx),%xmm0
+ .byte 102,15,111,129,187,140,0,0 // movdqa 0x8cbb(%ecx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,219,137,0,0 // mulps 0x89db(%ecx),%xmm0
- .byte 102,15,111,137,235,137,0,0 // movdqa 0x89eb(%ecx),%xmm1
+ .byte 15,89,129,203,140,0,0 // mulps 0x8ccb(%ecx),%xmm0
+ .byte 102,15,111,137,219,140,0,0 // movdqa 0x8cdb(%ecx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,137,251,137,0,0 // mulps 0x89fb(%ecx),%xmm1
- .byte 102,15,111,145,11,138,0,0 // movdqa 0x8a0b(%ecx),%xmm2
+ .byte 15,89,137,235,140,0,0 // mulps 0x8ceb(%ecx),%xmm1
+ .byte 102,15,111,145,251,140,0,0 // movdqa 0x8cfb(%ecx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,145,27,138,0,0 // mulps 0x8a1b(%ecx),%xmm2
- .byte 102,15,219,153,43,138,0,0 // pand 0x8a2b(%ecx),%xmm3
+ .byte 15,89,145,11,141,0,0 // mulps 0x8d0b(%ecx),%xmm2
+ .byte 102,15,219,153,27,141,0,0 // pand 0x8d1b(%ecx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,153,59,138,0,0 // mulps 0x8a3b(%ecx),%xmm3
+ .byte 15,89,153,43,141,0,0 // mulps 0x8d2b(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 81 // push %ecx
@@ -60903,7 +61657,7 @@ _sk_store_4444_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,206,137,0,0 // movaps 0x89ce(%edi),%xmm4
+ .byte 15,40,167,190,140,0,0 // movaps 0x8cbe(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -60988,11 +61742,11 @@ _sk_load_8888_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 117,102 // jne 4977 <_sk_load_8888_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,146,29,133,0,0 // movdqa 0x851d(%edx),%xmm2
+ .byte 102,15,111,146,13,136,0,0 // movdqa 0x880d(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,77,134,0,0 // movaps 0x864d(%edx),%xmm4
+ .byte 15,40,162,61,137,0,0 // movaps 0x893d(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -61057,11 +61811,11 @@ _sk_load_8888_dst_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 117,118 // jne 4a4e <_sk_load_8888_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,86,132,0,0 // movdqa 0x8456(%edx),%xmm5
+ .byte 102,15,111,170,70,135,0,0 // movdqa 0x8746(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,134,133,0,0 // movaps 0x8586(%edx),%xmm7
+ .byte 15,40,186,118,136,0,0 // movaps 0x8876(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,16 // movaps %xmm6,0x10(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -61143,11 +61897,11 @@ _sk_gather_8888_sse2:
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,145,19,131,0,0 // movdqa 0x8313(%ecx),%xmm2
+ .byte 102,15,111,145,3,134,0,0 // movdqa 0x8603(%ecx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,161,67,132,0,0 // movaps 0x8443(%ecx),%xmm4
+ .byte 15,40,161,51,135,0,0 // movaps 0x8733(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -61191,7 +61945,7 @@ _sk_store_8888_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,168,130,0,0 // movaps 0x82a8(%edi),%xmm4
+ .byte 15,40,167,152,133,0,0 // movaps 0x8598(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -61262,11 +62016,11 @@ _sk_load_bgra_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 117,102 // jne 4cb2 <_sk_load_bgra_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,130,226,129,0,0 // movdqa 0x81e2(%edx),%xmm0
+ .byte 102,15,111,130,210,132,0,0 // movdqa 0x84d2(%edx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,162,18,131,0,0 // movaps 0x8312(%edx),%xmm4
+ .byte 15,40,162,2,134,0,0 // movaps 0x8602(%edx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -61331,11 +62085,11 @@ _sk_load_bgra_dst_sse2:
.byte 139,57 // mov (%ecx),%edi
.byte 117,118 // jne 4d89 <_sk_load_bgra_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,27,129,0,0 // movdqa 0x811b(%edx),%xmm5
+ .byte 102,15,111,170,11,132,0,0 // movdqa 0x840b(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,75,130,0,0 // movaps 0x824b(%edx),%xmm7
+ .byte 15,40,186,59,133,0,0 // movaps 0x853b(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,48 // movaps %xmm6,0x30(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -61417,11 +62171,11 @@ _sk_gather_bgra_sse2:
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,129,216,127,0,0 // movdqa 0x7fd8(%ecx),%xmm0
+ .byte 102,15,111,129,200,130,0,0 // movdqa 0x82c8(%ecx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,161,8,129,0,0 // movaps 0x8108(%ecx),%xmm4
+ .byte 15,40,161,248,131,0,0 // movaps 0x83f8(%ecx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -61465,7 +62219,7 @@ _sk_store_bgra_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,109,127,0,0 // movaps 0x7f6d(%edi),%xmm4
+ .byte 15,40,167,93,130,0,0 // movaps 0x825d(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -61562,7 +62316,7 @@ _sk_load_f16_sse2:
.byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,154,119,130,0,0 // movdqa 0x8277(%edx),%xmm3
+ .byte 102,15,111,154,103,133,0,0 // movdqa 0x8567(%edx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -61595,15 +62349,15 @@ _sk_load_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,154,135,130,0,0 // movdqa 0x8287(%edx),%xmm3
+ .byte 102,15,111,154,119,133,0,0 // movdqa 0x8577(%edx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,154,151,130,0,0 // movdqa 0x8297(%edx),%xmm3
+ .byte 102,15,111,154,135,133,0,0 // movdqa 0x8587(%edx),%xmm3
.byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,154,167,130,0,0 // movdqa 0x82a7(%edx),%xmm3
+ .byte 102,15,111,154,151,133,0,0 // movdqa 0x8597(%edx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -61696,7 +62450,7 @@ _sk_load_f16_dst_sse2:
.byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
- .byte 102,15,111,154,97,128,0,0 // movdqa 0x8061(%edx),%xmm3
+ .byte 102,15,111,154,81,131,0,0 // movdqa 0x8351(%edx),%xmm3
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 102,15,239,226 // pxor %xmm2,%xmm4
@@ -61704,13 +62458,13 @@ _sk_load_f16_dst_sse2:
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,15,111,146,129,128,0,0 // movdqa 0x8081(%edx),%xmm2
+ .byte 102,15,111,146,113,131,0,0 // movdqa 0x8371(%edx),%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
.byte 102,15,239,226 // pxor %xmm2,%xmm4
- .byte 102,15,111,178,145,128,0,0 // movdqa 0x8091(%edx),%xmm6
+ .byte 102,15,111,178,129,131,0,0 // movdqa 0x8381(%edx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,15,102,252 // pcmpgtd %xmm4,%xmm7
- .byte 102,15,111,146,113,128,0,0 // movdqa 0x8071(%edx),%xmm2
+ .byte 102,15,111,146,97,131,0,0 // movdqa 0x8361(%edx),%xmm2
.byte 102,15,127,85,184 // movdqa %xmm2,-0x48(%ebp)
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,223,249 // pandn %xmm1,%xmm7
@@ -61854,7 +62608,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,69,248 // movd %xmm0,-0x8(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,153,183,125,0,0 // movdqa 0x7db7(%ecx),%xmm3
+ .byte 102,15,111,153,167,128,0,0 // movdqa 0x80a7(%ecx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -61887,15 +62641,15 @@ _sk_gather_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,153,199,125,0,0 // movdqa 0x7dc7(%ecx),%xmm3
+ .byte 102,15,111,153,183,128,0,0 // movdqa 0x80b7(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,153,215,125,0,0 // movdqa 0x7dd7(%ecx),%xmm3
+ .byte 102,15,111,153,199,128,0,0 // movdqa 0x80c7(%ecx),%xmm3
.byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,153,231,125,0,0 // movdqa 0x7de7(%ecx),%xmm3
+ .byte 102,15,111,153,215,128,0,0 // movdqa 0x80d7(%ecx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -61936,18 +62690,18 @@ _sk_store_f16_sse2:
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 232,0,0,0,0 // call 55ec <_sk_store_f16_sse2+0x15>
.byte 88 // pop %eax
- .byte 102,15,111,176,20,124,0,0 // movdqa 0x7c14(%eax),%xmm6
+ .byte 102,15,111,176,4,127,0,0 // movdqa 0x7f04(%eax),%xmm6
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,219,214 // pand %xmm6,%xmm2
.byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp)
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,239,234 // pxor %xmm2,%xmm5
- .byte 102,15,111,160,52,124,0,0 // movdqa 0x7c34(%eax),%xmm4
+ .byte 102,15,111,160,36,127,0,0 // movdqa 0x7f24(%eax),%xmm4
.byte 102,15,114,210,16 // psrld $0x10,%xmm2
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0
.byte 102,15,114,213,13 // psrld $0xd,%xmm5
- .byte 102,15,111,184,68,124,0,0 // movdqa 0x7c44(%eax),%xmm7
+ .byte 102,15,111,184,52,127,0,0 // movdqa 0x7f34(%eax),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,127,125,232 // movdqa %xmm7,-0x18(%ebp)
.byte 102,15,254,213 // paddd %xmm5,%xmm2
@@ -62084,7 +62838,7 @@ _sk_load_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,254,119,0,0 // movaps 0x77fe(%edx),%xmm4
+ .byte 15,40,162,238,122,0,0 // movaps 0x7aee(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -62188,7 +62942,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,170,151,118,0,0 // movaps 0x7697(%edx),%xmm5
+ .byte 15,40,170,135,121,0,0 // movaps 0x7987(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -62214,7 +62968,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,55,116,0,0 // movaps 0x7437(%edx),%xmm3
+ .byte 15,40,154,39,119,0,0 // movaps 0x7727(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -62255,7 +63009,7 @@ _sk_store_u16_be_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 232,0,0,0,0 // call 5a74 <_sk_store_u16_be_sse2+0x11>
.byte 88 // pop %eax
- .byte 15,40,176,204,119,0,0 // movaps 0x77cc(%eax),%xmm6
+ .byte 15,40,176,188,122,0,0 // movaps 0x7abc(%eax),%xmm6
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,89,230 // mulps %xmm6,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
@@ -62598,7 +63352,7 @@ _sk_repeat_x_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,56,111,0,0 // andps 0x6f38(%ecx),%xmm6
+ .byte 15,84,177,40,114,0,0 // andps 0x7228(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -62636,7 +63390,7 @@ _sk_repeat_y_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,210,110,0,0 // andps 0x6ed2(%ecx),%xmm6
+ .byte 15,84,177,194,113,0,0 // andps 0x71c2(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -62672,13 +63426,13 @@ _sk_mirror_x_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 243,15,89,177,108,117,0,0 // mulss 0x756c(%ecx),%xmm6
+ .byte 243,15,89,177,172,120,0,0 // mulss 0x78ac(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,108,110,0,0 // andps 0x6e6c(%ecx),%xmm6
+ .byte 15,84,177,92,113,0,0 // andps 0x715c(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -62718,13 +63472,13 @@ _sk_mirror_y_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 243,15,89,177,231,116,0,0 // mulss 0x74e7(%ecx),%xmm6
+ .byte 243,15,89,177,39,120,0,0 // mulss 0x7827(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,231,109,0,0 // andps 0x6de7(%ecx),%xmm6
+ .byte 15,84,177,215,112,0,0 // andps 0x70d7(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -62760,7 +63514,7 @@ _sk_clamp_x_1_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,93,160,98,109,0,0 // minps 0x6d62(%eax),%xmm4
+ .byte 15,93,160,82,112,0,0 // minps 0x7052(%eax),%xmm4
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -62785,7 +63539,7 @@ _sk_repeat_x_1_sse2:
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,84,168,50,109,0,0 // andps 0x6d32(%eax),%xmm5
+ .byte 15,84,168,34,112,0,0 // andps 0x7022(%eax),%xmm5
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -62807,14 +63561,14 @@ _sk_mirror_x_1_sse2:
.byte 232,0,0,0,0 // call 6059 <_sk_mirror_x_1_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 15,40,161,103,109,0,0 // movaps 0x6d67(%ecx),%xmm4
+ .byte 15,40,161,87,112,0,0 // movaps 0x7057(%ecx),%xmm4
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,169,215,108,0,0 // movaps 0x6cd7(%ecx),%xmm5
+ .byte 15,40,169,199,111,0,0 // movaps 0x6fc7(%ecx),%xmm5
.byte 15,89,232 // mulps %xmm0,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,194,238,1 // cmpltps %xmm6,%xmm5
- .byte 15,84,169,247,108,0,0 // andps 0x6cf7(%ecx),%xmm5
+ .byte 15,84,169,231,111,0,0 // andps 0x6fe7(%ecx),%xmm5
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,88,246 // addps %xmm6,%xmm6
@@ -62842,10 +63596,10 @@ _sk_luminance_to_alpha_sse2:
.byte 232,0,0,0,0 // call 60b7 <_sk_luminance_to_alpha_sse2+0xe>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,128,153,113,0,0 // mulps 0x7199(%eax),%xmm0
- .byte 15,89,136,169,113,0,0 // mulps 0x71a9(%eax),%xmm1
+ .byte 15,89,128,137,116,0,0 // mulps 0x7489(%eax),%xmm0
+ .byte 15,89,136,153,116,0,0 // mulps 0x7499(%eax),%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,152,185,113,0,0 // mulps 0x71b9(%eax),%xmm3
+ .byte 15,89,152,169,116,0,0 // mulps 0x74a9(%eax),%xmm3
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -63246,12 +64000,12 @@ _sk_evenly_spaced_gradient_sse2:
.byte 78 // dec %esi
.byte 102,15,110,206 // movd %esi,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
- .byte 102,15,111,146,44,109,0,0 // movdqa 0x6d2c(%edx),%xmm2
+ .byte 102,15,111,146,28,112,0,0 // movdqa 0x701c(%edx),%xmm2
.byte 102,15,219,209 // pand %xmm1,%xmm2
- .byte 102,15,235,146,12,107,0,0 // por 0x6b0c(%edx),%xmm2
+ .byte 102,15,235,146,252,109,0,0 // por 0x6dfc(%edx),%xmm2
.byte 102,15,114,209,16 // psrld $0x10,%xmm1
- .byte 102,15,235,138,60,109,0,0 // por 0x6d3c(%edx),%xmm1
- .byte 15,88,138,76,109,0,0 // addps 0x6d4c(%edx),%xmm1
+ .byte 102,15,235,138,44,112,0,0 // por 0x702c(%edx),%xmm1
+ .byte 15,88,138,60,112,0,0 // addps 0x703c(%edx),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -63361,15 +64115,15 @@ _sk_gauss_a_to_rgba_sse2:
.byte 232,0,0,0,0 // call 670a <_sk_gauss_a_to_rgba_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,128,166,107,0,0 // movaps 0x6ba6(%eax),%xmm0
+ .byte 15,40,128,150,110,0,0 // movaps 0x6e96(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,182,107,0,0 // addps 0x6bb6(%eax),%xmm0
+ .byte 15,88,128,166,110,0,0 // addps 0x6ea6(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,198,107,0,0 // addps 0x6bc6(%eax),%xmm0
+ .byte 15,88,128,182,110,0,0 // addps 0x6eb6(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,214,107,0,0 // addps 0x6bd6(%eax),%xmm0
+ .byte 15,88,128,198,110,0,0 // addps 0x6ec6(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,230,107,0,0 // addps 0x6be6(%eax),%xmm0
+ .byte 15,88,128,214,110,0,0 // addps 0x6ed6(%eax),%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,200 // movaps %xmm0,%xmm1
@@ -63406,7 +64160,7 @@ _sk_gradient_sse2:
.byte 74 // dec %edx
.byte 131,198,4 // add $0x4,%esi
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,151,11,102,0,0 // movaps 0x660b(%edi),%xmm2
+ .byte 15,40,151,251,104,0,0 // movaps 0x68fb(%edi),%xmm2
.byte 243,15,16,30 // movss (%esi),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -63581,30 +64335,30 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,94,247 // divps %xmm7,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,40,128,95,105,0,0 // movaps 0x695f(%eax),%xmm0
+ .byte 15,40,128,79,108,0,0 // movaps 0x6c4f(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,111,105,0,0 // addps 0x696f(%eax),%xmm0
+ .byte 15,88,128,95,108,0,0 // addps 0x6c5f(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,127,105,0,0 // addps 0x697f(%eax),%xmm0
+ .byte 15,88,128,111,108,0,0 // addps 0x6c6f(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,143,105,0,0 // addps 0x698f(%eax),%xmm0
+ .byte 15,88,128,127,108,0,0 // addps 0x6c7f(%eax),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,40,176,159,105,0,0 // movaps 0x699f(%eax),%xmm6
+ .byte 15,40,176,143,108,0,0 // movaps 0x6c8f(%eax),%xmm6
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,84,245 // andps %xmm5,%xmm6
.byte 15,85,232 // andnps %xmm0,%xmm5
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,86,238 // orps %xmm6,%xmm5
.byte 15,194,204,1 // cmpltps %xmm4,%xmm1
- .byte 15,40,128,143,99,0,0 // movaps 0x638f(%eax),%xmm0
+ .byte 15,40,128,127,102,0,0 // movaps 0x667f(%eax),%xmm0
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,84,193 // andps %xmm1,%xmm0
.byte 15,85,205 // andnps %xmm5,%xmm1
.byte 15,86,200 // orps %xmm0,%xmm1
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,194,196,1 // cmpltps %xmm4,%xmm0
- .byte 15,40,168,175,99,0,0 // movaps 0x63af(%eax),%xmm5
+ .byte 15,40,168,159,102,0,0 // movaps 0x669f(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,193 // andnps %xmm1,%xmm0
@@ -63672,8 +64426,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,146,104,0,0 // mulps 0x6892(%edx),%xmm4
- .byte 15,89,130,162,104,0,0 // mulps 0x68a2(%edx),%xmm0
+ .byte 15,89,162,130,107,0,0 // mulps 0x6b82(%edx),%xmm4
+ .byte 15,89,130,146,107,0,0 // mulps 0x6b92(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -63681,11 +64435,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,66,103,0,0 // xorps 0x6742(%edx),%xmm4
+ .byte 15,87,162,50,106,0,0 // xorps 0x6a32(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,114,98,0,0 // mulps 0x6272(%edx),%xmm5
+ .byte 15,89,170,98,101,0,0 // mulps 0x6562(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,95,196 // maxps %xmm4,%xmm0
@@ -63723,8 +64477,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,244,103,0,0 // mulps 0x67f4(%edx),%xmm4
- .byte 15,89,130,4,104,0,0 // mulps 0x6804(%edx),%xmm0
+ .byte 15,89,162,228,106,0,0 // mulps 0x6ae4(%edx),%xmm4
+ .byte 15,89,130,244,106,0,0 // mulps 0x6af4(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -63732,11 +64486,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,164,102,0,0 // xorps 0x66a4(%edx),%xmm4
+ .byte 15,87,162,148,105,0,0 // xorps 0x6994(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,212,97,0,0 // mulps 0x61d4(%edx),%xmm5
+ .byte 15,89,170,196,100,0,0 // mulps 0x64c4(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
@@ -63765,7 +64519,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,169,124,103,0,0 // mulps 0x677c(%ecx),%xmm5
+ .byte 15,89,169,108,106,0,0 // mulps 0x6a6c(%ecx),%xmm5
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
@@ -63773,7 +64527,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,228 // mulss %xmm4,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,129,44,102,0,0 // xorps 0x662c(%ecx),%xmm0
+ .byte 15,87,129,28,105,0,0 // xorps 0x691c(%ecx),%xmm0
.byte 15,94,197 // divps %xmm5,%xmm0
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
@@ -63849,14 +64603,14 @@ _sk_save_xy_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 232,0,0,0,0 // call 6cb1 <_sk_save_xy_sse2+0x12>
.byte 88 // pop %eax
- .byte 15,40,160,127,96,0,0 // movaps 0x607f(%eax),%xmm4
+ .byte 15,40,160,111,99,0,0 // movaps 0x636f(%eax),%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,88,236 // addps %xmm4,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,144,159,96,0,0 // movaps 0x609f(%eax),%xmm2
+ .byte 15,40,144,143,99,0,0 // movaps 0x638f(%eax),%xmm2
.byte 15,84,250 // andps %xmm2,%xmm7
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,238 // subps %xmm6,%xmm5
@@ -63938,8 +64692,8 @@ _sk_bilinear_nx_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,221,101,0,0 // addps 0x65dd(%eax),%xmm0
- .byte 15,40,168,189,95,0,0 // movaps 0x5fbd(%eax),%xmm5
+ .byte 15,88,128,205,104,0,0 // addps 0x68cd(%eax),%xmm0
+ .byte 15,40,168,173,98,0,0 // movaps 0x62ad(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -63967,7 +64721,7 @@ _sk_bilinear_px_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,90,95,0,0 // addps 0x5f5a(%eax),%xmm0
+ .byte 15,88,128,74,98,0,0 // addps 0x624a(%eax),%xmm0
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -63994,8 +64748,8 @@ _sk_bilinear_ny_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,97,101,0,0 // addps 0x6561(%eax),%xmm1
- .byte 15,40,168,65,95,0,0 // movaps 0x5f41(%eax),%xmm5
+ .byte 15,88,136,81,104,0,0 // addps 0x6851(%eax),%xmm1
+ .byte 15,40,168,49,98,0,0 // movaps 0x6231(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64023,7 +64777,7 @@ _sk_bilinear_py_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,221,94,0,0 // addps 0x5edd(%eax),%xmm1
+ .byte 15,88,136,205,97,0,0 // addps 0x61cd(%eax),%xmm1
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -64050,13 +64804,13 @@ _sk_bicubic_n3x_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,243,100,0,0 // addps 0x64f3(%eax),%xmm0
- .byte 15,40,168,195,94,0,0 // movaps 0x5ec3(%eax),%xmm5
+ .byte 15,88,128,227,103,0,0 // addps 0x67e3(%eax),%xmm0
+ .byte 15,40,168,179,97,0,0 // movaps 0x61b3(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,3,101,0,0 // mulps 0x6503(%eax),%xmm5
- .byte 15,88,168,163,96,0,0 // addps 0x60a3(%eax),%xmm5
+ .byte 15,89,168,243,103,0,0 // mulps 0x67f3(%eax),%xmm5
+ .byte 15,88,168,147,99,0,0 // addps 0x6393(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64084,16 +64838,16 @@ _sk_bicubic_n1x_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,137,100,0,0 // addps 0x6489(%eax),%xmm0
- .byte 15,40,168,105,94,0,0 // movaps 0x5e69(%eax),%xmm5
+ .byte 15,88,128,121,103,0,0 // addps 0x6779(%eax),%xmm0
+ .byte 15,40,168,89,97,0,0 // movaps 0x6159(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,185,100,0,0 // movaps 0x64b9(%eax),%xmm4
+ .byte 15,40,160,169,103,0,0 // movaps 0x67a9(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,201,100,0,0 // addps 0x64c9(%eax),%xmm4
+ .byte 15,88,160,185,103,0,0 // addps 0x67b9(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,73,94,0,0 // addps 0x5e49(%eax),%xmm4
+ .byte 15,88,160,57,97,0,0 // addps 0x6139(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,217,100,0,0 // addps 0x64d9(%eax),%xmm4
+ .byte 15,88,160,201,103,0,0 // addps 0x67c9(%eax),%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -64118,17 +64872,17 @@ _sk_bicubic_p1x_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,225,93,0,0 // movaps 0x5de1(%eax),%xmm4
+ .byte 15,40,160,209,96,0,0 // movaps 0x60d1(%eax),%xmm4
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,110,64 // movups 0x40(%esi),%xmm5
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,176,81,100,0,0 // movaps 0x6451(%eax),%xmm6
+ .byte 15,40,176,65,103,0,0 // movaps 0x6741(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,97,100,0,0 // addps 0x6461(%eax),%xmm6
+ .byte 15,88,176,81,103,0,0 // addps 0x6751(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,113,100,0,0 // addps 0x6471(%eax),%xmm6
+ .byte 15,88,176,97,103,0,0 // addps 0x6761(%eax),%xmm6
.byte 15,17,182,128,0,0,0 // movups %xmm6,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -64155,11 +64909,11 @@ _sk_bicubic_p3x_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,4,100,0,0 // addps 0x6404(%eax),%xmm0
+ .byte 15,88,128,244,102,0,0 // addps 0x66f4(%eax),%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,228,99,0,0 // mulps 0x63e4(%eax),%xmm4
- .byte 15,88,160,132,95,0,0 // addps 0x5f84(%eax),%xmm4
+ .byte 15,89,160,212,102,0,0 // mulps 0x66d4(%eax),%xmm4
+ .byte 15,88,160,116,98,0,0 // addps 0x6274(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64187,13 +64941,13 @@ _sk_bicubic_n3y_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,132,99,0,0 // addps 0x6384(%eax),%xmm1
- .byte 15,40,168,84,93,0,0 // movaps 0x5d54(%eax),%xmm5
+ .byte 15,88,136,116,102,0,0 // addps 0x6674(%eax),%xmm1
+ .byte 15,40,168,68,96,0,0 // movaps 0x6044(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,148,99,0,0 // mulps 0x6394(%eax),%xmm5
- .byte 15,88,168,52,95,0,0 // addps 0x5f34(%eax),%xmm5
+ .byte 15,89,168,132,102,0,0 // mulps 0x6684(%eax),%xmm5
+ .byte 15,88,168,36,98,0,0 // addps 0x6224(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64221,16 +64975,16 @@ _sk_bicubic_n1y_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,25,99,0,0 // addps 0x6319(%eax),%xmm1
- .byte 15,40,168,249,92,0,0 // movaps 0x5cf9(%eax),%xmm5
+ .byte 15,88,136,9,102,0,0 // addps 0x6609(%eax),%xmm1
+ .byte 15,40,168,233,95,0,0 // movaps 0x5fe9(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,73,99,0,0 // movaps 0x6349(%eax),%xmm4
+ .byte 15,40,160,57,102,0,0 // movaps 0x6639(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,89,99,0,0 // addps 0x6359(%eax),%xmm4
+ .byte 15,88,160,73,102,0,0 // addps 0x6649(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,217,92,0,0 // addps 0x5cd9(%eax),%xmm4
+ .byte 15,88,160,201,95,0,0 // addps 0x5fc9(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,105,99,0,0 // addps 0x6369(%eax),%xmm4
+ .byte 15,88,160,89,102,0,0 // addps 0x6659(%eax),%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -64255,17 +65009,17 @@ _sk_bicubic_p1y_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,112,92,0,0 // movaps 0x5c70(%eax),%xmm4
+ .byte 15,40,160,96,95,0,0 // movaps 0x5f60(%eax),%xmm4
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,110,96 // movups 0x60(%esi),%xmm5
.byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,176,224,98,0,0 // movaps 0x62e0(%eax),%xmm6
+ .byte 15,40,176,208,101,0,0 // movaps 0x65d0(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,240,98,0,0 // addps 0x62f0(%eax),%xmm6
+ .byte 15,88,176,224,101,0,0 // addps 0x65e0(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,0,99,0,0 // addps 0x6300(%eax),%xmm6
+ .byte 15,88,176,240,101,0,0 // addps 0x65f0(%eax),%xmm6
.byte 15,17,182,160,0,0,0 // movups %xmm6,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -64292,11 +65046,11 @@ _sk_bicubic_p3y_sse2:
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,146,98,0,0 // addps 0x6292(%eax),%xmm1
+ .byte 15,88,136,130,101,0,0 // addps 0x6582(%eax),%xmm1
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,114,98,0,0 // mulps 0x6272(%eax),%xmm4
- .byte 15,88,160,18,94,0,0 // addps 0x5e12(%eax),%xmm4
+ .byte 15,89,160,98,101,0,0 // mulps 0x6562(%eax),%xmm4
+ .byte 15,88,160,2,97,0,0 // addps 0x6102(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -64450,7 +65204,7 @@ _sk_clut_3D_sse2:
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,254,202 // paddd %xmm2,%xmm1
- .byte 102,15,111,130,206,96,0,0 // movdqa 0x60ce(%edx),%xmm0
+ .byte 102,15,111,130,190,99,0,0 // movdqa 0x63be(%edx),%xmm0
.byte 102,15,127,133,88,255,255,255 // movdqa %xmm0,-0xa8(%ebp)
.byte 102,15,112,225,245 // pshufd $0xf5,%xmm1,%xmm4
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
@@ -64474,7 +65228,7 @@ _sk_clut_3D_sse2:
.byte 15,20,196 // unpcklps %xmm4,%xmm0
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
- .byte 102,15,111,130,94,90,0,0 // movdqa 0x5a5e(%edx),%xmm0
+ .byte 102,15,111,130,78,93,0,0 // movdqa 0x5d4e(%edx),%xmm0
.byte 102,15,127,133,72,255,255,255 // movdqa %xmm0,-0xb8(%ebp)
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,254,224 // paddd %xmm0,%xmm4
@@ -64492,7 +65246,7 @@ _sk_clut_3D_sse2:
.byte 243,15,16,36,185 // movss (%ecx,%edi,4),%xmm4
.byte 15,20,252 // unpcklps %xmm4,%xmm7
.byte 15,20,248 // unpcklps %xmm0,%xmm7
- .byte 102,15,111,130,126,90,0,0 // movdqa 0x5a7e(%edx),%xmm0
+ .byte 102,15,111,130,110,93,0,0 // movdqa 0x5d6e(%edx),%xmm0
.byte 102,15,127,69,216 // movdqa %xmm0,-0x28(%ebp)
.byte 102,15,254,200 // paddd %xmm0,%xmm1
.byte 102,15,112,193,229 // pshufd $0xe5,%xmm1,%xmm0
@@ -64509,7 +65263,7 @@ _sk_clut_3D_sse2:
.byte 243,15,16,4,177 // movss (%ecx,%esi,4),%xmm0
.byte 15,20,232 // unpcklps %xmm0,%xmm5
.byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,40,130,190,96,0,0 // movaps 0x60be(%edx),%xmm0
+ .byte 15,40,130,174,99,0,0 // movaps 0x63ae(%edx),%xmm0
.byte 15,88,240 // addps %xmm0,%xmm6
.byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
.byte 15,40,141,56,255,255,255 // movaps -0xc8(%ebp),%xmm1
@@ -65135,7 +65889,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,245 // paddd %xmm5,%xmm6
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,15,254,206 // paddd %xmm6,%xmm1
- .byte 102,15,111,153,88,85,0,0 // movdqa 0x5558(%ecx),%xmm3
+ .byte 102,15,111,153,72,88,0,0 // movdqa 0x5848(%ecx),%xmm3
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
@@ -65158,7 +65912,7 @@ _sk_clut_4D_sse2:
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
- .byte 102,15,111,153,232,78,0,0 // movdqa 0x4ee8(%ecx),%xmm3
+ .byte 102,15,111,153,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm3
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
@@ -65176,7 +65930,7 @@ _sk_clut_4D_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 15,20,213 // unpcklps %xmm5,%xmm2
.byte 15,41,149,136,254,255,255 // movaps %xmm2,-0x178(%ebp)
- .byte 102,15,254,137,8,79,0,0 // paddd 0x4f08(%ecx),%xmm1
+ .byte 102,15,254,137,248,81,0,0 // paddd 0x51f8(%ecx),%xmm1
.byte 102,15,112,233,229 // pshufd $0xe5,%xmm1,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
.byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
@@ -65192,7 +65946,7 @@ _sk_clut_4D_sse2:
.byte 15,20,207 // unpcklps %xmm7,%xmm1
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,41,141,152,254,255,255 // movaps %xmm1,-0x168(%ebp)
- .byte 15,40,185,72,85,0,0 // movaps 0x5548(%ecx),%xmm7
+ .byte 15,40,185,56,88,0,0 // movaps 0x5838(%ecx),%xmm7
.byte 15,88,231 // addps %xmm7,%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,40,141,232,254,255,255 // movaps -0x118(%ebp),%xmm1
@@ -65213,7 +65967,7 @@ _sk_clut_4D_sse2:
.byte 102,15,127,77,184 // movdqa %xmm1,-0x48(%ebp)
.byte 102,15,254,241 // paddd %xmm1,%xmm6
.byte 102,15,112,254,245 // pshufd $0xf5,%xmm6,%xmm7
- .byte 102,15,111,137,88,85,0,0 // movdqa 0x5558(%ecx),%xmm1
+ .byte 102,15,111,137,72,88,0,0 // movdqa 0x5848(%ecx),%xmm1
.byte 102,15,244,241 // pmuludq %xmm1,%xmm6
.byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
.byte 102,15,244,249 // pmuludq %xmm1,%xmm7
@@ -65250,7 +66004,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,44,178 // movss (%edx,%esi,4),%xmm5
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,20,217 // unpcklps %xmm1,%xmm3
- .byte 102,15,111,177,8,79,0,0 // movdqa 0x4f08(%ecx),%xmm6
+ .byte 102,15,111,177,248,81,0,0 // movdqa 0x51f8(%ecx),%xmm6
.byte 102,15,254,198 // paddd %xmm6,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
@@ -65298,7 +66052,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,254,77,168 // paddd -0x58(%ebp),%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,129,88,85,0,0 // movdqa 0x5558(%ecx),%xmm0
+ .byte 102,15,111,129,72,88,0,0 // movdqa 0x5848(%ecx),%xmm0
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
@@ -65320,7 +66074,7 @@ _sk_clut_4D_sse2:
.byte 15,20,195 // unpcklps %xmm3,%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,129,232,78,0,0 // movdqa 0x4ee8(%ecx),%xmm0
+ .byte 102,15,111,129,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm0
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
@@ -65356,7 +66110,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,197 // movdqa %xmm5,%xmm0
.byte 102,15,254,69,184 // paddd -0x48(%ebp),%xmm0
.byte 102,15,112,216,245 // pshufd $0xf5,%xmm0,%xmm3
- .byte 102,15,111,137,88,85,0,0 // movdqa 0x5558(%ecx),%xmm1
+ .byte 102,15,111,137,72,88,0,0 // movdqa 0x5848(%ecx),%xmm1
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,217 // pmuludq %xmm1,%xmm3
@@ -65392,7 +66146,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,224 // unpcklps %xmm0,%xmm4
.byte 15,20,227 // unpcklps %xmm3,%xmm4
- .byte 102,15,111,153,8,79,0,0 // movdqa 0x4f08(%ecx),%xmm3
+ .byte 102,15,111,153,248,81,0,0 // movdqa 0x51f8(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,194,229 // pshufd $0xe5,%xmm2,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
@@ -65456,7 +66210,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,197 // movdqa %xmm5,%xmm0
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,145,88,85,0,0 // movdqa 0x5558(%ecx),%xmm2
+ .byte 102,15,111,145,72,88,0,0 // movdqa 0x5848(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -65478,7 +66232,7 @@ _sk_clut_4D_sse2:
.byte 15,20,214 // unpcklps %xmm6,%xmm2
.byte 15,41,85,136 // movaps %xmm2,-0x78(%ebp)
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,111,145,232,78,0,0 // movdqa 0x4ee8(%ecx),%xmm2
+ .byte 102,15,111,145,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm2
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
@@ -65511,7 +66265,7 @@ _sk_clut_4D_sse2:
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 102,15,254,109,184 // paddd -0x48(%ebp),%xmm5
.byte 102,15,112,245,245 // pshufd $0xf5,%xmm5,%xmm6
- .byte 102,15,111,129,88,85,0,0 // movdqa 0x5558(%ecx),%xmm0
+ .byte 102,15,111,129,72,88,0,0 // movdqa 0x5848(%ecx),%xmm0
.byte 102,15,244,232 // pmuludq %xmm0,%xmm5
.byte 102,15,112,253,232 // pshufd $0xe8,%xmm5,%xmm7
.byte 102,15,244,240 // pmuludq %xmm0,%xmm6
@@ -65547,7 +66301,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,234 // unpcklps %xmm2,%xmm5
.byte 15,20,238 // unpcklps %xmm6,%xmm5
- .byte 102,15,111,153,8,79,0,0 // movdqa 0x4f08(%ecx),%xmm3
+ .byte 102,15,111,153,248,81,0,0 // movdqa 0x51f8(%ecx),%xmm3
.byte 102,15,254,251 // paddd %xmm3,%xmm7
.byte 102,15,112,215,229 // pshufd $0xe5,%xmm7,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
@@ -65581,7 +66335,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,177,88,85,0,0 // movdqa 0x5558(%ecx),%xmm6
+ .byte 102,15,111,177,72,88,0,0 // movdqa 0x5848(%ecx),%xmm6
.byte 102,15,244,198 // pmuludq %xmm6,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,206 // pmuludq %xmm6,%xmm1
@@ -65603,7 +66357,7 @@ _sk_clut_4D_sse2:
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,15,254,137,232,78,0,0 // paddd 0x4ee8(%ecx),%xmm1
+ .byte 102,15,254,137,216,81,0,0 // paddd 0x51d8(%ecx),%xmm1
.byte 102,15,112,241,229 // pshufd $0xe5,%xmm1,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -65637,7 +66391,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,254,85,184 // paddd -0x48(%ebp),%xmm2
.byte 102,15,112,194,245 // pshufd $0xf5,%xmm2,%xmm0
- .byte 102,15,111,137,88,85,0,0 // movdqa 0x5558(%ecx),%xmm1
+ .byte 102,15,111,137,72,88,0,0 // movdqa 0x5848(%ecx),%xmm1
.byte 102,15,244,209 // pmuludq %xmm1,%xmm2
.byte 102,15,112,226,232 // pshufd $0xe8,%xmm2,%xmm4
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
@@ -65658,7 +66412,7 @@ _sk_clut_4D_sse2:
.byte 15,20,200 // unpcklps %xmm0,%xmm1
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
- .byte 102,15,254,129,232,78,0,0 // paddd 0x4ee8(%ecx),%xmm0
+ .byte 102,15,254,129,216,81,0,0 // paddd 0x51d8(%ecx),%xmm0
.byte 102,15,112,240,229 // pshufd $0xe5,%xmm0,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,240,78 // pshufd $0x4e,%xmm0,%xmm6
@@ -65673,7 +66427,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,208 // unpcklps %xmm0,%xmm2
.byte 15,20,214 // unpcklps %xmm6,%xmm2
- .byte 102,15,254,161,8,79,0,0 // paddd 0x4f08(%ecx),%xmm4
+ .byte 102,15,254,161,248,81,0,0 // paddd 0x51f8(%ecx),%xmm4
.byte 102,15,112,196,229 // pshufd $0xe5,%xmm4,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,196,78 // pshufd $0x4e,%xmm4,%xmm0
@@ -65741,7 +66495,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,69,168 // movdqa -0x58(%ebp),%xmm0
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,112,224,245 // pshufd $0xf5,%xmm0,%xmm4
- .byte 102,15,111,145,88,85,0,0 // movdqa 0x5558(%ecx),%xmm2
+ .byte 102,15,111,145,72,88,0,0 // movdqa 0x5848(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,216,232 // pshufd $0xe8,%xmm0,%xmm3
.byte 102,15,244,226 // pmuludq %xmm2,%xmm4
@@ -65764,7 +66518,7 @@ _sk_clut_4D_sse2:
.byte 15,20,196 // unpcklps %xmm4,%xmm0
.byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp)
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,111,145,232,78,0,0 // movdqa 0x4ee8(%ecx),%xmm2
+ .byte 102,15,111,145,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm2
.byte 102,15,254,226 // paddd %xmm2,%xmm4
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
@@ -65780,7 +66534,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
.byte 15,20,236 // unpcklps %xmm4,%xmm5
.byte 15,20,238 // unpcklps %xmm6,%xmm5
- .byte 102,15,254,153,8,79,0,0 // paddd 0x4f08(%ecx),%xmm3
+ .byte 102,15,254,153,248,81,0,0 // paddd 0x51f8(%ecx),%xmm3
.byte 102,15,112,227,229 // pshufd $0xe5,%xmm3,%xmm4
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
@@ -65832,7 +66586,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,20,223 // unpcklps %xmm7,%xmm3
- .byte 102,15,254,161,8,79,0,0 // paddd 0x4f08(%ecx),%xmm4
+ .byte 102,15,254,161,248,81,0,0 // paddd 0x51f8(%ecx),%xmm4
.byte 102,15,112,212,229 // pshufd $0xe5,%xmm4,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,212,78 // pshufd $0x4e,%xmm4,%xmm2
@@ -65865,7 +66619,7 @@ _sk_clut_4D_sse2:
.byte 102,15,127,133,56,255,255,255 // movdqa %xmm0,-0xc8(%ebp)
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,208,245 // pshufd $0xf5,%xmm0,%xmm2
- .byte 102,15,111,137,88,85,0,0 // movdqa 0x5558(%ecx),%xmm1
+ .byte 102,15,111,137,72,88,0,0 // movdqa 0x5848(%ecx),%xmm1
.byte 102,15,244,193 // pmuludq %xmm1,%xmm0
.byte 102,15,112,240,232 // pshufd $0xe8,%xmm0,%xmm6
.byte 102,15,244,209 // pmuludq %xmm1,%xmm2
@@ -65887,7 +66641,7 @@ _sk_clut_4D_sse2:
.byte 15,20,194 // unpcklps %xmm2,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 102,15,111,214 // movdqa %xmm6,%xmm2
- .byte 102,15,111,153,232,78,0,0 // movdqa 0x4ee8(%ecx),%xmm3
+ .byte 102,15,111,153,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,229 // pshufd $0xe5,%xmm2,%xmm5
.byte 102,15,126,232 // movd %xmm5,%eax
@@ -65903,7 +66657,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,20,178 // movss (%edx,%esi,4),%xmm2
.byte 15,20,234 // unpcklps %xmm2,%xmm5
.byte 15,20,239 // unpcklps %xmm7,%xmm5
- .byte 102,15,254,177,8,79,0,0 // paddd 0x4f08(%ecx),%xmm6
+ .byte 102,15,254,177,248,81,0,0 // paddd 0x51f8(%ecx),%xmm6
.byte 102,15,112,214,229 // pshufd $0xe5,%xmm6,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,214,78 // pshufd $0x4e,%xmm6,%xmm2
@@ -65956,7 +66710,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,4,178 // movss (%edx,%esi,4),%xmm0
.byte 15,20,216 // unpcklps %xmm0,%xmm3
.byte 15,20,218 // unpcklps %xmm2,%xmm3
- .byte 102,15,254,185,8,79,0,0 // paddd 0x4f08(%ecx),%xmm7
+ .byte 102,15,254,185,248,81,0,0 // paddd 0x51f8(%ecx),%xmm7
.byte 102,15,112,199,229 // pshufd $0xe5,%xmm7,%xmm0
.byte 102,15,126,192 // movd %xmm0,%eax
.byte 102,15,112,199,78 // pshufd $0x4e,%xmm7,%xmm0
@@ -66006,7 +66760,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,254,69,168 // paddd -0x58(%ebp),%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,153,88,85,0,0 // movdqa 0x5558(%ecx),%xmm3
+ .byte 102,15,111,153,72,88,0,0 // movdqa 0x5848(%ecx),%xmm3
.byte 102,15,244,195 // pmuludq %xmm3,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
@@ -66028,7 +66782,7 @@ _sk_clut_4D_sse2:
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,15,111,177,232,78,0,0 // movdqa 0x4ee8(%ecx),%xmm6
+ .byte 102,15,111,177,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm6
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,15,112,217,229 // pshufd $0xe5,%xmm1,%xmm3
.byte 102,15,126,216 // movd %xmm3,%eax
@@ -66044,7 +66798,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,36,178 // movss (%edx,%esi,4),%xmm4
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,203 // unpcklps %xmm3,%xmm1
- .byte 102,15,111,185,8,79,0,0 // movdqa 0x4f08(%ecx),%xmm7
+ .byte 102,15,111,185,248,81,0,0 // movdqa 0x51f8(%ecx),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,112,218,229 // pshufd $0xe5,%xmm2,%xmm3
.byte 102,15,126,216 // movd %xmm3,%eax
@@ -66063,7 +66817,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,221 // movdqa %xmm5,%xmm3
.byte 102,15,254,93,184 // paddd -0x48(%ebp),%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,15,111,129,88,85,0,0 // movdqa 0x5558(%ecx),%xmm0
+ .byte 102,15,111,129,72,88,0,0 // movdqa 0x5848(%ecx),%xmm0
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
.byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
.byte 102,15,244,224 // pmuludq %xmm0,%xmm4
@@ -66132,7 +66886,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,193 // paddd %xmm1,%xmm0
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,145,88,85,0,0 // movdqa 0x5558(%ecx),%xmm2
+ .byte 102,15,111,145,72,88,0,0 // movdqa 0x5848(%ecx),%xmm2
.byte 102,15,244,194 // pmuludq %xmm2,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -66155,7 +66909,7 @@ _sk_clut_4D_sse2:
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,41,93,168 // movaps %xmm3,-0x58(%ebp)
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,137,232,78,0,0 // paddd 0x4ee8(%ecx),%xmm1
+ .byte 102,15,254,137,216,81,0,0 // paddd 0x51d8(%ecx),%xmm1
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,15,126,208 // movd %xmm2,%eax
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
@@ -66171,7 +66925,7 @@ _sk_clut_4D_sse2:
.byte 15,20,217 // unpcklps %xmm1,%xmm3
.byte 15,20,218 // unpcklps %xmm2,%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
- .byte 102,15,254,129,8,79,0,0 // paddd 0x4f08(%ecx),%xmm0
+ .byte 102,15,254,129,248,81,0,0 // paddd 0x51f8(%ecx),%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -66208,7 +66962,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,60,178 // movss (%edx,%esi,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,177,232,78,0,0 // movdqa 0x4ee8(%ecx),%xmm6
+ .byte 102,15,111,177,216,81,0,0 // movdqa 0x51d8(%ecx),%xmm6
.byte 102,15,254,242 // paddd %xmm2,%xmm6
.byte 102,15,112,206,229 // pshufd $0xe5,%xmm6,%xmm1
.byte 102,15,126,200 // movd %xmm1,%eax
@@ -66224,7 +66978,7 @@ _sk_clut_4D_sse2:
.byte 243,15,16,52,178 // movss (%edx,%esi,4),%xmm6
.byte 15,20,206 // unpcklps %xmm6,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,145,8,79,0,0 // paddd 0x4f08(%ecx),%xmm2
+ .byte 102,15,254,145,248,81,0,0 // paddd 0x51f8(%ecx),%xmm2
.byte 102,15,112,242,229 // pshufd $0xe5,%xmm2,%xmm6
.byte 102,15,126,240 // movd %xmm6,%eax
.byte 102,15,112,242,78 // pshufd $0x4e,%xmm2,%xmm6
@@ -66294,7 +67048,7 @@ _sk_clut_4D_sse2:
.byte 139,117,12 // mov 0xc(%ebp),%esi
.byte 141,86,8 // lea 0x8(%esi),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,200,78,0,0 // movaps 0x4ec8(%ecx),%xmm3
+ .byte 15,40,153,184,81,0,0 // movaps 0x51b8(%ecx),%xmm3
.byte 82 // push %edx
.byte 80 // push %eax
.byte 255,86,4 // call *0x4(%esi)
@@ -66410,11 +67164,11 @@ _sk_set_rgb_sse2_8bit:
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
- .byte 243,15,16,161,182,64,0,0 // movss 0x40b6(%ecx),%xmm4
+ .byte 243,15,16,161,246,67,0,0 // movss 0x43f6(%ecx),%xmm4
.byte 243,15,16,50 // movss (%edx),%xmm6
.byte 243,15,89,244 // mulss %xmm4,%xmm6
.byte 243,15,44,246 // cvttss2si %xmm6,%esi
- .byte 243,15,16,169,186,64,0,0 // movss 0x40ba(%ecx),%xmm5
+ .byte 243,15,16,169,250,67,0,0 // movss 0x43fa(%ecx),%xmm5
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 243,15,92,253 // subss %xmm5,%xmm7
.byte 243,15,44,255 // cvttss2si %xmm7,%edi
@@ -66444,7 +67198,7 @@ _sk_set_rgb_sse2_8bit:
.byte 9,247 // or %esi,%edi
.byte 102,15,110,231 // movd %edi,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,169,82,64,0,0 // movdqa 0x4052(%ecx),%xmm5
+ .byte 102,15,111,169,66,67,0,0 // movdqa 0x4342(%ecx),%xmm5
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -66486,7 +67240,7 @@ _sk_premul_sse2_8bit:
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
.byte 242,15,112,228,95 // pshuflw $0x5f,%xmm4,%xmm4
.byte 243,15,112,252,95 // pshufhw $0x5f,%xmm4,%xmm7
- .byte 102,15,111,160,122,63,0,0 // movdqa 0x3f7a(%eax),%xmm4
+ .byte 102,15,111,160,106,66,0,0 // movdqa 0x426a(%eax),%xmm4
.byte 102,15,235,252 // por %xmm4,%xmm7
.byte 102,15,235,244 // por %xmm4,%xmm6
.byte 102,15,239,210 // pxor %xmm2,%xmm2
@@ -67098,6 +67852,232 @@ _sk_store_bgra_sse2_8bit:
.byte 0,0 // add %al,(%eax)
.byte 0 // .byte 0x0
+HIDDEN _sk_store_565_sse2_8bit
+.globl _sk_store_565_sse2_8bit
+FUNCTION(_sk_store_565_sse2_8bit)
+_sk_store_565_sse2_8bit:
+ .byte 85 // push %ebp
+ .byte 137,229 // mov %esp,%ebp
+ .byte 83 // push %ebx
+ .byte 87 // push %edi
+ .byte 86 // push %esi
+ .byte 131,236,12 // sub $0xc,%esp
+ .byte 232,0,0,0,0 // call 9bae <_sk_store_565_sse2_8bit+0xe>
+ .byte 88 // pop %eax
+ .byte 102,15,111,176,66,59,0,0 // movdqa 0x3b42(%eax),%xmm6
+ .byte 102,15,111,249 // movdqa %xmm1,%xmm7
+ .byte 102,15,219,254 // pand %xmm6,%xmm7
+ .byte 102,15,219,240 // pand %xmm0,%xmm6
+ .byte 102,15,114,246,8 // pslld $0x8,%xmm6
+ .byte 102,15,114,247,8 // pslld $0x8,%xmm7
+ .byte 102,15,111,160,82,59,0,0 // movdqa 0x3b52(%eax),%xmm4
+ .byte 102,15,111,233 // movdqa %xmm1,%xmm5
+ .byte 102,15,219,236 // pand %xmm4,%xmm5
+ .byte 102,15,219,224 // pand %xmm0,%xmm4
+ .byte 102,15,114,212,5 // psrld $0x5,%xmm4
+ .byte 102,15,114,213,5 // psrld $0x5,%xmm5
+ .byte 102,15,235,239 // por %xmm7,%xmm5
+ .byte 102,15,111,184,98,59,0,0 // movdqa 0x3b62(%eax),%xmm7
+ .byte 102,15,235,230 // por %xmm6,%xmm4
+ .byte 102,15,111,240 // movdqa %xmm0,%xmm6
+ .byte 102,15,219,247 // pand %xmm7,%xmm6
+ .byte 102,15,114,214,19 // psrld $0x13,%xmm6
+ .byte 102,15,235,230 // por %xmm6,%xmm4
+ .byte 102,15,219,249 // pand %xmm1,%xmm7
+ .byte 102,15,114,215,19 // psrld $0x13,%xmm7
+ .byte 102,15,235,239 // por %xmm7,%xmm5
+ .byte 102,15,114,245,16 // pslld $0x10,%xmm5
+ .byte 102,15,114,229,16 // psrad $0x10,%xmm5
+ .byte 102,15,114,244,16 // pslld $0x10,%xmm4
+ .byte 102,15,114,228,16 // psrad $0x10,%xmm4
+ .byte 102,15,107,229 // packssdw %xmm5,%xmm4
+ .byte 139,85,20 // mov 0x14(%ebp),%edx
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,49 // mov (%ecx),%esi
+ .byte 139,126,4 // mov 0x4(%esi),%edi
+ .byte 15,175,250 // imul %edx,%edi
+ .byte 1,255 // add %edi,%edi
+ .byte 3,62 // add (%esi),%edi
+ .byte 139,93,8 // mov 0x8(%ebp),%ebx
+ .byte 133,219 // test %ebx,%ebx
+ .byte 139,117,16 // mov 0x10(%ebp),%esi
+ .byte 117,23 // jne 9c64 <_sk_store_565_sse2_8bit+0xc4>
+ .byte 243,15,127,36,119 // movdqu %xmm4,(%edi,%esi,2)
+ .byte 141,65,8 // lea 0x8(%ecx),%eax
+ .byte 82 // push %edx
+ .byte 86 // push %esi
+ .byte 80 // push %eax
+ .byte 83 // push %ebx
+ .byte 255,81,4 // call *0x4(%ecx)
+ .byte 131,196,28 // add $0x1c,%esp
+ .byte 94 // pop %esi
+ .byte 95 // pop %edi
+ .byte 91 // pop %ebx
+ .byte 93 // pop %ebp
+ .byte 195 // ret
+ .byte 139,93,8 // mov 0x8(%ebp),%ebx
+ .byte 136,93,243 // mov %bl,-0xd(%ebp)
+ .byte 139,93,8 // mov 0x8(%ebp),%ebx
+ .byte 128,101,243,7 // andb $0x7,-0xd(%ebp)
+ .byte 254,77,243 // decb -0xd(%ebp)
+ .byte 128,125,243,6 // cmpb $0x6,-0xd(%ebp)
+ .byte 119,216 // ja 9c52 <_sk_store_565_sse2_8bit+0xb2>
+ .byte 15,182,85,243 // movzbl -0xd(%ebp),%edx
+ .byte 3,132,144,34,1,0,0 // add 0x122(%eax,%edx,4),%eax
+ .byte 255,224 // jmp *%eax
+ .byte 102,15,126,224 // movd %xmm4,%eax
+ .byte 102,137,4,119 // mov %ax,(%edi,%esi,2)
+ .byte 139,85,20 // mov 0x14(%ebp),%edx
+ .byte 235,190 // jmp 9c52 <_sk_store_565_sse2_8bit+0xb2>
+ .byte 102,15,197,196,2 // pextrw $0x2,%xmm4,%eax
+ .byte 102,137,68,119,4 // mov %ax,0x4(%edi,%esi,2)
+ .byte 102,15,126,36,119 // movd %xmm4,(%edi,%esi,2)
+ .byte 139,85,20 // mov 0x14(%ebp),%edx
+ .byte 235,170 // jmp 9c52 <_sk_store_565_sse2_8bit+0xb2>
+ .byte 102,15,197,196,6 // pextrw $0x6,%xmm4,%eax
+ .byte 102,137,68,119,12 // mov %ax,0xc(%edi,%esi,2)
+ .byte 102,15,197,196,5 // pextrw $0x5,%xmm4,%eax
+ .byte 102,137,68,119,10 // mov %ax,0xa(%edi,%esi,2)
+ .byte 102,15,197,196,4 // pextrw $0x4,%xmm4,%eax
+ .byte 102,137,68,119,8 // mov %ax,0x8(%edi,%esi,2)
+ .byte 102,15,214,36,119 // movq %xmm4,(%edi,%esi,2)
+ .byte 139,85,20 // mov 0x14(%ebp),%edx
+ .byte 235,130 // jmp 9c52 <_sk_store_565_sse2_8bit+0xb2>
+ .byte 217,0 // flds (%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 240,0,0 // lock add %al,(%eax)
+ .byte 0,230 // add %ah,%dh
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,24 // add %bl,(%eax)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,14 // add %cl,(%esi)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,4,1 // add %al,(%ecx,%eax,1)
+ .byte 0,0 // add %al,(%eax)
+ .byte 250 // cli
+ .byte 0,0 // add %al,(%eax)
+ .byte 0 // .byte 0x0
+
+HIDDEN _sk_load_565_dst_sse2_8bit
+.globl _sk_load_565_dst_sse2_8bit
+FUNCTION(_sk_load_565_dst_sse2_8bit)
+_sk_load_565_dst_sse2_8bit:
+ .byte 85 // push %ebp
+ .byte 137,229 // mov %esp,%ebp
+ .byte 83 // push %ebx
+ .byte 87 // push %edi
+ .byte 86 // push %esi
+ .byte 131,236,28 // sub $0x1c,%esp
+ .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
+ .byte 232,0,0,0,0 // call 9cfe <_sk_load_565_dst_sse2_8bit+0x12>
+ .byte 94 // pop %esi
+ .byte 139,69,12 // mov 0xc(%ebp),%eax
+ .byte 139,16 // mov (%eax),%edx
+ .byte 139,90,4 // mov 0x4(%edx),%ebx
+ .byte 15,175,93,20 // imul 0x14(%ebp),%ebx
+ .byte 1,219 // add %ebx,%ebx
+ .byte 3,26 // add (%edx),%ebx
+ .byte 139,85,8 // mov 0x8(%ebp),%edx
+ .byte 133,210 // test %edx,%edx
+ .byte 139,125,16 // mov 0x10(%ebp),%edi
+ .byte 15,133,235,0,0,0 // jne 9e08 <_sk_load_565_dst_sse2_8bit+0x11c>
+ .byte 243,15,111,20,123 // movdqu (%ebx,%edi,2),%xmm2
+ .byte 102,15,239,228 // pxor %xmm4,%xmm4
+ .byte 102,15,111,218 // movdqa %xmm2,%xmm3
+ .byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
+ .byte 102,15,97,212 // punpcklwd %xmm4,%xmm2
+ .byte 102,15,111,182,66,53,0,0 // movdqa 0x3542(%esi),%xmm6
+ .byte 102,15,111,250 // movdqa %xmm2,%xmm7
+ .byte 102,15,219,254 // pand %xmm6,%xmm7
+ .byte 102,15,219,243 // pand %xmm3,%xmm6
+ .byte 102,15,114,214,8 // psrld $0x8,%xmm6
+ .byte 102,15,114,215,8 // psrld $0x8,%xmm7
+ .byte 102,15,111,174,130,53,0,0 // movdqa 0x3582(%esi),%xmm5
+ .byte 102,15,111,226 // movdqa %xmm2,%xmm4
+ .byte 102,15,219,229 // pand %xmm5,%xmm4
+ .byte 102,15,219,235 // pand %xmm3,%xmm5
+ .byte 102,15,114,245,19 // pslld $0x13,%xmm5
+ .byte 102,15,114,244,19 // pslld $0x13,%xmm4
+ .byte 102,15,235,231 // por %xmm7,%xmm4
+ .byte 102,15,235,238 // por %xmm6,%xmm5
+ .byte 102,15,111,182,98,53,0,0 // movdqa 0x3562(%esi),%xmm6
+ .byte 102,15,111,251 // movdqa %xmm3,%xmm7
+ .byte 102,15,219,254 // pand %xmm6,%xmm7
+ .byte 102,15,219,242 // pand %xmm2,%xmm6
+ .byte 102,15,111,142,50,58,0,0 // movdqa 0x3a32(%esi),%xmm1
+ .byte 102,15,219,217 // pand %xmm1,%xmm3
+ .byte 102,15,219,209 // pand %xmm1,%xmm2
+ .byte 102,15,114,247,5 // pslld $0x5,%xmm7
+ .byte 102,15,114,211,1 // psrld $0x1,%xmm3
+ .byte 102,15,235,223 // por %xmm7,%xmm3
+ .byte 102,15,235,221 // por %xmm5,%xmm3
+ .byte 102,15,114,213,5 // psrld $0x5,%xmm5
+ .byte 102,15,114,246,5 // pslld $0x5,%xmm6
+ .byte 102,15,114,210,1 // psrld $0x1,%xmm2
+ .byte 102,15,235,214 // por %xmm6,%xmm2
+ .byte 102,15,235,212 // por %xmm4,%xmm2
+ .byte 102,15,114,212,5 // psrld $0x5,%xmm4
+ .byte 102,15,111,142,34,58,0,0 // movdqa 0x3a22(%esi),%xmm1
+ .byte 102,15,219,225 // pand %xmm1,%xmm4
+ .byte 102,15,219,233 // pand %xmm1,%xmm5
+ .byte 102,15,111,142,226,57,0,0 // movdqa 0x39e2(%esi),%xmm1
+ .byte 102,15,235,209 // por %xmm1,%xmm2
+ .byte 102,15,235,212 // por %xmm4,%xmm2
+ .byte 102,15,235,217 // por %xmm1,%xmm3
+ .byte 102,15,235,221 // por %xmm5,%xmm3
+ .byte 141,72,8 // lea 0x8(%eax),%ecx
+ .byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
+ .byte 255,117,20 // pushl 0x14(%ebp)
+ .byte 87 // push %edi
+ .byte 81 // push %ecx
+ .byte 82 // push %edx
+ .byte 255,80,4 // call *0x4(%eax)
+ .byte 131,196,44 // add $0x2c,%esp
+ .byte 94 // pop %esi
+ .byte 95 // pop %edi
+ .byte 91 // pop %ebx
+ .byte 93 // pop %ebp
+ .byte 195 // ret
+ .byte 137,209 // mov %edx,%ecx
+ .byte 128,225,7 // and $0x7,%cl
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
+ .byte 254,201 // dec %cl
+ .byte 128,249,6 // cmp $0x6,%cl
+ .byte 15,135,6,255,255,255 // ja 9d22 <_sk_load_565_dst_sse2_8bit+0x36>
+ .byte 15,182,201 // movzbl %cl,%ecx
+ .byte 139,140,142,118,1,0,0 // mov 0x176(%esi,%ecx,4),%ecx
+ .byte 1,241 // add %esi,%ecx
+ .byte 255,225 // jmp *%ecx
+ .byte 15,183,12,123 // movzwl (%ebx,%edi,2),%ecx
+ .byte 102,15,110,209 // movd %ecx,%xmm2
+ .byte 233,235,254,255,255 // jmp 9d22 <_sk_load_565_dst_sse2_8bit+0x36>
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
+ .byte 102,15,196,84,123,4,2 // pinsrw $0x2,0x4(%ebx,%edi,2),%xmm2
+ .byte 243,15,16,28,123 // movss (%ebx,%edi,2),%xmm3
+ .byte 243,15,16,211 // movss %xmm3,%xmm2
+ .byte 233,210,254,255,255 // jmp 9d22 <_sk_load_565_dst_sse2_8bit+0x36>
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
+ .byte 102,15,196,84,123,12,6 // pinsrw $0x6,0xc(%ebx,%edi,2),%xmm2
+ .byte 102,15,196,84,123,10,5 // pinsrw $0x5,0xa(%ebx,%edi,2),%xmm2
+ .byte 102,15,196,84,123,8,4 // pinsrw $0x4,0x8(%ebx,%edi,2),%xmm2
+ .byte 102,15,18,20,123 // movlpd (%ebx,%edi,2),%xmm2
+ .byte 233,175,254,255,255 // jmp 9d22 <_sk_load_565_dst_sse2_8bit+0x36>
+ .byte 144 // nop
+ .byte 44,1 // sub $0x1,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 68 // inc %esp
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,57 // add %bh,(%ecx)
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0,107,1 // add %ch,0x1(%ebx)
+ .byte 0,0 // add %al,(%eax)
+ .byte 100,1,0 // add %eax,%fs:(%eax)
+ .byte 0,93,1 // add %bl,0x1(%ebp)
+ .byte 0,0 // add %al,(%eax)
+ .byte 82 // push %edx
+ .byte 1,0 // add %eax,(%eax)
+ .byte 0 // .byte 0x0
+
HIDDEN _sk_load_a8_sse2_8bit
.globl _sk_load_a8_sse2_8bit
FUNCTION(_sk_load_a8_sse2_8bit)
@@ -67108,7 +68088,7 @@ _sk_load_a8_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 9bae <_sk_load_a8_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 9e9e <_sk_load_a8_sse2_8bit+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67118,10 +68098,10 @@ _sk_load_a8_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,63 // jne 9c06 <_sk_load_a8_sse2_8bit+0x66>
+ .byte 117,63 // jne 9ef6 <_sk_load_a8_sse2_8bit+0x66>
.byte 243,15,126,4,51 // movq (%ebx,%esi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,219,135,82,56,0,0 // pand 0x3852(%edi),%xmm0
+ .byte 102,15,219,135,162,56,0,0 // pand 0x38a2(%edi),%xmm0
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -67145,14 +68125,14 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,186 // ja 9bd0 <_sk_load_a8_sse2_8bit+0x30>
+ .byte 119,186 // ja 9ec0 <_sk_load_a8_sse2_8bit+0x30>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,214,0,0,0 // mov 0xd6(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,193 // movd %ecx,%xmm0
- .byte 235,162 // jmp 9bd0 <_sk_load_a8_sse2_8bit+0x30>
+ .byte 235,162 // jmp 9ec0 <_sk_load_a8_sse2_8bit+0x30>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,193,2 // pinsrw $0x2,%ecx,%xmm0
@@ -67160,7 +68140,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,110,201 // movd %ecx,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 235,130 // jmp 9bd0 <_sk_load_a8_sse2_8bit+0x30>
+ .byte 235,130 // jmp 9ec0 <_sk_load_a8_sse2_8bit+0x30>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,193,6 // pinsrw $0x6,%ecx,%xmm0
@@ -67171,9 +68151,9 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,110,12,51 // movd (%ebx,%esi,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,78,255,255,255 // jmp 9bd0 <_sk_load_a8_sse2_8bit+0x30>
+ .byte 233,78,255,255,255 // jmp 9ec0 <_sk_load_a8_sse2_8bit+0x30>
.byte 102,144 // xchg %ax,%ax
- .byte 118,0 // jbe 9c86 <_sk_load_a8_sse2_8bit+0xe6>
+ .byte 118,0 // jbe 9f76 <_sk_load_a8_sse2_8bit+0xe6>
.byte 0,0 // add %al,(%eax)
.byte 142,0 // mov (%eax),%es
.byte 0,0 // add %al,(%eax)
@@ -67197,7 +68177,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 9cae <_sk_load_a8_dst_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call 9f9e <_sk_load_a8_dst_sse2_8bit+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67207,10 +68187,10 @@ _sk_load_a8_dst_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 117,63 // jne 9d06 <_sk_load_a8_dst_sse2_8bit+0x66>
+ .byte 117,63 // jne 9ff6 <_sk_load_a8_dst_sse2_8bit+0x66>
.byte 243,15,126,20,51 // movq (%ebx,%esi,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,219,151,82,55,0,0 // pand 0x3752(%edi),%xmm2
+ .byte 102,15,219,151,162,55,0,0 // pand 0x37a2(%edi),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -67234,14 +68214,14 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,186 // ja 9cd0 <_sk_load_a8_dst_sse2_8bit+0x30>
+ .byte 119,186 // ja 9fc0 <_sk_load_a8_dst_sse2_8bit+0x30>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,214,0,0,0 // mov 0xd6(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,209 // movd %ecx,%xmm2
- .byte 235,162 // jmp 9cd0 <_sk_load_a8_dst_sse2_8bit+0x30>
+ .byte 235,162 // jmp 9fc0 <_sk_load_a8_dst_sse2_8bit+0x30>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
@@ -67249,7 +68229,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,110,217 // movd %ecx,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 235,130 // jmp 9cd0 <_sk_load_a8_dst_sse2_8bit+0x30>
+ .byte 235,130 // jmp 9fc0 <_sk_load_a8_dst_sse2_8bit+0x30>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,209,6 // pinsrw $0x6,%ecx,%xmm2
@@ -67260,9 +68240,9 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,110,28,51 // movd (%ebx,%esi,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,78,255,255,255 // jmp 9cd0 <_sk_load_a8_dst_sse2_8bit+0x30>
+ .byte 233,78,255,255,255 // jmp 9fc0 <_sk_load_a8_dst_sse2_8bit+0x30>
.byte 102,144 // xchg %ax,%ax
- .byte 118,0 // jbe 9d86 <_sk_load_a8_dst_sse2_8bit+0xe6>
+ .byte 118,0 // jbe a076 <_sk_load_a8_dst_sse2_8bit+0xe6>
.byte 0,0 // add %al,(%eax)
.byte 142,0 // mov (%eax),%es
.byte 0,0 // add %al,(%eax)
@@ -67286,7 +68266,7 @@ _sk_store_a8_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,92 // sub $0x5c,%esp
- .byte 232,0,0,0,0 // call 9dae <_sk_store_a8_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call a09e <_sk_store_a8_sse2_8bit+0xe>
.byte 91 // pop %ebx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67305,8 +68285,8 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,107,229 // packssdw %xmm5,%xmm4
.byte 133,210 // test %edx,%edx
.byte 139,125,16 // mov 0x10(%ebp),%edi
- .byte 117,37 // jne 9e16 <_sk_store_a8_sse2_8bit+0x76>
- .byte 102,15,219,163,82,54,0,0 // pand 0x3652(%ebx),%xmm4
+ .byte 117,37 // jne a106 <_sk_store_a8_sse2_8bit+0x76>
+ .byte 102,15,219,163,162,54,0,0 // pand 0x36a2(%ebx),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,214,36,62 // movq %xmm4,(%esi,%edi,1)
.byte 141,72,8 // lea 0x8(%eax),%ecx
@@ -67325,7 +68305,7 @@ _sk_store_a8_sse2_8bit:
.byte 128,225,7 // and $0x7,%cl
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 119,224 // ja 9e02 <_sk_store_a8_sse2_8bit+0x62>
+ .byte 119,224 // ja a0f2 <_sk_store_a8_sse2_8bit+0x62>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,139,238,0,0,0 // mov 0xee(%ebx,%ecx,4),%ecx
.byte 1,217 // add %ebx,%ecx
@@ -67333,15 +68313,15 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,127,101,152 // movdqa %xmm4,-0x68(%ebp)
.byte 138,77,152 // mov -0x68(%ebp),%cl
.byte 136,12,62 // mov %cl,(%esi,%edi,1)
- .byte 235,197 // jmp 9e02 <_sk_store_a8_sse2_8bit+0x62>
+ .byte 235,197 // jmp a0f2 <_sk_store_a8_sse2_8bit+0x62>
.byte 102,15,127,101,168 // movdqa %xmm4,-0x58(%ebp)
.byte 138,77,172 // mov -0x54(%ebp),%cl
.byte 136,76,62,2 // mov %cl,0x2(%esi,%edi,1)
- .byte 102,15,219,163,82,54,0,0 // pand 0x3652(%ebx),%xmm4
+ .byte 102,15,219,163,162,54,0,0 // pand 0x36a2(%ebx),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,225 // movd %xmm4,%ecx
.byte 102,137,12,62 // mov %cx,(%esi,%edi,1)
- .byte 235,163 // jmp 9e02 <_sk_store_a8_sse2_8bit+0x62>
+ .byte 235,163 // jmp a0f2 <_sk_store_a8_sse2_8bit+0x62>
.byte 102,15,127,101,184 // movdqa %xmm4,-0x48(%ebp)
.byte 138,77,196 // mov -0x3c(%ebp),%cl
.byte 136,76,62,6 // mov %cl,0x6(%esi,%edi,1)
@@ -67351,10 +68331,10 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp)
.byte 138,77,224 // mov -0x20(%ebp),%cl
.byte 136,76,62,4 // mov %cl,0x4(%esi,%edi,1)
- .byte 102,15,219,163,82,54,0,0 // pand 0x3652(%ebx),%xmm4
+ .byte 102,15,219,163,162,54,0,0 // pand 0x36a2(%ebx),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,36,62 // movd %xmm4,(%esi,%edi,1)
- .byte 233,105,255,255,255 // jmp 9e02 <_sk_store_a8_sse2_8bit+0x62>
+ .byte 233,105,255,255,255 // jmp a0f2 <_sk_store_a8_sse2_8bit+0x62>
.byte 15,31,0 // nopl (%eax)
.byte 130,0,0 // addb $0x0,(%eax)
.byte 0,155,0,0,0,143 // add %bl,-0x71000000(%ebx)
@@ -67377,7 +68357,7 @@ _sk_load_g8_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 9ec6 <_sk_load_g8_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call a1b6 <_sk_load_g8_sse2_8bit+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67387,15 +68367,15 @@ _sk_load_g8_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,131,0,0,0 // jne 9f66 <_sk_load_g8_sse2_8bit+0xae>
+ .byte 15,133,131,0,0,0 // jne a256 <_sk_load_g8_sse2_8bit+0xae>
.byte 243,15,126,4,51 // movq (%ebx,%esi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,219,135,58,53,0,0 // pand 0x353a(%edi),%xmm0
+ .byte 102,15,219,135,138,53,0,0 // pand 0x358a(%edi),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
- .byte 102,15,111,175,74,53,0,0 // movdqa 0x354a(%edi),%xmm5
+ .byte 102,15,111,175,154,53,0,0 // movdqa 0x359a(%edi),%xmm5
.byte 102,15,112,240,245 // pshufd $0xf5,%xmm0,%xmm6
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,200,232 // pshufd $0xe8,%xmm0,%xmm1
@@ -67428,14 +68408,14 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 15,135,114,255,255,255 // ja 9eec <_sk_load_g8_sse2_8bit+0x34>
+ .byte 15,135,114,255,255,255 // ja a1dc <_sk_load_g8_sse2_8bit+0x34>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,38,1,0,0 // mov 0x126(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,193 // movd %ecx,%xmm0
- .byte 233,87,255,255,255 // jmp 9eec <_sk_load_g8_sse2_8bit+0x34>
+ .byte 233,87,255,255,255 // jmp a1dc <_sk_load_g8_sse2_8bit+0x34>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,193,2 // pinsrw $0x2,%ecx,%xmm0
@@ -67443,7 +68423,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,110,201 // movd %ecx,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 233,52,255,255,255 // jmp 9eec <_sk_load_g8_sse2_8bit+0x34>
+ .byte 233,52,255,255,255 // jmp a1dc <_sk_load_g8_sse2_8bit+0x34>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,193,6 // pinsrw $0x6,%ecx,%xmm0
@@ -67454,7 +68434,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,110,12,51 // movd (%ebx,%esi,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,0,255,255,255 // jmp 9eec <_sk_load_g8_sse2_8bit+0x34>
+ .byte 233,0,255,255,255 // jmp a1dc <_sk_load_g8_sse2_8bit+0x34>
.byte 194,0,0 // ret $0x0
.byte 0,221 // add %bl,%ch
.byte 0,0 // add %al,(%eax)
@@ -67479,7 +68459,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call a016 <_sk_load_g8_dst_sse2_8bit+0xe>
+ .byte 232,0,0,0,0 // call a306 <_sk_load_g8_dst_sse2_8bit+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67489,15 +68469,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,131,0,0,0 // jne a0b6 <_sk_load_g8_dst_sse2_8bit+0xae>
+ .byte 15,133,131,0,0,0 // jne a3a6 <_sk_load_g8_dst_sse2_8bit+0xae>
.byte 243,15,126,20,51 // movq (%ebx,%esi,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,219,151,234,51,0,0 // pand 0x33ea(%edi),%xmm2
+ .byte 102,15,219,151,58,52,0,0 // pand 0x343a(%edi),%xmm2
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,15,97,227 // punpcklwd %xmm3,%xmm4
.byte 102,15,105,211 // punpckhwd %xmm3,%xmm2
- .byte 102,15,111,175,250,51,0,0 // movdqa 0x33fa(%edi),%xmm5
+ .byte 102,15,111,175,74,52,0,0 // movdqa 0x344a(%edi),%xmm5
.byte 102,15,112,242,245 // pshufd $0xf5,%xmm2,%xmm6
.byte 102,15,244,213 // pmuludq %xmm5,%xmm2
.byte 102,15,112,218,232 // pshufd $0xe8,%xmm2,%xmm3
@@ -67530,14 +68510,14 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 15,135,114,255,255,255 // ja a03c <_sk_load_g8_dst_sse2_8bit+0x34>
+ .byte 15,135,114,255,255,255 // ja a32c <_sk_load_g8_dst_sse2_8bit+0x34>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,38,1,0,0 // mov 0x126(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,209 // movd %ecx,%xmm2
- .byte 233,87,255,255,255 // jmp a03c <_sk_load_g8_dst_sse2_8bit+0x34>
+ .byte 233,87,255,255,255 // jmp a32c <_sk_load_g8_dst_sse2_8bit+0x34>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
@@ -67545,7 +68525,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,110,217 // movd %ecx,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 233,52,255,255,255 // jmp a03c <_sk_load_g8_dst_sse2_8bit+0x34>
+ .byte 233,52,255,255,255 // jmp a32c <_sk_load_g8_dst_sse2_8bit+0x34>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,209,6 // pinsrw $0x6,%ecx,%xmm2
@@ -67556,7 +68536,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,110,28,51 // movd (%ebx,%esi,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,0,255,255,255 // jmp a03c <_sk_load_g8_dst_sse2_8bit+0x34>
+ .byte 233,0,255,255,255 // jmp a32c <_sk_load_g8_dst_sse2_8bit+0x34>
.byte 194,0,0 // ret $0x0
.byte 0,221 // add %bl,%ch
.byte 0,0 // add %al,(%eax)
@@ -67583,7 +68563,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 131,236,124 // sub $0x7c,%esp
.byte 15,41,157,120,255,255,255 // movaps %xmm3,-0x88(%ebp)
.byte 102,15,127,85,136 // movdqa %xmm2,-0x78(%ebp)
- .byte 232,0,0,0,0 // call a172 <_sk_srcover_rgba_8888_sse2_8bit+0x1a>
+ .byte 232,0,0,0,0 // call a462 <_sk_srcover_rgba_8888_sse2_8bit+0x1a>
.byte 91 // pop %ebx
.byte 139,77,20 // mov 0x14(%ebp),%ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -67595,7 +68575,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,51,1,0,0 // jne a2c7 <_sk_srcover_rgba_8888_sse2_8bit+0x16f>
+ .byte 15,133,51,1,0,0 // jne a5b7 <_sk_srcover_rgba_8888_sse2_8bit+0x16f>
.byte 15,16,116,183,16 // movups 0x10(%edi,%esi,4),%xmm6
.byte 102,15,16,20,183 // movupd (%edi,%esi,4),%xmm2
.byte 102,15,41,85,200 // movapd %xmm2,-0x38(%ebp)
@@ -67655,7 +68635,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 133,210 // test %edx,%edx
.byte 102,15,252,232 // paddb %xmm0,%xmm5
.byte 102,15,252,217 // paddb %xmm1,%xmm3
- .byte 117,98 // jne a2fe <_sk_srcover_rgba_8888_sse2_8bit+0x1a6>
+ .byte 117,98 // jne a5ee <_sk_srcover_rgba_8888_sse2_8bit+0x1a6>
.byte 243,15,127,44,183 // movdqu %xmm5,(%edi,%esi,4)
.byte 243,15,127,92,183,16 // movdqu %xmm3,0x10(%edi,%esi,4)
.byte 141,120,8 // lea 0x8(%eax),%edi
@@ -67680,33 +68660,33 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 254,77,200 // decb -0x38(%ebp)
.byte 128,125,200,6 // cmpb $0x6,-0x38(%ebp)
- .byte 119,66 // ja a326 <_sk_srcover_rgba_8888_sse2_8bit+0x1ce>
+ .byte 119,66 // ja a616 <_sk_srcover_rgba_8888_sse2_8bit+0x1ce>
.byte 15,182,93,200 // movzbl -0x38(%ebp),%ebx
.byte 139,69,216 // mov -0x28(%ebp),%eax
.byte 139,156,152,70,2,0,0 // mov 0x246(%eax,%ebx,4),%ebx
.byte 3,93,216 // add -0x28(%ebp),%ebx
.byte 255,227 // jmp *%ebx
.byte 243,15,16,20,183 // movss (%edi,%esi,4),%xmm2
- .byte 235,109 // jmp a36b <_sk_srcover_rgba_8888_sse2_8bit+0x213>
+ .byte 235,109 // jmp a65b <_sk_srcover_rgba_8888_sse2_8bit+0x213>
.byte 137,93,216 // mov %ebx,-0x28(%ebp)
.byte 137,211 // mov %edx,%ebx
.byte 128,227,7 // and $0x7,%bl
.byte 254,203 // dec %bl
.byte 128,251,6 // cmp $0x6,%bl
- .byte 119,154 // ja a2a7 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ .byte 119,154 // ja a597 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
.byte 15,182,219 // movzbl %bl,%ebx
.byte 139,77,216 // mov -0x28(%ebp),%ecx
.byte 3,140,153,98,2,0,0 // add 0x262(%ecx,%ebx,4),%ecx
.byte 255,225 // jmp *%ecx
.byte 102,15,126,44,183 // movd %xmm5,(%edi,%esi,4)
.byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 235,129 // jmp a2a7 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ .byte 235,129 // jmp a597 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
.byte 139,93,216 // mov -0x28(%ebp),%ebx
- .byte 233,112,254,255,255 // jmp a19e <_sk_srcover_rgba_8888_sse2_8bit+0x46>
+ .byte 233,112,254,255,255 // jmp a48e <_sk_srcover_rgba_8888_sse2_8bit+0x46>
.byte 102,15,110,92,183,8 // movd 0x8(%edi,%esi,4),%xmm3
.byte 102,15,112,211,69 // pshufd $0x45,%xmm3,%xmm2
.byte 102,15,18,20,183 // movlpd (%edi,%esi,4),%xmm2
- .byte 235,43 // jmp a36b <_sk_srcover_rgba_8888_sse2_8bit+0x213>
+ .byte 235,43 // jmp a65b <_sk_srcover_rgba_8888_sse2_8bit+0x213>
.byte 102,15,110,84,183,24 // movd 0x18(%edi,%esi,4),%xmm2
.byte 102,15,112,242,69 // pshufd $0x45,%xmm2,%xmm6
.byte 243,15,16,92,183,20 // movss 0x14(%edi,%esi,4),%xmm3
@@ -67718,12 +68698,12 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,15,16,20,183 // movupd (%edi,%esi,4),%xmm2
.byte 139,93,216 // mov -0x28(%ebp),%ebx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 233,40,254,255,255 // jmp a19e <_sk_srcover_rgba_8888_sse2_8bit+0x46>
+ .byte 233,40,254,255,255 // jmp a48e <_sk_srcover_rgba_8888_sse2_8bit+0x46>
.byte 102,15,112,213,78 // pshufd $0x4e,%xmm5,%xmm2
.byte 102,15,126,84,183,8 // movd %xmm2,0x8(%edi,%esi,4)
.byte 102,15,214,44,183 // movq %xmm5,(%edi,%esi,4)
.byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 233,25,255,255,255 // jmp a2a7 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ .byte 233,25,255,255,255 // jmp a597 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
.byte 102,15,112,211,78 // pshufd $0x4e,%xmm3,%xmm2
.byte 102,15,126,84,183,24 // movd %xmm2,0x18(%edi,%esi,4)
.byte 102,15,112,211,229 // pshufd $0xe5,%xmm3,%xmm2
@@ -67731,7 +68711,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,15,126,92,183,16 // movd %xmm3,0x10(%edi,%esi,4)
.byte 243,15,127,44,183 // movdqu %xmm5,(%edi,%esi,4)
.byte 139,77,20 // mov 0x14(%ebp),%ecx
- .byte 233,240,254,255,255 // jmp a2a7 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ .byte 233,240,254,255,255 // jmp a597 <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
.byte 144 // nop
.byte 133,1 // test %eax,(%ecx)
.byte 0,0 // add %al,(%eax)
@@ -67769,12 +68749,12 @@ _sk_scale_1_float_sse2_8bit:
.byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 232,0,0,0,0 // call a40b <_sk_scale_1_float_sse2_8bit+0x1b>
+ .byte 232,0,0,0,0 // call a6fb <_sk_scale_1_float_sse2_8bit+0x1b>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
.byte 243,15,16,2 // movss (%edx),%xmm0
- .byte 243,15,89,129,73,48,0,0 // mulss 0x3049(%ecx),%xmm0
+ .byte 243,15,89,129,153,48,0,0 // mulss 0x3099(%ecx),%xmm0
.byte 243,15,44,208 // cvttss2si %xmm0,%edx
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,111,213 // movdqa %xmm5,%xmm2
@@ -67786,7 +68766,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,15,96,246 // punpcklbw %xmm6,%xmm6
.byte 242,15,112,246,0 // pshuflw $0x0,%xmm6,%xmm6
.byte 102,15,112,246,80 // pshufd $0x50,%xmm6,%xmm6
- .byte 102,15,219,177,245,47,0,0 // pand 0x2ff5(%ecx),%xmm6
+ .byte 102,15,219,177,69,48,0,0 // pand 0x3045(%ecx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,15,111,222 // movdqa %xmm6,%xmm3
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
@@ -67829,7 +68809,7 @@ _sk_scale_u8_sse2_8bit:
.byte 131,236,60 // sub $0x3c,%esp
.byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 102,15,127,85,200 // movdqa %xmm2,-0x38(%ebp)
- .byte 232,0,0,0,0 // call a4d3 <_sk_scale_u8_sse2_8bit+0x17>
+ .byte 232,0,0,0,0 // call a7c3 <_sk_scale_u8_sse2_8bit+0x17>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -67839,10 +68819,10 @@ _sk_scale_u8_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,11,1,0,0 // jne a5fb <_sk_scale_u8_sse2_8bit+0x13f>
+ .byte 15,133,11,1,0,0 // jne a8eb <_sk_scale_u8_sse2_8bit+0x13f>
.byte 243,15,126,36,51 // movq (%ebx,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
- .byte 102,15,219,167,45,47,0,0 // pand 0x2f2d(%edi),%xmm4
+ .byte 102,15,219,167,125,47,0,0 // pand 0x2f7d(%edi),%xmm4
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
.byte 102,15,105,234 // punpckhwd %xmm2,%xmm5
@@ -67913,14 +68893,14 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 15,135,234,254,255,255 // ja a4f9 <_sk_scale_u8_sse2_8bit+0x3d>
+ .byte 15,135,234,254,255,255 // ja a7e9 <_sk_scale_u8_sse2_8bit+0x3d>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,177,1,0,0 // mov 0x1b1(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,225 // movd %ecx,%xmm4
- .byte 233,207,254,255,255 // jmp a4f9 <_sk_scale_u8_sse2_8bit+0x3d>
+ .byte 233,207,254,255,255 // jmp a7e9 <_sk_scale_u8_sse2_8bit+0x3d>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,225,2 // pinsrw $0x2,%ecx,%xmm4
@@ -67928,7 +68908,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,110,217 // movd %ecx,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,227 // movss %xmm3,%xmm4
- .byte 233,172,254,255,255 // jmp a4f9 <_sk_scale_u8_sse2_8bit+0x3d>
+ .byte 233,172,254,255,255 // jmp a7e9 <_sk_scale_u8_sse2_8bit+0x3d>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,225,6 // pinsrw $0x6,%ecx,%xmm4
@@ -67939,7 +68919,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,110,28,51 // movd (%ebx,%esi,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,227 // movsd %xmm3,%xmm4
- .byte 233,120,254,255,255 // jmp a4f9 <_sk_scale_u8_sse2_8bit+0x3d>
+ .byte 233,120,254,255,255 // jmp a7e9 <_sk_scale_u8_sse2_8bit+0x3d>
.byte 15,31,0 // nopl (%eax)
.byte 74 // dec %edx
.byte 1,0 // add %eax,(%eax)
@@ -67951,7 +68931,7 @@ _sk_scale_u8_sse2_8bit:
.byte 0,0 // add %al,(%eax)
.byte 136,1 // mov %al,(%ecx)
.byte 0,0 // add %al,(%eax)
- .byte 122,1 // jp a69f <_sk_scale_u8_sse2_8bit+0x1e3>
+ .byte 122,1 // jp a98f <_sk_scale_u8_sse2_8bit+0x1e3>
.byte 0,0 // add %al,(%eax)
HIDDEN _sk_lerp_1_float_sse2_8bit
@@ -67965,12 +68945,12 @@ _sk_lerp_1_float_sse2_8bit:
.byte 15,41,85,232 // movaps %xmm2,-0x18(%ebp)
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 232,0,0,0,0 // call a6bb <_sk_lerp_1_float_sse2_8bit+0x1b>
+ .byte 232,0,0,0,0 // call a9ab <_sk_lerp_1_float_sse2_8bit+0x1b>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
.byte 243,15,16,34 // movss (%edx),%xmm4
- .byte 243,15,89,161,153,45,0,0 // mulss 0x2d99(%ecx),%xmm4
+ .byte 243,15,89,161,233,45,0,0 // mulss 0x2de9(%ecx),%xmm4
.byte 243,15,44,212 // cvttss2si %xmm4,%edx
.byte 102,15,110,226 // movd %edx,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -67979,7 +68959,7 @@ _sk_lerp_1_float_sse2_8bit:
.byte 102,15,127,85,200 // movdqa %xmm2,-0x38(%ebp)
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,96,197 // punpcklbw %xmm5,%xmm0
- .byte 102,15,111,153,69,45,0,0 // movdqa 0x2d45(%ecx),%xmm3
+ .byte 102,15,111,153,149,45,0,0 // movdqa 0x2d95(%ecx),%xmm3
.byte 102,15,219,218 // pand %xmm2,%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
@@ -68062,7 +69042,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 131,236,92 // sub $0x5c,%esp
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 102,15,127,85,216 // movdqa %xmm2,-0x28(%ebp)
- .byte 232,0,0,0,0 // call a821 <_sk_lerp_u8_sse2_8bit+0x17>
+ .byte 232,0,0,0,0 // call ab11 <_sk_lerp_u8_sse2_8bit+0x17>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -68072,10 +69052,10 @@ _sk_lerp_u8_sse2_8bit:
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 133,210 // test %edx,%edx
.byte 139,117,16 // mov 0x10(%ebp),%esi
- .byte 15,133,181,1,0,0 // jne a9f3 <_sk_lerp_u8_sse2_8bit+0x1e9>
+ .byte 15,133,181,1,0,0 // jne ace3 <_sk_lerp_u8_sse2_8bit+0x1e9>
.byte 243,15,126,44,51 // movq (%ebx,%esi,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
- .byte 102,15,219,175,223,43,0,0 // pand 0x2bdf(%edi),%xmm5
+ .byte 102,15,219,175,47,44,0,0 // pand 0x2c2f(%edi),%xmm5
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,111,221 // movdqa %xmm5,%xmm3
.byte 102,15,105,218 // punpckhwd %xmm2,%xmm3
@@ -68186,14 +69166,14 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 254,201 // dec %cl
.byte 128,249,6 // cmp $0x6,%cl
- .byte 15,135,64,254,255,255 // ja a847 <_sk_lerp_u8_sse2_8bit+0x3d>
+ .byte 15,135,64,254,255,255 // ja ab37 <_sk_lerp_u8_sse2_8bit+0x3d>
.byte 15,182,201 // movzbl %cl,%ecx
.byte 139,140,143,91,2,0,0 // mov 0x25b(%edi,%ecx,4),%ecx
.byte 1,249 // add %edi,%ecx
.byte 255,225 // jmp *%ecx
.byte 15,182,12,51 // movzbl (%ebx,%esi,1),%ecx
.byte 102,15,110,233 // movd %ecx,%xmm5
- .byte 233,37,254,255,255 // jmp a847 <_sk_lerp_u8_sse2_8bit+0x3d>
+ .byte 233,37,254,255,255 // jmp ab37 <_sk_lerp_u8_sse2_8bit+0x3d>
.byte 15,182,76,51,2 // movzbl 0x2(%ebx,%esi,1),%ecx
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,233,2 // pinsrw $0x2,%ecx,%xmm5
@@ -68201,7 +69181,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,110,217 // movd %ecx,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,235 // movss %xmm3,%xmm5
- .byte 233,2,254,255,255 // jmp a847 <_sk_lerp_u8_sse2_8bit+0x3d>
+ .byte 233,2,254,255,255 // jmp ab37 <_sk_lerp_u8_sse2_8bit+0x3d>
.byte 15,182,76,51,6 // movzbl 0x6(%ebx,%esi,1),%ecx
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,233,6 // pinsrw $0x6,%ecx,%xmm5
@@ -68212,7 +69192,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,110,28,51 // movd (%ebx,%esi,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,235 // movsd %xmm3,%xmm5
- .byte 233,206,253,255,255 // jmp a847 <_sk_lerp_u8_sse2_8bit+0x3d>
+ .byte 233,206,253,255,255 // jmp ab37 <_sk_lerp_u8_sse2_8bit+0x3d>
.byte 15,31,0 // nopl (%eax)
.byte 244 // hlt
.byte 1,0 // add %eax,(%eax)
@@ -68276,7 +69256,7 @@ _sk_black_color_sse2_8bit:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call aae9 <_sk_black_color_sse2_8bit+0xb>
+ .byte 232,0,0,0,0 // call add9 <_sk_black_color_sse2_8bit+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
@@ -69517,12 +70497,12 @@ _sk_darken_sse2_8bit:
.byte 102,15,252,218 // paddb %xmm2,%xmm3
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,15,248,238 // psubb %xmm6,%xmm5
- .byte 232,0,0,0,0 // call bd0c <_sk_darken_sse2_8bit+0x1f7>
+ .byte 232,0,0,0,0 // call bffc <_sk_darken_sse2_8bit+0x1f7>
.byte 88 // pop %eax
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,248,216 // psubb %xmm0,%xmm3
- .byte 102,15,111,128,20,23,0,0 // movdqa 0x1714(%eax),%xmm0
+ .byte 102,15,111,128,100,23,0,0 // movdqa 0x1764(%eax),%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,223,203 // pandn %xmm3,%xmm1
.byte 102,15,219,232 // pand %xmm0,%xmm5
@@ -69663,12 +70643,12 @@ _sk_lighten_sse2_8bit:
.byte 102,15,252,218 // paddb %xmm2,%xmm3
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,15,248,238 // psubb %xmm6,%xmm5
- .byte 232,0,0,0,0 // call bf5a <_sk_lighten_sse2_8bit+0x1f7>
+ .byte 232,0,0,0,0 // call c24a <_sk_lighten_sse2_8bit+0x1f7>
.byte 88 // pop %eax
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,248,216 // psubb %xmm0,%xmm3
- .byte 102,15,111,128,198,20,0,0 // movdqa 0x14c6(%eax),%xmm0
+ .byte 102,15,111,128,22,21,0,0 // movdqa 0x1516(%eax),%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,223,203 // pandn %xmm3,%xmm1
.byte 102,15,219,232 // pand %xmm0,%xmm5
@@ -69736,12 +70716,12 @@ _sk_exclusion_sse2_8bit:
.byte 102,15,113,209,8 // psrlw $0x8,%xmm1
.byte 102,15,113,212,8 // psrlw $0x8,%xmm4
.byte 102,15,103,225 // packuswb %xmm1,%xmm4
- .byte 232,0,0,0,0 // call c063 <_sk_exclusion_sse2_8bit+0xb2>
+ .byte 232,0,0,0,0 // call c353 <_sk_exclusion_sse2_8bit+0xb2>
.byte 88 // pop %eax
.byte 102,15,113,208,8 // psrlw $0x8,%xmm0
.byte 102,15,113,213,8 // psrlw $0x8,%xmm5
.byte 102,15,103,232 // packuswb %xmm0,%xmm5
- .byte 102,15,111,128,189,19,0,0 // movdqa 0x13bd(%eax),%xmm0
+ .byte 102,15,111,128,13,20,0,0 // movdqa 0x140d(%eax),%xmm0
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
.byte 102,15,252,254 // paddb %xmm6,%xmm7
.byte 102,15,248,253 // psubb %xmm5,%xmm7
@@ -69870,10 +70850,10 @@ _sk_difference_sse2_8bit:
.byte 102,15,113,208,8 // psrlw $0x8,%xmm0
.byte 102,15,103,194 // packuswb %xmm2,%xmm0
.byte 102,15,218,125,152 // pminub -0x68(%ebp),%xmm7
- .byte 232,0,0,0,0 // call c27e <_sk_difference_sse2_8bit+0x1b8>
+ .byte 232,0,0,0,0 // call c56e <_sk_difference_sse2_8bit+0x1b8>
.byte 88 // pop %eax
.byte 102,15,218,198 // pminub %xmm6,%xmm0
- .byte 102,15,111,136,162,17,0,0 // movdqa 0x11a2(%eax),%xmm1
+ .byte 102,15,111,136,242,17,0,0 // movdqa 0x11f2(%eax),%xmm1
.byte 102,15,111,101,136 // movdqa -0x78(%ebp),%xmm4
.byte 102,15,111,93,232 // movdqa -0x18(%ebp),%xmm3
.byte 102,15,252,227 // paddb %xmm3,%xmm4
@@ -69995,9 +70975,9 @@ _sk_hardlight_sse2_8bit:
.byte 102,15,217,229 // psubusw %xmm5,%xmm4
.byte 102,15,117,231 // pcmpeqw %xmm7,%xmm4
.byte 102,15,127,165,72,255,255,255 // movdqa %xmm4,-0xb8(%ebp)
- .byte 232,0,0,0,0 // call c4af <_sk_hardlight_sse2_8bit+0x1ce>
+ .byte 232,0,0,0,0 // call c79f <_sk_hardlight_sse2_8bit+0x1ce>
.byte 88 // pop %eax
- .byte 102,15,111,176,81,15,0,0 // movdqa 0xf51(%eax),%xmm6
+ .byte 102,15,111,176,161,15,0,0 // movdqa 0xfa1(%eax),%xmm6
.byte 102,15,111,157,88,255,255,255 // movdqa -0xa8(%ebp),%xmm3
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,239,206 // pxor %xmm6,%xmm1
@@ -70132,7 +71112,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,15,111,69,216 // movdqa -0x28(%ebp),%xmm0
.byte 102,15,253,133,104,255,255,255 // paddw -0x98(%ebp),%xmm0
.byte 102,15,253,117,136 // paddw -0x78(%ebp),%xmm6
- .byte 102,15,111,152,129,15,0,0 // movdqa 0xf81(%eax),%xmm3
+ .byte 102,15,111,152,209,15,0,0 // movdqa 0xfd1(%eax),%xmm3
.byte 102,15,253,227 // paddw %xmm3,%xmm4
.byte 102,15,111,149,72,255,255,255 // movdqa -0xb8(%ebp),%xmm2
.byte 102,15,253,212 // paddw %xmm4,%xmm2
@@ -70142,7 +71122,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,15,253,200 // paddw %xmm0,%xmm1
.byte 102,15,253,243 // paddw %xmm3,%xmm6
.byte 102,15,253,245 // paddw %xmm5,%xmm6
- .byte 102,15,111,152,145,15,0,0 // movdqa 0xf91(%eax),%xmm3
+ .byte 102,15,111,152,225,15,0,0 // movdqa 0xfe1(%eax),%xmm3
.byte 102,15,228,243 // pmulhuw %xmm3,%xmm6
.byte 102,15,228,203 // pmulhuw %xmm3,%xmm1
.byte 102,15,228,251 // pmulhuw %xmm3,%xmm7
@@ -70262,9 +71242,9 @@ _sk_overlay_sse2_8bit:
.byte 102,15,217,236 // psubusw %xmm4,%xmm5
.byte 102,15,117,238 // pcmpeqw %xmm6,%xmm5
.byte 102,15,127,173,72,255,255,255 // movdqa %xmm5,-0xb8(%ebp)
- .byte 232,0,0,0,0 // call c9d5 <_sk_overlay_sse2_8bit+0x1c5>
+ .byte 232,0,0,0,0 // call ccc5 <_sk_overlay_sse2_8bit+0x1c5>
.byte 88 // pop %eax
- .byte 102,15,111,152,43,10,0,0 // movdqa 0xa2b(%eax),%xmm3
+ .byte 102,15,111,152,123,10,0,0 // movdqa 0xa7b(%eax),%xmm3
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,239,195 // pxor %xmm3,%xmm0
.byte 102,15,111,181,120,255,255,255 // movdqa -0x88(%ebp),%xmm6
@@ -70397,7 +71377,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,253,189,120,255,255,255 // paddw -0x88(%ebp),%xmm7
.byte 102,15,253,173,104,255,255,255 // paddw -0x98(%ebp),%xmm5
.byte 102,15,253,157,216,254,255,255 // paddw -0x128(%ebp),%xmm3
- .byte 102,15,111,144,91,10,0,0 // movdqa 0xa5b(%eax),%xmm2
+ .byte 102,15,111,144,171,10,0,0 // movdqa 0xaab(%eax),%xmm2
.byte 102,15,253,194 // paddw %xmm2,%xmm0
.byte 102,15,253,133,72,255,255,255 // paddw -0xb8(%ebp),%xmm0
.byte 102,15,253,250 // paddw %xmm2,%xmm7
@@ -70406,7 +71386,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,253,233 // paddw %xmm1,%xmm5
.byte 102,15,253,218 // paddw %xmm2,%xmm3
.byte 102,15,253,220 // paddw %xmm4,%xmm3
- .byte 102,15,111,144,107,10,0,0 // movdqa 0xa6b(%eax),%xmm2
+ .byte 102,15,111,144,187,10,0,0 // movdqa 0xabb(%eax),%xmm2
.byte 102,15,228,218 // pmulhuw %xmm2,%xmm3
.byte 102,15,228,234 // pmulhuw %xmm2,%xmm5
.byte 102,15,228,250 // pmulhuw %xmm2,%xmm7
@@ -70501,11 +71481,11 @@ BALIGN16
.byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%eax)
.byte 191,0,0,224,64 // mov $0x40e00000,%edi
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne ce18 <.literal16+0xe8>
+ .byte 224,64 // loopne d108 <.literal16+0xe8>
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne ce1c <.literal16+0xec>
+ .byte 224,64 // loopne d10c <.literal16+0xec>
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne ce20 <.literal16+0xf0>
+ .byte 224,64 // loopne d110 <.literal16+0xf0>
.byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999
.byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999
.byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax
@@ -70516,16 +71496,16 @@ BALIGN16
.byte 63 // aas
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope ce41 <.literal16+0x111>
+ .byte 225,61 // loope d131 <.literal16+0x111>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope ce45 <.literal16+0x115>
+ .byte 225,61 // loope d135 <.literal16+0x115>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope ce49 <.literal16+0x119>
+ .byte 225,61 // loope d139 <.literal16+0x119>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope ce4d <.literal16+0x11d>
+ .byte 225,61 // loope d13d <.literal16+0x11d>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -70535,13 +71515,13 @@ BALIGN16
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg ce67 <.literal16+0x137>
+ .byte 127,67 // jg d157 <.literal16+0x137>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg ce6b <.literal16+0x13b>
+ .byte 127,67 // jg d15b <.literal16+0x13b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg ce6f <.literal16+0x13f>
+ .byte 127,67 // jg d15f <.literal16+0x13f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg ce73 <.literal16+0x143>
+ .byte 127,67 // jg d163 <.literal16+0x143>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%esi)
.byte 145 // xchg %eax,%ecx
@@ -70692,13 +71672,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne cf79 <.literal16+0x249>
+ .byte 224,7 // loopne d269 <.literal16+0x249>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne cf7d <.literal16+0x24d>
+ .byte 224,7 // loopne d26d <.literal16+0x24d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne cf81 <.literal16+0x251>
+ .byte 224,7 // loopne d271 <.literal16+0x251>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne cf85 <.literal16+0x255>
+ .byte 224,7 // loopne d275 <.literal16+0x255>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -70739,17 +71719,17 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg cfd4 <.literal16+0x2a4>
+ .byte 127,0 // jg d2c4 <.literal16+0x2a4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg cfd8 <.literal16+0x2a8>
+ .byte 127,0 // jg d2c8 <.literal16+0x2a8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg cfdc <.literal16+0x2ac>
+ .byte 127,0 // jg d2cc <.literal16+0x2ac>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg cfe0 <.literal16+0x2b0>
- .byte 119,115 // ja d055 <.literal16+0x325>
+ .byte 127,0 // jg d2d0 <.literal16+0x2b0>
+ .byte 119,115 // ja d345 <.literal16+0x325>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -70760,7 +71740,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne cfb9 <.literal16+0x289>
+ .byte 117,191 // jne d2a9 <.literal16+0x289>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -70776,7 +71756,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a40ff6 <_sk_overlay_sse2_8bit+0xe9a347e6>
+ .byte 233,220,63,163,233 // jmp e9a412e6 <_sk_overlay_sse2_8bit+0xe9a347e6>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,81 // mov %eax,0x513fdce9
.byte 140,242 // mov %?,%edx
@@ -70872,16 +71852,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%ebx)
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe d143 <.literal16+0x413>
+ .byte 118,63 // jbe d433 <.literal16+0x413>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe d147 <.literal16+0x417>
+ .byte 118,63 // jbe d437 <.literal16+0x417>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe d14b <.literal16+0x41b>
+ .byte 118,63 // jbe d43b <.literal16+0x41b>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe d14f <.literal16+0x41f>
+ .byte 118,63 // jbe d43f <.literal16+0x41f>
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
@@ -70907,13 +71887,13 @@ BALIGN16
.byte 248 // clc
.byte 65 // inc %ecx
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl d186 <.literal16+0x456>
+ .byte 124,66 // jl d476 <.literal16+0x456>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl d18a <.literal16+0x45a>
+ .byte 124,66 // jl d47a <.literal16+0x45a>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl d18e <.literal16+0x45e>
+ .byte 124,66 // jl d47e <.literal16+0x45e>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl d192 <.literal16+0x462>
+ .byte 124,66 // jl d482 <.literal16+0x462>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%eax)
.byte 0,240 // add %dh,%al
@@ -70959,13 +71939,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo d215 <.literal16+0x4e5>
+ .byte 112,65 // jo d505 <.literal16+0x4e5>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo d219 <.literal16+0x4e9>
+ .byte 112,65 // jo d509 <.literal16+0x4e9>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo d21d <.literal16+0x4ed>
+ .byte 112,65 // jo d50d <.literal16+0x4ed>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo d221 <.literal16+0x4f1>
+ .byte 112,65 // jo d511 <.literal16+0x4f1>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
@@ -71002,13 +71982,13 @@ BALIGN16
.byte 254 // (bad)
.byte 255,0 // incl (%eax)
.byte 255 // (bad)
- .byte 127,71 // jg d28b <.literal16+0x55b>
+ .byte 127,71 // jg d57b <.literal16+0x55b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg d28f <.literal16+0x55f>
+ .byte 127,71 // jg d57f <.literal16+0x55f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg d293 <.literal16+0x563>
+ .byte 127,71 // jg d583 <.literal16+0x563>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg d297 <.literal16+0x567>
+ .byte 127,71 // jg d587 <.literal16+0x567>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,208 // ds (bad)
@@ -71061,7 +72041,7 @@ BALIGN16
.byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js d2fc <.literal16+0x5cc>
+ .byte 120,57 // js d5ec <.literal16+0x5cc>
.byte 64 // inc %eax
.byte 18,120,57 // adc 0x39(%eax),%bh
.byte 64 // inc %eax
@@ -71132,13 +72112,13 @@ BALIGN16
.byte 192,191,0,0,192,191,0 // sarb $0x0,-0x40400000(%edi)
.byte 0,192 // add %al,%al
.byte 191,0,0,192,191 // mov $0xbfc00000,%edi
- .byte 114,28 // jb d3ae <.literal16+0x67e>
+ .byte 114,28 // jb d69e <.literal16+0x67e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt d3b2 <.literal16+0x682>
+ .byte 62,114,28 // jb,pt d6a2 <.literal16+0x682>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt d3b6 <.literal16+0x686>
+ .byte 62,114,28 // jb,pt d6a6 <.literal16+0x686>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt d3ba <.literal16+0x68a>
+ .byte 62,114,28 // jb,pt d6aa <.literal16+0x68a>
.byte 199 // (bad)
.byte 62,85 // ds push %ebp
.byte 85 // push %ebp
@@ -71159,13 +72139,13 @@ BALIGN16
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%esi)
.byte 99,61,57,142,99,61 // arpl %di,0x3d638e39
.byte 57,142,99,61,114,249 // cmp %ecx,-0x68dc29d(%esi)
- .byte 127,63 // jg d413 <.literal16+0x6e3>
- .byte 114,249 // jb d3cf <.literal16+0x69f>
- .byte 127,63 // jg d417 <.literal16+0x6e7>
- .byte 114,249 // jb d3d3 <.literal16+0x6a3>
- .byte 127,63 // jg d41b <.literal16+0x6eb>
- .byte 114,249 // jb d3d7 <.literal16+0x6a7>
- .byte 127,63 // jg d41f <.literal16+0x6ef>
+ .byte 127,63 // jg d703 <.literal16+0x6e3>
+ .byte 114,249 // jb d6bf <.literal16+0x69f>
+ .byte 127,63 // jg d707 <.literal16+0x6e7>
+ .byte 114,249 // jb d6c3 <.literal16+0x6a3>
+ .byte 127,63 // jg d70b <.literal16+0x6eb>
+ .byte 114,249 // jb d6c7 <.literal16+0x6a7>
+ .byte 127,63 // jg d70f <.literal16+0x6ef>
.byte 3,0 // add (%eax),%eax
.byte 0,0 // add %al,(%eax)
.byte 3,0 // add (%eax),%eax
@@ -71182,23 +72162,64 @@ BALIGN16
.byte 0,255 // add %bh,%bh
.byte 0,0 // add %al,(%eax)
.byte 0,255 // add %bh,%bh
- .byte 255,0 // incl (%eax)
- .byte 255,0 // incl (%eax)
- .byte 255,0 // incl (%eax)
- .byte 255,0 // incl (%eax)
- .byte 255,0 // incl (%eax)
- .byte 255,0 // incl (%eax)
- .byte 255,0 // incl (%eax)
- .byte 255,0 // incl (%eax)
+ .byte 248 // clc
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 252 // cld
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,252 // add %bh,%ah
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,0 // add %al,(%eax)
+ .byte 248 // clc
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,248 // add %bh,%al
+ .byte 0,7 // add %al,(%edi)
+ .byte 0,7 // add %al,(%edi)
+ .byte 0,7 // add %al,(%edi)
+ .byte 0,7 // add %al,(%edi)
+ .byte 0,7 // add %al,(%edi)
+ .byte 0,7 // add %al,(%edi)
+ .byte 0,7 // add %al,(%edi)
+ .byte 0,7 // add %al,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 12,0 // or $0x0,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 12,0 // or $0x0,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 12,0 // or $0x0,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 12,0 // or $0x0,%al
+ .byte 0,255 // add %bh,%bh
+ .byte 0,255 // add %bh,%bh
+ .byte 0,255 // add %bh,%bh
+ .byte 0,255 // add %bh,%bh
+ .byte 0,255 // add %bh,%bh
+ .byte 0,255 // add %bh,%bh
+ .byte 0,255 // add %bh,%bh
+ .byte 0,255 // add %bh,%bh
+ .byte 0,1 // add %al,(%ecx)
.byte 1,1 // add %eax,(%ecx)
- .byte 1,0 // add %eax,(%eax)
+ .byte 0,1 // add %al,(%ecx)
.byte 1,1 // add %eax,(%ecx)
- .byte 1,0 // add %eax,(%eax)
+ .byte 0,1 // add %al,(%ecx)
.byte 1,1 // add %eax,(%ecx)
- .byte 1,0 // add %eax,(%eax)
+ .byte 0,1 // add %al,(%ecx)
.byte 1,1 // add %eax,(%ecx)
- .byte 1,0 // add %eax,(%eax)
- .byte 255 // (bad)
+ .byte 0,255 // add %bh,%bh
.byte 255 // (bad)
.byte 255,0 // incl (%eax)
.byte 255 // (bad)
@@ -71210,14 +72231,14 @@ BALIGN16
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,0 // incl (%eax)
- .byte 127,0 // jg d432 <.literal16+0x702>
- .byte 127,0 // jg d434 <.literal16+0x704>
- .byte 127,0 // jg d436 <.literal16+0x706>
- .byte 127,0 // jg d438 <.literal16+0x708>
- .byte 127,0 // jg d43a <.literal16+0x70a>
- .byte 127,0 // jg d43c <.literal16+0x70c>
- .byte 127,0 // jg d43e <.literal16+0x70e>
- .byte 127,0 // jg d440 <.literal16+0x710>
+ .byte 127,0 // jg d772 <.literal16+0x752>
+ .byte 127,0 // jg d774 <.literal16+0x754>
+ .byte 127,0 // jg d776 <.literal16+0x756>
+ .byte 127,0 // jg d778 <.literal16+0x758>
+ .byte 127,0 // jg d77a <.literal16+0x75a>
+ .byte 127,0 // jg d77c <.literal16+0x75c>
+ .byte 127,0 // jg d77e <.literal16+0x75e>
+ .byte 127,0 // jg d780 <.literal16+0x760>
.byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%eax)
.byte 129 // .byte 0x81
.byte 128 // .byte 0x80
@@ -71230,7 +72251,7 @@ BALIGN4
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg d49b <_sk_overlay_sse2_8bit+0xc8b>
+ .byte 127,67 // jg d7db <_sk_overlay_sse2_8bit+0xcdb>
.byte 0,0 // add %al,(%eax)
.byte 0 // .byte 0x0
.byte 79 // dec %edi
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index 620f6e25dd..d0bad7d382 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -99,15 +99,15 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,249,110,194 ; vmovd %edx,%xmm0
DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,198,190,2,0 ; vbroadcastss 0x2bec6(%rip),%ymm1 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,13,130,200,2,0 ; vbroadcastss 0x2c882(%rip),%ymm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 197,252,88,5,94,192,2,0 ; vaddps 0x2c05e(%rip),%ymm0,%ymm0 # 2c1c0 <_sk_overlay_sse2_8bit+0x610>
+ DB 197,252,88,5,30,202,2,0 ; vaddps 0x2ca1e(%rip),%ymm0,%ymm0 # 2cb80 <_sk_overlay_sse2_8bit+0x614>
DB 197,249,110,209 ; vmovd %ecx,%xmm2
DB 196,226,125,88,210 ; vpbroadcastd %xmm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,162,190,2,0 ; vbroadcastss 0x2bea2(%rip),%ymm2 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,21,94,200,2,0 ; vbroadcastss 0x2c85e(%rip),%ymm2 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -120,17 +120,17 @@ _sk_dither_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,121,110,194 ; vmovd %edx,%xmm8
DB 196,66,125,88,192 ; vpbroadcastd %xmm8,%ymm8
- DB 197,61,254,5,57,192,2,0 ; vpaddd 0x2c039(%rip),%ymm8,%ymm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x630>
+ DB 197,61,254,5,249,201,2,0 ; vpaddd 0x2c9f9(%rip),%ymm8,%ymm8 # 2cba0 <_sk_overlay_sse2_8bit+0x634>
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9
DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9
- DB 196,98,125,88,21,102,190,2,0 ; vpbroadcastd 0x2be66(%rip),%ymm10 # 2c024 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,88,21,34,200,2,0 ; vpbroadcastd 0x2c822(%rip),%ymm10 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11
DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10
- DB 196,98,125,88,37,75,190,2,0 ; vpbroadcastd 0x2be4b(%rip),%ymm12 # 2c028 <_sk_overlay_sse2_8bit+0x478>
- DB 196,98,125,88,45,70,190,2,0 ; vpbroadcastd 0x2be46(%rip),%ymm13 # 2c02c <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,125,88,37,7,200,2,0 ; vpbroadcastd 0x2c807(%rip),%ymm12 # 2c9e4 <_sk_overlay_sse2_8bit+0x478>
+ DB 196,98,125,88,45,2,200,2,0 ; vpbroadcastd 0x2c802(%rip),%ymm13 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14
DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14
DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13
@@ -145,8 +145,8 @@ _sk_dither_hsw LABEL PROC
DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,248,189,2,0 ; vbroadcastss 0x2bdf8(%rip),%ymm9 # 2c030 <_sk_overlay_sse2_8bit+0x480>
- DB 196,98,125,24,21,243,189,2,0 ; vbroadcastss 0x2bdf3(%rip),%ymm10 # 2c034 <_sk_overlay_sse2_8bit+0x484>
+ DB 196,98,125,24,13,180,199,2,0 ; vbroadcastss 0x2c7b4(%rip),%ymm9 # 2c9ec <_sk_overlay_sse2_8bit+0x480>
+ DB 196,98,125,24,21,175,199,2,0 ; vbroadcastss 0x2c7af(%rip),%ymm10 # 2c9f0 <_sk_overlay_sse2_8bit+0x484>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8
DB 196,65,44,89,192 ; vmulps %ymm8,%ymm10,%ymm8
@@ -176,7 +176,7 @@ _sk_uniform_color_hsw LABEL PROC
PUBLIC _sk_black_color_hsw
_sk_black_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,123,189,2,0 ; vbroadcastss 0x2bd7b(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,55,199,2,0 ; vbroadcastss 0x2c737(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -185,7 +185,7 @@ _sk_black_color_hsw LABEL PROC
PUBLIC _sk_white_color_hsw
_sk_white_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,98,189,2,0 ; vbroadcastss 0x2bd62(%rip),%ymm0 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,30,199,2,0 ; vbroadcastss 0x2c71e(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -223,7 +223,7 @@ _sk_clear_hsw LABEL PROC
PUBLIC _sk_srcatop_hsw
_sk_srcatop_hsw LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,1,189,2,0 ; vbroadcastss 0x2bd01(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,189,198,2,0 ; vbroadcastss 0x2c6bd(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0
DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1
@@ -237,7 +237,7 @@ _sk_srcatop_hsw LABEL PROC
PUBLIC _sk_dstatop_hsw
_sk_dstatop_hsw LABEL PROC
- DB 196,98,125,24,5,208,188,2,0 ; vbroadcastss 0x2bcd0(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,140,198,2,0 ; vbroadcastss 0x2c68c(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -270,7 +270,7 @@ _sk_dstin_hsw LABEL PROC
PUBLIC _sk_srcout_hsw
_sk_srcout_hsw LABEL PROC
- DB 196,98,125,24,5,115,188,2,0 ; vbroadcastss 0x2bc73(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,47,198,2,0 ; vbroadcastss 0x2c62f(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -281,7 +281,7 @@ _sk_srcout_hsw LABEL PROC
PUBLIC _sk_dstout_hsw
_sk_dstout_hsw LABEL PROC
- DB 196,226,125,24,5,82,188,2,0 ; vbroadcastss 0x2bc52(%rip),%ymm0 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,14,198,2,0 ; vbroadcastss 0x2c60e(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -292,7 +292,7 @@ _sk_dstout_hsw LABEL PROC
PUBLIC _sk_srcover_hsw
_sk_srcover_hsw LABEL PROC
- DB 196,98,125,24,5,49,188,2,0 ; vbroadcastss 0x2bc31(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,237,197,2,0 ; vbroadcastss 0x2c5ed(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -303,7 +303,7 @@ _sk_srcover_hsw LABEL PROC
PUBLIC _sk_dstover_hsw
_sk_dstover_hsw LABEL PROC
- DB 196,98,125,24,5,12,188,2,0 ; vbroadcastss 0x2bc0c(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,200,197,2,0 ; vbroadcastss 0x2c5c8(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -323,7 +323,7 @@ _sk_modulate_hsw LABEL PROC
PUBLIC _sk_multiply_hsw
_sk_multiply_hsw LABEL PROC
- DB 196,98,125,24,5,211,187,2,0 ; vbroadcastss 0x2bbd3(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,143,197,2,0 ; vbroadcastss 0x2c58f(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -344,7 +344,7 @@ _sk_multiply_hsw LABEL PROC
PUBLIC _sk_plus__hsw
_sk_plus__hsw LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,5,130,187,2,0 ; vbroadcastss 0x2bb82(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,62,197,2,0 ; vbroadcastss 0x2c53e(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
@@ -370,7 +370,7 @@ _sk_screen_hsw LABEL PROC
PUBLIC _sk_xor__hsw
_sk_xor__hsw LABEL PROC
- DB 196,98,125,24,5,45,187,2,0 ; vbroadcastss 0x2bb2d(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,233,196,2,0 ; vbroadcastss 0x2c4e9(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -402,7 +402,7 @@ _sk_darken_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,177,186,2,0 ; vbroadcastss 0x2bab1(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,109,196,2,0 ; vbroadcastss 0x2c46d(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -425,7 +425,7 @@ _sk_lighten_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,92,186,2,0 ; vbroadcastss 0x2ba5c(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,24,196,2,0 ; vbroadcastss 0x2c418(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -451,7 +451,7 @@ _sk_difference_hsw LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,251,185,2,0 ; vbroadcastss 0x2b9fb(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,183,195,2,0 ; vbroadcastss 0x2c3b7(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -471,7 +471,7 @@ _sk_exclusion_hsw LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,181,185,2,0 ; vbroadcastss 0x2b9b5(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,113,195,2,0 ; vbroadcastss 0x2c371(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -479,7 +479,7 @@ _sk_exclusion_hsw LABEL PROC
PUBLIC _sk_colorburn_hsw
_sk_colorburn_hsw LABEL PROC
- DB 196,98,125,24,5,159,185,2,0 ; vbroadcastss 0x2b99f(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,91,195,2,0 ; vbroadcastss 0x2c35b(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -535,7 +535,7 @@ _sk_colorburn_hsw LABEL PROC
PUBLIC _sk_colordodge_hsw
_sk_colordodge_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,175,184,2,0 ; vbroadcastss 0x2b8af(%rip),%ymm9 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,13,107,194,2,0 ; vbroadcastss 0x2c26b(%rip),%ymm9 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -586,7 +586,7 @@ _sk_colordodge_hsw LABEL PROC
PUBLIC _sk_hardlight_hsw
_sk_hardlight_hsw LABEL PROC
- DB 196,98,125,24,5,201,183,2,0 ; vbroadcastss 0x2b7c9(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,133,193,2,0 ; vbroadcastss 0x2c185(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -635,7 +635,7 @@ _sk_hardlight_hsw LABEL PROC
PUBLIC _sk_overlay_hsw
_sk_overlay_hsw LABEL PROC
- DB 196,98,125,24,5,253,182,2,0 ; vbroadcastss 0x2b6fd(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,185,192,2,0 ; vbroadcastss 0x2c0b9(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -695,10 +695,10 @@ _sk_softlight_hsw LABEL PROC
DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,29,20,182,2,0 ; vbroadcastss 0x2b614(%rip),%ymm11 # 2c038 <_sk_overlay_sse2_8bit+0x488>
+ DB 196,98,125,24,29,208,191,2,0 ; vbroadcastss 0x2bfd0(%rip),%ymm11 # 2c9f4 <_sk_overlay_sse2_8bit+0x488>
DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12
DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8
- DB 196,98,125,24,37,5,182,2,0 ; vbroadcastss 0x2b605(%rip),%ymm12 # 2c03c <_sk_overlay_sse2_8bit+0x48c>
+ DB 196,98,125,24,37,193,191,2,0 ; vbroadcastss 0x2bfc1(%rip),%ymm12 # 2c9f8 <_sk_overlay_sse2_8bit+0x48c>
DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8
DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14
DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14
@@ -708,7 +708,7 @@ _sk_softlight_hsw LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,180,181,2,0 ; vbroadcastss 0x2b5b4(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,112,191,2,0 ; vbroadcastss 0x2bf70(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -821,11 +821,11 @@ _sk_hue_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,199,179,2,0 ; vbroadcastss 0x2b3c7(%rip),%ymm14 # 2c040 <_sk_overlay_sse2_8bit+0x490>
- DB 196,98,125,24,61,194,179,2,0 ; vbroadcastss 0x2b3c2(%rip),%ymm15 # 2c044 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,53,131,189,2,0 ; vbroadcastss 0x2bd83(%rip),%ymm14 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,61,126,189,2,0 ; vbroadcastss 0x2bd7e(%rip),%ymm15 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,179,179,2,0 ; vbroadcastss 0x2b3b3(%rip),%ymm0 # 2c048 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,226,125,24,5,111,189,2,0 ; vbroadcastss 0x2bd6f(%rip),%ymm0 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -880,7 +880,7 @@ _sk_hue_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,116,178,2,0 ; vbroadcastss 0x2b274(%rip),%ymm1 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,13,48,188,2,0 ; vbroadcastss 0x2bc30(%rip),%ymm1 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -934,11 +934,11 @@ _sk_saturation_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,161,177,2,0 ; vbroadcastss 0x2b1a1(%rip),%ymm14 # 2c040 <_sk_overlay_sse2_8bit+0x490>
- DB 196,98,125,24,61,156,177,2,0 ; vbroadcastss 0x2b19c(%rip),%ymm15 # 2c044 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,53,93,187,2,0 ; vbroadcastss 0x2bb5d(%rip),%ymm14 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,61,88,187,2,0 ; vbroadcastss 0x2bb58(%rip),%ymm15 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,141,177,2,0 ; vbroadcastss 0x2b18d(%rip),%ymm0 # 2c048 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,226,125,24,5,73,187,2,0 ; vbroadcastss 0x2bb49(%rip),%ymm0 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -993,7 +993,7 @@ _sk_saturation_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,78,176,2,0 ; vbroadcastss 0x2b04e(%rip),%ymm1 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,13,10,186,2,0 ; vbroadcastss 0x2ba0a(%rip),%ymm1 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -1021,11 +1021,11 @@ _sk_color_hsw LABEL PROC
DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8
DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10
DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11
- DB 196,98,125,24,45,253,175,2,0 ; vbroadcastss 0x2affd(%rip),%ymm13 # 2c040 <_sk_overlay_sse2_8bit+0x490>
- DB 196,98,125,24,53,248,175,2,0 ; vbroadcastss 0x2aff8(%rip),%ymm14 # 2c044 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,45,185,185,2,0 ; vbroadcastss 0x2b9b9(%rip),%ymm13 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,53,180,185,2,0 ; vbroadcastss 0x2b9b4(%rip),%ymm14 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12
DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12
- DB 196,98,125,24,61,233,175,2,0 ; vbroadcastss 0x2afe9(%rip),%ymm15 # 2c048 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,98,125,24,61,165,185,2,0 ; vbroadcastss 0x2b9a5(%rip),%ymm15 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1081,7 +1081,7 @@ _sk_color_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,159,174,2,0 ; vbroadcastss 0x2ae9f(%rip),%ymm0 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,91,184,2,0 ; vbroadcastss 0x2b85b(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1109,11 +1109,11 @@ _sk_luminosity_hsw LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
- DB 196,98,125,24,45,78,174,2,0 ; vbroadcastss 0x2ae4e(%rip),%ymm13 # 2c040 <_sk_overlay_sse2_8bit+0x490>
- DB 196,98,125,24,53,73,174,2,0 ; vbroadcastss 0x2ae49(%rip),%ymm14 # 2c044 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,45,10,184,2,0 ; vbroadcastss 0x2b80a(%rip),%ymm13 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,53,5,184,2,0 ; vbroadcastss 0x2b805(%rip),%ymm14 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12
DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12
- DB 196,98,125,24,61,58,174,2,0 ; vbroadcastss 0x2ae3a(%rip),%ymm15 # 2c048 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,98,125,24,61,246,183,2,0 ; vbroadcastss 0x2b7f6(%rip),%ymm15 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1169,7 +1169,7 @@ _sk_luminosity_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,240,172,2,0 ; vbroadcastss 0x2acf0(%rip),%ymm0 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,172,182,2,0 ; vbroadcastss 0x2b6ac(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1199,17 +1199,17 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 15,133,179,0,0,0 ; jne 1448 <_sk_srcover_rgba_8888_hsw+0xd3>
DB 196,129,126,111,60,152 ; vmovdqu (%r8,%r11,4),%ymm7
- DB 197,197,219,37,93,174,2,0 ; vpand 0x2ae5d(%rip),%ymm7,%ymm4 # 2c200 <_sk_overlay_sse2_8bit+0x650>
+ DB 197,197,219,37,29,184,2,0 ; vpand 0x2b81d(%rip),%ymm7,%ymm4 # 2cbc0 <_sk_overlay_sse2_8bit+0x654>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,69,0,45,112,174,2,0 ; vpshufb 0x2ae70(%rip),%ymm7,%ymm5 # 2c220 <_sk_overlay_sse2_8bit+0x670>
+ DB 196,226,69,0,45,48,184,2,0 ; vpshufb 0x2b830(%rip),%ymm7,%ymm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x674>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,69,0,53,131,174,2,0 ; vpshufb 0x2ae83(%rip),%ymm7,%ymm6 # 2c240 <_sk_overlay_sse2_8bit+0x690>
+ DB 196,226,69,0,53,67,184,2,0 ; vpshufb 0x2b843(%rip),%ymm7,%ymm6 # 2cc00 <_sk_overlay_sse2_8bit+0x694>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,77,172,2,0 ; vbroadcastss 0x2ac4d(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,9,182,2,0 ; vbroadcastss 0x2b609(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,108,172,2,0 ; vbroadcastss 0x2ac6c(%rip),%ymm9 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,13,40,182,2,0 ; vbroadcastss 0x2b628(%rip),%ymm9 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -1331,7 +1331,7 @@ _sk_clamp_0_hsw LABEL PROC
PUBLIC _sk_clamp_1_hsw
_sk_clamp_1_hsw LABEL PROC
- DB 196,98,125,24,5,90,170,2,0 ; vbroadcastss 0x2aa5a(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,22,180,2,0 ; vbroadcastss 0x2b416(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -1341,7 +1341,7 @@ _sk_clamp_1_hsw LABEL PROC
PUBLIC _sk_clamp_a_hsw
_sk_clamp_a_hsw LABEL PROC
- DB 196,98,125,24,5,57,170,2,0 ; vbroadcastss 0x2aa39(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,245,179,2,0 ; vbroadcastss 0x2b3f5(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -1351,7 +1351,7 @@ _sk_clamp_a_hsw LABEL PROC
PUBLIC _sk_clamp_a_dst_hsw
_sk_clamp_a_dst_hsw LABEL PROC
- DB 196,98,125,24,5,27,170,2,0 ; vbroadcastss 0x2aa1b(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,215,179,2,0 ; vbroadcastss 0x2b3d7(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -1378,7 +1378,7 @@ _sk_swap_rb_hsw LABEL PROC
PUBLIC _sk_invert_hsw
_sk_invert_hsw LABEL PROC
- DB 196,98,125,24,5,214,169,2,0 ; vbroadcastss 0x2a9d6(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,146,179,2,0 ; vbroadcastss 0x2b392(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -1424,7 +1424,7 @@ PUBLIC _sk_unpremul_hsw
_sk_unpremul_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,102,169,2,0 ; vbroadcastss 0x2a966(%rip),%ymm10 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,21,34,179,2,0 ; vbroadcastss 0x2b322(%rip),%ymm10 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -1435,16 +1435,16 @@ _sk_unpremul_hsw LABEL PROC
PUBLIC _sk_from_srgb_hsw
_sk_from_srgb_hsw LABEL PROC
- DB 196,98,125,24,5,115,169,2,0 ; vbroadcastss 0x2a973(%rip),%ymm8 # 2c050 <_sk_overlay_sse2_8bit+0x4a0>
+ DB 196,98,125,24,5,47,179,2,0 ; vbroadcastss 0x2b32f(%rip),%ymm8 # 2ca0c <_sk_overlay_sse2_8bit+0x4a0>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,101,169,2,0 ; vbroadcastss 0x2a965(%rip),%ymm11 # 2c054 <_sk_overlay_sse2_8bit+0x4a4>
- DB 196,98,125,24,37,72,169,2,0 ; vbroadcastss 0x2a948(%rip),%ymm12 # 2c040 <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,29,33,179,2,0 ; vbroadcastss 0x2b321(%rip),%ymm11 # 2ca10 <_sk_overlay_sse2_8bit+0x4a4>
+ DB 196,98,125,24,37,4,179,2,0 ; vbroadcastss 0x2b304(%rip),%ymm12 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13
- DB 196,98,125,24,53,77,169,2,0 ; vbroadcastss 0x2a94d(%rip),%ymm14 # 2c058 <_sk_overlay_sse2_8bit+0x4a8>
+ DB 196,98,125,24,53,9,179,2,0 ; vbroadcastss 0x2b309(%rip),%ymm14 # 2ca14 <_sk_overlay_sse2_8bit+0x4a8>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,67,169,2,0 ; vbroadcastss 0x2a943(%rip),%ymm10 # 2c05c <_sk_overlay_sse2_8bit+0x4ac>
+ DB 196,98,125,24,21,255,178,2,0 ; vbroadcastss 0x2b2ff(%rip),%ymm10 # 2ca18 <_sk_overlay_sse2_8bit+0x4ac>
DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0
DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -1465,16 +1465,16 @@ _sk_from_srgb_hsw LABEL PROC
PUBLIC _sk_from_srgb_dst_hsw
_sk_from_srgb_dst_hsw LABEL PROC
- DB 196,98,125,24,5,219,168,2,0 ; vbroadcastss 0x2a8db(%rip),%ymm8 # 2c050 <_sk_overlay_sse2_8bit+0x4a0>
+ DB 196,98,125,24,5,151,178,2,0 ; vbroadcastss 0x2b297(%rip),%ymm8 # 2ca0c <_sk_overlay_sse2_8bit+0x4a0>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,205,168,2,0 ; vbroadcastss 0x2a8cd(%rip),%ymm11 # 2c054 <_sk_overlay_sse2_8bit+0x4a4>
- DB 196,98,125,24,37,176,168,2,0 ; vbroadcastss 0x2a8b0(%rip),%ymm12 # 2c040 <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,29,137,178,2,0 ; vbroadcastss 0x2b289(%rip),%ymm11 # 2ca10 <_sk_overlay_sse2_8bit+0x4a4>
+ DB 196,98,125,24,37,108,178,2,0 ; vbroadcastss 0x2b26c(%rip),%ymm12 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,93,168,235 ; vfmadd213ps %ymm11,%ymm4,%ymm13
- DB 196,98,125,24,53,181,168,2,0 ; vbroadcastss 0x2a8b5(%rip),%ymm14 # 2c058 <_sk_overlay_sse2_8bit+0x4a8>
+ DB 196,98,125,24,53,113,178,2,0 ; vbroadcastss 0x2b271(%rip),%ymm14 # 2ca14 <_sk_overlay_sse2_8bit+0x4a8>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,171,168,2,0 ; vbroadcastss 0x2a8ab(%rip),%ymm10 # 2c05c <_sk_overlay_sse2_8bit+0x4ac>
+ DB 196,98,125,24,21,103,178,2,0 ; vbroadcastss 0x2b267(%rip),%ymm10 # 2ca18 <_sk_overlay_sse2_8bit+0x4ac>
DB 196,193,92,194,226,1 ; vcmpltps %ymm10,%ymm4,%ymm4
DB 196,195,21,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm13,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -1496,19 +1496,19 @@ _sk_from_srgb_dst_hsw LABEL PROC
PUBLIC _sk_to_srgb_hsw
_sk_to_srgb_hsw LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,79,168,2,0 ; vbroadcastss 0x2a84f(%rip),%ymm8 # 2c060 <_sk_overlay_sse2_8bit+0x4b0>
+ DB 196,98,125,24,5,11,178,2,0 ; vbroadcastss 0x2b20b(%rip),%ymm8 # 2ca1c <_sk_overlay_sse2_8bit+0x4b0>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,69,168,2,0 ; vbroadcastss 0x2a845(%rip),%ymm11 # 2c064 <_sk_overlay_sse2_8bit+0x4b4>
- DB 196,98,125,24,37,64,168,2,0 ; vbroadcastss 0x2a840(%rip),%ymm12 # 2c068 <_sk_overlay_sse2_8bit+0x4b8>
+ DB 196,98,125,24,29,1,178,2,0 ; vbroadcastss 0x2b201(%rip),%ymm11 # 2ca20 <_sk_overlay_sse2_8bit+0x4b4>
+ DB 196,98,125,24,37,252,177,2,0 ; vbroadcastss 0x2b1fc(%rip),%ymm12 # 2ca24 <_sk_overlay_sse2_8bit+0x4b8>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13
- DB 196,98,125,24,53,49,168,2,0 ; vbroadcastss 0x2a831(%rip),%ymm14 # 2c06c <_sk_overlay_sse2_8bit+0x4bc>
+ DB 196,98,125,24,53,237,177,2,0 ; vbroadcastss 0x2b1ed(%rip),%ymm14 # 2ca28 <_sk_overlay_sse2_8bit+0x4bc>
DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13
- DB 196,98,125,24,61,39,168,2,0 ; vbroadcastss 0x2a827(%rip),%ymm15 # 2c070 <_sk_overlay_sse2_8bit+0x4c0>
+ DB 196,98,125,24,61,227,177,2,0 ; vbroadcastss 0x2b1e3(%rip),%ymm15 # 2ca2c <_sk_overlay_sse2_8bit+0x4c0>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9
- DB 196,98,125,24,45,19,168,2,0 ; vbroadcastss 0x2a813(%rip),%ymm13 # 2c074 <_sk_overlay_sse2_8bit+0x4c4>
+ DB 196,98,125,24,45,207,177,2,0 ; vbroadcastss 0x2b1cf(%rip),%ymm13 # 2ca30 <_sk_overlay_sse2_8bit+0x4c4>
DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -1540,26 +1540,26 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,46,167,2,0 ; vbroadcastss 0x2a72e(%rip),%ymm11 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,29,234,176,2,0 ; vbroadcastss 0x2b0ea(%rip),%ymm11 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13
- DB 196,98,125,24,53,111,167,2,0 ; vbroadcastss 0x2a76f(%rip),%ymm14 # 2c078 <_sk_overlay_sse2_8bit+0x4c8>
+ DB 196,98,125,24,53,43,177,2,0 ; vbroadcastss 0x2b12b(%rip),%ymm14 # 2ca34 <_sk_overlay_sse2_8bit+0x4c8>
DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13
DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12
DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13
- DB 196,98,125,24,53,86,167,2,0 ; vbroadcastss 0x2a756(%rip),%ymm14 # 2c080 <_sk_overlay_sse2_8bit+0x4d0>
+ DB 196,98,125,24,53,18,177,2,0 ; vbroadcastss 0x2b112(%rip),%ymm14 # 2ca3c <_sk_overlay_sse2_8bit+0x4d0>
DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13
- DB 196,98,125,24,53,68,167,2,0 ; vbroadcastss 0x2a744(%rip),%ymm14 # 2c07c <_sk_overlay_sse2_8bit+0x4cc>
+ DB 196,98,125,24,53,0,177,2,0 ; vbroadcastss 0x2b100(%rip),%ymm14 # 2ca38 <_sk_overlay_sse2_8bit+0x4cc>
DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2
DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1
DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,29,187,166,2,0 ; vbroadcastss 0x2a6bb(%rip),%ymm11 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,119,176,2,0 ; vbroadcastss 0x2b077(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2
DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11
DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12
@@ -1569,7 +1569,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0
DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- DB 196,98,125,24,5,234,166,2,0 ; vbroadcastss 0x2a6ea(%rip),%ymm8 # 2c084 <_sk_overlay_sse2_8bit+0x4d4>
+ DB 196,98,125,24,5,166,176,2,0 ; vbroadcastss 0x2b0a6(%rip),%ymm8 # 2ca40 <_sk_overlay_sse2_8bit+0x4d4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1584,30 +1584,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 197,252,40,224 ; vmovaps %ymm0,%ymm4
- DB 196,98,125,24,5,65,166,2,0 ; vbroadcastss 0x2a641(%rip),%ymm8 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,253,175,2,0 ; vbroadcastss 0x2affd(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10
DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11
DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
- DB 196,98,125,24,13,128,166,2,0 ; vbroadcastss 0x2a680(%rip),%ymm9 # 2c07c <_sk_overlay_sse2_8bit+0x4cc>
+ DB 196,98,125,24,13,60,176,2,0 ; vbroadcastss 0x2b03c(%rip),%ymm9 # 2ca38 <_sk_overlay_sse2_8bit+0x4cc>
DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9
- DB 196,98,125,24,29,126,166,2,0 ; vbroadcastss 0x2a67e(%rip),%ymm11 # 2c088 <_sk_overlay_sse2_8bit+0x4d8>
+ DB 196,98,125,24,29,58,176,2,0 ; vbroadcastss 0x2b03a(%rip),%ymm11 # 2ca44 <_sk_overlay_sse2_8bit+0x4d8>
DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,45,80,166,2,0 ; vbroadcastss 0x2a650(%rip),%ymm13 # 2c078 <_sk_overlay_sse2_8bit+0x4c8>
+ DB 196,98,125,24,45,12,176,2,0 ; vbroadcastss 0x2b00c(%rip),%ymm13 # 2ca34 <_sk_overlay_sse2_8bit+0x4c8>
DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0
- DB 196,98,125,24,53,74,166,2,0 ; vbroadcastss 0x2a64a(%rip),%ymm14 # 2c080 <_sk_overlay_sse2_8bit+0x4d0>
+ DB 196,98,125,24,53,6,176,2,0 ; vbroadcastss 0x2b006(%rip),%ymm14 # 2ca3c <_sk_overlay_sse2_8bit+0x4d0>
DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12
DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12
- DB 196,226,125,24,29,68,166,2,0 ; vbroadcastss 0x2a644(%rip),%ymm3 # 2c08c <_sk_overlay_sse2_8bit+0x4dc>
+ DB 196,226,125,24,29,0,176,2,0 ; vbroadcastss 0x2b000(%rip),%ymm3 # 2ca48 <_sk_overlay_sse2_8bit+0x4dc>
DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7
DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7
DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12
DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,37,27,166,2,0 ; vbroadcastss 0x2a61b(%rip),%ymm12 # 2c084 <_sk_overlay_sse2_8bit+0x4d4>
+ DB 196,98,125,24,37,215,175,2,0 ; vbroadcastss 0x2afd7(%rip),%ymm12 # 2ca40 <_sk_overlay_sse2_8bit+0x4d4>
DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15
DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0
DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -1623,7 +1623,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0
DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7
DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- DB 196,226,125,24,5,207,165,2,0 ; vbroadcastss 0x2a5cf(%rip),%ymm0 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,226,125,24,5,139,175,2,0 ; vbroadcastss 0x2af8b(%rip),%ymm0 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
@@ -1673,10 +1673,10 @@ _sk_scale_u8_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,58 ; jne 1bb6 <_sk_scale_u8_hsw+0x52>
DB 196,2,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm8
- DB 197,57,219,5,134,174,2,0 ; vpand 0x2ae86(%rip),%xmm8,%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,57,219,5,198,184,2,0 ; vpand 0x2b8c6(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,247,164,2,0 ; vbroadcastss 0x2a4f7(%rip),%ymm9 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,179,174,2,0 ; vbroadcastss 0x2aeb3(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -1725,7 +1725,7 @@ _sk_scale_u8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf001c60 <_sk_overlay_sse2_8bit+0xffffffffdefd60b0>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf001c60 <_sk_overlay_sse2_8bit+0xffffffffdefd56f4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -1749,20 +1749,20 @@ _sk_scale_565_hsw LABEL PROC
DB 15,133,161,0,0,0 ; jne 1d2c <_sk_scale_565_hsw+0xc0>
DB 196,1,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,249,163,2,0 ; vpbroadcastd 0x2a3f9(%rip),%ymm9 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,98,125,88,13,181,173,2,0 ; vpbroadcastd 0x2adb5(%rip),%ymm9 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,234,163,2,0 ; vbroadcastss 0x2a3ea(%rip),%ymm10 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,98,125,24,21,166,173,2,0 ; vbroadcastss 0x2ada6(%rip),%ymm10 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,224,163,2,0 ; vpbroadcastd 0x2a3e0(%rip),%ymm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,98,125,88,21,156,173,2,0 ; vpbroadcastd 0x2ad9c(%rip),%ymm10 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,209,163,2,0 ; vbroadcastss 0x2a3d1(%rip),%ymm11 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,98,125,24,29,141,173,2,0 ; vbroadcastss 0x2ad8d(%rip),%ymm11 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,199,163,2,0 ; vpbroadcastd 0x2a3c7(%rip),%ymm11 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,98,125,88,29,131,173,2,0 ; vpbroadcastd 0x2ad83(%rip),%ymm11 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,184,163,2,0 ; vbroadcastss 0x2a3b8(%rip),%ymm11 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,98,125,24,29,116,173,2,0 ; vbroadcastss 0x2ad74(%rip),%ymm11 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -1849,10 +1849,10 @@ _sk_lerp_u8_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,78 ; jne 1e65 <_sk_lerp_u8_hsw+0x66>
DB 196,2,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm8
- DB 197,57,219,5,235,171,2,0 ; vpand 0x2abeb(%rip),%xmm8,%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,57,219,5,43,182,2,0 ; vpand 0x2b62b(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,92,162,2,0 ; vbroadcastss 0x2a25c(%rip),%ymm9 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,24,172,2,0 ; vbroadcastss 0x2ac18(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -1904,7 +1904,7 @@ _sk_lerp_u8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde001f10 <_sk_overlay_sse2_8bit+0xffffffffddfd6360>
+ DB 232,255,255,255,221 ; callq ffffffffde001f10 <_sk_overlay_sse2_8bit+0xffffffffddfd59a4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -1928,20 +1928,20 @@ _sk_lerp_565_hsw LABEL PROC
DB 15,133,181,0,0,0 ; jne 1ff0 <_sk_lerp_565_hsw+0xd4>
DB 196,1,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,73,161,2,0 ; vpbroadcastd 0x2a149(%rip),%ymm9 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,98,125,88,13,5,171,2,0 ; vpbroadcastd 0x2ab05(%rip),%ymm9 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,58,161,2,0 ; vbroadcastss 0x2a13a(%rip),%ymm10 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,98,125,24,21,246,170,2,0 ; vbroadcastss 0x2aaf6(%rip),%ymm10 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,48,161,2,0 ; vpbroadcastd 0x2a130(%rip),%ymm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,98,125,88,21,236,170,2,0 ; vpbroadcastd 0x2aaec(%rip),%ymm10 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,33,161,2,0 ; vbroadcastss 0x2a121(%rip),%ymm11 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,98,125,24,29,221,170,2,0 ; vbroadcastss 0x2aadd(%rip),%ymm11 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,23,161,2,0 ; vpbroadcastd 0x2a117(%rip),%ymm11 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,98,125,88,29,211,170,2,0 ; vpbroadcastd 0x2aad3(%rip),%ymm11 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,8,161,2,0 ; vbroadcastss 0x2a108(%rip),%ymm11 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,98,125,24,29,196,170,2,0 ; vbroadcastss 0x2aac4(%rip),%ymm11 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -2013,21 +2013,21 @@ _sk_load_tables_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,103 ; jne 2105 <_sk_load_tables_hsw+0x71>
DB 196,193,126,111,28,144 ; vmovdqu (%r8,%rdx,4),%ymm3
- DB 197,229,219,13,180,161,2,0 ; vpand 0x2a1b4(%rip),%ymm3,%ymm1 # 2c260 <_sk_overlay_sse2_8bit+0x6b0>
+ DB 197,229,219,13,116,171,2,0 ; vpand 0x2ab74(%rip),%ymm3,%ymm1 # 2cc20 <_sk_overlay_sse2_8bit+0x6b4>
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 76,139,64,8 ; mov 0x8(%rax),%r8
DB 76,139,72,16 ; mov 0x10(%rax),%r9
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 196,194,109,146,4,136 ; vgatherdps %ymm2,(%r8,%ymm1,4),%ymm0
- DB 196,226,101,0,21,180,161,2,0 ; vpshufb 0x2a1b4(%rip),%ymm3,%ymm2 # 2c280 <_sk_overlay_sse2_8bit+0x6d0>
+ DB 196,226,101,0,21,116,171,2,0 ; vpshufb 0x2ab74(%rip),%ymm3,%ymm2 # 2cc40 <_sk_overlay_sse2_8bit+0x6d4>
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,194,53,146,12,145 ; vgatherdps %ymm9,(%r9,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
- DB 196,98,101,0,13,188,161,2,0 ; vpshufb 0x2a1bc(%rip),%ymm3,%ymm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x6f0>
+ DB 196,98,101,0,13,124,171,2,0 ; vpshufb 0x2ab7c(%rip),%ymm3,%ymm9 # 2cc60 <_sk_overlay_sse2_8bit+0x6f4>
DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,152,159,2,0 ; vbroadcastss 0x29f98(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,84,169,2,0 ; vbroadcastss 0x2a954(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2107,7 +2107,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1
DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2
DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8
- DB 197,121,111,21,221,167,2,0 ; vmovdqa 0x2a7dd(%rip),%xmm10 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,121,111,21,29,178,2,0 ; vmovdqa 0x2b21d(%rip),%xmm10 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -2129,7 +2129,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,14,158,2,0 ; vbroadcastss 0x29e0e(%rip),%ymm8 # 2c0b0 <_sk_overlay_sse2_8bit+0x500>
+ DB 196,98,125,24,5,202,167,2,0 ; vbroadcastss 0x2a7ca(%rip),%ymm8 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2187,7 +2187,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 197,185,108,211 ; vpunpcklqdq %xmm3,%xmm8,%xmm2
DB 197,185,109,219 ; vpunpckhqdq %xmm3,%xmm8,%xmm3
DB 197,113,108,192 ; vpunpcklqdq %xmm0,%xmm1,%xmm8
- DB 197,121,111,13,108,166,2,0 ; vmovdqa 0x2a66c(%rip),%xmm9 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,121,111,13,172,176,2,0 ; vmovdqa 0x2b0ac(%rip),%xmm9 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,193,105,219,193 ; vpand %xmm9,%xmm2,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -2204,7 +2204,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 196,226,125,51,218 ; vpmovzxwd %xmm2,%ymm3
DB 196,226,45,146,20,152 ; vgatherdps %ymm10,(%rax,%ymm3,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,40,156,2,0 ; vbroadcastss 0x29c28(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,228,165,2,0 ; vbroadcastss 0x2a5e4(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,72 ; vmovd (%r8,%r9,2),%xmm0
DB 196,1,121,196,92,72,4,2 ; vpinsrw $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
@@ -2271,7 +2271,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
PUBLIC _sk_byte_tables_hsw
_sk_byte_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,24,155,2,0 ; vbroadcastss 0x29b18(%rip),%ymm8 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,212,164,2,0 ; vbroadcastss 0x2a4d4(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,200 ; vmovq %xmm9,%r8
@@ -2393,7 +2393,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 67,15,182,4,17 ; movzbl (%r9,%r10,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,1,153,2,0 ; vbroadcastss 0x29901(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,189,162,2,0 ; vbroadcastss 0x2a2bd(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2507,7 +2507,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC
DB 67,15,182,4,17 ; movzbl (%r9,%r10,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,233,150,2,0 ; vbroadcastss 0x296e9(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,165,160,2,0 ; vbroadcastss 0x2a0a5(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2596,33 +2596,33 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10
DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,223,149,2,0 ; vbroadcastss 0x295df(%rip),%ymm12 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
- DB 196,98,125,24,45,218,149,2,0 ; vbroadcastss 0x295da(%rip),%ymm13 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,155,159,2,0 ; vbroadcastss 0x29f9b(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,45,150,159,2,0 ; vbroadcastss 0x29f96(%rip),%ymm13 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,48,149,2,0 ; vbroadcastss 0x29530(%rip),%ymm13 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,45,236,158,2,0 ; vbroadcastss 0x29eec(%rip),%ymm13 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,194,149,2,0 ; vbroadcastss 0x295c2(%rip),%ymm13 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,126,159,2,0 ; vbroadcastss 0x29f7e(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,184,149,2,0 ; vbroadcastss 0x295b8(%rip),%ymm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,116,159,2,0 ; vbroadcastss 0x29f74(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,174,149,2,0 ; vbroadcastss 0x295ae(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,106,159,2,0 ; vbroadcastss 0x29f6a(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,164,149,2,0 ; vbroadcastss 0x295a4(%rip),%ymm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,96,159,2,0 ; vbroadcastss 0x29f60(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,133,149,2,0 ; vbroadcastss 0x29585(%rip),%ymm11 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,65,159,2,0 ; vbroadcastss 0x29f41(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,123,149,2,0 ; vbroadcastss 0x2957b(%rip),%ymm11 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,55,159,2,0 ; vbroadcastss 0x29f37(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11
- DB 196,226,125,24,5,113,149,2,0 ; vbroadcastss 0x29571(%rip),%ymm0 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,5,45,159,2,0 ; vbroadcastss 0x29f2d(%rip),%ymm0 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,103,149,2,0 ; vbroadcastss 0x29567(%rip),%ymm10 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,21,35,159,2,0 ; vbroadcastss 0x29f23(%rip),%ymm10 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0
DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,21,90,149,2,0 ; vbroadcastss 0x2955a(%rip),%ymm10 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,22,159,2,0 ; vbroadcastss 0x29f16(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2630,7 +2630,7 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,113,148,2,0 ; vbroadcastss 0x29471(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,45,158,2,0 ; vbroadcastss 0x29e2d(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2648,33 +2648,33 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10
DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,185,148,2,0 ; vbroadcastss 0x294b9(%rip),%ymm12 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
- DB 196,98,125,24,45,180,148,2,0 ; vbroadcastss 0x294b4(%rip),%ymm13 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,117,158,2,0 ; vbroadcastss 0x29e75(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,45,112,158,2,0 ; vbroadcastss 0x29e70(%rip),%ymm13 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,10,148,2,0 ; vbroadcastss 0x2940a(%rip),%ymm13 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,45,198,157,2,0 ; vbroadcastss 0x29dc6(%rip),%ymm13 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,156,148,2,0 ; vbroadcastss 0x2949c(%rip),%ymm13 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,88,158,2,0 ; vbroadcastss 0x29e58(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,146,148,2,0 ; vbroadcastss 0x29492(%rip),%ymm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,78,158,2,0 ; vbroadcastss 0x29e4e(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,136,148,2,0 ; vbroadcastss 0x29488(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,68,158,2,0 ; vbroadcastss 0x29e44(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,126,148,2,0 ; vbroadcastss 0x2947e(%rip),%ymm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,58,158,2,0 ; vbroadcastss 0x29e3a(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,95,148,2,0 ; vbroadcastss 0x2945f(%rip),%ymm11 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,27,158,2,0 ; vbroadcastss 0x29e1b(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,85,148,2,0 ; vbroadcastss 0x29455(%rip),%ymm11 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,17,158,2,0 ; vbroadcastss 0x29e11(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11
- DB 196,226,125,24,13,75,148,2,0 ; vbroadcastss 0x2944b(%rip),%ymm1 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,13,7,158,2,0 ; vbroadcastss 0x29e07(%rip),%ymm1 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,65,148,2,0 ; vbroadcastss 0x29441(%rip),%ymm10 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,21,253,157,2,0 ; vbroadcastss 0x29dfd(%rip),%ymm10 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
- DB 196,98,125,24,21,52,148,2,0 ; vbroadcastss 0x29434(%rip),%ymm10 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,240,157,2,0 ; vbroadcastss 0x29df0(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2682,7 +2682,7 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,75,147,2,0 ; vbroadcastss 0x2934b(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,7,157,2,0 ; vbroadcastss 0x29d07(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2700,33 +2700,33 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,147,147,2,0 ; vbroadcastss 0x29393(%rip),%ymm12 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
- DB 196,98,125,24,45,142,147,2,0 ; vbroadcastss 0x2938e(%rip),%ymm13 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,79,157,2,0 ; vbroadcastss 0x29d4f(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,45,74,157,2,0 ; vbroadcastss 0x29d4a(%rip),%ymm13 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,228,146,2,0 ; vbroadcastss 0x292e4(%rip),%ymm13 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,45,160,156,2,0 ; vbroadcastss 0x29ca0(%rip),%ymm13 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,118,147,2,0 ; vbroadcastss 0x29376(%rip),%ymm13 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,50,157,2,0 ; vbroadcastss 0x29d32(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,108,147,2,0 ; vbroadcastss 0x2936c(%rip),%ymm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,40,157,2,0 ; vbroadcastss 0x29d28(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,98,147,2,0 ; vbroadcastss 0x29362(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,30,157,2,0 ; vbroadcastss 0x29d1e(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,88,147,2,0 ; vbroadcastss 0x29358(%rip),%ymm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,20,157,2,0 ; vbroadcastss 0x29d14(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,57,147,2,0 ; vbroadcastss 0x29339(%rip),%ymm11 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,245,156,2,0 ; vbroadcastss 0x29cf5(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,47,147,2,0 ; vbroadcastss 0x2932f(%rip),%ymm11 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,235,156,2,0 ; vbroadcastss 0x29ceb(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11
- DB 196,226,125,24,21,37,147,2,0 ; vbroadcastss 0x29325(%rip),%ymm2 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,21,225,156,2,0 ; vbroadcastss 0x29ce1(%rip),%ymm2 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,27,147,2,0 ; vbroadcastss 0x2931b(%rip),%ymm10 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,21,215,156,2,0 ; vbroadcastss 0x29cd7(%rip),%ymm10 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2
DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2
- DB 196,98,125,24,21,14,147,2,0 ; vbroadcastss 0x2930e(%rip),%ymm10 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,202,156,2,0 ; vbroadcastss 0x29cca(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2734,7 +2734,7 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,37,146,2,0 ; vbroadcastss 0x29225(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,225,155,2,0 ; vbroadcastss 0x29be1(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2752,33 +2752,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10
DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,109,146,2,0 ; vbroadcastss 0x2926d(%rip),%ymm12 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
- DB 196,98,125,24,45,104,146,2,0 ; vbroadcastss 0x29268(%rip),%ymm13 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,41,156,2,0 ; vbroadcastss 0x29c29(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,45,36,156,2,0 ; vbroadcastss 0x29c24(%rip),%ymm13 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,190,145,2,0 ; vbroadcastss 0x291be(%rip),%ymm13 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,45,122,155,2,0 ; vbroadcastss 0x29b7a(%rip),%ymm13 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,80,146,2,0 ; vbroadcastss 0x29250(%rip),%ymm13 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,12,156,2,0 ; vbroadcastss 0x29c0c(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,70,146,2,0 ; vbroadcastss 0x29246(%rip),%ymm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,2,156,2,0 ; vbroadcastss 0x29c02(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,60,146,2,0 ; vbroadcastss 0x2923c(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,248,155,2,0 ; vbroadcastss 0x29bf8(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,50,146,2,0 ; vbroadcastss 0x29232(%rip),%ymm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,238,155,2,0 ; vbroadcastss 0x29bee(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,19,146,2,0 ; vbroadcastss 0x29213(%rip),%ymm11 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,207,155,2,0 ; vbroadcastss 0x29bcf(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,9,146,2,0 ; vbroadcastss 0x29209(%rip),%ymm11 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,197,155,2,0 ; vbroadcastss 0x29bc5(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11
- DB 196,226,125,24,29,255,145,2,0 ; vbroadcastss 0x291ff(%rip),%ymm3 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,29,187,155,2,0 ; vbroadcastss 0x29bbb(%rip),%ymm3 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,245,145,2,0 ; vbroadcastss 0x291f5(%rip),%ymm10 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,21,177,155,2,0 ; vbroadcastss 0x29bb1(%rip),%ymm10 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3
DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3
- DB 196,98,125,24,21,232,145,2,0 ; vbroadcastss 0x291e8(%rip),%ymm10 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,164,155,2,0 ; vbroadcastss 0x29ba4(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2786,7 +2786,7 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,255,144,2,0 ; vbroadcastss 0x290ff(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,187,154,2,0 ; vbroadcastss 0x29abb(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2803,35 +2803,35 @@ _sk_gamma_hsw LABEL PROC
DB 197,252,40,241 ; vmovaps %ymm1,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,124,91,208 ; vcvtdq2ps %ymm0,%ymm10
- DB 196,98,125,24,29,76,145,2,0 ; vbroadcastss 0x2914c(%rip),%ymm11 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
- DB 196,226,125,24,45,71,145,2,0 ; vbroadcastss 0x29147(%rip),%ymm5 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,29,8,155,2,0 ; vbroadcastss 0x29b08(%rip),%ymm11 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,226,125,24,45,3,155,2,0 ; vbroadcastss 0x29b03(%rip),%ymm5 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 197,124,84,205 ; vandps %ymm5,%ymm0,%ymm9
- DB 196,226,125,24,37,158,144,2,0 ; vbroadcastss 0x2909e(%rip),%ymm4 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,37,90,154,2,0 ; vbroadcastss 0x29a5a(%rip),%ymm4 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,52,86,228 ; vorps %ymm4,%ymm9,%ymm12
- DB 196,98,125,24,45,49,145,2,0 ; vbroadcastss 0x29131(%rip),%ymm13 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,45,237,154,2,0 ; vbroadcastss 0x29aed(%rip),%ymm13 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,66,37,168,213 ; vfmadd213ps %ymm13,%ymm11,%ymm10
- DB 196,98,125,24,13,39,145,2,0 ; vbroadcastss 0x29127(%rip),%ymm9 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,13,227,154,2,0 ; vbroadcastss 0x29ae3(%rip),%ymm9 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,66,29,188,209 ; vfnmadd231ps %ymm9,%ymm12,%ymm10
DB 197,124,91,246 ; vcvtdq2ps %ymm6,%ymm14
DB 196,66,37,168,245 ; vfmadd213ps %ymm13,%ymm11,%ymm14
DB 197,124,91,255 ; vcvtdq2ps %ymm7,%ymm15
DB 196,66,37,168,253 ; vfmadd213ps %ymm13,%ymm11,%ymm15
- DB 196,98,125,24,29,11,145,2,0 ; vbroadcastss 0x2910b(%rip),%ymm11 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,29,199,154,2,0 ; vbroadcastss 0x29ac7(%rip),%ymm11 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,65,28,88,227 ; vaddps %ymm11,%ymm12,%ymm12
- DB 196,98,125,24,45,1,145,2,0 ; vbroadcastss 0x29101(%rip),%ymm13 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,45,189,154,2,0 ; vbroadcastss 0x29abd(%rip),%ymm13 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 196,65,20,94,228 ; vdivps %ymm12,%ymm13,%ymm12
DB 196,65,44,92,212 ; vsubps %ymm12,%ymm10,%ymm10
DB 196,98,125,24,32 ; vbroadcastss (%rax),%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
DB 196,67,125,8,194,1 ; vroundps $0x1,%ymm10,%ymm8
DB 196,65,44,92,192 ; vsubps %ymm8,%ymm10,%ymm8
- DB 196,226,125,24,21,221,144,2,0 ; vbroadcastss 0x290dd(%rip),%ymm2 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,226,125,24,21,153,154,2,0 ; vbroadcastss 0x29a99(%rip),%ymm2 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 197,44,88,210 ; vaddps %ymm2,%ymm10,%ymm10
- DB 196,226,125,24,29,212,144,2,0 ; vbroadcastss 0x290d4(%rip),%ymm3 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,226,125,24,29,144,154,2,0 ; vbroadcastss 0x29a90(%rip),%ymm3 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 196,98,61,188,211 ; vfnmadd231ps %ymm3,%ymm8,%ymm10
- DB 196,226,125,24,13,202,144,2,0 ; vbroadcastss 0x290ca(%rip),%ymm1 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,13,134,154,2,0 ; vbroadcastss 0x29a86(%rip),%ymm1 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 196,65,116,92,192 ; vsubps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,5,192,144,2,0 ; vbroadcastss 0x290c0(%rip),%ymm0 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,226,125,24,5,124,154,2,0 ; vbroadcastss 0x29a7c(%rip),%ymm0 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 196,65,124,94,192 ; vdivps %ymm8,%ymm0,%ymm8
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 197,204,84,245 ; vandps %ymm5,%ymm6,%ymm6
@@ -2862,7 +2862,7 @@ _sk_gamma_hsw LABEL PROC
DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0
DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0
- DB 196,226,125,24,13,49,144,2,0 ; vbroadcastss 0x29031(%rip),%ymm1 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,226,125,24,13,237,153,2,0 ; vbroadcastss 0x299ed(%rip),%ymm1 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 197,188,89,209 ; vmulps %ymm1,%ymm8,%ymm2
DB 197,204,89,217 ; vmulps %ymm1,%ymm6,%ymm3
DB 197,252,89,225 ; vmulps %ymm1,%ymm0,%ymm4
@@ -2880,26 +2880,26 @@ _sk_gamma_hsw LABEL PROC
PUBLIC _sk_lab_to_xyz_hsw
_sk_lab_to_xyz_hsw LABEL PROC
- DB 196,98,125,24,5,233,143,2,0 ; vbroadcastss 0x28fe9(%rip),%ymm8 # 2c0e0 <_sk_overlay_sse2_8bit+0x530>
- DB 196,98,125,24,13,76,143,2,0 ; vbroadcastss 0x28f4c(%rip),%ymm9 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
- DB 196,98,125,24,21,219,143,2,0 ; vbroadcastss 0x28fdb(%rip),%ymm10 # 2c0e4 <_sk_overlay_sse2_8bit+0x534>
+ DB 196,98,125,24,5,165,153,2,0 ; vbroadcastss 0x299a5(%rip),%ymm8 # 2ca9c <_sk_overlay_sse2_8bit+0x530>
+ DB 196,98,125,24,13,8,153,2,0 ; vbroadcastss 0x29908(%rip),%ymm9 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,21,151,153,2,0 ; vbroadcastss 0x29997(%rip),%ymm10 # 2caa0 <_sk_overlay_sse2_8bit+0x534>
DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1
DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2
- DB 196,98,125,24,13,204,143,2,0 ; vbroadcastss 0x28fcc(%rip),%ymm9 # 2c0e8 <_sk_overlay_sse2_8bit+0x538>
+ DB 196,98,125,24,13,136,153,2,0 ; vbroadcastss 0x29988(%rip),%ymm9 # 2caa4 <_sk_overlay_sse2_8bit+0x538>
DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9
- DB 196,226,125,24,5,194,143,2,0 ; vbroadcastss 0x28fc2(%rip),%ymm0 # 2c0ec <_sk_overlay_sse2_8bit+0x53c>
+ DB 196,226,125,24,5,126,153,2,0 ; vbroadcastss 0x2997e(%rip),%ymm0 # 2caa8 <_sk_overlay_sse2_8bit+0x53c>
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
- DB 196,98,125,24,5,185,143,2,0 ; vbroadcastss 0x28fb9(%rip),%ymm8 # 2c0f0 <_sk_overlay_sse2_8bit+0x540>
+ DB 196,98,125,24,5,117,153,2,0 ; vbroadcastss 0x29975(%rip),%ymm8 # 2caac <_sk_overlay_sse2_8bit+0x540>
DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8
- DB 196,98,125,24,13,175,143,2,0 ; vbroadcastss 0x28faf(%rip),%ymm9 # 2c0f4 <_sk_overlay_sse2_8bit+0x544>
+ DB 196,98,125,24,13,107,153,2,0 ; vbroadcastss 0x2996b(%rip),%ymm9 # 2cab0 <_sk_overlay_sse2_8bit+0x544>
DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9
DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
- DB 196,226,125,24,21,156,143,2,0 ; vbroadcastss 0x28f9c(%rip),%ymm2 # 2c0f8 <_sk_overlay_sse2_8bit+0x548>
+ DB 196,226,125,24,21,88,153,2,0 ; vbroadcastss 0x29958(%rip),%ymm2 # 2cab4 <_sk_overlay_sse2_8bit+0x548>
DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10
- DB 196,98,125,24,29,146,143,2,0 ; vbroadcastss 0x28f92(%rip),%ymm11 # 2c0fc <_sk_overlay_sse2_8bit+0x54c>
+ DB 196,98,125,24,29,78,153,2,0 ; vbroadcastss 0x2994e(%rip),%ymm11 # 2cab8 <_sk_overlay_sse2_8bit+0x54c>
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,37,136,143,2,0 ; vbroadcastss 0x28f88(%rip),%ymm12 # 2c100 <_sk_overlay_sse2_8bit+0x550>
+ DB 196,98,125,24,37,68,153,2,0 ; vbroadcastss 0x29944(%rip),%ymm12 # 2cabc <_sk_overlay_sse2_8bit+0x550>
DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8
DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -2914,9 +2914,9 @@ _sk_lab_to_xyz_hsw LABEL PROC
DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- DB 196,226,125,24,5,61,143,2,0 ; vbroadcastss 0x28f3d(%rip),%ymm0 # 2c104 <_sk_overlay_sse2_8bit+0x554>
+ DB 196,226,125,24,5,249,152,2,0 ; vbroadcastss 0x298f9(%rip),%ymm0 # 2cac0 <_sk_overlay_sse2_8bit+0x554>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,52,143,2,0 ; vbroadcastss 0x28f34(%rip),%ymm8 # 2c108 <_sk_overlay_sse2_8bit+0x558>
+ DB 196,98,125,24,5,240,152,2,0 ; vbroadcastss 0x298f0(%rip),%ymm8 # 2cac4 <_sk_overlay_sse2_8bit+0x558>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2932,10 +2932,10 @@ _sk_load_a8_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,52 ; jne 3229 <_sk_load_a8_hsw+0x4c>
DB 196,130,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm0
- DB 197,249,219,5,13,152,2,0 ; vpand 0x2980d(%rip),%xmm0,%xmm0 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,249,219,5,77,162,2,0 ; vpand 0x2a24d(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,127,142,2,0 ; vbroadcastss 0x28e7f(%rip),%ymm1 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,59,152,2,0 ; vbroadcastss 0x2983b(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2983,7 +2983,7 @@ _sk_load_a8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf0032d0 <_sk_overlay_sse2_8bit+0xffffffffdefd7720>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf0032d0 <_sk_overlay_sse2_8bit+0xffffffffdefd6d64>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -3005,10 +3005,10 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,52 ; jne 3328 <_sk_load_a8_dst_hsw+0x4c>
DB 196,130,121,48,36,24 ; vpmovzxbw (%r8,%r11,1),%xmm4
- DB 197,217,219,37,14,151,2,0 ; vpand 0x2970e(%rip),%xmm4,%xmm4 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,217,219,37,78,161,2,0 ; vpand 0x2a14e(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,128,141,2,0 ; vbroadcastss 0x28d80(%rip),%ymm5 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,45,60,151,2,0 ; vbroadcastss 0x2973c(%rip),%ymm5 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -3056,7 +3056,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde0033d0 <_sk_overlay_sse2_8bit+0xffffffffddfd7820>
+ DB 232,255,255,255,221 ; callq ffffffffde0033d0 <_sk_overlay_sse2_8bit+0xffffffffddfd6e64>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -3109,7 +3109,7 @@ _sk_gather_a8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,251,139,2,0 ; vbroadcastss 0x28bfb(%rip),%ymm1 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,183,149,2,0 ; vbroadcastss 0x295b7(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -3129,7 +3129,7 @@ _sk_store_a8_hsw LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,124,139,2,0 ; vbroadcastss 0x28b7c(%rip),%ymm8 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,56,149,2,0 ; vbroadcastss 0x29538(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -3154,13 +3154,13 @@ _sk_store_a8_hsw LABEL PROC
DB 196,3,121,20,4,24,0 ; vpextrb $0x0,%xmm8,(%r8,%r11,1)
DB 235,202 ; jmp 34f5 <_sk_store_a8_hsw+0x41>
DB 196,3,121,20,68,24,2,4 ; vpextrb $0x4,%xmm8,0x2(%r8,%r11,1)
- DB 196,98,57,0,5,228,148,2,0 ; vpshufb 0x294e4(%rip),%xmm8,%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0xe70>
+ DB 196,98,57,0,5,36,159,2,0 ; vpshufb 0x29f24(%rip),%xmm8,%xmm8 # 2d460 <_sk_overlay_sse2_8bit+0xef4>
DB 196,3,121,21,4,24,0 ; vpextrw $0x0,%xmm8,(%r8,%r11,1)
DB 235,176 ; jmp 34f5 <_sk_store_a8_hsw+0x41>
DB 196,3,121,20,68,24,6,12 ; vpextrb $0xc,%xmm8,0x6(%r8,%r11,1)
DB 196,3,121,20,68,24,5,10 ; vpextrb $0xa,%xmm8,0x5(%r8,%r11,1)
DB 196,3,121,20,68,24,4,8 ; vpextrb $0x8,%xmm8,0x4(%r8,%r11,1)
- DB 196,98,57,0,5,202,148,2,0 ; vpshufb 0x294ca(%rip),%xmm8,%xmm8 # 2ca30 <_sk_overlay_sse2_8bit+0xe80>
+ DB 196,98,57,0,5,10,159,2,0 ; vpshufb 0x29f0a(%rip),%xmm8,%xmm8 # 2d470 <_sk_overlay_sse2_8bit+0xf04>
DB 196,1,121,126,4,24 ; vmovd %xmm8,(%r8,%r11,1)
DB 235,135 ; jmp 34f5 <_sk_store_a8_hsw+0x41>
DB 102,144 ; xchg %ax,%ax
@@ -3195,13 +3195,13 @@ _sk_load_g8_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,57 ; jne 35dd <_sk_load_g8_hsw+0x51>
DB 196,130,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm0
- DB 197,249,219,5,94,148,2,0 ; vpand 0x2945e(%rip),%xmm0,%xmm0 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,249,219,5,158,158,2,0 ; vpand 0x29e9e(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,208,138,2,0 ; vbroadcastss 0x28ad0(%rip),%ymm1 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,140,148,2,0 ; vbroadcastss 0x2948c(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,77,138,2,0 ; vbroadcastss 0x28a4d(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,9,148,2,0 ; vbroadcastss 0x29409(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -3246,7 +3246,7 @@ _sk_load_g8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf003684 <_sk_overlay_sse2_8bit+0xffffffffdefd7ad4>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003684 <_sk_overlay_sse2_8bit+0xffffffffdefd7118>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -3268,13 +3268,13 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,57 ; jne 36e1 <_sk_load_g8_dst_hsw+0x51>
DB 196,130,121,48,36,24 ; vpmovzxbw (%r8,%r11,1),%xmm4
- DB 197,217,219,37,90,147,2,0 ; vpand 0x2935a(%rip),%xmm4,%xmm4 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,217,219,37,154,157,2,0 ; vpand 0x29d9a(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,204,137,2,0 ; vbroadcastss 0x289cc(%rip),%ymm5 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,45,136,147,2,0 ; vbroadcastss 0x29388(%rip),%ymm5 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,73,137,2,0 ; vbroadcastss 0x28949(%rip),%ymm7 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,61,5,147,2,0 ; vbroadcastss 0x29305(%rip),%ymm7 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 255,224 ; jmpq *%rax
@@ -3319,7 +3319,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf003788 <_sk_overlay_sse2_8bit+0xffffffffdefd7bd8>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003788 <_sk_overlay_sse2_8bit+0xffffffffdefd721c>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -3372,10 +3372,10 @@ _sk_gather_g8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,67,136,2,0 ; vbroadcastss 0x28843(%rip),%ymm1 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,255,145,2,0 ; vbroadcastss 0x291ff(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,192,135,2,0 ; vbroadcastss 0x287c0(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,124,145,2,0 ; vbroadcastss 0x2917c(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -3397,23 +3397,23 @@ _sk_load_565_hsw LABEL PROC
DB 117,114 ; jne 38fe <_sk_load_565_hsw+0x8d>
DB 196,129,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,248,135,2,0 ; vpbroadcastd 0x287f8(%rip),%ymm0 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,88,5,180,145,2,0 ; vpbroadcastd 0x291b4(%rip),%ymm0 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,235,135,2,0 ; vbroadcastss 0x287eb(%rip),%ymm1 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,13,167,145,2,0 ; vbroadcastss 0x291a7(%rip),%ymm1 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,226,135,2,0 ; vpbroadcastd 0x287e2(%rip),%ymm1 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,88,13,158,145,2,0 ; vpbroadcastd 0x2919e(%rip),%ymm1 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,213,135,2,0 ; vbroadcastss 0x287d5(%rip),%ymm3 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,29,145,145,2,0 ; vbroadcastss 0x29191(%rip),%ymm3 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,204,135,2,0 ; vpbroadcastd 0x287cc(%rip),%ymm3 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,88,29,136,145,2,0 ; vpbroadcastd 0x29188(%rip),%ymm3 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,191,135,2,0 ; vbroadcastss 0x287bf(%rip),%ymm3 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,29,123,145,2,0 ; vbroadcastss 0x2917b(%rip),%ymm3 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,36,135,2,0 ; vbroadcastss 0x28724(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,224,144,2,0 ; vbroadcastss 0x290e0(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
@@ -3474,23 +3474,23 @@ _sk_load_565_dst_hsw LABEL PROC
DB 117,114 ; jne 3a29 <_sk_load_565_dst_hsw+0x8d>
DB 196,129,122,111,36,88 ; vmovdqu (%r8,%r11,2),%xmm4
DB 196,226,125,51,244 ; vpmovzxwd %xmm4,%ymm6
- DB 196,226,125,88,37,205,134,2,0 ; vpbroadcastd 0x286cd(%rip),%ymm4 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,88,37,137,144,2,0 ; vpbroadcastd 0x29089(%rip),%ymm4 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 197,205,219,228 ; vpand %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,192,134,2,0 ; vbroadcastss 0x286c0(%rip),%ymm5 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,45,124,144,2,0 ; vbroadcastss 0x2907c(%rip),%ymm5 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,183,134,2,0 ; vpbroadcastd 0x286b7(%rip),%ymm5 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,88,45,115,144,2,0 ; vpbroadcastd 0x29073(%rip),%ymm5 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 197,205,219,237 ; vpand %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,170,134,2,0 ; vbroadcastss 0x286aa(%rip),%ymm7 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,61,102,144,2,0 ; vbroadcastss 0x29066(%rip),%ymm7 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,88,61,161,134,2,0 ; vpbroadcastd 0x286a1(%rip),%ymm7 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,88,61,93,144,2,0 ; vpbroadcastd 0x2905d(%rip),%ymm7 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 197,205,219,247 ; vpand %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,148,134,2,0 ; vbroadcastss 0x28694(%rip),%ymm7 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,61,80,144,2,0 ; vbroadcastss 0x29050(%rip),%ymm7 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,249,133,2,0 ; vbroadcastss 0x285f9(%rip),%ymm7 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,61,181,143,2,0 ; vbroadcastss 0x28fb5(%rip),%ymm7 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
@@ -3584,23 +3584,23 @@ _sk_gather_565_hsw LABEL PROC
DB 65,15,183,4,88 ; movzwl (%r8,%rbx,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,21,133,2,0 ; vpbroadcastd 0x28515(%rip),%ymm0 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,88,5,209,142,2,0 ; vpbroadcastd 0x28ed1(%rip),%ymm0 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,8,133,2,0 ; vbroadcastss 0x28508(%rip),%ymm1 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,13,196,142,2,0 ; vbroadcastss 0x28ec4(%rip),%ymm1 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,255,132,2,0 ; vpbroadcastd 0x284ff(%rip),%ymm1 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,88,13,187,142,2,0 ; vpbroadcastd 0x28ebb(%rip),%ymm1 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,242,132,2,0 ; vbroadcastss 0x284f2(%rip),%ymm3 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,29,174,142,2,0 ; vbroadcastss 0x28eae(%rip),%ymm3 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,233,132,2,0 ; vpbroadcastd 0x284e9(%rip),%ymm3 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,88,29,165,142,2,0 ; vpbroadcastd 0x28ea5(%rip),%ymm3 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,220,132,2,0 ; vbroadcastss 0x284dc(%rip),%ymm3 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,29,152,142,2,0 ; vbroadcastss 0x28e98(%rip),%ymm3 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,65,132,2,0 ; vbroadcastss 0x28441(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,253,141,2,0 ; vbroadcastss 0x28dfd(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 91 ; pop %rbx
DB 65,92 ; pop %r12
DB 65,94 ; pop %r14
@@ -3616,11 +3616,11 @@ _sk_store_565_hsw LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,5,133,2,0 ; vbroadcastss 0x28505(%rip),%ymm8 # 2c10c <_sk_overlay_sse2_8bit+0x55c>
+ DB 196,98,125,24,5,193,142,2,0 ; vbroadcastss 0x28ec1(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0x55c>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9
- DB 196,98,125,24,21,240,132,2,0 ; vbroadcastss 0x284f0(%rip),%ymm10 # 2c110 <_sk_overlay_sse2_8bit+0x560>
+ DB 196,98,125,24,21,172,142,2,0 ; vbroadcastss 0x28eac(%rip),%ymm10 # 2cacc <_sk_overlay_sse2_8bit+0x560>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10
@@ -3693,25 +3693,25 @@ _sk_load_4444_hsw LABEL PROC
DB 15,133,138,0,0,0 ; jne 3d81 <_sk_load_4444_hsw+0xa9>
DB 196,129,122,111,4,88 ; vmovdqu (%r8,%r11,2),%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,9,132,2,0 ; vpbroadcastd 0x28409(%rip),%ymm0 # 2c114 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,88,5,197,141,2,0 ; vpbroadcastd 0x28dc5(%rip),%ymm0 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,252,131,2,0 ; vbroadcastss 0x283fc(%rip),%ymm1 # 2c118 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,13,184,141,2,0 ; vbroadcastss 0x28db8(%rip),%ymm1 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,243,131,2,0 ; vpbroadcastd 0x283f3(%rip),%ymm1 # 2c11c <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,88,13,175,141,2,0 ; vpbroadcastd 0x28daf(%rip),%ymm1 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,230,131,2,0 ; vbroadcastss 0x283e6(%rip),%ymm2 # 2c120 <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,21,162,141,2,0 ; vbroadcastss 0x28da2(%rip),%ymm2 # 2cadc <_sk_overlay_sse2_8bit+0x570>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,221,131,2,0 ; vpbroadcastd 0x283dd(%rip),%ymm2 # 2c124 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,88,21,153,141,2,0 ; vpbroadcastd 0x28d99(%rip),%ymm2 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,208,131,2,0 ; vbroadcastss 0x283d0(%rip),%ymm8 # 2c128 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,140,141,2,0 ; vbroadcastss 0x28d8c(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,198,131,2,0 ; vpbroadcastd 0x283c6(%rip),%ymm8 # 2c12c <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,88,5,130,141,2,0 ; vpbroadcastd 0x28d82(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,184,131,2,0 ; vbroadcastss 0x283b8(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,116,141,2,0 ; vbroadcastss 0x28d74(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3777,25 +3777,25 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 15,133,138,0,0,0 ; jne 3ecd <_sk_load_4444_dst_hsw+0xa9>
DB 196,129,122,111,36,88 ; vmovdqu (%r8,%r11,2),%xmm4
DB 196,226,125,51,252 ; vpmovzxwd %xmm4,%ymm7
- DB 196,226,125,88,37,189,130,2,0 ; vpbroadcastd 0x282bd(%rip),%ymm4 # 2c114 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,88,37,121,140,2,0 ; vpbroadcastd 0x28c79(%rip),%ymm4 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
DB 197,197,219,228 ; vpand %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,176,130,2,0 ; vbroadcastss 0x282b0(%rip),%ymm5 # 2c118 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,45,108,140,2,0 ; vbroadcastss 0x28c6c(%rip),%ymm5 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,167,130,2,0 ; vpbroadcastd 0x282a7(%rip),%ymm5 # 2c11c <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,88,45,99,140,2,0 ; vpbroadcastd 0x28c63(%rip),%ymm5 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
DB 197,197,219,237 ; vpand %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,154,130,2,0 ; vbroadcastss 0x2829a(%rip),%ymm6 # 2c120 <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,53,86,140,2,0 ; vbroadcastss 0x28c56(%rip),%ymm6 # 2cadc <_sk_overlay_sse2_8bit+0x570>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,88,53,145,130,2,0 ; vpbroadcastd 0x28291(%rip),%ymm6 # 2c124 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,88,53,77,140,2,0 ; vpbroadcastd 0x28c4d(%rip),%ymm6 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
DB 197,197,219,246 ; vpand %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,132,130,2,0 ; vbroadcastss 0x28284(%rip),%ymm8 # 2c128 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,64,140,2,0 ; vbroadcastss 0x28c40(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,88,5,122,130,2,0 ; vpbroadcastd 0x2827a(%rip),%ymm8 # 2c12c <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,88,5,54,140,2,0 ; vpbroadcastd 0x28c36(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,108,130,2,0 ; vbroadcastss 0x2826c(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,40,140,2,0 ; vbroadcastss 0x28c28(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3891,25 +3891,25 @@ _sk_gather_4444_hsw LABEL PROC
DB 65,15,183,4,88 ; movzwl (%r8,%rbx,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,233,128,2,0 ; vpbroadcastd 0x280e9(%rip),%ymm0 # 2c114 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,88,5,165,138,2,0 ; vpbroadcastd 0x28aa5(%rip),%ymm0 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,220,128,2,0 ; vbroadcastss 0x280dc(%rip),%ymm1 # 2c118 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,13,152,138,2,0 ; vbroadcastss 0x28a98(%rip),%ymm1 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,211,128,2,0 ; vpbroadcastd 0x280d3(%rip),%ymm1 # 2c11c <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,88,13,143,138,2,0 ; vpbroadcastd 0x28a8f(%rip),%ymm1 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,198,128,2,0 ; vbroadcastss 0x280c6(%rip),%ymm2 # 2c120 <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,21,130,138,2,0 ; vbroadcastss 0x28a82(%rip),%ymm2 # 2cadc <_sk_overlay_sse2_8bit+0x570>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,189,128,2,0 ; vpbroadcastd 0x280bd(%rip),%ymm2 # 2c124 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,88,21,121,138,2,0 ; vpbroadcastd 0x28a79(%rip),%ymm2 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,176,128,2,0 ; vbroadcastss 0x280b0(%rip),%ymm8 # 2c128 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,108,138,2,0 ; vbroadcastss 0x28a6c(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,166,128,2,0 ; vpbroadcastd 0x280a6(%rip),%ymm8 # 2c12c <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,88,5,98,138,2,0 ; vpbroadcastd 0x28a62(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,152,128,2,0 ; vbroadcastss 0x28098(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,84,138,2,0 ; vbroadcastss 0x28a54(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3927,7 +3927,7 @@ _sk_store_4444_hsw LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,109,128,2,0 ; vbroadcastss 0x2806d(%rip),%ymm8 # 2c134 <_sk_overlay_sse2_8bit+0x584>
+ DB 196,98,125,24,5,41,138,2,0 ; vbroadcastss 0x28a29(%rip),%ymm8 # 2caf0 <_sk_overlay_sse2_8bit+0x584>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9
@@ -4006,14 +4006,14 @@ _sk_load_8888_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,86 ; jne 4216 <_sk_load_8888_hsw+0x72>
DB 196,129,126,111,28,152 ; vmovdqu (%r8,%r11,4),%ymm3
- DB 197,229,219,5,242,128,2,0 ; vpand 0x280f2(%rip),%ymm3,%ymm0 # 2c2c0 <_sk_overlay_sse2_8bit+0x710>
+ DB 197,229,219,5,178,138,2,0 ; vpand 0x28ab2(%rip),%ymm3,%ymm0 # 2cc80 <_sk_overlay_sse2_8bit+0x714>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,185,126,2,0 ; vbroadcastss 0x27eb9(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,117,136,2,0 ; vbroadcastss 0x28875(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,247,128,2,0 ; vpshufb 0x280f7(%rip),%ymm3,%ymm1 # 2c2e0 <_sk_overlay_sse2_8bit+0x730>
+ DB 196,226,101,0,13,183,138,2,0 ; vpshufb 0x28ab7(%rip),%ymm3,%ymm1 # 2cca0 <_sk_overlay_sse2_8bit+0x734>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,5,129,2,0 ; vpshufb 0x28105(%rip),%ymm3,%ymm2 # 2c300 <_sk_overlay_sse2_8bit+0x750>
+ DB 196,226,101,0,21,197,138,2,0 ; vpshufb 0x28ac5(%rip),%ymm3,%ymm2 # 2ccc0 <_sk_overlay_sse2_8bit+0x754>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4087,14 +4087,14 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,86 ; jne 434a <_sk_load_8888_dst_hsw+0x72>
DB 196,129,126,111,60,152 ; vmovdqu (%r8,%r11,4),%ymm7
- DB 197,197,219,37,30,128,2,0 ; vpand 0x2801e(%rip),%ymm7,%ymm4 # 2c320 <_sk_overlay_sse2_8bit+0x770>
+ DB 197,197,219,37,222,137,2,0 ; vpand 0x289de(%rip),%ymm7,%ymm4 # 2cce0 <_sk_overlay_sse2_8bit+0x774>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,133,125,2,0 ; vbroadcastss 0x27d85(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,65,135,2,0 ; vbroadcastss 0x28741(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
- DB 196,226,69,0,45,35,128,2,0 ; vpshufb 0x28023(%rip),%ymm7,%ymm5 # 2c340 <_sk_overlay_sse2_8bit+0x790>
+ DB 196,226,69,0,45,227,137,2,0 ; vpshufb 0x289e3(%rip),%ymm7,%ymm5 # 2cd00 <_sk_overlay_sse2_8bit+0x794>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
DB 196,193,84,89,232 ; vmulps %ymm8,%ymm5,%ymm5
- DB 196,226,69,0,53,49,128,2,0 ; vpshufb 0x28031(%rip),%ymm7,%ymm6 # 2c360 <_sk_overlay_sse2_8bit+0x7b0>
+ DB 196,226,69,0,53,241,137,2,0 ; vpshufb 0x289f1(%rip),%ymm7,%ymm6 # 2cd20 <_sk_overlay_sse2_8bit+0x7b4>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -4167,14 +4167,14 @@ _sk_gather_8888_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,128 ; vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- DB 197,229,219,5,70,127,2,0 ; vpand 0x27f46(%rip),%ymm3,%ymm0 # 2c380 <_sk_overlay_sse2_8bit+0x7d0>
+ DB 197,229,219,5,6,137,2,0 ; vpand 0x28906(%rip),%ymm3,%ymm0 # 2cd40 <_sk_overlay_sse2_8bit+0x7d4>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,77,124,2,0 ; vbroadcastss 0x27c4d(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,9,134,2,0 ; vbroadcastss 0x28609(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,75,127,2,0 ; vpshufb 0x27f4b(%rip),%ymm3,%ymm1 # 2c3a0 <_sk_overlay_sse2_8bit+0x7f0>
+ DB 196,226,101,0,13,11,137,2,0 ; vpshufb 0x2890b(%rip),%ymm3,%ymm1 # 2cd60 <_sk_overlay_sse2_8bit+0x7f4>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,89,127,2,0 ; vpshufb 0x27f59(%rip),%ymm3,%ymm2 # 2c3c0 <_sk_overlay_sse2_8bit+0x810>
+ DB 196,226,101,0,21,25,137,2,0 ; vpshufb 0x28919(%rip),%ymm3,%ymm2 # 2cd80 <_sk_overlay_sse2_8bit+0x814>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4192,7 +4192,7 @@ _sk_store_8888_hsw LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,170,123,2,0 ; vbroadcastss 0x27baa(%rip),%ymm8 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,102,133,2,0 ; vbroadcastss 0x28566(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4269,14 +4269,14 @@ _sk_load_bgra_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,86 ; jne 45f6 <_sk_load_bgra_hsw+0x72>
DB 196,129,126,111,28,152 ; vmovdqu (%r8,%r11,4),%ymm3
- DB 197,229,219,5,50,126,2,0 ; vpand 0x27e32(%rip),%ymm3,%ymm0 # 2c3e0 <_sk_overlay_sse2_8bit+0x830>
+ DB 197,229,219,5,242,135,2,0 ; vpand 0x287f2(%rip),%ymm3,%ymm0 # 2cda0 <_sk_overlay_sse2_8bit+0x834>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,217,122,2,0 ; vbroadcastss 0x27ad9(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,149,132,2,0 ; vbroadcastss 0x28495(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,55,126,2,0 ; vpshufb 0x27e37(%rip),%ymm3,%ymm0 # 2c400 <_sk_overlay_sse2_8bit+0x850>
+ DB 196,226,101,0,5,247,135,2,0 ; vpshufb 0x287f7(%rip),%ymm3,%ymm0 # 2cdc0 <_sk_overlay_sse2_8bit+0x854>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,69,126,2,0 ; vpshufb 0x27e45(%rip),%ymm3,%ymm0 # 2c420 <_sk_overlay_sse2_8bit+0x870>
+ DB 196,226,101,0,5,5,136,2,0 ; vpshufb 0x28805(%rip),%ymm3,%ymm0 # 2cde0 <_sk_overlay_sse2_8bit+0x874>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4350,14 +4350,14 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,86 ; jne 472a <_sk_load_bgra_dst_hsw+0x72>
DB 196,129,126,111,60,152 ; vmovdqu (%r8,%r11,4),%ymm7
- DB 197,197,219,37,94,125,2,0 ; vpand 0x27d5e(%rip),%ymm7,%ymm4 # 2c440 <_sk_overlay_sse2_8bit+0x890>
+ DB 197,197,219,37,30,135,2,0 ; vpand 0x2871e(%rip),%ymm7,%ymm4 # 2ce00 <_sk_overlay_sse2_8bit+0x894>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,165,121,2,0 ; vbroadcastss 0x279a5(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,97,131,2,0 ; vbroadcastss 0x28361(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,92,89,240 ; vmulps %ymm8,%ymm4,%ymm6
- DB 196,226,69,0,37,99,125,2,0 ; vpshufb 0x27d63(%rip),%ymm7,%ymm4 # 2c460 <_sk_overlay_sse2_8bit+0x8b0>
+ DB 196,226,69,0,37,35,135,2,0 ; vpshufb 0x28723(%rip),%ymm7,%ymm4 # 2ce20 <_sk_overlay_sse2_8bit+0x8b4>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,232 ; vmulps %ymm8,%ymm4,%ymm5
- DB 196,226,69,0,37,113,125,2,0 ; vpshufb 0x27d71(%rip),%ymm7,%ymm4 # 2c480 <_sk_overlay_sse2_8bit+0x8d0>
+ DB 196,226,69,0,37,49,135,2,0 ; vpshufb 0x28731(%rip),%ymm7,%ymm4 # 2ce40 <_sk_overlay_sse2_8bit+0x8d4>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -4430,14 +4430,14 @@ _sk_gather_bgra_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,128 ; vpgatherdd %ymm1,(%r8,%ymm0,4),%ymm3
- DB 197,229,219,5,134,124,2,0 ; vpand 0x27c86(%rip),%ymm3,%ymm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x8f0>
+ DB 197,229,219,5,70,134,2,0 ; vpand 0x28646(%rip),%ymm3,%ymm0 # 2ce60 <_sk_overlay_sse2_8bit+0x8f4>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,109,120,2,0 ; vbroadcastss 0x2786d(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,41,130,2,0 ; vbroadcastss 0x28229(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,139,124,2,0 ; vpshufb 0x27c8b(%rip),%ymm3,%ymm0 # 2c4c0 <_sk_overlay_sse2_8bit+0x910>
+ DB 196,226,101,0,5,75,134,2,0 ; vpshufb 0x2864b(%rip),%ymm3,%ymm0 # 2ce80 <_sk_overlay_sse2_8bit+0x914>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,153,124,2,0 ; vpshufb 0x27c99(%rip),%ymm3,%ymm0 # 2c4e0 <_sk_overlay_sse2_8bit+0x930>
+ DB 196,226,101,0,5,89,134,2,0 ; vpshufb 0x28659(%rip),%ymm3,%ymm0 # 2cea0 <_sk_overlay_sse2_8bit+0x934>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4455,7 +4455,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,202,119,2,0 ; vbroadcastss 0x277ca(%rip),%ymm8 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,134,129,2,0 ; vbroadcastss 0x28186(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4753,7 +4753,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,119,115,2,0 ; vbroadcastss 0x27377(%rip),%ymm10 # 2c0b0 <_sk_overlay_sse2_8bit+0x500>
+ DB 196,98,125,24,21,51,125,2,0 ; vbroadcastss 0x27d33(%rip),%ymm10 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4842,7 +4842,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,225,235,192 ; vpor %xmm0,%xmm3,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,29,234,113,2,0 ; vbroadcastss 0x271ea(%rip),%ymm3 # 2c0b0 <_sk_overlay_sse2_8bit+0x500>
+ DB 196,226,125,24,29,166,123,2,0 ; vbroadcastss 0x27ba6(%rip),%ymm3 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
DB 197,185,109,201 ; vpunpckhqdq %xmm1,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4859,7 +4859,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,12,113,2,0 ; vbroadcastss 0x2710c(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,200,122,2,0 ; vbroadcastss 0x27ac8(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,64 ; vmovd (%r8,%rax,2),%xmm0
DB 196,65,121,196,92,64,4,2 ; vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
@@ -4933,7 +4933,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
- DB 196,98,125,24,5,204,112,2,0 ; vbroadcastss 0x270cc(%rip),%ymm8 # 2c138 <_sk_overlay_sse2_8bit+0x588>
+ DB 196,98,125,24,5,136,122,2,0 ; vbroadcastss 0x27a88(%rip),%ymm8 # 2caf4 <_sk_overlay_sse2_8bit+0x588>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -5190,7 +5190,7 @@ _sk_load_f32_dst_hsw LABEL PROC
DB 255,92,255,255 ; lcall *-0x1(%rdi,%rdi,8)
DB 255,70,255 ; incl -0x1(%rsi)
DB 255 ; (bad)
- DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 290054e4 <_sk_overlay_sse2_8bit+0x28fd9934>
+ DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 290054e4 <_sk_overlay_sse2_8bit+0x28fd8f78>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -5309,7 +5309,7 @@ _sk_mirror_x_hsw LABEL PROC
DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8
- DB 197,178,89,5,135,105,2,0 ; vmulss 0x26987(%rip),%xmm9,%xmm0 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 197,178,89,5,67,115,2,0 ; vmulss 0x27343(%rip),%xmm9,%xmm0 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0
@@ -5334,7 +5334,7 @@ _sk_mirror_y_hsw LABEL PROC
DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8
- DB 197,178,89,13,35,105,2,0 ; vmulss 0x26923(%rip),%xmm9,%xmm1 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 197,178,89,13,223,114,2,0 ; vmulss 0x272df(%rip),%xmm9,%xmm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1
@@ -5354,7 +5354,7 @@ PUBLIC _sk_clamp_x_1_hsw
_sk_clamp_x_1_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,216,104,2,0 ; vbroadcastss 0x268d8(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,148,114,2,0 ; vbroadcastss 0x27294(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -5368,9 +5368,9 @@ _sk_repeat_x_1_hsw LABEL PROC
PUBLIC _sk_mirror_x_1_hsw
_sk_mirror_x_1_hsw LABEL PROC
- DB 196,98,125,24,5,207,104,2,0 ; vbroadcastss 0x268cf(%rip),%ymm8 # 2c038 <_sk_overlay_sse2_8bit+0x488>
+ DB 196,98,125,24,5,139,114,2,0 ; vbroadcastss 0x2728b(%rip),%ymm8 # 2c9f4 <_sk_overlay_sse2_8bit+0x488>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,165,104,2,0 ; vbroadcastss 0x268a5(%rip),%ymm9 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,13,97,114,2,0 ; vbroadcastss 0x27261(%rip),%ymm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -5384,11 +5384,11 @@ _sk_mirror_x_1_hsw LABEL PROC
PUBLIC _sk_luminance_to_alpha_hsw
_sk_luminance_to_alpha_hsw LABEL PROC
- DB 196,226,125,24,29,145,105,2,0 ; vbroadcastss 0x26991(%rip),%ymm3 # 2c13c <_sk_overlay_sse2_8bit+0x58c>
- DB 196,98,125,24,5,140,105,2,0 ; vbroadcastss 0x2698c(%rip),%ymm8 # 2c140 <_sk_overlay_sse2_8bit+0x590>
+ DB 196,226,125,24,29,77,115,2,0 ; vbroadcastss 0x2734d(%rip),%ymm3 # 2caf8 <_sk_overlay_sse2_8bit+0x58c>
+ DB 196,98,125,24,5,72,115,2,0 ; vbroadcastss 0x27348(%rip),%ymm8 # 2cafc <_sk_overlay_sse2_8bit+0x590>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1
- DB 196,226,125,24,29,125,105,2,0 ; vbroadcastss 0x2697d(%rip),%ymm3 # 2c144 <_sk_overlay_sse2_8bit+0x594>
+ DB 196,226,125,24,29,57,115,2,0 ; vbroadcastss 0x27339(%rip),%ymm3 # 2cb00 <_sk_overlay_sse2_8bit+0x594>
DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -5634,14 +5634,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_hsw
_sk_gauss_a_to_rgba_hsw LABEL PROC
- DB 196,226,125,24,5,135,101,2,0 ; vbroadcastss 0x26587(%rip),%ymm0 # 2c148 <_sk_overlay_sse2_8bit+0x598>
- DB 196,226,125,24,13,130,101,2,0 ; vbroadcastss 0x26582(%rip),%ymm1 # 2c14c <_sk_overlay_sse2_8bit+0x59c>
+ DB 196,226,125,24,5,67,111,2,0 ; vbroadcastss 0x26f43(%rip),%ymm0 # 2cb04 <_sk_overlay_sse2_8bit+0x598>
+ DB 196,226,125,24,13,62,111,2,0 ; vbroadcastss 0x26f3e(%rip),%ymm1 # 2cb08 <_sk_overlay_sse2_8bit+0x59c>
DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,120,101,2,0 ; vbroadcastss 0x26578(%rip),%ymm0 # 2c150 <_sk_overlay_sse2_8bit+0x5a0>
+ DB 196,226,125,24,5,52,111,2,0 ; vbroadcastss 0x26f34(%rip),%ymm0 # 2cb0c <_sk_overlay_sse2_8bit+0x5a0>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
- DB 196,226,125,24,13,110,101,2,0 ; vbroadcastss 0x2656e(%rip),%ymm1 # 2c154 <_sk_overlay_sse2_8bit+0x5a4>
+ DB 196,226,125,24,13,42,111,2,0 ; vbroadcastss 0x26f2a(%rip),%ymm1 # 2cb10 <_sk_overlay_sse2_8bit+0x5a4>
DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,100,101,2,0 ; vbroadcastss 0x26564(%rip),%ymm0 # 2c158 <_sk_overlay_sse2_8bit+0x5a8>
+ DB 196,226,125,24,5,32,111,2,0 ; vbroadcastss 0x26f20(%rip),%ymm0 # 2cb14 <_sk_overlay_sse2_8bit+0x5a8>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -5658,7 +5658,7 @@ _sk_gradient_hsw LABEL PROC
DB 76,139,72,72 ; mov 0x48(%rax),%r9
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 65,186,1,0,0,0 ; mov $0x1,%r10d
- DB 196,226,125,24,21,245,99,2,0 ; vbroadcastss 0x263f5(%rip),%ymm2 # 2c024 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,226,125,24,21,177,109,2,0 ; vbroadcastss 0x26db1(%rip),%ymm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
DB 196,130,125,24,28,145 ; vbroadcastss (%r9,%r10,4),%ymm3
DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3
@@ -5749,24 +5749,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,168,99,2,0 ; vbroadcastss 0x263a8(%rip),%ymm13 # 2c15c <_sk_overlay_sse2_8bit+0x5ac>
- DB 196,98,125,24,53,163,99,2,0 ; vbroadcastss 0x263a3(%rip),%ymm14 # 2c160 <_sk_overlay_sse2_8bit+0x5b0>
+ DB 196,98,125,24,45,100,109,2,0 ; vbroadcastss 0x26d64(%rip),%ymm13 # 2cb18 <_sk_overlay_sse2_8bit+0x5ac>
+ DB 196,98,125,24,53,95,109,2,0 ; vbroadcastss 0x26d5f(%rip),%ymm14 # 2cb1c <_sk_overlay_sse2_8bit+0x5b0>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
- DB 196,98,125,24,45,153,99,2,0 ; vbroadcastss 0x26399(%rip),%ymm13 # 2c164 <_sk_overlay_sse2_8bit+0x5b4>
+ DB 196,98,125,24,45,85,109,2,0 ; vbroadcastss 0x26d55(%rip),%ymm13 # 2cb20 <_sk_overlay_sse2_8bit+0x5b4>
DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13
- DB 196,98,125,24,53,143,99,2,0 ; vbroadcastss 0x2638f(%rip),%ymm14 # 2c168 <_sk_overlay_sse2_8bit+0x5b8>
+ DB 196,98,125,24,53,75,109,2,0 ; vbroadcastss 0x26d4b(%rip),%ymm14 # 2cb24 <_sk_overlay_sse2_8bit+0x5b8>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,122,99,2,0 ; vbroadcastss 0x2637a(%rip),%ymm10 # 2c16c <_sk_overlay_sse2_8bit+0x5bc>
+ DB 196,98,125,24,21,54,109,2,0 ; vbroadcastss 0x26d36(%rip),%ymm10 # 2cb28 <_sk_overlay_sse2_8bit+0x5bc>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,16,98,2,0 ; vbroadcastss 0x26210(%rip),%ymm10 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,21,204,107,2,0 ; vbroadcastss 0x26bcc(%rip),%ymm10 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,250,97,2,0 ; vbroadcastss 0x261fa(%rip),%ymm10 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,21,182,107,2,0 ; vbroadcastss 0x26bb6(%rip),%ymm10 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -5790,23 +5790,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,250,98,2,0 ; vbroadcastss 0x262fa(%rip),%ymm11 # 2c170 <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,29,182,108,2,0 ; vbroadcastss 0x26cb6(%rip),%ymm11 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,217,98,2,0 ; vbroadcastss 0x262d9(%rip),%ymm9 # 2c174 <_sk_overlay_sse2_8bit+0x5c4>
+ DB 196,98,125,24,13,149,108,2,0 ; vbroadcastss 0x26c95(%rip),%ymm9 # 2cb30 <_sk_overlay_sse2_8bit+0x5c4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,188,98,2,0 ; vbroadcastss 0x262bc(%rip),%ymm9 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,120,108,2,0 ; vbroadcastss 0x26c78(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,77,97,2,0 ; vbroadcastss 0x2614d(%rip),%ymm11 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,9,107,2,0 ; vbroadcastss 0x26b09(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5823,23 +5823,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,98,98,2,0 ; vbroadcastss 0x26262(%rip),%ymm11 # 2c170 <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,29,30,108,2,0 ; vbroadcastss 0x26c1e(%rip),%ymm11 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,65,98,2,0 ; vbroadcastss 0x26241(%rip),%ymm9 # 2c174 <_sk_overlay_sse2_8bit+0x5c4>
+ DB 196,98,125,24,13,253,107,2,0 ; vbroadcastss 0x26bfd(%rip),%ymm9 # 2cb30 <_sk_overlay_sse2_8bit+0x5c4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,36,98,2,0 ; vbroadcastss 0x26224(%rip),%ymm9 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,224,107,2,0 ; vbroadcastss 0x26be0(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,181,96,2,0 ; vbroadcastss 0x260b5(%rip),%ymm11 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,113,106,2,0 ; vbroadcastss 0x26a71(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5855,14 +5855,14 @@ _sk_xy_to_2pt_conical_linear_hsw LABEL PROC
DB 197,58,89,72,44 ; vmulss 0x2c(%rax),%xmm8,%xmm9
DB 196,66,125,24,201 ; vbroadcastss %xmm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,208,97,2,0 ; vbroadcastss 0x261d0(%rip),%ymm10 # 2c170 <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,21,140,107,2,0 ; vbroadcastss 0x26b8c(%rip),%ymm10 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
DB 196,98,125,184,208 ; vfmadd231ps %ymm0,%ymm0,%ymm10
DB 196,193,58,89,192 ; vmulss %xmm8,%xmm8,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,179,97,2,0 ; vbroadcastss 0x261b3(%rip),%ymm8 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,5,111,107,2,0 ; vbroadcastss 0x26b6f(%rip),%ymm8 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5896,7 +5896,7 @@ _sk_apply_vector_mask_hsw LABEL PROC
PUBLIC _sk_save_xy_hsw
_sk_save_xy_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,243,95,2,0 ; vbroadcastss 0x25ff3(%rip),%ymm8 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,175,105,2,0 ; vbroadcastss 0x269af(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -5926,9 +5926,9 @@ _sk_accumulate_hsw LABEL PROC
PUBLIC _sk_bilinear_nx_hsw
_sk_bilinear_nx_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,227,96,2,0 ; vbroadcastss 0x260e3(%rip),%ymm0 # 2c17c <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,5,159,106,2,0 ; vbroadcastss 0x26a9f(%rip),%ymm0 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,122,95,2,0 ; vbroadcastss 0x25f7a(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,54,105,2,0 ; vbroadcastss 0x26936(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5937,7 +5937,7 @@ _sk_bilinear_nx_hsw LABEL PROC
PUBLIC _sk_bilinear_px_hsw
_sk_bilinear_px_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,90,95,2,0 ; vbroadcastss 0x25f5a(%rip),%ymm0 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,5,22,105,2,0 ; vbroadcastss 0x26916(%rip),%ymm0 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5947,9 +5947,9 @@ _sk_bilinear_px_hsw LABEL PROC
PUBLIC _sk_bilinear_ny_hsw
_sk_bilinear_ny_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,154,96,2,0 ; vbroadcastss 0x2609a(%rip),%ymm1 # 2c17c <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,13,86,106,2,0 ; vbroadcastss 0x26a56(%rip),%ymm1 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,48,95,2,0 ; vbroadcastss 0x25f30(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,236,104,2,0 ; vbroadcastss 0x268ec(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5958,7 +5958,7 @@ _sk_bilinear_ny_hsw LABEL PROC
PUBLIC _sk_bilinear_py_hsw
_sk_bilinear_py_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,16,95,2,0 ; vbroadcastss 0x25f10(%rip),%ymm1 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,13,204,104,2,0 ; vbroadcastss 0x268cc(%rip),%ymm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5968,13 +5968,13 @@ _sk_bilinear_py_hsw LABEL PROC
PUBLIC _sk_bicubic_n3x_hsw
_sk_bicubic_n3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,83,96,2,0 ; vbroadcastss 0x26053(%rip),%ymm0 # 2c180 <_sk_overlay_sse2_8bit+0x5d0>
+ DB 196,226,125,24,5,15,106,2,0 ; vbroadcastss 0x26a0f(%rip),%ymm0 # 2cb3c <_sk_overlay_sse2_8bit+0x5d0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,230,94,2,0 ; vbroadcastss 0x25ee6(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,162,104,2,0 ; vbroadcastss 0x268a2(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,67,95,2,0 ; vbroadcastss 0x25f43(%rip),%ymm10 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
- DB 196,98,125,24,29,46,96,2,0 ; vbroadcastss 0x2602e(%rip),%ymm11 # 2c184 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,255,104,2,0 ; vbroadcastss 0x268ff(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,29,234,105,2,0 ; vbroadcastss 0x269ea(%rip),%ymm11 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5984,16 +5984,16 @@ _sk_bicubic_n3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n1x_hsw
_sk_bicubic_n1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,5,96,2,0 ; vbroadcastss 0x26005(%rip),%ymm0 # 2c17c <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,5,193,105,2,0 ; vbroadcastss 0x269c1(%rip),%ymm0 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,156,94,2,0 ; vbroadcastss 0x25e9c(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,88,104,2,0 ; vbroadcastss 0x26858(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,246,95,2,0 ; vbroadcastss 0x25ff6(%rip),%ymm9 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
- DB 196,98,125,24,21,241,95,2,0 ; vbroadcastss 0x25ff1(%rip),%ymm10 # 2c18c <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,13,178,105,2,0 ; vbroadcastss 0x269b2(%rip),%ymm9 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,21,173,105,2,0 ; vbroadcastss 0x269ad(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,115,94,2,0 ; vbroadcastss 0x25e73(%rip),%ymm9 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,13,47,104,2,0 ; vbroadcastss 0x2682f(%rip),%ymm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,217,95,2,0 ; vbroadcastss 0x25fd9(%rip),%ymm10 # 2c190 <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,21,149,105,2,0 ; vbroadcastss 0x26995(%rip),%ymm10 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -6002,14 +6002,14 @@ _sk_bicubic_n1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p1x_hsw
_sk_bicubic_p1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,73,94,2,0 ; vbroadcastss 0x25e49(%rip),%ymm8 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,5,104,2,0 ; vbroadcastss 0x26805(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,163,95,2,0 ; vbroadcastss 0x25fa3(%rip),%ymm10 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
- DB 196,98,125,24,29,158,95,2,0 ; vbroadcastss 0x25f9e(%rip),%ymm11 # 2c18c <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,21,95,105,2,0 ; vbroadcastss 0x2695f(%rip),%ymm10 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,29,90,105,2,0 ; vbroadcastss 0x2695a(%rip),%ymm11 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,143,95,2,0 ; vbroadcastss 0x25f8f(%rip),%ymm8 # 2c190 <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,5,75,105,2,0 ; vbroadcastss 0x2694b(%rip),%ymm8 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -6018,12 +6018,12 @@ _sk_bicubic_p1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p3x_hsw
_sk_bicubic_p3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,107,95,2,0 ; vbroadcastss 0x25f6b(%rip),%ymm0 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,226,125,24,5,39,105,2,0 ; vbroadcastss 0x26927(%rip),%ymm0 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,92,94,2,0 ; vbroadcastss 0x25e5c(%rip),%ymm10 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
- DB 196,98,125,24,29,71,95,2,0 ; vbroadcastss 0x25f47(%rip),%ymm11 # 2c184 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,24,104,2,0 ; vbroadcastss 0x26818(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,29,3,105,2,0 ; vbroadcastss 0x26903(%rip),%ymm11 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -6033,13 +6033,13 @@ _sk_bicubic_p3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n3y_hsw
_sk_bicubic_n3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,34,95,2,0 ; vbroadcastss 0x25f22(%rip),%ymm1 # 2c180 <_sk_overlay_sse2_8bit+0x5d0>
+ DB 196,226,125,24,13,222,104,2,0 ; vbroadcastss 0x268de(%rip),%ymm1 # 2cb3c <_sk_overlay_sse2_8bit+0x5d0>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,180,93,2,0 ; vbroadcastss 0x25db4(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,112,103,2,0 ; vbroadcastss 0x26770(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,17,94,2,0 ; vbroadcastss 0x25e11(%rip),%ymm10 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
- DB 196,98,125,24,29,252,94,2,0 ; vbroadcastss 0x25efc(%rip),%ymm11 # 2c184 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,205,103,2,0 ; vbroadcastss 0x267cd(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,29,184,104,2,0 ; vbroadcastss 0x268b8(%rip),%ymm11 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -6049,16 +6049,16 @@ _sk_bicubic_n3y_hsw LABEL PROC
PUBLIC _sk_bicubic_n1y_hsw
_sk_bicubic_n1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,211,94,2,0 ; vbroadcastss 0x25ed3(%rip),%ymm1 # 2c17c <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,13,143,104,2,0 ; vbroadcastss 0x2688f(%rip),%ymm1 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,105,93,2,0 ; vbroadcastss 0x25d69(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,37,103,2,0 ; vbroadcastss 0x26725(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,195,94,2,0 ; vbroadcastss 0x25ec3(%rip),%ymm9 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
- DB 196,98,125,24,21,190,94,2,0 ; vbroadcastss 0x25ebe(%rip),%ymm10 # 2c18c <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,13,127,104,2,0 ; vbroadcastss 0x2687f(%rip),%ymm9 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,21,122,104,2,0 ; vbroadcastss 0x2687a(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,64,93,2,0 ; vbroadcastss 0x25d40(%rip),%ymm9 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,13,252,102,2,0 ; vbroadcastss 0x266fc(%rip),%ymm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,166,94,2,0 ; vbroadcastss 0x25ea6(%rip),%ymm10 # 2c190 <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,21,98,104,2,0 ; vbroadcastss 0x26862(%rip),%ymm10 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -6067,14 +6067,14 @@ _sk_bicubic_n1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p1y_hsw
_sk_bicubic_p1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,22,93,2,0 ; vbroadcastss 0x25d16(%rip),%ymm8 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,210,102,2,0 ; vbroadcastss 0x266d2(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,111,94,2,0 ; vbroadcastss 0x25e6f(%rip),%ymm10 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
- DB 196,98,125,24,29,106,94,2,0 ; vbroadcastss 0x25e6a(%rip),%ymm11 # 2c18c <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,21,43,104,2,0 ; vbroadcastss 0x2682b(%rip),%ymm10 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,29,38,104,2,0 ; vbroadcastss 0x26826(%rip),%ymm11 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,91,94,2,0 ; vbroadcastss 0x25e5b(%rip),%ymm8 # 2c190 <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,5,23,104,2,0 ; vbroadcastss 0x26817(%rip),%ymm8 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -6083,12 +6083,12 @@ _sk_bicubic_p1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p3y_hsw
_sk_bicubic_p3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,55,94,2,0 ; vbroadcastss 0x25e37(%rip),%ymm1 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,226,125,24,13,243,103,2,0 ; vbroadcastss 0x267f3(%rip),%ymm1 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,39,93,2,0 ; vbroadcastss 0x25d27(%rip),%ymm10 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
- DB 196,98,125,24,29,18,94,2,0 ; vbroadcastss 0x25e12(%rip),%ymm11 # 2c184 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,227,102,2,0 ; vbroadcastss 0x266e3(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,29,206,103,2,0 ; vbroadcastss 0x267ce(%rip),%ymm11 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -6214,19 +6214,19 @@ _sk_clut_3D_hsw LABEL PROC
DB 197,254,127,76,36,32 ; vmovdqu %ymm1,0x20(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
- DB 196,226,125,88,61,240,91,2,0 ; vpbroadcastd 0x25bf0(%rip),%ymm7 # 2c198 <_sk_overlay_sse2_8bit+0x5e8>
+ DB 196,226,125,88,61,172,101,2,0 ; vpbroadcastd 0x265ac(%rip),%ymm7 # 2cb54 <_sk_overlay_sse2_8bit+0x5e8>
DB 196,226,117,64,207 ; vpmulld %ymm7,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,98,77,146,4,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- DB 196,98,125,88,21,100,90,2,0 ; vpbroadcastd 0x25a64(%rip),%ymm10 # 2c024 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,88,21,32,100,2,0 ; vpbroadcastd 0x26420(%rip),%ymm10 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
DB 196,193,117,254,242 ; vpaddd %ymm10,%ymm1,%ymm6
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
DB 196,226,37,146,28,176 ; vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- DB 196,98,125,88,29,83,90,2,0 ; vpbroadcastd 0x25a53(%rip),%ymm11 # 2c02c <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,125,88,29,15,100,2,0 ; vpbroadcastd 0x2640f(%rip),%ymm11 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
DB 196,193,117,254,203 ; vpaddd %ymm11,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,226,77,146,36,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- DB 196,98,125,24,45,163,91,2,0 ; vbroadcastss 0x25ba3(%rip),%ymm13 # 2c194 <_sk_overlay_sse2_8bit+0x5e4>
+ DB 196,98,125,24,45,95,101,2,0 ; vbroadcastss 0x2655f(%rip),%ymm13 # 2cb50 <_sk_overlay_sse2_8bit+0x5e4>
DB 196,193,124,88,245 ; vaddps %ymm13,%ymm0,%ymm6
DB 197,254,91,246 ; vcvttps2dq %ymm6,%ymm6
DB 196,226,77,64,205 ; vpmulld %ymm5,%ymm6,%ymm1
@@ -6444,19 +6444,19 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,126,91,245 ; vcvttps2dq %ymm5,%ymm14
DB 196,98,13,64,233 ; vpmulld %ymm1,%ymm14,%ymm13
DB 197,149,254,198 ; vpaddd %ymm6,%ymm13,%ymm0
- DB 196,98,125,88,21,28,87,2,0 ; vpbroadcastd 0x2571c(%rip),%ymm10 # 2c198 <_sk_overlay_sse2_8bit+0x5e8>
+ DB 196,98,125,88,21,216,96,2,0 ; vpbroadcastd 0x260d8(%rip),%ymm10 # 2cb54 <_sk_overlay_sse2_8bit+0x5e8>
DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,98,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- DB 196,98,125,88,29,143,85,2,0 ; vpbroadcastd 0x2558f(%rip),%ymm11 # 2c024 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,88,29,75,95,2,0 ; vpbroadcastd 0x25f4b(%rip),%ymm11 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
DB 196,65,125,254,195 ; vpaddd %ymm11,%ymm0,%ymm8
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,162,53,146,20,128 ; vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- DB 196,98,125,88,37,126,85,2,0 ; vpbroadcastd 0x2557e(%rip),%ymm12 # 2c02c <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,125,88,37,58,95,2,0 ; vpbroadcastd 0x25f3a(%rip),%ymm12 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,226,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- DB 196,98,125,24,13,205,86,2,0 ; vbroadcastss 0x256cd(%rip),%ymm9 # 2c194 <_sk_overlay_sse2_8bit+0x5e4>
+ DB 196,98,125,24,13,137,96,2,0 ; vbroadcastss 0x26089(%rip),%ymm9 # 2cb50 <_sk_overlay_sse2_8bit+0x5e4>
DB 196,65,84,88,193 ; vaddps %ymm9,%ymm5,%ymm8
DB 196,65,126,91,192 ; vcvttps2dq %ymm8,%ymm8
DB 196,226,61,64,193 ; vpmulld %ymm1,%ymm8,%ymm0
@@ -6781,7 +6781,7 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,196,92,214 ; vsubps %ymm6,%ymm7,%ymm2
DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,92,78,2,0 ; vbroadcastss 0x24e5c(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,24,88,2,0 ; vbroadcastss 0x25818(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,16,164,36,160,3,0,0 ; vmovups 0x3a0(%rsp),%ymm4
DB 197,252,16,172,36,192,3,0,0 ; vmovups 0x3c0(%rsp),%ymm5
DB 197,252,16,180,36,224,3,0,0 ; vmovups 0x3e0(%rsp),%ymm6
@@ -6882,16 +6882,16 @@ _sk_seed_shader_avx LABEL PROC
DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,204,76,2,0 ; vbroadcastss 0x24ccc(%rip),%ymm1 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,13,136,86,2,0 ; vbroadcastss 0x25688(%rip),%ymm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 197,252,88,5,164,81,2,0 ; vaddps 0x251a4(%rip),%ymm0,%ymm0 # 2c500 <_sk_overlay_sse2_8bit+0x950>
+ DB 197,252,88,5,100,91,2,0 ; vaddps 0x25b64(%rip),%ymm0,%ymm0 # 2cec0 <_sk_overlay_sse2_8bit+0x954>
DB 197,249,110,209 ; vmovd %ecx,%xmm2
DB 197,249,112,210,0 ; vpshufd $0x0,%xmm2,%xmm2
DB 196,227,109,24,210,1 ; vinsertf128 $0x1,%xmm2,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,162,76,2,0 ; vbroadcastss 0x24ca2(%rip),%ymm2 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,21,94,86,2,0 ; vbroadcastss 0x2565e(%rip),%ymm2 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -6904,14 +6904,14 @@ _sk_dither_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,121,110,194 ; vmovd %edx,%xmm8
DB 196,65,121,112,192,0 ; vpshufd $0x0,%xmm8,%xmm8
- DB 197,57,254,13,152,86,2,0 ; vpaddd 0x25698(%rip),%xmm8,%xmm9 # 2ca40 <_sk_overlay_sse2_8bit+0xe90>
- DB 197,57,254,5,160,86,2,0 ; vpaddd 0x256a0(%rip),%xmm8,%xmm8 # 2ca50 <_sk_overlay_sse2_8bit+0xea0>
+ DB 197,57,254,13,216,96,2,0 ; vpaddd 0x260d8(%rip),%xmm8,%xmm9 # 2d480 <_sk_overlay_sse2_8bit+0xf14>
+ DB 197,57,254,5,224,96,2,0 ; vpaddd 0x260e0(%rip),%xmm8,%xmm8 # 2d490 <_sk_overlay_sse2_8bit+0xf24>
DB 196,67,53,24,192,1 ; vinsertf128 $0x1,%xmm8,%ymm9,%ymm8
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,80,76,2,0 ; vbroadcastss 0x24c50(%rip),%ymm11 # 2c024 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,24,29,12,86,2,0 ; vbroadcastss 0x2560c(%rip),%ymm11 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9
DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
@@ -6922,8 +6922,8 @@ _sk_dither_avx LABEL PROC
DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11
DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11
DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- DB 196,98,125,24,37,17,76,2,0 ; vbroadcastss 0x24c11(%rip),%ymm12 # 2c028 <_sk_overlay_sse2_8bit+0x478>
- DB 196,98,125,24,45,12,76,2,0 ; vbroadcastss 0x24c0c(%rip),%ymm13 # 2c02c <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,125,24,37,205,85,2,0 ; vbroadcastss 0x255cd(%rip),%ymm12 # 2c9e4 <_sk_overlay_sse2_8bit+0x478>
+ DB 196,98,125,24,45,200,85,2,0 ; vbroadcastss 0x255c8(%rip),%ymm13 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14
DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15
DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14
@@ -6950,9 +6950,9 @@ _sk_dither_avx LABEL PROC
DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8
DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,119,75,2,0 ; vbroadcastss 0x24b77(%rip),%ymm9 # 2c030 <_sk_overlay_sse2_8bit+0x480>
+ DB 196,98,125,24,13,51,85,2,0 ; vbroadcastss 0x25533(%rip),%ymm9 # 2c9ec <_sk_overlay_sse2_8bit+0x480>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,109,75,2,0 ; vbroadcastss 0x24b6d(%rip),%ymm9 # 2c034 <_sk_overlay_sse2_8bit+0x484>
+ DB 196,98,125,24,13,41,85,2,0 ; vbroadcastss 0x25529(%rip),%ymm9 # 2c9f0 <_sk_overlay_sse2_8bit+0x484>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
@@ -6982,7 +6982,7 @@ _sk_uniform_color_avx LABEL PROC
PUBLIC _sk_black_color_avx
_sk_black_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,245,74,2,0 ; vbroadcastss 0x24af5(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,177,84,2,0 ; vbroadcastss 0x254b1(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -6991,7 +6991,7 @@ _sk_black_color_avx LABEL PROC
PUBLIC _sk_white_color_avx
_sk_white_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,220,74,2,0 ; vbroadcastss 0x24adc(%rip),%ymm0 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,152,84,2,0 ; vbroadcastss 0x25498(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -7029,7 +7029,7 @@ _sk_clear_avx LABEL PROC
PUBLIC _sk_srcatop_avx
_sk_srcatop_avx LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,123,74,2,0 ; vbroadcastss 0x24a7b(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,55,84,2,0 ; vbroadcastss 0x25437(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -7048,7 +7048,7 @@ _sk_srcatop_avx LABEL PROC
PUBLIC _sk_dstatop_avx
_sk_dstatop_avx LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
- DB 196,98,125,24,13,57,74,2,0 ; vbroadcastss 0x24a39(%rip),%ymm9 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,13,245,83,2,0 ; vbroadcastss 0x253f5(%rip),%ymm9 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
@@ -7084,7 +7084,7 @@ _sk_dstin_avx LABEL PROC
PUBLIC _sk_srcout_avx
_sk_srcout_avx LABEL PROC
- DB 196,98,125,24,5,212,73,2,0 ; vbroadcastss 0x249d4(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,144,83,2,0 ; vbroadcastss 0x25390(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -7095,7 +7095,7 @@ _sk_srcout_avx LABEL PROC
PUBLIC _sk_dstout_avx
_sk_dstout_avx LABEL PROC
- DB 196,226,125,24,5,179,73,2,0 ; vbroadcastss 0x249b3(%rip),%ymm0 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,111,83,2,0 ; vbroadcastss 0x2536f(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -7106,7 +7106,7 @@ _sk_dstout_avx LABEL PROC
PUBLIC _sk_srcover_avx
_sk_srcover_avx LABEL PROC
- DB 196,98,125,24,5,146,73,2,0 ; vbroadcastss 0x24992(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,78,83,2,0 ; vbroadcastss 0x2534e(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -7121,7 +7121,7 @@ _sk_srcover_avx LABEL PROC
PUBLIC _sk_dstover_avx
_sk_dstover_avx LABEL PROC
- DB 196,98,125,24,5,97,73,2,0 ; vbroadcastss 0x24961(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,29,83,2,0 ; vbroadcastss 0x2531d(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -7145,7 +7145,7 @@ _sk_modulate_avx LABEL PROC
PUBLIC _sk_multiply_avx
_sk_multiply_avx LABEL PROC
- DB 196,98,125,24,5,28,73,2,0 ; vbroadcastss 0x2491c(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,216,82,2,0 ; vbroadcastss 0x252d8(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7174,7 +7174,7 @@ _sk_multiply_avx LABEL PROC
PUBLIC _sk_plus__avx
_sk_plus__avx LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,5,171,72,2,0 ; vbroadcastss 0x248ab(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,103,82,2,0 ; vbroadcastss 0x25267(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
@@ -7204,7 +7204,7 @@ _sk_screen_avx LABEL PROC
PUBLIC _sk_xor__avx
_sk_xor__avx LABEL PROC
- DB 196,98,125,24,5,74,72,2,0 ; vbroadcastss 0x2484a(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,6,82,2,0 ; vbroadcastss 0x25206(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7239,7 +7239,7 @@ _sk_darken_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,198,71,2,0 ; vbroadcastss 0x247c6(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,130,81,2,0 ; vbroadcastss 0x25182(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7263,7 +7263,7 @@ _sk_lighten_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,110,71,2,0 ; vbroadcastss 0x2476e(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,42,81,2,0 ; vbroadcastss 0x2512a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7290,7 +7290,7 @@ _sk_difference_avx LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,10,71,2,0 ; vbroadcastss 0x2470a(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,198,80,2,0 ; vbroadcastss 0x250c6(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7311,7 +7311,7 @@ _sk_exclusion_avx LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,193,70,2,0 ; vbroadcastss 0x246c1(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,125,80,2,0 ; vbroadcastss 0x2507d(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7320,7 +7320,7 @@ _sk_exclusion_avx LABEL PROC
PUBLIC _sk_colorburn_avx
_sk_colorburn_avx LABEL PROC
- DB 196,98,125,24,5,168,70,2,0 ; vbroadcastss 0x246a8(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,100,80,2,0 ; vbroadcastss 0x25064(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -7380,7 +7380,7 @@ _sk_colorburn_avx LABEL PROC
PUBLIC _sk_colordodge_avx
_sk_colordodge_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,172,69,2,0 ; vbroadcastss 0x245ac(%rip),%ymm9 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,13,104,79,2,0 ; vbroadcastss 0x24f68(%rip),%ymm9 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -7435,7 +7435,7 @@ _sk_colordodge_avx LABEL PROC
PUBLIC _sk_hardlight_avx
_sk_hardlight_avx LABEL PROC
- DB 196,98,125,24,5,183,68,2,0 ; vbroadcastss 0x244b7(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,115,78,2,0 ; vbroadcastss 0x24e73(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7488,7 +7488,7 @@ _sk_hardlight_avx LABEL PROC
PUBLIC _sk_overlay_avx
_sk_overlay_avx LABEL PROC
- DB 196,98,125,24,5,220,67,2,0 ; vbroadcastss 0x243dc(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,152,77,2,0 ; vbroadcastss 0x24d98(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7553,10 +7553,10 @@ _sk_softlight_avx LABEL PROC
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,29,223,66,2,0 ; vbroadcastss 0x242df(%rip),%ymm11 # 2c038 <_sk_overlay_sse2_8bit+0x488>
+ DB 196,98,125,24,29,155,76,2,0 ; vbroadcastss 0x24c9b(%rip),%ymm11 # 2c9f4 <_sk_overlay_sse2_8bit+0x488>
DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13
DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8
- DB 196,98,125,24,45,208,66,2,0 ; vbroadcastss 0x242d0(%rip),%ymm13 # 2c03c <_sk_overlay_sse2_8bit+0x48c>
+ DB 196,98,125,24,45,140,76,2,0 ; vbroadcastss 0x24c8c(%rip),%ymm13 # 2c9f8 <_sk_overlay_sse2_8bit+0x48c>
DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14
DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8
DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14
@@ -7567,7 +7567,7 @@ _sk_softlight_avx LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,122,66,2,0 ; vbroadcastss 0x2427a(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,54,76,2,0 ; vbroadcastss 0x24c36(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
@@ -7694,12 +7694,12 @@ _sk_hue_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,88,64,2,0 ; vbroadcastss 0x24058(%rip),%ymm14 # 2c040 <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,53,20,74,2,0 ; vbroadcastss 0x24a14(%rip),%ymm14 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,78,64,2,0 ; vbroadcastss 0x2404e(%rip),%ymm15 # 2c044 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,61,10,74,2,0 ; vbroadcastss 0x24a0a(%rip),%ymm15 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,63,64,2,0 ; vbroadcastss 0x2403f(%rip),%ymm0 # 2c048 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,226,125,24,5,251,73,2,0 ; vbroadcastss 0x249fb(%rip),%ymm0 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7760,7 +7760,7 @@ _sk_hue_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,236,62,2,0 ; vbroadcastss 0x23eec(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,168,72,2,0 ; vbroadcastss 0x248a8(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7817,12 +7817,12 @@ _sk_saturation_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,16,62,2,0 ; vbroadcastss 0x23e10(%rip),%ymm14 # 2c040 <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,53,204,71,2,0 ; vbroadcastss 0x247cc(%rip),%ymm14 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,6,62,2,0 ; vbroadcastss 0x23e06(%rip),%ymm15 # 2c044 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,61,194,71,2,0 ; vbroadcastss 0x247c2(%rip),%ymm15 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,247,61,2,0 ; vbroadcastss 0x23df7(%rip),%ymm0 # 2c048 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,226,125,24,5,179,71,2,0 ; vbroadcastss 0x247b3(%rip),%ymm0 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7883,7 +7883,7 @@ _sk_saturation_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,164,60,2,0 ; vbroadcastss 0x23ca4(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,96,70,2,0 ; vbroadcastss 0x24660(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7912,12 +7912,12 @@ _sk_color_avx LABEL PROC
DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8
DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9
- DB 196,98,125,24,45,80,60,2,0 ; vbroadcastss 0x23c50(%rip),%ymm13 # 2c040 <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,45,12,70,2,0 ; vbroadcastss 0x2460c(%rip),%ymm13 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10
- DB 196,98,125,24,53,70,60,2,0 ; vbroadcastss 0x23c46(%rip),%ymm14 # 2c044 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,53,2,70,2,0 ; vbroadcastss 0x24602(%rip),%ymm14 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,55,60,2,0 ; vbroadcastss 0x23c37(%rip),%ymm15 # 2c048 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,98,125,24,61,243,69,2,0 ; vbroadcastss 0x245f3(%rip),%ymm15 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7980,7 +7980,7 @@ _sk_color_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,210,58,2,0 ; vbroadcastss 0x23ad2(%rip),%ymm0 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,142,68,2,0 ; vbroadcastss 0x2448e(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -8010,12 +8010,12 @@ _sk_luminosity_avx LABEL PROC
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9
- DB 196,98,125,24,45,122,58,2,0 ; vbroadcastss 0x23a7a(%rip),%ymm13 # 2c040 <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,45,54,68,2,0 ; vbroadcastss 0x24436(%rip),%ymm13 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10
- DB 196,98,125,24,53,112,58,2,0 ; vbroadcastss 0x23a70(%rip),%ymm14 # 2c044 <_sk_overlay_sse2_8bit+0x494>
+ DB 196,98,125,24,53,44,68,2,0 ; vbroadcastss 0x2442c(%rip),%ymm14 # 2ca00 <_sk_overlay_sse2_8bit+0x494>
DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,97,58,2,0 ; vbroadcastss 0x23a61(%rip),%ymm15 # 2c048 <_sk_overlay_sse2_8bit+0x498>
+ DB 196,98,125,24,61,29,68,2,0 ; vbroadcastss 0x2441d(%rip),%ymm15 # 2ca04 <_sk_overlay_sse2_8bit+0x498>
DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -8078,7 +8078,7 @@ _sk_luminosity_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,252,56,2,0 ; vbroadcastss 0x238fc(%rip),%ymm0 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,5,184,66,2,0 ; vbroadcastss 0x242b8(%rip),%ymm0 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -8111,7 +8111,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 15,133,42,1,0,0 ; jne 88bc <_sk_srcover_rgba_8888_avx+0x14a>
DB 196,1,125,16,4,152 ; vmovupd (%r8,%r11,4),%ymm8
- DB 197,125,40,13,128,61,2,0 ; vmovapd 0x23d80(%rip),%ymm9 # 2c520 <_sk_overlay_sse2_8bit+0x970>
+ DB 197,125,40,13,64,71,2,0 ; vmovapd 0x24740(%rip),%ymm9 # 2cee0 <_sk_overlay_sse2_8bit+0x974>
DB 196,193,61,84,225 ; vandpd %ymm9,%ymm8,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,81,114,208,8 ; vpsrld $0x8,%xmm8,%xmm5
@@ -8129,9 +8129,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 197,193,114,215,24 ; vpsrld $0x18,%xmm7,%xmm7
DB 196,227,61,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,31,56,2,0 ; vbroadcastss 0x2381f(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,219,65,2,0 ; vbroadcastss 0x241db(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,62,56,2,0 ; vbroadcastss 0x2383e(%rip),%ymm9 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,13,250,65,2,0 ; vbroadcastss 0x241fa(%rip),%ymm9 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
@@ -8269,7 +8269,7 @@ _sk_clamp_0_avx LABEL PROC
PUBLIC _sk_clamp_1_avx
_sk_clamp_1_avx LABEL PROC
- DB 196,98,125,24,5,222,53,2,0 ; vbroadcastss 0x235de(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,154,63,2,0 ; vbroadcastss 0x23f9a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -8279,7 +8279,7 @@ _sk_clamp_1_avx LABEL PROC
PUBLIC _sk_clamp_a_avx
_sk_clamp_a_avx LABEL PROC
- DB 196,98,125,24,5,189,53,2,0 ; vbroadcastss 0x235bd(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,121,63,2,0 ; vbroadcastss 0x23f79(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -8289,7 +8289,7 @@ _sk_clamp_a_avx LABEL PROC
PUBLIC _sk_clamp_a_dst_avx
_sk_clamp_a_dst_avx LABEL PROC
- DB 196,98,125,24,5,159,53,2,0 ; vbroadcastss 0x2359f(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,91,63,2,0 ; vbroadcastss 0x23f5b(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -8316,7 +8316,7 @@ _sk_swap_rb_avx LABEL PROC
PUBLIC _sk_invert_avx
_sk_invert_avx LABEL PROC
- DB 196,98,125,24,5,90,53,2,0 ; vbroadcastss 0x2355a(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,22,63,2,0 ; vbroadcastss 0x23f16(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -8362,7 +8362,7 @@ PUBLIC _sk_unpremul_avx
_sk_unpremul_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,234,52,2,0 ; vbroadcastss 0x234ea(%rip),%ymm10 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,21,166,62,2,0 ; vbroadcastss 0x23ea6(%rip),%ymm10 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -8373,17 +8373,17 @@ _sk_unpremul_avx LABEL PROC
PUBLIC _sk_from_srgb_avx
_sk_from_srgb_avx LABEL PROC
- DB 196,98,125,24,5,247,52,2,0 ; vbroadcastss 0x234f7(%rip),%ymm8 # 2c050 <_sk_overlay_sse2_8bit+0x4a0>
+ DB 196,98,125,24,5,179,62,2,0 ; vbroadcastss 0x23eb3(%rip),%ymm8 # 2ca0c <_sk_overlay_sse2_8bit+0x4a0>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,213,52,2,0 ; vbroadcastss 0x234d5(%rip),%ymm11 # 2c040 <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,29,145,62,2,0 ; vbroadcastss 0x23e91(%rip),%ymm11 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12
- DB 196,98,125,24,45,219,52,2,0 ; vbroadcastss 0x234db(%rip),%ymm13 # 2c054 <_sk_overlay_sse2_8bit+0x4a4>
+ DB 196,98,125,24,45,151,62,2,0 ; vbroadcastss 0x23e97(%rip),%ymm13 # 2ca10 <_sk_overlay_sse2_8bit+0x4a4>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,204,52,2,0 ; vbroadcastss 0x234cc(%rip),%ymm12 # 2c058 <_sk_overlay_sse2_8bit+0x4a8>
+ DB 196,98,125,24,37,136,62,2,0 ; vbroadcastss 0x23e88(%rip),%ymm12 # 2ca14 <_sk_overlay_sse2_8bit+0x4a8>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,194,52,2,0 ; vbroadcastss 0x234c2(%rip),%ymm14 # 2c05c <_sk_overlay_sse2_8bit+0x4ac>
+ DB 196,98,125,24,53,126,62,2,0 ; vbroadcastss 0x23e7e(%rip),%ymm14 # 2ca18 <_sk_overlay_sse2_8bit+0x4ac>
DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0
DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -8407,17 +8407,17 @@ _sk_from_srgb_avx LABEL PROC
PUBLIC _sk_from_srgb_dst_avx
_sk_from_srgb_dst_avx LABEL PROC
- DB 196,98,125,24,5,75,52,2,0 ; vbroadcastss 0x2344b(%rip),%ymm8 # 2c050 <_sk_overlay_sse2_8bit+0x4a0>
+ DB 196,98,125,24,5,7,62,2,0 ; vbroadcastss 0x23e07(%rip),%ymm8 # 2ca0c <_sk_overlay_sse2_8bit+0x4a0>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,41,52,2,0 ; vbroadcastss 0x23429(%rip),%ymm11 # 2c040 <_sk_overlay_sse2_8bit+0x490>
+ DB 196,98,125,24,29,229,61,2,0 ; vbroadcastss 0x23de5(%rip),%ymm11 # 2c9fc <_sk_overlay_sse2_8bit+0x490>
DB 196,65,92,89,227 ; vmulps %ymm11,%ymm4,%ymm12
- DB 196,98,125,24,45,47,52,2,0 ; vbroadcastss 0x2342f(%rip),%ymm13 # 2c054 <_sk_overlay_sse2_8bit+0x4a4>
+ DB 196,98,125,24,45,235,61,2,0 ; vbroadcastss 0x23deb(%rip),%ymm13 # 2ca10 <_sk_overlay_sse2_8bit+0x4a4>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,32,52,2,0 ; vbroadcastss 0x23420(%rip),%ymm12 # 2c058 <_sk_overlay_sse2_8bit+0x4a8>
+ DB 196,98,125,24,37,220,61,2,0 ; vbroadcastss 0x23ddc(%rip),%ymm12 # 2ca14 <_sk_overlay_sse2_8bit+0x4a8>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,22,52,2,0 ; vbroadcastss 0x23416(%rip),%ymm14 # 2c05c <_sk_overlay_sse2_8bit+0x4ac>
+ DB 196,98,125,24,53,210,61,2,0 ; vbroadcastss 0x23dd2(%rip),%ymm14 # 2ca18 <_sk_overlay_sse2_8bit+0x4ac>
DB 196,193,92,194,230,1 ; vcmpltps %ymm14,%ymm4,%ymm4
DB 196,195,45,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm10,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -8442,20 +8442,20 @@ _sk_from_srgb_dst_avx LABEL PROC
PUBLIC _sk_to_srgb_avx
_sk_to_srgb_avx LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,171,51,2,0 ; vbroadcastss 0x233ab(%rip),%ymm8 # 2c060 <_sk_overlay_sse2_8bit+0x4b0>
+ DB 196,98,125,24,5,103,61,2,0 ; vbroadcastss 0x23d67(%rip),%ymm8 # 2ca1c <_sk_overlay_sse2_8bit+0x4b0>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,165,51,2,0 ; vbroadcastss 0x233a5(%rip),%ymm11 # 2c068 <_sk_overlay_sse2_8bit+0x4b8>
+ DB 196,98,125,24,29,97,61,2,0 ; vbroadcastss 0x23d61(%rip),%ymm11 # 2ca24 <_sk_overlay_sse2_8bit+0x4b8>
DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12
- DB 196,98,125,24,45,147,51,2,0 ; vbroadcastss 0x23393(%rip),%ymm13 # 2c064 <_sk_overlay_sse2_8bit+0x4b4>
+ DB 196,98,125,24,45,79,61,2,0 ; vbroadcastss 0x23d4f(%rip),%ymm13 # 2ca20 <_sk_overlay_sse2_8bit+0x4b4>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12
- DB 196,98,125,24,53,136,51,2,0 ; vbroadcastss 0x23388(%rip),%ymm14 # 2c06c <_sk_overlay_sse2_8bit+0x4bc>
+ DB 196,98,125,24,53,68,61,2,0 ; vbroadcastss 0x23d44(%rip),%ymm14 # 2ca28 <_sk_overlay_sse2_8bit+0x4bc>
DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12
- DB 196,98,125,24,61,126,51,2,0 ; vbroadcastss 0x2337e(%rip),%ymm15 # 2c070 <_sk_overlay_sse2_8bit+0x4c0>
+ DB 196,98,125,24,61,58,61,2,0 ; vbroadcastss 0x23d3a(%rip),%ymm15 # 2ca2c <_sk_overlay_sse2_8bit+0x4c0>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
- DB 196,98,125,24,37,106,51,2,0 ; vbroadcastss 0x2336a(%rip),%ymm12 # 2c074 <_sk_overlay_sse2_8bit+0x4c4>
+ DB 196,98,125,24,37,38,61,2,0 ; vbroadcastss 0x23d26(%rip),%ymm12 # 2ca30 <_sk_overlay_sse2_8bit+0x4c4>
DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -8490,7 +8490,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,118,50,2,0 ; vbroadcastss 0x23276(%rip),%ymm11 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,29,50,60,2,0 ; vbroadcastss 0x23c32(%rip),%ymm11 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12
@@ -8500,19 +8500,19 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,163,50,2,0 ; vbroadcastss 0x232a3(%rip),%ymm11 # 2c080 <_sk_overlay_sse2_8bit+0x4d0>
+ DB 196,98,125,24,29,95,60,2,0 ; vbroadcastss 0x23c5f(%rip),%ymm11 # 2ca3c <_sk_overlay_sse2_8bit+0x4d0>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,145,50,2,0 ; vbroadcastss 0x23291(%rip),%ymm11 # 2c07c <_sk_overlay_sse2_8bit+0x4cc>
+ DB 196,98,125,24,29,77,60,2,0 ; vbroadcastss 0x23c4d(%rip),%ymm11 # 2ca38 <_sk_overlay_sse2_8bit+0x4cc>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,121,50,2,0 ; vbroadcastss 0x23279(%rip),%ymm2 # 2c078 <_sk_overlay_sse2_8bit+0x4c8>
+ DB 196,226,125,24,21,53,60,2,0 ; vbroadcastss 0x23c35(%rip),%ymm2 # 2ca34 <_sk_overlay_sse2_8bit+0x4c8>
DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,37,244,49,2,0 ; vbroadcastss 0x231f4(%rip),%ymm12 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,176,59,2,0 ; vbroadcastss 0x23bb0(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2
DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12
DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11
@@ -8522,7 +8522,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0
DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- DB 196,98,125,24,5,35,50,2,0 ; vbroadcastss 0x23223(%rip),%ymm8 # 2c084 <_sk_overlay_sse2_8bit+0x4d4>
+ DB 196,98,125,24,5,223,59,2,0 ; vbroadcastss 0x23bdf(%rip),%ymm8 # 2ca40 <_sk_overlay_sse2_8bit+0x4d4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8537,7 +8537,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,225 ; vmovaps %ymm1,%ymm4
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
- DB 196,98,125,24,5,122,49,2,0 ; vbroadcastss 0x2317a(%rip),%ymm8 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,54,59,2,0 ; vbroadcastss 0x23b36(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10
DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11
@@ -8545,23 +8545,23 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,29,188,49,2,0 ; vbroadcastss 0x231bc(%rip),%ymm11 # 2c088 <_sk_overlay_sse2_8bit+0x4d8>
+ DB 196,98,125,24,29,120,59,2,0 ; vbroadcastss 0x23b78(%rip),%ymm11 # 2ca44 <_sk_overlay_sse2_8bit+0x4d8>
DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,37,142,49,2,0 ; vbroadcastss 0x2318e(%rip),%ymm12 # 2c078 <_sk_overlay_sse2_8bit+0x4c8>
+ DB 196,98,125,24,37,74,59,2,0 ; vbroadcastss 0x23b4a(%rip),%ymm12 # 2ca34 <_sk_overlay_sse2_8bit+0x4c8>
DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0
- DB 196,98,125,24,45,136,49,2,0 ; vbroadcastss 0x23188(%rip),%ymm13 # 2c080 <_sk_overlay_sse2_8bit+0x4d0>
+ DB 196,98,125,24,45,68,59,2,0 ; vbroadcastss 0x23b44(%rip),%ymm13 # 2ca3c <_sk_overlay_sse2_8bit+0x4d0>
DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14
DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
- DB 196,226,125,24,13,125,49,2,0 ; vbroadcastss 0x2317d(%rip),%ymm1 # 2c08c <_sk_overlay_sse2_8bit+0x4dc>
+ DB 196,226,125,24,13,57,59,2,0 ; vbroadcastss 0x23b39(%rip),%ymm1 # 2ca48 <_sk_overlay_sse2_8bit+0x4dc>
DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7
DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7
DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14
DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,53,84,49,2,0 ; vbroadcastss 0x23154(%rip),%ymm14 # 2c084 <_sk_overlay_sse2_8bit+0x4d4>
+ DB 196,98,125,24,53,16,59,2,0 ; vbroadcastss 0x23b10(%rip),%ymm14 # 2ca40 <_sk_overlay_sse2_8bit+0x4d4>
DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -8580,7 +8580,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6
DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6
DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- DB 196,226,125,24,5,254,48,2,0 ; vbroadcastss 0x230fe(%rip),%ymm0 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,226,125,24,5,186,58,2,0 ; vbroadcastss 0x23aba(%rip),%ymm0 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0
DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3
DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0
@@ -8632,13 +8632,13 @@ _sk_scale_u8_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,74 ; jne 909d <_sk_scale_u8_avx+0x62>
DB 196,2,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm8
- DB 197,57,219,5,175,57,2,0 ; vpand 0x239af(%rip),%xmm8,%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,57,219,5,239,67,2,0 ; vpand 0x243ef(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,16,48,2,0 ; vbroadcastss 0x23010(%rip),%ymm9 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,204,57,2,0 ; vbroadcastss 0x239cc(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -8686,7 +8686,7 @@ _sk_scale_u8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde009148 <_sk_overlay_sse2_8bit+0xffffffffddfdd598>
+ DB 232,255,255,255,221 ; callq ffffffffde009148 <_sk_overlay_sse2_8bit+0xffffffffddfdcbdc>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -8713,20 +8713,20 @@ _sk_scale_565_avx LABEL PROC
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,1,47,2,0 ; vbroadcastss 0x22f01(%rip),%ymm9 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,98,125,24,13,189,56,2,0 ; vbroadcastss 0x238bd(%rip),%ymm9 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,242,46,2,0 ; vbroadcastss 0x22ef2(%rip),%ymm10 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,98,125,24,21,174,56,2,0 ; vbroadcastss 0x238ae(%rip),%ymm10 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,232,46,2,0 ; vbroadcastss 0x22ee8(%rip),%ymm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,98,125,24,21,164,56,2,0 ; vbroadcastss 0x238a4(%rip),%ymm10 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,217,46,2,0 ; vbroadcastss 0x22ed9(%rip),%ymm11 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,98,125,24,29,149,56,2,0 ; vbroadcastss 0x23895(%rip),%ymm11 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,207,46,2,0 ; vbroadcastss 0x22ecf(%rip),%ymm11 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,98,125,24,29,139,56,2,0 ; vbroadcastss 0x2388b(%rip),%ymm11 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,192,46,2,0 ; vbroadcastss 0x22ec0(%rip),%ymm11 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,98,125,24,29,124,56,2,0 ; vbroadcastss 0x2387c(%rip),%ymm11 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -8817,13 +8817,13 @@ _sk_lerp_u8_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,110 ; jne 938d <_sk_lerp_u8_avx+0x86>
DB 196,2,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm8
- DB 197,57,219,5,227,54,2,0 ; vpand 0x236e3(%rip),%xmm8,%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,57,219,5,35,65,2,0 ; vpand 0x24123(%rip),%xmm8,%xmm8 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,68,45,2,0 ; vbroadcastss 0x22d44(%rip),%ymm9 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,0,55,2,0 ; vbroadcastss 0x23700(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
@@ -8908,20 +8908,20 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,13,44,2,0 ; vbroadcastss 0x22c0d(%rip),%ymm9 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,98,125,24,13,201,53,2,0 ; vbroadcastss 0x235c9(%rip),%ymm9 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,254,43,2,0 ; vbroadcastss 0x22bfe(%rip),%ymm10 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,98,125,24,21,186,53,2,0 ; vbroadcastss 0x235ba(%rip),%ymm10 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,244,43,2,0 ; vbroadcastss 0x22bf4(%rip),%ymm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,98,125,24,21,176,53,2,0 ; vbroadcastss 0x235b0(%rip),%ymm10 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,229,43,2,0 ; vbroadcastss 0x22be5(%rip),%ymm11 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,98,125,24,29,161,53,2,0 ; vbroadcastss 0x235a1(%rip),%ymm11 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,219,43,2,0 ; vbroadcastss 0x22bdb(%rip),%ymm11 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,98,125,24,29,151,53,2,0 ; vbroadcastss 0x23597(%rip),%ymm11 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,204,43,2,0 ; vbroadcastss 0x22bcc(%rip),%ymm11 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,98,125,24,29,136,53,2,0 ; vbroadcastss 0x23588(%rip),%ymm11 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -8999,7 +8999,7 @@ _sk_load_tables_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 15,133,7,2,0,0 ; jne 97fe <_sk_load_tables_avx+0x21e>
DB 196,65,125,16,20,144 ; vmovupd (%r8,%rdx,4),%ymm10
- DB 197,125,40,13,59,47,2,0 ; vmovapd 0x22f3b(%rip),%ymm9 # 2c540 <_sk_overlay_sse2_8bit+0x990>
+ DB 197,125,40,13,251,56,2,0 ; vmovapd 0x238fb(%rip),%ymm9 # 2cf00 <_sk_overlay_sse2_8bit+0x994>
DB 196,193,45,84,201 ; vandpd %ymm9,%ymm10,%ymm1
DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0
DB 196,193,249,126,192 ; vmovq %xmm0,%r8
@@ -9091,7 +9091,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,193,65,114,213,24 ; vpsrld $0x18,%xmm13,%xmm7
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,167,40,2,0 ; vbroadcastss 0x228a7(%rip),%ymm7 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,61,99,50,2,0 ; vbroadcastss 0x23263(%rip),%ymm7 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -9176,7 +9176,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11
DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1
DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12
- DB 197,121,111,21,212,48,2,0 ; vmovdqa 0x230d4(%rip),%xmm10 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,121,111,21,20,59,2,0 ; vmovdqa 0x23b14(%rip),%xmm10 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -9274,7 +9274,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,123,37,2,0 ; vbroadcastss 0x2257b(%rip),%ymm7 # 2c0b0 <_sk_overlay_sse2_8bit+0x500>
+ DB 196,226,125,24,61,55,47,2,0 ; vbroadcastss 0x22f37(%rip),%ymm7 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -9337,7 +9337,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 197,185,108,211 ; vpunpcklqdq %xmm3,%xmm8,%xmm2
DB 197,57,109,219 ; vpunpckhqdq %xmm3,%xmm8,%xmm11
DB 197,113,108,192 ; vpunpcklqdq %xmm0,%xmm1,%xmm8
- DB 197,121,111,13,194,45,2,0 ; vmovdqa 0x22dc2(%rip),%xmm9 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,121,111,13,2,56,2,0 ; vmovdqa 0x23802(%rip),%xmm9 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 196,193,105,219,193 ; vpand %xmm9,%xmm2,%xmm0
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -9427,7 +9427,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2
DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,3,34,2,0 ; vbroadcastss 0x22203(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,191,43,2,0 ; vbroadcastss 0x22bbf(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6
DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7
DB 72,131,196,88 ; add $0x58,%rsp
@@ -9497,7 +9497,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
PUBLIC _sk_byte_tables_avx
_sk_byte_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,228,32,2,0 ; vbroadcastss 0x220e4(%rip),%ymm8 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,160,42,2,0 ; vbroadcastss 0x22aa0(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,200 ; vmovq %xmm9,%r8
@@ -9616,7 +9616,7 @@ _sk_byte_tables_avx LABEL PROC
DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1
DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- DB 196,98,125,24,13,210,30,2,0 ; vbroadcastss 0x21ed2(%rip),%ymm9 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,142,40,2,0 ; vbroadcastss 0x2288e(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -9730,7 +9730,7 @@ _sk_byte_tables_rgb_avx LABEL PROC
DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,175,28,2,0 ; vbroadcastss 0x21caf(%rip),%ymm9 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,107,38,2,0 ; vbroadcastss 0x2266b(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1
DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2
@@ -9957,36 +9957,36 @@ _sk_parametric_r_avx LABEL PROC
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11
- DB 196,98,125,24,37,64,25,2,0 ; vbroadcastss 0x21940(%rip),%ymm12 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,37,252,34,2,0 ; vbroadcastss 0x222fc(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,54,25,2,0 ; vbroadcastss 0x21936(%rip),%ymm12 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,242,34,2,0 ; vbroadcastss 0x222f2(%rip),%ymm12 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,140,24,2,0 ; vbroadcastss 0x2188c(%rip),%ymm12 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,72,34,2,0 ; vbroadcastss 0x22248(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,30,25,2,0 ; vbroadcastss 0x2191e(%rip),%ymm12 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,37,218,34,2,0 ; vbroadcastss 0x222da(%rip),%ymm12 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,20,25,2,0 ; vbroadcastss 0x21914(%rip),%ymm12 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,37,208,34,2,0 ; vbroadcastss 0x222d0(%rip),%ymm12 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,5,25,2,0 ; vbroadcastss 0x21905(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,193,34,2,0 ; vbroadcastss 0x222c1(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,251,24,2,0 ; vbroadcastss 0x218fb(%rip),%ymm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,183,34,2,0 ; vbroadcastss 0x222b7(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,223,24,2,0 ; vbroadcastss 0x218df(%rip),%ymm11 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,155,34,2,0 ; vbroadcastss 0x2229b(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,213,24,2,0 ; vbroadcastss 0x218d5(%rip),%ymm11 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,145,34,2,0 ; vbroadcastss 0x22291(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,198,24,2,0 ; vbroadcastss 0x218c6(%rip),%ymm11 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,98,125,24,29,130,34,2,0 ; vbroadcastss 0x22282(%rip),%ymm11 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,188,24,2,0 ; vbroadcastss 0x218bc(%rip),%ymm11 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,29,120,34,2,0 ; vbroadcastss 0x22278(%rip),%ymm11 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,173,24,2,0 ; vbroadcastss 0x218ad(%rip),%ymm10 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,105,34,2,0 ; vbroadcastss 0x22269(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9994,7 +9994,7 @@ _sk_parametric_r_avx LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,196,23,2,0 ; vbroadcastss 0x217c4(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,128,33,2,0 ; vbroadcastss 0x22180(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10014,36 +10014,36 @@ _sk_parametric_g_avx LABEL PROC
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11
- DB 196,98,125,24,37,5,24,2,0 ; vbroadcastss 0x21805(%rip),%ymm12 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,37,193,33,2,0 ; vbroadcastss 0x221c1(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,251,23,2,0 ; vbroadcastss 0x217fb(%rip),%ymm12 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,183,33,2,0 ; vbroadcastss 0x221b7(%rip),%ymm12 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,81,23,2,0 ; vbroadcastss 0x21751(%rip),%ymm12 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,13,33,2,0 ; vbroadcastss 0x2210d(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,227,23,2,0 ; vbroadcastss 0x217e3(%rip),%ymm12 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,37,159,33,2,0 ; vbroadcastss 0x2219f(%rip),%ymm12 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,217,23,2,0 ; vbroadcastss 0x217d9(%rip),%ymm12 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,37,149,33,2,0 ; vbroadcastss 0x22195(%rip),%ymm12 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,202,23,2,0 ; vbroadcastss 0x217ca(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,134,33,2,0 ; vbroadcastss 0x22186(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,192,23,2,0 ; vbroadcastss 0x217c0(%rip),%ymm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,124,33,2,0 ; vbroadcastss 0x2217c(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1
DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1
DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,164,23,2,0 ; vbroadcastss 0x217a4(%rip),%ymm11 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,96,33,2,0 ; vbroadcastss 0x22160(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,154,23,2,0 ; vbroadcastss 0x2179a(%rip),%ymm11 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,86,33,2,0 ; vbroadcastss 0x22156(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,139,23,2,0 ; vbroadcastss 0x2178b(%rip),%ymm11 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,98,125,24,29,71,33,2,0 ; vbroadcastss 0x22147(%rip),%ymm11 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,129,23,2,0 ; vbroadcastss 0x21781(%rip),%ymm11 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,29,61,33,2,0 ; vbroadcastss 0x2213d(%rip),%ymm11 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,114,23,2,0 ; vbroadcastss 0x21772(%rip),%ymm10 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,46,33,2,0 ; vbroadcastss 0x2212e(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -10051,7 +10051,7 @@ _sk_parametric_g_avx LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,137,22,2,0 ; vbroadcastss 0x21689(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,69,32,2,0 ; vbroadcastss 0x22045(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10071,36 +10071,36 @@ _sk_parametric_b_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11
- DB 196,98,125,24,37,202,22,2,0 ; vbroadcastss 0x216ca(%rip),%ymm12 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,37,134,32,2,0 ; vbroadcastss 0x22086(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,192,22,2,0 ; vbroadcastss 0x216c0(%rip),%ymm12 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,124,32,2,0 ; vbroadcastss 0x2207c(%rip),%ymm12 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,22,22,2,0 ; vbroadcastss 0x21616(%rip),%ymm12 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,210,31,2,0 ; vbroadcastss 0x21fd2(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,168,22,2,0 ; vbroadcastss 0x216a8(%rip),%ymm12 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,37,100,32,2,0 ; vbroadcastss 0x22064(%rip),%ymm12 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,158,22,2,0 ; vbroadcastss 0x2169e(%rip),%ymm12 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,37,90,32,2,0 ; vbroadcastss 0x2205a(%rip),%ymm12 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,143,22,2,0 ; vbroadcastss 0x2168f(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,75,32,2,0 ; vbroadcastss 0x2204b(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,133,22,2,0 ; vbroadcastss 0x21685(%rip),%ymm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,65,32,2,0 ; vbroadcastss 0x22041(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2
DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,105,22,2,0 ; vbroadcastss 0x21669(%rip),%ymm11 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,37,32,2,0 ; vbroadcastss 0x22025(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,95,22,2,0 ; vbroadcastss 0x2165f(%rip),%ymm11 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,27,32,2,0 ; vbroadcastss 0x2201b(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,80,22,2,0 ; vbroadcastss 0x21650(%rip),%ymm11 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,98,125,24,29,12,32,2,0 ; vbroadcastss 0x2200c(%rip),%ymm11 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,70,22,2,0 ; vbroadcastss 0x21646(%rip),%ymm11 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,29,2,32,2,0 ; vbroadcastss 0x22002(%rip),%ymm11 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,55,22,2,0 ; vbroadcastss 0x21637(%rip),%ymm10 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,243,31,2,0 ; vbroadcastss 0x21ff3(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -10108,7 +10108,7 @@ _sk_parametric_b_avx LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,78,21,2,0 ; vbroadcastss 0x2154e(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,10,31,2,0 ; vbroadcastss 0x21f0a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10128,36 +10128,36 @@ _sk_parametric_a_avx LABEL PROC
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11
- DB 196,98,125,24,37,143,21,2,0 ; vbroadcastss 0x2158f(%rip),%ymm12 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,37,75,31,2,0 ; vbroadcastss 0x21f4b(%rip),%ymm12 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,133,21,2,0 ; vbroadcastss 0x21585(%rip),%ymm12 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,37,65,31,2,0 ; vbroadcastss 0x21f41(%rip),%ymm12 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,219,20,2,0 ; vbroadcastss 0x214db(%rip),%ymm12 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,37,151,30,2,0 ; vbroadcastss 0x21e97(%rip),%ymm12 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,109,21,2,0 ; vbroadcastss 0x2156d(%rip),%ymm12 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,37,41,31,2,0 ; vbroadcastss 0x21f29(%rip),%ymm12 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,99,21,2,0 ; vbroadcastss 0x21563(%rip),%ymm12 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,37,31,31,2,0 ; vbroadcastss 0x21f1f(%rip),%ymm12 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,84,21,2,0 ; vbroadcastss 0x21554(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,16,31,2,0 ; vbroadcastss 0x21f10(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,74,21,2,0 ; vbroadcastss 0x2154a(%rip),%ymm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,37,6,31,2,0 ; vbroadcastss 0x21f06(%rip),%ymm12 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3
DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,46,21,2,0 ; vbroadcastss 0x2152e(%rip),%ymm11 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,29,234,30,2,0 ; vbroadcastss 0x21eea(%rip),%ymm11 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,36,21,2,0 ; vbroadcastss 0x21524(%rip),%ymm11 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,98,125,24,29,224,30,2,0 ; vbroadcastss 0x21ee0(%rip),%ymm11 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,21,21,2,0 ; vbroadcastss 0x21515(%rip),%ymm11 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,98,125,24,29,209,30,2,0 ; vbroadcastss 0x21ed1(%rip),%ymm11 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,11,21,2,0 ; vbroadcastss 0x2150b(%rip),%ymm11 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,98,125,24,29,199,30,2,0 ; vbroadcastss 0x21ec7(%rip),%ymm11 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,252,20,2,0 ; vbroadcastss 0x214fc(%rip),%ymm10 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,98,125,24,21,184,30,2,0 ; vbroadcastss 0x21eb8(%rip),%ymm10 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -10165,7 +10165,7 @@ _sk_parametric_a_avx LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,19,20,2,0 ; vbroadcastss 0x21413(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,207,29,2,0 ; vbroadcastss 0x21dcf(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10182,34 +10182,34 @@ _sk_gamma_avx LABEL PROC
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,91,200 ; vcvtdq2ps %ymm0,%ymm1
- DB 196,98,125,24,5,92,20,2,0 ; vbroadcastss 0x2145c(%rip),%ymm8 # 2c0b4 <_sk_overlay_sse2_8bit+0x504>
+ DB 196,98,125,24,5,24,30,2,0 ; vbroadcastss 0x21e18(%rip),%ymm8 # 2ca70 <_sk_overlay_sse2_8bit+0x504>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,82,20,2,0 ; vbroadcastss 0x21452(%rip),%ymm9 # 2c0b8 <_sk_overlay_sse2_8bit+0x508>
+ DB 196,98,125,24,13,14,30,2,0 ; vbroadcastss 0x21e0e(%rip),%ymm9 # 2ca74 <_sk_overlay_sse2_8bit+0x508>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
- DB 196,226,125,24,37,168,19,2,0 ; vbroadcastss 0x213a8(%rip),%ymm4 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,37,100,29,2,0 ; vbroadcastss 0x21d64(%rip),%ymm4 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,252,86,196 ; vorps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,21,59,20,2,0 ; vbroadcastss 0x2143b(%rip),%ymm10 # 2c0bc <_sk_overlay_sse2_8bit+0x50c>
+ DB 196,98,125,24,21,247,29,2,0 ; vbroadcastss 0x21df7(%rip),%ymm10 # 2ca78 <_sk_overlay_sse2_8bit+0x50c>
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,29,49,20,2,0 ; vbroadcastss 0x21431(%rip),%ymm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x510>
+ DB 196,98,125,24,29,237,29,2,0 ; vbroadcastss 0x21ded(%rip),%ymm11 # 2ca7c <_sk_overlay_sse2_8bit+0x510>
DB 196,193,124,89,211 ; vmulps %ymm11,%ymm0,%ymm2
DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1
- DB 196,98,125,24,37,35,20,2,0 ; vbroadcastss 0x21423(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x514>
+ DB 196,98,125,24,37,223,29,2,0 ; vbroadcastss 0x21ddf(%rip),%ymm12 # 2ca80 <_sk_overlay_sse2_8bit+0x514>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,45,25,20,2,0 ; vbroadcastss 0x21419(%rip),%ymm13 # 2c0c8 <_sk_overlay_sse2_8bit+0x518>
+ DB 196,98,125,24,45,213,29,2,0 ; vbroadcastss 0x21dd5(%rip),%ymm13 # 2ca84 <_sk_overlay_sse2_8bit+0x518>
DB 197,148,94,192 ; vdivps %ymm0,%ymm13,%ymm0
DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0
DB 196,98,125,24,48 ; vbroadcastss (%rax),%ymm14
DB 196,193,124,89,198 ; vmulps %ymm14,%ymm0,%ymm0
DB 196,227,125,8,200,1 ; vroundps $0x1,%ymm0,%ymm1
DB 197,252,92,241 ; vsubps %ymm1,%ymm0,%ymm6
- DB 196,98,125,24,61,248,19,2,0 ; vbroadcastss 0x213f8(%rip),%ymm15 # 2c0cc <_sk_overlay_sse2_8bit+0x51c>
+ DB 196,98,125,24,61,180,29,2,0 ; vbroadcastss 0x21db4(%rip),%ymm15 # 2ca88 <_sk_overlay_sse2_8bit+0x51c>
DB 196,193,124,88,199 ; vaddps %ymm15,%ymm0,%ymm0
- DB 196,226,125,24,29,238,19,2,0 ; vbroadcastss 0x213ee(%rip),%ymm3 # 2c0d0 <_sk_overlay_sse2_8bit+0x520>
+ DB 196,226,125,24,29,170,29,2,0 ; vbroadcastss 0x21daa(%rip),%ymm3 # 2ca8c <_sk_overlay_sse2_8bit+0x520>
DB 197,204,89,203 ; vmulps %ymm3,%ymm6,%ymm1
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
- DB 196,226,125,24,21,225,19,2,0 ; vbroadcastss 0x213e1(%rip),%ymm2 # 2c0d4 <_sk_overlay_sse2_8bit+0x524>
+ DB 196,226,125,24,21,157,29,2,0 ; vbroadcastss 0x21d9d(%rip),%ymm2 # 2ca90 <_sk_overlay_sse2_8bit+0x524>
DB 197,236,92,198 ; vsubps %ymm6,%ymm2,%ymm0
- DB 196,226,125,24,53,216,19,2,0 ; vbroadcastss 0x213d8(%rip),%ymm6 # 2c0d8 <_sk_overlay_sse2_8bit+0x528>
+ DB 196,226,125,24,53,148,29,2,0 ; vbroadcastss 0x21d94(%rip),%ymm6 # 2ca94 <_sk_overlay_sse2_8bit+0x528>
DB 197,204,94,192 ; vdivps %ymm0,%ymm6,%ymm0
DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
@@ -10251,7 +10251,7 @@ _sk_gamma_avx LABEL PROC
DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
DB 197,204,94,210 ; vdivps %ymm2,%ymm6,%ymm2
DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,28,19,2,0 ; vbroadcastss 0x2131c(%rip),%ymm2 # 2c0dc <_sk_overlay_sse2_8bit+0x52c>
+ DB 196,226,125,24,21,216,28,2,0 ; vbroadcastss 0x21cd8(%rip),%ymm2 # 2ca98 <_sk_overlay_sse2_8bit+0x52c>
DB 197,236,89,28,36 ; vmulps (%rsp),%ymm2,%ymm3
DB 197,252,89,226 ; vmulps %ymm2,%ymm0,%ymm4
DB 197,244,89,210 ; vmulps %ymm2,%ymm1,%ymm2
@@ -10269,31 +10269,31 @@ _sk_gamma_avx LABEL PROC
PUBLIC _sk_lab_to_xyz_avx
_sk_lab_to_xyz_avx LABEL PROC
- DB 196,98,125,24,5,207,18,2,0 ; vbroadcastss 0x212cf(%rip),%ymm8 # 2c0e0 <_sk_overlay_sse2_8bit+0x530>
+ DB 196,98,125,24,5,139,28,2,0 ; vbroadcastss 0x21c8b(%rip),%ymm8 # 2ca9c <_sk_overlay_sse2_8bit+0x530>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,45,18,2,0 ; vbroadcastss 0x2122d(%rip),%ymm8 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,233,27,2,0 ; vbroadcastss 0x21be9(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,183,18,2,0 ; vbroadcastss 0x212b7(%rip),%ymm9 # 2c0e4 <_sk_overlay_sse2_8bit+0x534>
+ DB 196,98,125,24,13,115,28,2,0 ; vbroadcastss 0x21c73(%rip),%ymm9 # 2caa0 <_sk_overlay_sse2_8bit+0x534>
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2
- DB 196,98,125,24,5,163,18,2,0 ; vbroadcastss 0x212a3(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x538>
+ DB 196,98,125,24,5,95,28,2,0 ; vbroadcastss 0x21c5f(%rip),%ymm8 # 2caa4 <_sk_overlay_sse2_8bit+0x538>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,153,18,2,0 ; vbroadcastss 0x21299(%rip),%ymm8 # 2c0ec <_sk_overlay_sse2_8bit+0x53c>
+ DB 196,98,125,24,5,85,28,2,0 ; vbroadcastss 0x21c55(%rip),%ymm8 # 2caa8 <_sk_overlay_sse2_8bit+0x53c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,143,18,2,0 ; vbroadcastss 0x2128f(%rip),%ymm8 # 2c0f0 <_sk_overlay_sse2_8bit+0x540>
+ DB 196,98,125,24,5,75,28,2,0 ; vbroadcastss 0x21c4b(%rip),%ymm8 # 2caac <_sk_overlay_sse2_8bit+0x540>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1
- DB 196,98,125,24,5,129,18,2,0 ; vbroadcastss 0x21281(%rip),%ymm8 # 2c0f4 <_sk_overlay_sse2_8bit+0x544>
+ DB 196,98,125,24,5,61,28,2,0 ; vbroadcastss 0x21c3d(%rip),%ymm8 # 2cab0 <_sk_overlay_sse2_8bit+0x544>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2
DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8
DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8
- DB 196,98,125,24,13,106,18,2,0 ; vbroadcastss 0x2126a(%rip),%ymm9 # 2c0f8 <_sk_overlay_sse2_8bit+0x548>
+ DB 196,98,125,24,13,38,28,2,0 ; vbroadcastss 0x21c26(%rip),%ymm9 # 2cab4 <_sk_overlay_sse2_8bit+0x548>
DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,95,18,2,0 ; vbroadcastss 0x2125f(%rip),%ymm11 # 2c0fc <_sk_overlay_sse2_8bit+0x54c>
+ DB 196,98,125,24,29,27,28,2,0 ; vbroadcastss 0x21c1b(%rip),%ymm11 # 2cab8 <_sk_overlay_sse2_8bit+0x54c>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,37,85,18,2,0 ; vbroadcastss 0x21255(%rip),%ymm12 # 2c100 <_sk_overlay_sse2_8bit+0x550>
+ DB 196,98,125,24,37,17,28,2,0 ; vbroadcastss 0x21c11(%rip),%ymm12 # 2cabc <_sk_overlay_sse2_8bit+0x550>
DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1
DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -10308,9 +10308,9 @@ _sk_lab_to_xyz_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2
DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- DB 196,226,125,24,5,11,18,2,0 ; vbroadcastss 0x2120b(%rip),%ymm0 # 2c104 <_sk_overlay_sse2_8bit+0x554>
+ DB 196,226,125,24,5,199,27,2,0 ; vbroadcastss 0x21bc7(%rip),%ymm0 # 2cac0 <_sk_overlay_sse2_8bit+0x554>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,2,18,2,0 ; vbroadcastss 0x21202(%rip),%ymm8 # 2c108 <_sk_overlay_sse2_8bit+0x558>
+ DB 196,98,125,24,5,190,27,2,0 ; vbroadcastss 0x21bbe(%rip),%ymm8 # 2cac4 <_sk_overlay_sse2_8bit+0x558>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10326,13 +10326,13 @@ _sk_load_a8_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,66 ; jne af69 <_sk_load_a8_avx+0x5a>
DB 196,130,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm0
- DB 197,249,219,5,219,26,2,0 ; vpand 0x21adb(%rip),%xmm0,%xmm0 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,249,219,5,27,37,2,0 ; vpand 0x2251b(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,63,17,2,0 ; vbroadcastss 0x2113f(%rip),%ymm1 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,251,26,2,0 ; vbroadcastss 0x21afb(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -10380,7 +10380,7 @@ _sk_load_a8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00b010 <_sk_overlay_sse2_8bit+0xffffffffdefdf460>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00b010 <_sk_overlay_sse2_8bit+0xffffffffdefdeaa4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10402,13 +10402,13 @@ _sk_load_a8_dst_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,66 ; jne b076 <_sk_load_a8_dst_avx+0x5a>
DB 196,130,121,48,36,24 ; vpmovzxbw (%r8,%r11,1),%xmm4
- DB 197,217,219,37,206,25,2,0 ; vpand 0x219ce(%rip),%xmm4,%xmm4 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,217,219,37,14,36,2,0 ; vpand 0x2240e(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,50,16,2,0 ; vbroadcastss 0x21032(%rip),%ymm5 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,45,238,25,2,0 ; vbroadcastss 0x219ee(%rip),%ymm5 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -10514,7 +10514,7 @@ _sk_gather_a8_avx LABEL PROC
DB 196,226,121,49,201 ; vpmovzxbd %xmm1,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,153,14,2,0 ; vbroadcastss 0x20e99(%rip),%ymm1 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,85,24,2,0 ; vbroadcastss 0x21855(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -10534,7 +10534,7 @@ _sk_store_a8_avx LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,26,14,2,0 ; vbroadcastss 0x20e1a(%rip),%ymm8 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,214,23,2,0 ; vbroadcastss 0x217d6(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -10559,13 +10559,13 @@ _sk_store_a8_avx LABEL PROC
DB 196,3,121,20,4,24,0 ; vpextrb $0x0,%xmm8,(%r8,%r11,1)
DB 235,202 ; jmp b257 <_sk_store_a8_avx+0x41>
DB 196,3,121,20,68,24,2,4 ; vpextrb $0x4,%xmm8,0x2(%r8,%r11,1)
- DB 196,98,57,0,5,130,23,2,0 ; vpshufb 0x21782(%rip),%xmm8,%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0xe70>
+ DB 196,98,57,0,5,194,33,2,0 ; vpshufb 0x221c2(%rip),%xmm8,%xmm8 # 2d460 <_sk_overlay_sse2_8bit+0xef4>
DB 196,3,121,21,4,24,0 ; vpextrw $0x0,%xmm8,(%r8,%r11,1)
DB 235,176 ; jmp b257 <_sk_store_a8_avx+0x41>
DB 196,3,121,20,68,24,6,12 ; vpextrb $0xc,%xmm8,0x6(%r8,%r11,1)
DB 196,3,121,20,68,24,5,10 ; vpextrb $0xa,%xmm8,0x5(%r8,%r11,1)
DB 196,3,121,20,68,24,4,8 ; vpextrb $0x8,%xmm8,0x4(%r8,%r11,1)
- DB 196,98,57,0,5,104,23,2,0 ; vpshufb 0x21768(%rip),%xmm8,%xmm8 # 2ca30 <_sk_overlay_sse2_8bit+0xe80>
+ DB 196,98,57,0,5,168,33,2,0 ; vpshufb 0x221a8(%rip),%xmm8,%xmm8 # 2d470 <_sk_overlay_sse2_8bit+0xf04>
DB 196,1,121,126,4,24 ; vmovd %xmm8,(%r8,%r11,1)
DB 235,135 ; jmp b257 <_sk_store_a8_avx+0x41>
DB 180,255 ; mov $0xff,%ah
@@ -10599,16 +10599,16 @@ _sk_load_g8_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,71 ; jne b34b <_sk_load_g8_avx+0x5f>
DB 196,130,121,48,4,24 ; vpmovzxbw (%r8,%r11,1),%xmm0
- DB 197,249,219,5,254,22,2,0 ; vpand 0x216fe(%rip),%xmm0,%xmm0 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,249,219,5,62,33,2,0 ; vpand 0x2213e(%rip),%xmm0,%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,98,13,2,0 ; vbroadcastss 0x20d62(%rip),%ymm1 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,30,23,2,0 ; vbroadcastss 0x2171e(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,223,12,2,0 ; vbroadcastss 0x20cdf(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,155,22,2,0 ; vbroadcastss 0x2169b(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -10677,16 +10677,16 @@ _sk_load_g8_dst_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,71 ; jne b45f <_sk_load_g8_dst_avx+0x5f>
DB 196,130,121,48,36,24 ; vpmovzxbw (%r8,%r11,1),%xmm4
- DB 197,217,219,37,234,21,2,0 ; vpand 0x215ea(%rip),%xmm4,%xmm4 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 197,217,219,37,42,32,2,0 ; vpand 0x2202a(%rip),%xmm4,%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,78,12,2,0 ; vbroadcastss 0x20c4e(%rip),%ymm5 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,45,10,22,2,0 ; vbroadcastss 0x2160a(%rip),%ymm5 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,203,11,2,0 ; vbroadcastss 0x20bcb(%rip),%ymm7 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,61,135,21,2,0 ; vbroadcastss 0x21587(%rip),%ymm7 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 255,224 ; jmpq *%rax
@@ -10790,10 +10790,10 @@ _sk_gather_g8_avx LABEL PROC
DB 196,226,121,49,201 ; vpmovzxbd %xmm1,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,173,10,2,0 ; vbroadcastss 0x20aad(%rip),%ymm1 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,226,125,24,13,105,20,2,0 ; vbroadcastss 0x21469(%rip),%ymm1 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,42,10,2,0 ; vbroadcastss 0x20a2a(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,230,19,2,0 ; vbroadcastss 0x213e6(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -10818,23 +10818,23 @@ _sk_load_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,80,10,2,0 ; vbroadcastss 0x20a50(%rip),%ymm0 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,24,5,12,20,2,0 ; vbroadcastss 0x2140c(%rip),%ymm0 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,67,10,2,0 ; vbroadcastss 0x20a43(%rip),%ymm1 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,13,255,19,2,0 ; vbroadcastss 0x213ff(%rip),%ymm1 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,58,10,2,0 ; vbroadcastss 0x20a3a(%rip),%ymm1 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,24,13,246,19,2,0 ; vbroadcastss 0x213f6(%rip),%ymm1 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,45,10,2,0 ; vbroadcastss 0x20a2d(%rip),%ymm3 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,29,233,19,2,0 ; vbroadcastss 0x213e9(%rip),%ymm3 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,36,10,2,0 ; vbroadcastss 0x20a24(%rip),%ymm3 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,24,29,224,19,2,0 ; vbroadcastss 0x213e0(%rip),%ymm3 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,23,10,2,0 ; vbroadcastss 0x20a17(%rip),%ymm3 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,29,211,19,2,0 ; vbroadcastss 0x213d3(%rip),%ymm3 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,124,9,2,0 ; vbroadcastss 0x2097c(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,56,19,2,0 ; vbroadcastss 0x21338(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
@@ -10898,23 +10898,23 @@ _sk_load_565_dst_avx LABEL PROC
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,245,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- DB 196,226,125,24,37,15,9,2,0 ; vbroadcastss 0x2090f(%rip),%ymm4 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,24,37,203,18,2,0 ; vbroadcastss 0x212cb(%rip),%ymm4 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 197,204,84,228 ; vandps %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,2,9,2,0 ; vbroadcastss 0x20902(%rip),%ymm5 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,45,190,18,2,0 ; vbroadcastss 0x212be(%rip),%ymm5 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,249,8,2,0 ; vbroadcastss 0x208f9(%rip),%ymm5 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,24,45,181,18,2,0 ; vbroadcastss 0x212b5(%rip),%ymm5 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 197,204,84,237 ; vandps %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,236,8,2,0 ; vbroadcastss 0x208ec(%rip),%ymm7 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,61,168,18,2,0 ; vbroadcastss 0x212a8(%rip),%ymm7 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,24,61,227,8,2,0 ; vbroadcastss 0x208e3(%rip),%ymm7 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,24,61,159,18,2,0 ; vbroadcastss 0x2129f(%rip),%ymm7 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 197,204,84,247 ; vandps %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,214,8,2,0 ; vbroadcastss 0x208d6(%rip),%ymm7 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,61,146,18,2,0 ; vbroadcastss 0x21292(%rip),%ymm7 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,59,8,2,0 ; vbroadcastss 0x2083b(%rip),%ymm7 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,61,247,17,2,0 ; vbroadcastss 0x211f7(%rip),%ymm7 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
@@ -11014,23 +11014,23 @@ _sk_gather_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,54,7,2,0 ; vbroadcastss 0x20736(%rip),%ymm0 # 2c098 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 196,226,125,24,5,242,16,2,0 ; vbroadcastss 0x210f2(%rip),%ymm0 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,41,7,2,0 ; vbroadcastss 0x20729(%rip),%ymm1 # 2c09c <_sk_overlay_sse2_8bit+0x4ec>
+ DB 196,226,125,24,13,229,16,2,0 ; vbroadcastss 0x210e5(%rip),%ymm1 # 2ca58 <_sk_overlay_sse2_8bit+0x4ec>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,32,7,2,0 ; vbroadcastss 0x20720(%rip),%ymm1 # 2c0a0 <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,226,125,24,13,220,16,2,0 ; vbroadcastss 0x210dc(%rip),%ymm1 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,19,7,2,0 ; vbroadcastss 0x20713(%rip),%ymm3 # 2c0a4 <_sk_overlay_sse2_8bit+0x4f4>
+ DB 196,226,125,24,29,207,16,2,0 ; vbroadcastss 0x210cf(%rip),%ymm3 # 2ca60 <_sk_overlay_sse2_8bit+0x4f4>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,10,7,2,0 ; vbroadcastss 0x2070a(%rip),%ymm3 # 2c0a8 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 196,226,125,24,29,198,16,2,0 ; vbroadcastss 0x210c6(%rip),%ymm3 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,253,6,2,0 ; vbroadcastss 0x206fd(%rip),%ymm3 # 2c0ac <_sk_overlay_sse2_8bit+0x4fc>
+ DB 196,226,125,24,29,185,16,2,0 ; vbroadcastss 0x210b9(%rip),%ymm3 # 2ca68 <_sk_overlay_sse2_8bit+0x4fc>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,98,6,2,0 ; vbroadcastss 0x20662(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,30,16,2,0 ; vbroadcastss 0x2101e(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 91 ; pop %rbx
DB 65,92 ; pop %r12
DB 65,94 ; pop %r14
@@ -11047,14 +11047,14 @@ _sk_store_565_avx LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,37,7,2,0 ; vbroadcastss 0x20725(%rip),%ymm8 # 2c10c <_sk_overlay_sse2_8bit+0x55c>
+ DB 196,98,125,24,5,225,16,2,0 ; vbroadcastss 0x210e1(%rip),%ymm8 # 2cac8 <_sk_overlay_sse2_8bit+0x55c>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- DB 196,98,125,24,21,254,6,2,0 ; vbroadcastss 0x206fe(%rip),%ymm10 # 2c110 <_sk_overlay_sse2_8bit+0x560>
+ DB 196,98,125,24,21,186,16,2,0 ; vbroadcastss 0x210ba(%rip),%ymm10 # 2cacc <_sk_overlay_sse2_8bit+0x560>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11
@@ -11133,25 +11133,25 @@ _sk_load_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,247,5,2,0 ; vbroadcastss 0x205f7(%rip),%ymm0 # 2c114 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,24,5,179,15,2,0 ; vbroadcastss 0x20fb3(%rip),%ymm0 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,234,5,2,0 ; vbroadcastss 0x205ea(%rip),%ymm1 # 2c118 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,13,166,15,2,0 ; vbroadcastss 0x20fa6(%rip),%ymm1 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,225,5,2,0 ; vbroadcastss 0x205e1(%rip),%ymm1 # 2c11c <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,24,13,157,15,2,0 ; vbroadcastss 0x20f9d(%rip),%ymm1 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,212,5,2,0 ; vbroadcastss 0x205d4(%rip),%ymm2 # 2c120 <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,21,144,15,2,0 ; vbroadcastss 0x20f90(%rip),%ymm2 # 2cadc <_sk_overlay_sse2_8bit+0x570>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,203,5,2,0 ; vbroadcastss 0x205cb(%rip),%ymm2 # 2c124 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,24,21,135,15,2,0 ; vbroadcastss 0x20f87(%rip),%ymm2 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,190,5,2,0 ; vbroadcastss 0x205be(%rip),%ymm8 # 2c128 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,122,15,2,0 ; vbroadcastss 0x20f7a(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,180,5,2,0 ; vbroadcastss 0x205b4(%rip),%ymm8 # 2c12c <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,24,5,112,15,2,0 ; vbroadcastss 0x20f70(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,166,5,2,0 ; vbroadcastss 0x205a6(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,98,15,2,0 ; vbroadcastss 0x20f62(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -11218,25 +11218,25 @@ _sk_load_4444_dst_avx LABEL PROC
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,253,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- DB 196,226,125,24,37,159,4,2,0 ; vbroadcastss 0x2049f(%rip),%ymm4 # 2c114 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,24,37,91,14,2,0 ; vbroadcastss 0x20e5b(%rip),%ymm4 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
DB 197,196,84,228 ; vandps %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,146,4,2,0 ; vbroadcastss 0x20492(%rip),%ymm5 # 2c118 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,45,78,14,2,0 ; vbroadcastss 0x20e4e(%rip),%ymm5 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,137,4,2,0 ; vbroadcastss 0x20489(%rip),%ymm5 # 2c11c <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,24,45,69,14,2,0 ; vbroadcastss 0x20e45(%rip),%ymm5 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,124,4,2,0 ; vbroadcastss 0x2047c(%rip),%ymm6 # 2c120 <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,53,56,14,2,0 ; vbroadcastss 0x20e38(%rip),%ymm6 # 2cadc <_sk_overlay_sse2_8bit+0x570>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,24,53,115,4,2,0 ; vbroadcastss 0x20473(%rip),%ymm6 # 2c124 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,24,53,47,14,2,0 ; vbroadcastss 0x20e2f(%rip),%ymm6 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
DB 197,196,84,246 ; vandps %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,102,4,2,0 ; vbroadcastss 0x20466(%rip),%ymm8 # 2c128 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,34,14,2,0 ; vbroadcastss 0x20e22(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,24,5,92,4,2,0 ; vbroadcastss 0x2045c(%rip),%ymm8 # 2c12c <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,24,5,24,14,2,0 ; vbroadcastss 0x20e18(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
DB 196,193,68,84,248 ; vandps %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,78,4,2,0 ; vbroadcastss 0x2044e(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,10,14,2,0 ; vbroadcastss 0x20e0a(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -11338,25 +11338,25 @@ _sk_gather_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,174,2,2,0 ; vbroadcastss 0x202ae(%rip),%ymm0 # 2c114 <_sk_overlay_sse2_8bit+0x564>
+ DB 196,226,125,24,5,106,12,2,0 ; vbroadcastss 0x20c6a(%rip),%ymm0 # 2cad0 <_sk_overlay_sse2_8bit+0x564>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,161,2,2,0 ; vbroadcastss 0x202a1(%rip),%ymm1 # 2c118 <_sk_overlay_sse2_8bit+0x568>
+ DB 196,226,125,24,13,93,12,2,0 ; vbroadcastss 0x20c5d(%rip),%ymm1 # 2cad4 <_sk_overlay_sse2_8bit+0x568>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,152,2,2,0 ; vbroadcastss 0x20298(%rip),%ymm1 # 2c11c <_sk_overlay_sse2_8bit+0x56c>
+ DB 196,226,125,24,13,84,12,2,0 ; vbroadcastss 0x20c54(%rip),%ymm1 # 2cad8 <_sk_overlay_sse2_8bit+0x56c>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,139,2,2,0 ; vbroadcastss 0x2028b(%rip),%ymm2 # 2c120 <_sk_overlay_sse2_8bit+0x570>
+ DB 196,226,125,24,21,71,12,2,0 ; vbroadcastss 0x20c47(%rip),%ymm2 # 2cadc <_sk_overlay_sse2_8bit+0x570>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,130,2,2,0 ; vbroadcastss 0x20282(%rip),%ymm2 # 2c124 <_sk_overlay_sse2_8bit+0x574>
+ DB 196,226,125,24,21,62,12,2,0 ; vbroadcastss 0x20c3e(%rip),%ymm2 # 2cae0 <_sk_overlay_sse2_8bit+0x574>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,117,2,2,0 ; vbroadcastss 0x20275(%rip),%ymm8 # 2c128 <_sk_overlay_sse2_8bit+0x578>
+ DB 196,98,125,24,5,49,12,2,0 ; vbroadcastss 0x20c31(%rip),%ymm8 # 2cae4 <_sk_overlay_sse2_8bit+0x578>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,107,2,2,0 ; vbroadcastss 0x2026b(%rip),%ymm8 # 2c12c <_sk_overlay_sse2_8bit+0x57c>
+ DB 196,98,125,24,5,39,12,2,0 ; vbroadcastss 0x20c27(%rip),%ymm8 # 2cae8 <_sk_overlay_sse2_8bit+0x57c>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,93,2,2,0 ; vbroadcastss 0x2025d(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x580>
+ DB 196,98,125,24,5,25,12,2,0 ; vbroadcastss 0x20c19(%rip),%ymm8 # 2caec <_sk_overlay_sse2_8bit+0x580>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11375,7 +11375,7 @@ _sk_store_4444_avx LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,49,2,2,0 ; vbroadcastss 0x20231(%rip),%ymm8 # 2c134 <_sk_overlay_sse2_8bit+0x584>
+ DB 196,98,125,24,5,237,11,2,0 ; vbroadcastss 0x20bed(%rip),%ymm8 # 2caf0 <_sk_overlay_sse2_8bit+0x584>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10
@@ -11463,10 +11463,10 @@ _sk_load_8888_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 15,133,135,0,0,0 ; jne c0bf <_sk_load_8888_avx+0xa7>
DB 196,1,125,16,12,152 ; vmovupd (%r8,%r11,4),%ymm9
- DB 197,125,40,21,26,5,2,0 ; vmovapd 0x2051a(%rip),%ymm10 # 2c560 <_sk_overlay_sse2_8bit+0x9b0>
+ DB 197,125,40,21,218,14,2,0 ; vmovapd 0x20eda(%rip),%ymm10 # 2cf20 <_sk_overlay_sse2_8bit+0x9b4>
DB 196,193,53,84,194 ; vandpd %ymm10,%ymm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,60,0,2,0 ; vbroadcastss 0x2003c(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,248,9,2,0 ; vbroadcastss 0x209f8(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11556,10 +11556,10 @@ _sk_load_8888_dst_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 15,133,135,0,0,0 ; jne c237 <_sk_load_8888_dst_avx+0xa7>
DB 196,1,125,16,12,152 ; vmovupd (%r8,%r11,4),%ymm9
- DB 197,125,40,21,194,3,2,0 ; vmovapd 0x203c2(%rip),%ymm10 # 2c580 <_sk_overlay_sse2_8bit+0x9d0>
+ DB 197,125,40,21,130,13,2,0 ; vmovapd 0x20d82(%rip),%ymm10 # 2cf40 <_sk_overlay_sse2_8bit+0x9d4>
DB 196,193,53,84,226 ; vandpd %ymm10,%ymm9,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,196,254,1,0 ; vbroadcastss 0x1fec4(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,128,8,2,0 ; vbroadcastss 0x20880(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -11676,10 +11676,10 @@ _sk_gather_8888_avx LABEL PROC
DB 196,131,121,34,4,152,2 ; vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
DB 196,131,121,34,28,144,3 ; vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,230,1,2,0 ; vmovaps 0x201e6(%rip),%ymm10 # 2c5a0 <_sk_overlay_sse2_8bit+0x9f0>
+ DB 197,124,40,21,166,11,2,0 ; vmovaps 0x20ba6(%rip),%ymm10 # 2cf60 <_sk_overlay_sse2_8bit+0x9f4>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,200,252,1,0 ; vbroadcastss 0x1fcc8(%rip),%ymm9 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,13,132,6,2,0 ; vbroadcastss 0x20684(%rip),%ymm9 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -11714,7 +11714,7 @@ _sk_store_8888_avx LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,248,251,1,0 ; vbroadcastss 0x1fbf8(%rip),%ymm8 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,180,5,2,0 ; vbroadcastss 0x205b4(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11800,10 +11800,10 @@ _sk_load_bgra_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 15,133,135,0,0,0 ; jne c613 <_sk_load_bgra_avx+0xa7>
DB 196,1,125,16,12,152 ; vmovupd (%r8,%r11,4),%ymm9
- DB 197,125,40,21,38,0,2,0 ; vmovapd 0x20026(%rip),%ymm10 # 2c5c0 <_sk_overlay_sse2_8bit+0xa10>
+ DB 197,125,40,21,230,9,2,0 ; vmovapd 0x209e6(%rip),%ymm10 # 2cf80 <_sk_overlay_sse2_8bit+0xa14>
DB 196,193,53,84,202 ; vandpd %ymm10,%ymm9,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,98,125,24,5,232,250,1,0 ; vbroadcastss 0x1fae8(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,164,4,2,0 ; vbroadcastss 0x204a4(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,116,89,208 ; vmulps %ymm8,%ymm1,%ymm2
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11893,10 +11893,10 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 15,133,135,0,0,0 ; jne c78b <_sk_load_bgra_dst_avx+0xa7>
DB 196,1,125,16,12,152 ; vmovupd (%r8,%r11,4),%ymm9
- DB 197,125,40,21,206,254,1,0 ; vmovapd 0x1fece(%rip),%ymm10 # 2c5e0 <_sk_overlay_sse2_8bit+0xa30>
+ DB 197,125,40,21,142,8,2,0 ; vmovapd 0x2088e(%rip),%ymm10 # 2cfa0 <_sk_overlay_sse2_8bit+0xa34>
DB 196,193,53,84,234 ; vandpd %ymm10,%ymm9,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,98,125,24,5,112,249,1,0 ; vbroadcastss 0x1f970(%rip),%ymm8 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,5,44,3,2,0 ; vbroadcastss 0x2032c(%rip),%ymm8 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,84,89,240 ; vmulps %ymm8,%ymm5,%ymm6
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -12013,10 +12013,10 @@ _sk_gather_bgra_avx LABEL PROC
DB 196,131,121,34,4,152,2 ; vpinsrd $0x2,(%r8,%r11,4),%xmm0,%xmm0
DB 196,131,121,34,28,144,3 ; vpinsrd $0x3,(%r8,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,13,242,252,1,0 ; vmovaps 0x1fcf2(%rip),%ymm9 # 2c600 <_sk_overlay_sse2_8bit+0xa50>
+ DB 197,124,40,13,178,6,2,0 ; vmovaps 0x206b2(%rip),%ymm9 # 2cfc0 <_sk_overlay_sse2_8bit+0xa54>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,116,247,1,0 ; vbroadcastss 0x1f774(%rip),%ymm10 # 2c094 <_sk_overlay_sse2_8bit+0x4e4>
+ DB 196,98,125,24,21,48,1,2,0 ; vbroadcastss 0x20130(%rip),%ymm10 # 2ca50 <_sk_overlay_sse2_8bit+0x4e4>
DB 196,193,124,89,210 ; vmulps %ymm10,%ymm0,%ymm2
DB 196,193,121,114,208,8 ; vpsrld $0x8,%xmm8,%xmm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
@@ -12051,7 +12051,7 @@ _sk_store_bgra_avx LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 196,98,125,24,5,164,246,1,0 ; vbroadcastss 0x1f6a4(%rip),%ymm8 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 196,98,125,24,5,96,0,2,0 ; vbroadcastss 0x20060(%rip),%ymm8 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -12158,13 +12158,13 @@ _sk_load_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,65,246,1,0 ; vbroadcastss 0x1f641(%rip),%ymm12 # 2c19c <_sk_overlay_sse2_8bit+0x5ec>
+ DB 196,98,125,24,37,253,255,1,0 ; vbroadcastss 0x1fffd(%rip),%ymm12 # 2cb58 <_sk_overlay_sse2_8bit+0x5ec>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,5,246,1,0 ; vbroadcastss 0x1f605(%rip),%xmm11 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,121,24,29,193,255,1,0 ; vbroadcastss 0x1ffc1(%rip),%xmm11 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,31,246,1,0 ; vbroadcastss 0x1f61f(%rip),%xmm13 # 2c1a0 <_sk_overlay_sse2_8bit+0x5f0>
+ DB 196,98,121,24,45,219,255,1,0 ; vbroadcastss 0x1ffdb(%rip),%xmm13 # 2cb5c <_sk_overlay_sse2_8bit+0x5f0>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12178,7 +12178,7 @@ _sk_load_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,213,245,1,0 ; vbroadcastss 0x1f5d5(%rip),%xmm3 # 2c1a4 <_sk_overlay_sse2_8bit+0x5f4>
+ DB 196,226,121,24,29,145,255,1,0 ; vbroadcastss 0x1ff91(%rip),%xmm3 # 2cb60 <_sk_overlay_sse2_8bit+0x5f4>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -12328,13 +12328,13 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,217,105,232 ; vpunpckhwd %xmm0,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- DB 196,98,125,24,37,244,242,1,0 ; vbroadcastss 0x1f2f4(%rip),%ymm12 # 2c19c <_sk_overlay_sse2_8bit+0x5ec>
+ DB 196,98,125,24,37,176,252,1,0 ; vbroadcastss 0x1fcb0(%rip),%ymm12 # 2cb58 <_sk_overlay_sse2_8bit+0x5ec>
DB 196,193,92,84,236 ; vandps %ymm12,%ymm4,%ymm5
DB 197,220,87,229 ; vxorps %ymm5,%ymm4,%ymm4
DB 196,195,125,25,230,1 ; vextractf128 $0x1,%ymm4,%xmm14
- DB 196,98,121,24,29,184,242,1,0 ; vbroadcastss 0x1f2b8(%rip),%xmm11 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,121,24,29,116,252,1,0 ; vbroadcastss 0x1fc74(%rip),%xmm11 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,193,8,87,251 ; vxorps %xmm11,%xmm14,%xmm7
- DB 196,98,121,24,45,210,242,1,0 ; vbroadcastss 0x1f2d2(%rip),%xmm13 # 2c1a0 <_sk_overlay_sse2_8bit+0x5f0>
+ DB 196,98,121,24,45,142,252,1,0 ; vbroadcastss 0x1fc8e(%rip),%xmm13 # 2cb5c <_sk_overlay_sse2_8bit+0x5f0>
DB 197,145,102,255 ; vpcmpgtd %xmm7,%xmm13,%xmm7
DB 196,65,88,87,211 ; vxorps %xmm11,%xmm4,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12348,7 +12348,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,227,93,24,231,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
DB 197,220,86,229 ; vorps %ymm5,%ymm4,%ymm4
DB 196,227,125,25,229,1 ; vextractf128 $0x1,%ymm4,%xmm5
- DB 196,226,121,24,61,136,242,1,0 ; vbroadcastss 0x1f288(%rip),%xmm7 # 2c1a4 <_sk_overlay_sse2_8bit+0x5f4>
+ DB 196,226,121,24,61,68,252,1,0 ; vbroadcastss 0x1fc44(%rip),%xmm7 # 2cb60 <_sk_overlay_sse2_8bit+0x5f4>
DB 197,209,254,239 ; vpaddd %xmm7,%xmm5,%xmm5
DB 197,217,254,231 ; vpaddd %xmm7,%xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -12525,13 +12525,13 @@ _sk_gather_f16_avx LABEL PROC
DB 197,249,105,210 ; vpunpckhwd %xmm2,%xmm0,%xmm2
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
- DB 196,98,125,24,37,53,239,1,0 ; vbroadcastss 0x1ef35(%rip),%ymm12 # 2c19c <_sk_overlay_sse2_8bit+0x5ec>
+ DB 196,98,125,24,37,241,248,1,0 ; vbroadcastss 0x1f8f1(%rip),%ymm12 # 2cb58 <_sk_overlay_sse2_8bit+0x5ec>
DB 196,193,124,84,212 ; vandps %ymm12,%ymm0,%ymm2
DB 197,252,87,194 ; vxorps %ymm2,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,249,238,1,0 ; vbroadcastss 0x1eef9(%rip),%xmm11 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,121,24,29,181,248,1,0 ; vbroadcastss 0x1f8b5(%rip),%xmm11 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,19,239,1,0 ; vbroadcastss 0x1ef13(%rip),%xmm13 # 2c1a0 <_sk_overlay_sse2_8bit+0x5f0>
+ DB 196,98,121,24,45,207,248,1,0 ; vbroadcastss 0x1f8cf(%rip),%xmm13 # 2cb5c <_sk_overlay_sse2_8bit+0x5f0>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12545,7 +12545,7 @@ _sk_gather_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,194 ; vorps %ymm2,%ymm0,%ymm0
DB 196,227,125,25,194,1 ; vextractf128 $0x1,%ymm0,%xmm2
- DB 196,226,121,24,29,201,238,1,0 ; vbroadcastss 0x1eec9(%rip),%xmm3 # 2c1a4 <_sk_overlay_sse2_8bit+0x5f4>
+ DB 196,226,121,24,29,133,248,1,0 ; vbroadcastss 0x1f885(%rip),%xmm3 # 2cb60 <_sk_overlay_sse2_8bit+0x5f4>
DB 197,233,254,211 ; vpaddd %xmm3,%xmm2,%xmm2
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
@@ -12647,12 +12647,12 @@ _sk_store_f16_avx LABEL PROC
DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
- DB 196,98,125,24,13,166,236,1,0 ; vbroadcastss 0x1eca6(%rip),%ymm9 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,98,246,1,0 ; vbroadcastss 0x1f662(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11
DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12
- DB 196,98,121,24,5,184,236,1,0 ; vbroadcastss 0x1ecb8(%rip),%xmm8 # 2c1a8 <_sk_overlay_sse2_8bit+0x5f8>
+ DB 196,98,121,24,5,116,246,1,0 ; vbroadcastss 0x1f674(%rip),%xmm8 # 2cb64 <_sk_overlay_sse2_8bit+0x5f8>
DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13
DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14
DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -12662,7 +12662,7 @@ _sk_store_f16_avx LABEL PROC
DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11
DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12
- DB 196,98,125,24,21,127,236,1,0 ; vbroadcastss 0x1ec7f(%rip),%ymm10 # 2c1ac <_sk_overlay_sse2_8bit+0x5fc>
+ DB 196,98,125,24,21,59,246,1,0 ; vbroadcastss 0x1f63b(%rip),%ymm10 # 2cb68 <_sk_overlay_sse2_8bit+0x5fc>
DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14
DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15
DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12
@@ -12815,7 +12815,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,157,232,1,0 ; vbroadcastss 0x1e89d(%rip),%ymm11 # 2c0b0 <_sk_overlay_sse2_8bit+0x500>
+ DB 196,98,125,24,29,89,242,1,0 ; vbroadcastss 0x1f259(%rip),%ymm11 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -12913,7 +12913,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,21,223,230,1,0 ; vbroadcastss 0x1e6df(%rip),%ymm2 # 2c0b0 <_sk_overlay_sse2_8bit+0x500>
+ DB 196,226,125,24,21,155,240,1,0 ; vbroadcastss 0x1f09b(%rip),%ymm2 # 2ca6c <_sk_overlay_sse2_8bit+0x500>
DB 197,252,89,194 ; vmulps %ymm2,%ymm0,%ymm0
DB 197,185,109,201 ; vpunpckhqdq %xmm1,%xmm8,%xmm1
DB 197,225,113,241,8 ; vpsllw $0x8,%xmm1,%xmm3
@@ -12934,7 +12934,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,235,229,1,0 ; vbroadcastss 0x1e5eb(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,167,239,1,0 ; vbroadcastss 0x1efa7(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,64 ; vmovd (%r8,%rax,2),%xmm0
DB 196,65,121,196,92,64,4,2 ; vpinsrw $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
@@ -13008,7 +13008,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
- DB 196,98,125,24,5,171,229,1,0 ; vbroadcastss 0x1e5ab(%rip),%ymm8 # 2c138 <_sk_overlay_sse2_8bit+0x588>
+ DB 196,98,125,24,5,103,239,1,0 ; vbroadcastss 0x1ef67(%rip),%ymm8 # 2caf4 <_sk_overlay_sse2_8bit+0x588>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -13265,7 +13265,7 @@ _sk_load_f32_dst_avx LABEL PROC
DB 255,92,255,255 ; lcall *-0x1(%rdi,%rdi,8)
DB 255,70,255 ; incl -0x1(%rsi)
DB 255 ; (bad)
- DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 2900e004 <_sk_overlay_sse2_8bit+0x28fe2454>
+ DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 2900e004 <_sk_overlay_sse2_8bit+0x28fe1a98>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -13400,7 +13400,7 @@ _sk_mirror_x_avx LABEL PROC
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- DB 197,178,89,5,15,222,1,0 ; vmulss 0x1de0f(%rip),%xmm9,%xmm0 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 197,178,89,5,203,231,1,0 ; vmulss 0x1e7cb(%rip),%xmm9,%xmm0 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
@@ -13432,7 +13432,7 @@ _sk_mirror_y_avx LABEL PROC
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- DB 197,178,89,13,130,221,1,0 ; vmulss 0x1dd82(%rip),%xmm9,%xmm1 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 197,178,89,13,62,231,1,0 ; vmulss 0x1e73e(%rip),%xmm9,%xmm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
@@ -13457,7 +13457,7 @@ PUBLIC _sk_clamp_x_1_avx
_sk_clamp_x_1_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,28,221,1,0 ; vbroadcastss 0x1dd1c(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,216,230,1,0 ; vbroadcastss 0x1e6d8(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -13471,9 +13471,9 @@ _sk_repeat_x_1_avx LABEL PROC
PUBLIC _sk_mirror_x_1_avx
_sk_mirror_x_1_avx LABEL PROC
- DB 196,98,125,24,5,19,221,1,0 ; vbroadcastss 0x1dd13(%rip),%ymm8 # 2c038 <_sk_overlay_sse2_8bit+0x488>
+ DB 196,98,125,24,5,207,230,1,0 ; vbroadcastss 0x1e6cf(%rip),%ymm8 # 2c9f4 <_sk_overlay_sse2_8bit+0x488>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,233,220,1,0 ; vbroadcastss 0x1dce9(%rip),%ymm9 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,13,165,230,1,0 ; vbroadcastss 0x1e6a5(%rip),%ymm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -13487,12 +13487,12 @@ _sk_mirror_x_1_avx LABEL PROC
PUBLIC _sk_luminance_to_alpha_avx
_sk_luminance_to_alpha_avx LABEL PROC
- DB 196,226,125,24,29,213,221,1,0 ; vbroadcastss 0x1ddd5(%rip),%ymm3 # 2c13c <_sk_overlay_sse2_8bit+0x58c>
+ DB 196,226,125,24,29,145,231,1,0 ; vbroadcastss 0x1e791(%rip),%ymm3 # 2caf8 <_sk_overlay_sse2_8bit+0x58c>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,29,204,221,1,0 ; vbroadcastss 0x1ddcc(%rip),%ymm3 # 2c140 <_sk_overlay_sse2_8bit+0x590>
+ DB 196,226,125,24,29,136,231,1,0 ; vbroadcastss 0x1e788(%rip),%ymm3 # 2cafc <_sk_overlay_sse2_8bit+0x590>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,191,221,1,0 ; vbroadcastss 0x1ddbf(%rip),%ymm1 # 2c144 <_sk_overlay_sse2_8bit+0x594>
+ DB 196,226,125,24,13,123,231,1,0 ; vbroadcastss 0x1e77b(%rip),%ymm1 # 2cb00 <_sk_overlay_sse2_8bit+0x594>
DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13884,18 +13884,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_avx
_sk_gauss_a_to_rgba_avx LABEL PROC
- DB 196,226,125,24,5,212,214,1,0 ; vbroadcastss 0x1d6d4(%rip),%ymm0 # 2c14c <_sk_overlay_sse2_8bit+0x59c>
+ DB 196,226,125,24,5,144,224,1,0 ; vbroadcastss 0x1e090(%rip),%ymm0 # 2cb08 <_sk_overlay_sse2_8bit+0x59c>
DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
- DB 196,226,125,24,13,195,214,1,0 ; vbroadcastss 0x1d6c3(%rip),%ymm1 # 2c148 <_sk_overlay_sse2_8bit+0x598>
+ DB 196,226,125,24,13,127,224,1,0 ; vbroadcastss 0x1e07f(%rip),%ymm1 # 2cb04 <_sk_overlay_sse2_8bit+0x598>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,186,214,1,0 ; vbroadcastss 0x1d6ba(%rip),%ymm1 # 2c150 <_sk_overlay_sse2_8bit+0x5a0>
+ DB 196,226,125,24,13,118,224,1,0 ; vbroadcastss 0x1e076(%rip),%ymm1 # 2cb0c <_sk_overlay_sse2_8bit+0x5a0>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,173,214,1,0 ; vbroadcastss 0x1d6ad(%rip),%ymm1 # 2c154 <_sk_overlay_sse2_8bit+0x5a4>
+ DB 196,226,125,24,13,105,224,1,0 ; vbroadcastss 0x1e069(%rip),%ymm1 # 2cb10 <_sk_overlay_sse2_8bit+0x5a4>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,160,214,1,0 ; vbroadcastss 0x1d6a0(%rip),%ymm1 # 2c158 <_sk_overlay_sse2_8bit+0x5a8>
+ DB 196,226,125,24,13,92,224,1,0 ; vbroadcastss 0x1e05c(%rip),%ymm1 # 2cb14 <_sk_overlay_sse2_8bit+0x5a8>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -13921,7 +13921,7 @@ _sk_gradient_avx LABEL PROC
DB 73,255,200 ; dec %r8
DB 72,131,195,4 ; add $0x4,%rbx
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
- DB 196,98,125,24,21,30,213,1,0 ; vbroadcastss 0x1d51e(%rip),%ymm10 # 2c024 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,125,24,21,218,222,1,0 ; vbroadcastss 0x1deda(%rip),%ymm10 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8
DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8
@@ -14112,27 +14112,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,70,210,1,0 ; vbroadcastss 0x1d246(%rip),%ymm13 # 2c15c <_sk_overlay_sse2_8bit+0x5ac>
+ DB 196,98,125,24,45,2,220,1,0 ; vbroadcastss 0x1dc02(%rip),%ymm13 # 2cb18 <_sk_overlay_sse2_8bit+0x5ac>
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,60,210,1,0 ; vbroadcastss 0x1d23c(%rip),%ymm14 # 2c160 <_sk_overlay_sse2_8bit+0x5b0>
+ DB 196,98,125,24,53,248,219,1,0 ; vbroadcastss 0x1dbf8(%rip),%ymm14 # 2cb1c <_sk_overlay_sse2_8bit+0x5b0>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,45,210,1,0 ; vbroadcastss 0x1d22d(%rip),%ymm14 # 2c164 <_sk_overlay_sse2_8bit+0x5b4>
+ DB 196,98,125,24,53,233,219,1,0 ; vbroadcastss 0x1dbe9(%rip),%ymm14 # 2cb20 <_sk_overlay_sse2_8bit+0x5b4>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12
- DB 196,98,125,24,45,30,210,1,0 ; vbroadcastss 0x1d21e(%rip),%ymm13 # 2c168 <_sk_overlay_sse2_8bit+0x5b8>
+ DB 196,98,125,24,45,218,219,1,0 ; vbroadcastss 0x1dbda(%rip),%ymm13 # 2cb24 <_sk_overlay_sse2_8bit+0x5b8>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,9,210,1,0 ; vbroadcastss 0x1d209(%rip),%ymm10 # 2c16c <_sk_overlay_sse2_8bit+0x5bc>
+ DB 196,98,125,24,21,197,219,1,0 ; vbroadcastss 0x1dbc5(%rip),%ymm10 # 2cb28 <_sk_overlay_sse2_8bit+0x5bc>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,159,208,1,0 ; vbroadcastss 0x1d09f(%rip),%ymm10 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,21,91,218,1,0 ; vbroadcastss 0x1da5b(%rip),%ymm10 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,137,208,1,0 ; vbroadcastss 0x1d089(%rip),%ymm10 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,21,69,218,1,0 ; vbroadcastss 0x1da45(%rip),%ymm10 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -14158,7 +14158,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,127,209,1,0 ; vbroadcastss 0x1d17f(%rip),%ymm11 # 2c170 <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,29,59,219,1,0 ; vbroadcastss 0x1db3b(%rip),%ymm11 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -14167,17 +14167,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,83,209,1,0 ; vbroadcastss 0x1d153(%rip),%ymm9 # 2c174 <_sk_overlay_sse2_8bit+0x5c4>
+ DB 196,98,125,24,13,15,219,1,0 ; vbroadcastss 0x1db0f(%rip),%ymm9 # 2cb30 <_sk_overlay_sse2_8bit+0x5c4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,49,209,1,0 ; vbroadcastss 0x1d131(%rip),%ymm9 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,237,218,1,0 ; vbroadcastss 0x1daed(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,194,207,1,0 ; vbroadcastss 0x1cfc2(%rip),%ymm11 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,126,217,1,0 ; vbroadcastss 0x1d97e(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -14195,7 +14195,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,209,208,1,0 ; vbroadcastss 0x1d0d1(%rip),%ymm11 # 2c170 <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,29,141,218,1,0 ; vbroadcastss 0x1da8d(%rip),%ymm11 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -14204,17 +14204,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,165,208,1,0 ; vbroadcastss 0x1d0a5(%rip),%ymm9 # 2c174 <_sk_overlay_sse2_8bit+0x5c4>
+ DB 196,98,125,24,13,97,218,1,0 ; vbroadcastss 0x1da61(%rip),%ymm9 # 2cb30 <_sk_overlay_sse2_8bit+0x5c4>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,131,208,1,0 ; vbroadcastss 0x1d083(%rip),%ymm9 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,13,63,218,1,0 ; vbroadcastss 0x1da3f(%rip),%ymm9 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,20,207,1,0 ; vbroadcastss 0x1cf14(%rip),%ymm11 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,29,208,216,1,0 ; vbroadcastss 0x1d8d0(%rip),%ymm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -14231,7 +14231,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,67,121,4,201,0 ; vpermilps $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,41,208,1,0 ; vbroadcastss 0x1d029(%rip),%ymm10 # 2c170 <_sk_overlay_sse2_8bit+0x5c0>
+ DB 196,98,125,24,21,229,217,1,0 ; vbroadcastss 0x1d9e5(%rip),%ymm10 # 2cb2c <_sk_overlay_sse2_8bit+0x5c0>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
@@ -14240,7 +14240,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,1,208,1,0 ; vbroadcastss 0x1d001(%rip),%ymm8 # 2c178 <_sk_overlay_sse2_8bit+0x5c8>
+ DB 196,98,125,24,5,189,217,1,0 ; vbroadcastss 0x1d9bd(%rip),%ymm8 # 2cb34 <_sk_overlay_sse2_8bit+0x5c8>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14275,7 +14275,7 @@ _sk_apply_vector_mask_avx LABEL PROC
PUBLIC _sk_save_xy_avx
_sk_save_xy_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,61,206,1,0 ; vbroadcastss 0x1ce3d(%rip),%ymm8 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,249,215,1,0 ; vbroadcastss 0x1d7f9(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -14308,9 +14308,9 @@ _sk_accumulate_avx LABEL PROC
PUBLIC _sk_bilinear_nx_avx
_sk_bilinear_nx_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,37,207,1,0 ; vbroadcastss 0x1cf25(%rip),%ymm0 # 2c17c <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,5,225,216,1,0 ; vbroadcastss 0x1d8e1(%rip),%ymm0 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,188,205,1,0 ; vbroadcastss 0x1cdbc(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,120,215,1,0 ; vbroadcastss 0x1d778(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14319,7 +14319,7 @@ _sk_bilinear_nx_avx LABEL PROC
PUBLIC _sk_bilinear_px_avx
_sk_bilinear_px_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,156,205,1,0 ; vbroadcastss 0x1cd9c(%rip),%ymm0 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,5,88,215,1,0 ; vbroadcastss 0x1d758(%rip),%ymm0 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -14329,9 +14329,9 @@ _sk_bilinear_px_avx LABEL PROC
PUBLIC _sk_bilinear_ny_avx
_sk_bilinear_ny_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,220,206,1,0 ; vbroadcastss 0x1cedc(%rip),%ymm1 # 2c17c <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,13,152,216,1,0 ; vbroadcastss 0x1d898(%rip),%ymm1 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,114,205,1,0 ; vbroadcastss 0x1cd72(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,46,215,1,0 ; vbroadcastss 0x1d72e(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14340,7 +14340,7 @@ _sk_bilinear_ny_avx LABEL PROC
PUBLIC _sk_bilinear_py_avx
_sk_bilinear_py_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,82,205,1,0 ; vbroadcastss 0x1cd52(%rip),%ymm1 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,226,125,24,13,14,215,1,0 ; vbroadcastss 0x1d70e(%rip),%ymm1 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14350,14 +14350,14 @@ _sk_bilinear_py_avx LABEL PROC
PUBLIC _sk_bicubic_n3x_avx
_sk_bicubic_n3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,149,206,1,0 ; vbroadcastss 0x1ce95(%rip),%ymm0 # 2c180 <_sk_overlay_sse2_8bit+0x5d0>
+ DB 196,226,125,24,5,81,216,1,0 ; vbroadcastss 0x1d851(%rip),%ymm0 # 2cb3c <_sk_overlay_sse2_8bit+0x5d0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,40,205,1,0 ; vbroadcastss 0x1cd28(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,228,214,1,0 ; vbroadcastss 0x1d6e4(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,121,206,1,0 ; vbroadcastss 0x1ce79(%rip),%ymm10 # 2c184 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,53,216,1,0 ; vbroadcastss 0x1d835(%rip),%ymm10 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,119,205,1,0 ; vbroadcastss 0x1cd77(%rip),%ymm10 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,21,51,215,1,0 ; vbroadcastss 0x1d733(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -14367,19 +14367,19 @@ _sk_bicubic_n3x_avx LABEL PROC
PUBLIC _sk_bicubic_n1x_avx
_sk_bicubic_n1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,66,206,1,0 ; vbroadcastss 0x1ce42(%rip),%ymm0 # 2c17c <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,5,254,215,1,0 ; vbroadcastss 0x1d7fe(%rip),%ymm0 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,217,204,1,0 ; vbroadcastss 0x1ccd9(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,149,214,1,0 ; vbroadcastss 0x1d695(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,55,206,1,0 ; vbroadcastss 0x1ce37(%rip),%ymm9 # 2c18c <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,13,243,215,1,0 ; vbroadcastss 0x1d7f3(%rip),%ymm9 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,37,206,1,0 ; vbroadcastss 0x1ce25(%rip),%ymm10 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,21,225,215,1,0 ; vbroadcastss 0x1d7e1(%rip),%ymm10 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,166,204,1,0 ; vbroadcastss 0x1cca6(%rip),%ymm10 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,21,98,214,1,0 ; vbroadcastss 0x1d662(%rip),%ymm10 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,7,206,1,0 ; vbroadcastss 0x1ce07(%rip),%ymm9 # 2c190 <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,13,195,215,1,0 ; vbroadcastss 0x1d7c3(%rip),%ymm9 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14388,17 +14388,17 @@ _sk_bicubic_n1x_avx LABEL PROC
PUBLIC _sk_bicubic_p1x_avx
_sk_bicubic_p1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,119,204,1,0 ; vbroadcastss 0x1cc77(%rip),%ymm8 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,51,214,1,0 ; vbroadcastss 0x1d633(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,213,205,1,0 ; vbroadcastss 0x1cdd5(%rip),%ymm10 # 2c18c <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,21,145,215,1,0 ; vbroadcastss 0x1d791(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,195,205,1,0 ; vbroadcastss 0x1cdc3(%rip),%ymm11 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,29,127,215,1,0 ; vbroadcastss 0x1d77f(%rip),%ymm11 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,174,205,1,0 ; vbroadcastss 0x1cdae(%rip),%ymm9 # 2c190 <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,13,106,215,1,0 ; vbroadcastss 0x1d76a(%rip),%ymm9 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14407,13 +14407,13 @@ _sk_bicubic_p1x_avx LABEL PROC
PUBLIC _sk_bicubic_p3x_avx
_sk_bicubic_p3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,138,205,1,0 ; vbroadcastss 0x1cd8a(%rip),%ymm0 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,226,125,24,5,70,215,1,0 ; vbroadcastss 0x1d746(%rip),%ymm0 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,111,205,1,0 ; vbroadcastss 0x1cd6f(%rip),%ymm10 # 2c184 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,43,215,1,0 ; vbroadcastss 0x1d72b(%rip),%ymm10 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,109,204,1,0 ; vbroadcastss 0x1cc6d(%rip),%ymm10 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,21,41,214,1,0 ; vbroadcastss 0x1d629(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -14423,14 +14423,14 @@ _sk_bicubic_p3x_avx LABEL PROC
PUBLIC _sk_bicubic_n3y_avx
_sk_bicubic_n3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,60,205,1,0 ; vbroadcastss 0x1cd3c(%rip),%ymm1 # 2c180 <_sk_overlay_sse2_8bit+0x5d0>
+ DB 196,226,125,24,13,248,214,1,0 ; vbroadcastss 0x1d6f8(%rip),%ymm1 # 2cb3c <_sk_overlay_sse2_8bit+0x5d0>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,206,203,1,0 ; vbroadcastss 0x1cbce(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,138,213,1,0 ; vbroadcastss 0x1d58a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,31,205,1,0 ; vbroadcastss 0x1cd1f(%rip),%ymm10 # 2c184 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,219,214,1,0 ; vbroadcastss 0x1d6db(%rip),%ymm10 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,29,204,1,0 ; vbroadcastss 0x1cc1d(%rip),%ymm10 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,21,217,213,1,0 ; vbroadcastss 0x1d5d9(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14440,19 +14440,19 @@ _sk_bicubic_n3y_avx LABEL PROC
PUBLIC _sk_bicubic_n1y_avx
_sk_bicubic_n1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,232,204,1,0 ; vbroadcastss 0x1cce8(%rip),%ymm1 # 2c17c <_sk_overlay_sse2_8bit+0x5cc>
+ DB 196,226,125,24,13,164,214,1,0 ; vbroadcastss 0x1d6a4(%rip),%ymm1 # 2cb38 <_sk_overlay_sse2_8bit+0x5cc>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,126,203,1,0 ; vbroadcastss 0x1cb7e(%rip),%ymm8 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,98,125,24,5,58,213,1,0 ; vbroadcastss 0x1d53a(%rip),%ymm8 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,220,204,1,0 ; vbroadcastss 0x1ccdc(%rip),%ymm9 # 2c18c <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,13,152,214,1,0 ; vbroadcastss 0x1d698(%rip),%ymm9 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,202,204,1,0 ; vbroadcastss 0x1ccca(%rip),%ymm10 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,21,134,214,1,0 ; vbroadcastss 0x1d686(%rip),%ymm10 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,75,203,1,0 ; vbroadcastss 0x1cb4b(%rip),%ymm10 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,21,7,213,1,0 ; vbroadcastss 0x1d507(%rip),%ymm10 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,172,204,1,0 ; vbroadcastss 0x1ccac(%rip),%ymm9 # 2c190 <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,13,104,214,1,0 ; vbroadcastss 0x1d668(%rip),%ymm9 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14461,17 +14461,17 @@ _sk_bicubic_n1y_avx LABEL PROC
PUBLIC _sk_bicubic_p1y_avx
_sk_bicubic_p1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,28,203,1,0 ; vbroadcastss 0x1cb1c(%rip),%ymm8 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 196,98,125,24,5,216,212,1,0 ; vbroadcastss 0x1d4d8(%rip),%ymm8 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,121,204,1,0 ; vbroadcastss 0x1cc79(%rip),%ymm10 # 2c18c <_sk_overlay_sse2_8bit+0x5dc>
+ DB 196,98,125,24,21,53,214,1,0 ; vbroadcastss 0x1d635(%rip),%ymm10 # 2cb48 <_sk_overlay_sse2_8bit+0x5dc>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,103,204,1,0 ; vbroadcastss 0x1cc67(%rip),%ymm11 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,98,125,24,29,35,214,1,0 ; vbroadcastss 0x1d623(%rip),%ymm11 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,82,204,1,0 ; vbroadcastss 0x1cc52(%rip),%ymm9 # 2c190 <_sk_overlay_sse2_8bit+0x5e0>
+ DB 196,98,125,24,13,14,214,1,0 ; vbroadcastss 0x1d60e(%rip),%ymm9 # 2cb4c <_sk_overlay_sse2_8bit+0x5e0>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14480,13 +14480,13 @@ _sk_bicubic_p1y_avx LABEL PROC
PUBLIC _sk_bicubic_p3y_avx
_sk_bicubic_p3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,46,204,1,0 ; vbroadcastss 0x1cc2e(%rip),%ymm1 # 2c188 <_sk_overlay_sse2_8bit+0x5d8>
+ DB 196,226,125,24,13,234,213,1,0 ; vbroadcastss 0x1d5ea(%rip),%ymm1 # 2cb44 <_sk_overlay_sse2_8bit+0x5d8>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,18,204,1,0 ; vbroadcastss 0x1cc12(%rip),%ymm10 # 2c184 <_sk_overlay_sse2_8bit+0x5d4>
+ DB 196,98,125,24,21,206,213,1,0 ; vbroadcastss 0x1d5ce(%rip),%ymm10 # 2cb40 <_sk_overlay_sse2_8bit+0x5d4>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,16,203,1,0 ; vbroadcastss 0x1cb10(%rip),%ymm10 # 2c090 <_sk_overlay_sse2_8bit+0x4e0>
+ DB 196,98,125,24,21,204,212,1,0 ; vbroadcastss 0x1d4cc(%rip),%ymm10 # 2ca4c <_sk_overlay_sse2_8bit+0x4e0>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14617,7 +14617,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,249,127,68,36,96 ; vmovdqa %xmm0,0x60(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,121,254,194 ; vpaddd %xmm10,%xmm0,%xmm0
- DB 196,98,121,24,29,198,201,1,0 ; vbroadcastss 0x1c9c6(%rip),%xmm11 # 2c198 <_sk_overlay_sse2_8bit+0x5e8>
+ DB 196,98,121,24,29,130,211,1,0 ; vbroadcastss 0x1d382(%rip),%xmm11 # 2cb54 <_sk_overlay_sse2_8bit+0x5e8>
DB 196,194,121,64,203 ; vpmulld %xmm11,%xmm0,%xmm1
DB 196,193,249,126,200 ; vmovq %xmm1,%r8
DB 69,137,193 ; mov %r8d,%r9d
@@ -14651,7 +14651,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,227,93,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
DB 197,252,17,156,36,192,0,0,0 ; vmovups %ymm3,0xc0(%rsp)
- DB 196,98,121,24,13,141,199,1,0 ; vbroadcastss 0x1c78d(%rip),%xmm9 # 2c024 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,121,24,13,73,209,1,0 ; vbroadcastss 0x1d149(%rip),%xmm9 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
DB 196,193,105,254,249 ; vpaddd %xmm9,%xmm2,%xmm7
DB 196,195,249,22,248,1 ; vpextrq $0x1,%xmm7,%r8
DB 196,193,249,126,249 ; vmovq %xmm7,%r9
@@ -14679,7 +14679,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,254,1 ; vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- DB 196,98,121,24,37,2,199,1,0 ; vbroadcastss 0x1c702(%rip),%xmm12 # 2c02c <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,121,24,37,190,208,1,0 ; vbroadcastss 0x1d0be(%rip),%xmm12 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
DB 196,193,105,254,212 ; vpaddd %xmm12,%xmm2,%xmm2
DB 196,195,249,22,208,1 ; vpextrq $0x1,%xmm2,%r8
DB 196,193,249,126,209 ; vmovq %xmm2,%r9
@@ -14707,7 +14707,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,105,33,213,48 ; vinsertps $0x30,%xmm5,%xmm2,%xmm2
DB 196,227,109,24,225,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- DB 196,226,125,24,13,214,199,1,0 ; vbroadcastss 0x1c7d6(%rip),%ymm1 # 2c194 <_sk_overlay_sse2_8bit+0x5e4>
+ DB 196,226,125,24,13,146,209,1,0 ; vbroadcastss 0x1d192(%rip),%ymm1 # 2cb50 <_sk_overlay_sse2_8bit+0x5e4>
DB 197,188,88,209 ; vaddps %ymm1,%ymm8,%ymm2
DB 197,252,17,140,36,160,0,0,0 ; vmovups %ymm1,0xa0(%rsp)
DB 197,254,91,210 ; vcvttps2dq %ymm2,%ymm2
@@ -15458,7 +15458,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,226,25,64,200 ; vpmulld %xmm0,%xmm12,%xmm1
DB 197,249,127,12,36 ; vmovdqa %xmm1,(%rsp)
DB 197,241,254,202 ; vpaddd %xmm2,%xmm1,%xmm1
- DB 196,98,121,24,61,91,184,1,0 ; vbroadcastss 0x1b85b(%rip),%xmm15 # 2c198 <_sk_overlay_sse2_8bit+0x5e8>
+ DB 196,98,121,24,61,23,194,1,0 ; vbroadcastss 0x1c217(%rip),%xmm15 # 2cb54 <_sk_overlay_sse2_8bit+0x5e8>
DB 196,194,113,64,247 ; vpmulld %xmm15,%xmm1,%xmm6
DB 196,193,249,126,240 ; vmovq %xmm6,%r8
DB 69,137,193 ; mov %r8d,%r9d
@@ -15496,7 +15496,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,163,65,33,60,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,99,53,24,247,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- DB 196,98,121,24,21,9,182,1,0 ; vbroadcastss 0x1b609(%rip),%xmm10 # 2c024 <_sk_overlay_sse2_8bit+0x474>
+ DB 196,98,121,24,21,197,191,1,0 ; vbroadcastss 0x1bfc5(%rip),%xmm10 # 2c9e0 <_sk_overlay_sse2_8bit+0x474>
DB 196,65,97,254,202 ; vpaddd %xmm10,%xmm3,%xmm9
DB 196,67,249,22,200,1 ; vpextrq $0x1,%xmm9,%r8
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -15524,7 +15524,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,220,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- DB 196,98,121,24,13,126,181,1,0 ; vbroadcastss 0x1b57e(%rip),%xmm9 # 2c02c <_sk_overlay_sse2_8bit+0x47c>
+ DB 196,98,121,24,13,58,191,1,0 ; vbroadcastss 0x1bf3a(%rip),%xmm9 # 2c9e8 <_sk_overlay_sse2_8bit+0x47c>
DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
DB 196,195,249,22,216,1 ; vpextrq $0x1,%xmm3,%r8
DB 196,193,249,126,217 ; vmovq %xmm3,%r9
@@ -15552,7 +15552,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,89,33,229,48 ; vinsertps $0x30,%xmm5,%xmm4,%xmm4
DB 196,227,93,24,243,1 ; vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- DB 196,226,125,24,37,82,182,1,0 ; vbroadcastss 0x1b652(%rip),%ymm4 # 2c194 <_sk_overlay_sse2_8bit+0x5e4>
+ DB 196,226,125,24,37,14,192,1,0 ; vbroadcastss 0x1c00e(%rip),%ymm4 # 2cb50 <_sk_overlay_sse2_8bit+0x5e4>
DB 197,148,88,220 ; vaddps %ymm4,%ymm13,%ymm3
DB 197,252,40,252 ; vmovaps %ymm4,%ymm7
DB 197,252,17,188,36,160,0,0,0 ; vmovups %ymm7,0xa0(%rsp)
@@ -16982,7 +16982,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,220,89,210 ; vmulps %ymm2,%ymm4,%ymm2
DB 197,212,88,210 ; vaddps %ymm2,%ymm5,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,23,151,1,0 ; vbroadcastss 0x19717(%rip),%ymm3 # 2c020 <_sk_overlay_sse2_8bit+0x470>
+ DB 196,226,125,24,29,211,160,1,0 ; vbroadcastss 0x1a0d3(%rip),%ymm3 # 2c9dc <_sk_overlay_sse2_8bit+0x470>
DB 197,252,16,164,36,160,2,0,0 ; vmovups 0x2a0(%rsp),%ymm4
DB 197,252,16,172,36,192,2,0,0 ; vmovups 0x2c0(%rsp),%ymm5
DB 197,252,16,180,36,224,2,0,0 ; vmovups 0x2e0(%rsp),%ymm6
@@ -17080,15 +17080,15 @@ _sk_seed_shader_sse41 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,21,219,159,1,0 ; movaps 0x19fdb(%rip),%xmm2 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 15,40,21,27,170,1,0 ; movaps 0x1aa1b(%rip),%xmm2 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 15,88,194 ; addps %xmm2,%xmm0
- DB 15,88,5,225,159,1,0 ; addps 0x19fe1(%rip),%xmm0 # 2ca70 <_sk_overlay_sse2_8bit+0xec0>
+ DB 15,88,5,33,170,1,0 ; addps 0x1aa21(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0xf44>
DB 102,15,110,201 ; movd %ecx,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,217,159,1,0 ; movaps 0x19fd9(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,25,170,1,0 ; movaps 0x1aa19(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -17101,18 +17101,18 @@ _sk_dither_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 102,68,15,110,194 ; movd %edx,%xmm8
DB 102,69,15,112,200,0 ; pshufd $0x0,%xmm8,%xmm9
- DB 102,68,15,254,13,114,159,1,0 ; paddd 0x19f72(%rip),%xmm9 # 2ca40 <_sk_overlay_sse2_8bit+0xe90>
+ DB 102,68,15,254,13,178,169,1,0 ; paddd 0x1a9b2(%rip),%xmm9 # 2d480 <_sk_overlay_sse2_8bit+0xf14>
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,169,159,1,0 ; movdqa 0x19fa9(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,111,21,233,169,1,0 ; movdqa 0x1a9e9(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,149,159,1,0 ; movdqa 0x19f95(%rip),%xmm12 # 2caa0 <_sk_overlay_sse2_8bit+0xef0>
- DB 102,68,15,111,45,156,159,1,0 ; movdqa 0x19f9c(%rip),%xmm13 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,68,15,111,37,213,169,1,0 ; movdqa 0x1a9d5(%rip),%xmm12 # 2d4e0 <_sk_overlay_sse2_8bit+0xf74>
+ DB 102,68,15,111,45,220,169,1,0 ; movdqa 0x1a9dc(%rip),%xmm13 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -17128,8 +17128,8 @@ _sk_dither_sse41 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,87,159,1,0 ; mulps 0x19f57(%rip),%xmm8 # 2cac0 <_sk_overlay_sse2_8bit+0xf10>
- DB 68,15,88,5,95,159,1,0 ; addps 0x19f5f(%rip),%xmm8 # 2cad0 <_sk_overlay_sse2_8bit+0xf20>
+ DB 68,15,89,5,151,169,1,0 ; mulps 0x1a997(%rip),%xmm8 # 2d500 <_sk_overlay_sse2_8bit+0xf94>
+ DB 68,15,88,5,159,169,1,0 ; addps 0x1a99f(%rip),%xmm8 # 2d510 <_sk_overlay_sse2_8bit+0xfa4>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -17167,7 +17167,7 @@ _sk_uniform_color_sse41 LABEL PROC
PUBLIC _sk_black_color_sse41
_sk_black_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,149,158,1,0 ; movaps 0x19e95(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,213,168,1,0 ; movaps 0x1a8d5(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -17176,7 +17176,7 @@ _sk_black_color_sse41 LABEL PROC
PUBLIC _sk_white_color_sse41
_sk_white_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,129,158,1,0 ; movaps 0x19e81(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,5,193,168,1,0 ; movaps 0x1a8c1(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -17214,7 +17214,7 @@ _sk_clear_sse41 LABEL PROC
PUBLIC _sk_srcatop_sse41
_sk_srcatop_sse41 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,49,158,1,0 ; movaps 0x19e31(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,113,168,1,0 ; movaps 0x1a871(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -17237,7 +17237,7 @@ PUBLIC _sk_dstatop_sse41
_sk_dstatop_sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,228,157,1,0 ; movaps 0x19de4(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,36,168,1,0 ; movaps 0x1a824(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -17278,7 +17278,7 @@ _sk_dstin_sse41 LABEL PROC
PUBLIC _sk_srcout_sse41
_sk_srcout_sse41 LABEL PROC
- DB 68,15,40,5,120,157,1,0 ; movaps 0x19d78(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,184,167,1,0 ; movaps 0x1a7b8(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -17289,7 +17289,7 @@ _sk_srcout_sse41 LABEL PROC
PUBLIC _sk_dstout_sse41
_sk_dstout_sse41 LABEL PROC
- DB 68,15,40,5,88,157,1,0 ; movaps 0x19d58(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,152,167,1,0 ; movaps 0x1a798(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -17304,7 +17304,7 @@ _sk_dstout_sse41 LABEL PROC
PUBLIC _sk_srcover_sse41
_sk_srcover_sse41 LABEL PROC
- DB 68,15,40,5,43,157,1,0 ; movaps 0x19d2b(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,107,167,1,0 ; movaps 0x1a76b(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -17322,7 +17322,7 @@ _sk_srcover_sse41 LABEL PROC
PUBLIC _sk_dstover_sse41
_sk_dstover_sse41 LABEL PROC
- DB 68,15,40,5,239,156,1,0 ; movaps 0x19cef(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,47,167,1,0 ; movaps 0x1a72f(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -17346,7 +17346,7 @@ _sk_modulate_sse41 LABEL PROC
PUBLIC _sk_multiply_sse41
_sk_multiply_sse41 LABEL PROC
- DB 68,15,40,5,179,156,1,0 ; movaps 0x19cb3(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,243,166,1,0 ; movaps 0x1a6f3(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -17382,7 +17382,7 @@ _sk_multiply_sse41 LABEL PROC
PUBLIC _sk_plus__sse41
_sk_plus__sse41 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 68,15,40,5,52,156,1,0 ; movaps 0x19c34(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,116,166,1,0 ; movaps 0x1a674(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
DB 65,15,93,200 ; minps %xmm8,%xmm1
@@ -17420,7 +17420,7 @@ _sk_screen_sse41 LABEL PROC
PUBLIC _sk_xor__sse41
_sk_xor__sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,192,155,1,0 ; movaps 0x19bc0(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,0,166,1,0 ; movaps 0x1a600(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -17466,7 +17466,7 @@ _sk_darken_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,27,155,1,0 ; movaps 0x19b1b(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,91,165,1,0 ; movaps 0x1a55b(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17498,7 +17498,7 @@ _sk_lighten_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,176,154,1,0 ; movaps 0x19ab0(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,240,164,1,0 ; movaps 0x1a4f0(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17533,7 +17533,7 @@ _sk_difference_sse41 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,58,154,1,0 ; movaps 0x19a3a(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,122,164,1,0 ; movaps 0x1a47a(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17559,7 +17559,7 @@ _sk_exclusion_sse41 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,234,153,1,0 ; movaps 0x199ea(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,42,164,1,0 ; movaps 0x1a42a(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17569,7 +17569,7 @@ _sk_exclusion_sse41 LABEL PROC
PUBLIC _sk_colorburn_sse41
_sk_colorburn_sse41 LABEL PROC
- DB 68,15,40,29,209,153,1,0 ; movaps 0x199d1(%rip),%xmm11 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,29,17,164,1,0 ; movaps 0x1a411(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 68,15,92,231 ; subps %xmm7,%xmm12
DB 69,15,40,204 ; movaps %xmm12,%xmm9
@@ -17651,7 +17651,7 @@ _sk_colorburn_sse41 LABEL PROC
PUBLIC _sk_colordodge_sse41
_sk_colordodge_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,155,152,1,0 ; movaps 0x1989b(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,21,219,162,1,0 ; movaps 0x1a2db(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -17732,7 +17732,7 @@ _sk_hardlight_sse41 LABEL PROC
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,99,151,1,0 ; movaps 0x19763(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,21,163,161,1,0 ; movaps 0x1a1a3(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,40,234 ; movaps %xmm10,%xmm5
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -17814,7 +17814,7 @@ PUBLIC _sk_overlay_sse41
_sk_overlay_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,240 ; movaps %xmm0,%xmm14
- DB 68,15,40,21,53,150,1,0 ; movaps 0x19635(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,21,117,160,1,0 ; movaps 0x1a075(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -17898,7 +17898,7 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 65,15,84,193 ; andps %xmm9,%xmm0
- DB 15,40,13,248,148,1,0 ; movaps 0x194f8(%rip),%xmm1 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,13,56,159,1,0 ; movaps 0x19f38(%rip),%xmm1 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 68,15,40,240 ; movaps %xmm0,%xmm14
@@ -17911,10 +17911,10 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,40,45,38,149,1,0 ; movaps 0x19526(%rip),%xmm13 # 2cae0 <_sk_overlay_sse2_8bit+0xf30>
+ DB 68,15,40,45,102,159,1,0 ; movaps 0x19f66(%rip),%xmm13 # 2d520 <_sk_overlay_sse2_8bit+0xfb4>
DB 69,15,88,245 ; addps %xmm13,%xmm14
DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 68,15,40,37,38,149,1,0 ; movaps 0x19526(%rip),%xmm12 # 2caf0 <_sk_overlay_sse2_8bit+0xf40>
+ DB 68,15,40,37,102,159,1,0 ; movaps 0x19f66(%rip),%xmm12 # 2d530 <_sk_overlay_sse2_8bit+0xfc4>
DB 69,15,89,252 ; mulps %xmm12,%xmm15
DB 69,15,88,254 ; addps %xmm14,%xmm15
DB 15,40,198 ; movaps %xmm6,%xmm0
@@ -18100,12 +18100,12 @@ _sk_hue_sse41 LABEL PROC
DB 68,15,84,208 ; andps %xmm0,%xmm10
DB 15,84,200 ; andps %xmm0,%xmm1
DB 68,15,84,232 ; andps %xmm0,%xmm13
- DB 15,40,5,140,146,1,0 ; movaps 0x1928c(%rip),%xmm0 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 15,40,5,204,156,1,0 ; movaps 0x19ccc(%rip),%xmm0 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 68,15,89,224 ; mulps %xmm0,%xmm12
- DB 15,40,21,145,146,1,0 ; movaps 0x19291(%rip),%xmm2 # 2cb10 <_sk_overlay_sse2_8bit+0xf60>
+ DB 15,40,21,209,156,1,0 ; movaps 0x19cd1(%rip),%xmm2 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
DB 15,89,250 ; mulps %xmm2,%xmm7
DB 65,15,88,252 ; addps %xmm12,%xmm7
- DB 68,15,40,53,146,146,1,0 ; movaps 0x19292(%rip),%xmm14 # 2cb20 <_sk_overlay_sse2_8bit+0xf70>
+ DB 68,15,40,53,210,156,1,0 ; movaps 0x19cd2(%rip),%xmm14 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
DB 68,15,40,252 ; movaps %xmm4,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,255 ; addps %xmm7,%xmm15
@@ -18188,7 +18188,7 @@ _sk_hue_sse41 LABEL PROC
DB 65,15,88,214 ; addps %xmm14,%xmm2
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,40,13,167,144,1,0 ; movaps 0x190a7(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,231,154,1,0 ; movaps 0x19ae7(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,40,225 ; movaps %xmm9,%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0
@@ -18282,14 +18282,14 @@ _sk_saturation_sse41 LABEL PROC
DB 68,15,84,215 ; andps %xmm7,%xmm10
DB 68,15,84,223 ; andps %xmm7,%xmm11
DB 68,15,84,199 ; andps %xmm7,%xmm8
- DB 15,40,21,202,143,1,0 ; movaps 0x18fca(%rip),%xmm2 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 15,40,21,10,154,1,0 ; movaps 0x19a0a(%rip),%xmm2 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,40,13,205,143,1,0 ; movaps 0x18fcd(%rip),%xmm1 # 2cb10 <_sk_overlay_sse2_8bit+0xf60>
+ DB 15,40,13,13,154,1,0 ; movaps 0x19a0d(%rip),%xmm1 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,249 ; mulps %xmm1,%xmm7
DB 15,88,251 ; addps %xmm3,%xmm7
- DB 68,15,40,45,204,143,1,0 ; movaps 0x18fcc(%rip),%xmm13 # 2cb20 <_sk_overlay_sse2_8bit+0xf70>
+ DB 68,15,40,45,12,154,1,0 ; movaps 0x19a0c(%rip),%xmm13 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 68,15,88,247 ; addps %xmm7,%xmm14
DB 65,15,40,218 ; movaps %xmm10,%xmm3
@@ -18370,7 +18370,7 @@ _sk_saturation_sse41 LABEL PROC
DB 65,15,88,253 ; addps %xmm13,%xmm7
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11
- DB 68,15,40,13,226,141,1,0 ; movaps 0x18de2(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,34,152,1,0 ; movaps 0x19822(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 68,15,92,204 ; subps %xmm4,%xmm9
DB 15,40,60,36 ; movaps (%rsp),%xmm7
@@ -18425,14 +18425,14 @@ _sk_color_sse41 LABEL PROC
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 68,15,89,244 ; mulps %xmm4,%xmm14
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 68,15,40,13,151,141,1,0 ; movaps 0x18d97(%rip),%xmm9 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,13,215,151,1,0 ; movaps 0x197d7(%rip),%xmm9 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 65,15,40,250 ; movaps %xmm10,%xmm7
DB 65,15,89,249 ; mulps %xmm9,%xmm7
- DB 68,15,40,21,151,141,1,0 ; movaps 0x18d97(%rip),%xmm10 # 2cb10 <_sk_overlay_sse2_8bit+0xf60>
+ DB 68,15,40,21,215,151,1,0 ; movaps 0x197d7(%rip),%xmm10 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
DB 65,15,40,219 ; movaps %xmm11,%xmm3
DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,40,29,148,141,1,0 ; movaps 0x18d94(%rip),%xmm11 # 2cb20 <_sk_overlay_sse2_8bit+0xf70>
+ DB 68,15,40,29,212,151,1,0 ; movaps 0x197d4(%rip),%xmm11 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
@@ -18517,7 +18517,7 @@ _sk_color_sse41 LABEL PROC
DB 65,15,88,251 ; addps %xmm11,%xmm7
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1
- DB 68,15,40,13,160,139,1,0 ; movaps 0x18ba0(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,224,149,1,0 ; movaps 0x195e0(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
DB 68,15,89,192 ; mulps %xmm0,%xmm8
@@ -18569,13 +18569,13 @@ _sk_luminosity_sse41 LABEL PROC
DB 69,15,89,216 ; mulps %xmm8,%xmm11
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,89,205 ; mulps %xmm5,%xmm9
- DB 68,15,40,5,98,139,1,0 ; movaps 0x18b62(%rip),%xmm8 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,5,162,149,1,0 ; movaps 0x195a2(%rip),%xmm8 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 68,15,40,21,102,139,1,0 ; movaps 0x18b66(%rip),%xmm10 # 2cb10 <_sk_overlay_sse2_8bit+0xf60>
+ DB 68,15,40,21,166,149,1,0 ; movaps 0x195a6(%rip),%xmm10 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 65,15,89,234 ; mulps %xmm10,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 68,15,40,37,100,139,1,0 ; movaps 0x18b64(%rip),%xmm12 # 2cb20 <_sk_overlay_sse2_8bit+0xf70>
+ DB 68,15,40,37,164,149,1,0 ; movaps 0x195a4(%rip),%xmm12 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
DB 68,15,40,242 ; movaps %xmm2,%xmm14
DB 69,15,89,244 ; mulps %xmm12,%xmm14
DB 68,15,88,245 ; addps %xmm5,%xmm14
@@ -18660,7 +18660,7 @@ _sk_luminosity_sse41 LABEL PROC
DB 65,15,88,244 ; addps %xmm12,%xmm6
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9
- DB 15,40,5,106,137,1,0 ; movaps 0x1896a(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,5,170,147,1,0 ; movaps 0x193aa(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,92,215 ; subps %xmm7,%xmm2
DB 15,89,226 ; mulps %xmm2,%xmm4
@@ -18707,20 +18707,20 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 15,133,219,0,0,0 ; jne 14281 <_sk_srcover_rgba_8888_sse41+0xfb>
DB 243,65,15,111,60,128 ; movdqu (%r8,%rax,4),%xmm7
DB 72,133,255 ; test %rdi,%rdi
- DB 102,15,111,37,121,137,1,0 ; movdqa 0x18979(%rip),%xmm4 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,37,185,147,1,0 ; movdqa 0x193b9(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,117,137,1,0 ; pshufb 0x18975(%rip),%xmm5 # 2cb40 <_sk_overlay_sse2_8bit+0xf90>
+ DB 102,15,56,0,45,181,147,1,0 ; pshufb 0x193b5(%rip),%xmm5 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,117,137,1,0 ; pshufb 0x18975(%rip),%xmm6 # 2cb50 <_sk_overlay_sse2_8bit+0xfa0>
+ DB 102,15,56,0,53,181,147,1,0 ; pshufb 0x193b5(%rip),%xmm6 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 68,15,40,5,146,136,1,0 ; movaps 0x18892(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,210,146,1,0 ; movaps 0x192d2(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,102,137,1,0 ; movaps 0x18966(%rip),%xmm12 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,37,166,147,1,0 ; movaps 0x193a6(%rip),%xmm12 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -18796,7 +18796,7 @@ _sk_clamp_0_sse41 LABEL PROC
PUBLIC _sk_clamp_1_sse41
_sk_clamp_1_sse41 LABEL PROC
- DB 68,15,40,5,97,135,1,0 ; movaps 0x18761(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,161,145,1,0 ; movaps 0x191a1(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -18806,7 +18806,7 @@ _sk_clamp_1_sse41 LABEL PROC
PUBLIC _sk_clamp_a_sse41
_sk_clamp_a_sse41 LABEL PROC
- DB 15,93,29,70,135,1,0 ; minps 0x18746(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,93,29,134,145,1,0 ; minps 0x19186(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -18815,7 +18815,7 @@ _sk_clamp_a_sse41 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse41
_sk_clamp_a_dst_sse41 LABEL PROC
- DB 15,93,61,50,135,1,0 ; minps 0x18732(%rip),%xmm7 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,93,61,114,145,1,0 ; minps 0x19172(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -18844,7 +18844,7 @@ _sk_swap_rb_sse41 LABEL PROC
PUBLIC _sk_invert_sse41
_sk_invert_sse41 LABEL PROC
- DB 68,15,40,5,238,134,1,0 ; movaps 0x186ee(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,46,145,1,0 ; movaps 0x1912e(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -18896,7 +18896,7 @@ _sk_premul_dst_sse41 LABEL PROC
PUBLIC _sk_unpremul_sse41
_sk_unpremul_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,120,134,1,0 ; movaps 0x18678(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,184,144,1,0 ; movaps 0x190b8(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -18908,20 +18908,20 @@ _sk_unpremul_sse41 LABEL PROC
PUBLIC _sk_from_srgb_sse41
_sk_from_srgb_sse41 LABEL PROC
- DB 68,15,40,29,67,135,1,0 ; movaps 0x18743(%rip),%xmm11 # 2cb70 <_sk_overlay_sse2_8bit+0xfc0>
+ DB 68,15,40,29,131,145,1,0 ; movaps 0x19183(%rip),%xmm11 # 2d5b0 <_sk_overlay_sse2_8bit+0x1044>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
DB 68,15,40,208 ; movaps %xmm0,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
- DB 68,15,40,37,187,134,1,0 ; movaps 0x186bb(%rip),%xmm12 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,37,251,144,1,0 ; movaps 0x190fb(%rip),%xmm12 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,43,135,1,0 ; movaps 0x1872b(%rip),%xmm13 # 2cb80 <_sk_overlay_sse2_8bit+0xfd0>
+ DB 68,15,40,45,107,145,1,0 ; movaps 0x1916b(%rip),%xmm13 # 2d5c0 <_sk_overlay_sse2_8bit+0x1054>
DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,40,53,43,135,1,0 ; movaps 0x1872b(%rip),%xmm14 # 2cb90 <_sk_overlay_sse2_8bit+0xfe0>
+ DB 68,15,40,53,107,145,1,0 ; movaps 0x1916b(%rip),%xmm14 # 2d5d0 <_sk_overlay_sse2_8bit+0x1064>
DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 68,15,40,61,47,135,1,0 ; movaps 0x1872f(%rip),%xmm15 # 2cba0 <_sk_overlay_sse2_8bit+0xff0>
+ DB 68,15,40,61,111,145,1,0 ; movaps 0x1916f(%rip),%xmm15 # 2d5e0 <_sk_overlay_sse2_8bit+0x1074>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,40,209 ; movaps %xmm1,%xmm10
@@ -18956,19 +18956,19 @@ PUBLIC _sk_from_srgb_dst_sse41
_sk_from_srgb_dst_sse41 LABEL PROC
DB 68,15,40,204 ; movaps %xmm4,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,29,122,134,1,0 ; movaps 0x1867a(%rip),%xmm11 # 2cb70 <_sk_overlay_sse2_8bit+0xfc0>
+ DB 68,15,40,29,186,144,1,0 ; movaps 0x190ba(%rip),%xmm11 # 2d5b0 <_sk_overlay_sse2_8bit+0x1044>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 68,15,40,37,243,133,1,0 ; movaps 0x185f3(%rip),%xmm12 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,37,51,144,1,0 ; movaps 0x19033(%rip),%xmm12 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 65,15,89,228 ; mulps %xmm12,%xmm4
- DB 68,15,40,45,103,134,1,0 ; movaps 0x18667(%rip),%xmm13 # 2cb80 <_sk_overlay_sse2_8bit+0xfd0>
+ DB 68,15,40,45,167,144,1,0 ; movaps 0x190a7(%rip),%xmm13 # 2d5c0 <_sk_overlay_sse2_8bit+0x1054>
DB 65,15,88,229 ; addps %xmm13,%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 68,15,40,53,104,134,1,0 ; movaps 0x18668(%rip),%xmm14 # 2cb90 <_sk_overlay_sse2_8bit+0xfe0>
+ DB 68,15,40,53,168,144,1,0 ; movaps 0x190a8(%rip),%xmm14 # 2d5d0 <_sk_overlay_sse2_8bit+0x1064>
DB 65,15,88,230 ; addps %xmm14,%xmm4
- DB 68,15,40,61,108,134,1,0 ; movaps 0x1866c(%rip),%xmm15 # 2cba0 <_sk_overlay_sse2_8bit+0xff0>
+ DB 68,15,40,61,172,144,1,0 ; movaps 0x190ac(%rip),%xmm15 # 2d5e0 <_sk_overlay_sse2_8bit+0x1074>
DB 69,15,194,207,1 ; cmpltps %xmm15,%xmm9
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,226 ; blendvps %xmm0,%xmm10,%xmm4
@@ -19011,22 +19011,22 @@ _sk_to_srgb_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
- DB 68,15,40,29,221,133,1,0 ; movaps 0x185dd(%rip),%xmm11 # 2cbb0 <_sk_overlay_sse2_8bit+0x1000>
+ DB 68,15,40,29,29,144,1,0 ; movaps 0x1901d(%rip),%xmm11 # 2d5f0 <_sk_overlay_sse2_8bit+0x1084>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 68,15,40,37,221,133,1,0 ; movaps 0x185dd(%rip),%xmm12 # 2cbc0 <_sk_overlay_sse2_8bit+0x1010>
+ DB 68,15,40,37,29,144,1,0 ; movaps 0x1901d(%rip),%xmm12 # 2d600 <_sk_overlay_sse2_8bit+0x1094>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 69,15,89,252 ; mulps %xmm12,%xmm15
- DB 68,15,40,21,221,133,1,0 ; movaps 0x185dd(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x1020>
+ DB 68,15,40,21,29,144,1,0 ; movaps 0x1901d(%rip),%xmm10 # 2d610 <_sk_overlay_sse2_8bit+0x10a4>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 68,15,40,45,221,133,1,0 ; movaps 0x185dd(%rip),%xmm13 # 2cbe0 <_sk_overlay_sse2_8bit+0x1030>
+ DB 68,15,40,45,29,144,1,0 ; movaps 0x1901d(%rip),%xmm13 # 2d620 <_sk_overlay_sse2_8bit+0x10b4>
DB 69,15,88,253 ; addps %xmm13,%xmm15
- DB 68,15,40,53,225,133,1,0 ; movaps 0x185e1(%rip),%xmm14 # 2cbf0 <_sk_overlay_sse2_8bit+0x1040>
+ DB 68,15,40,53,33,144,1,0 ; movaps 0x19021(%rip),%xmm14 # 2d630 <_sk_overlay_sse2_8bit+0x10c4>
DB 69,15,88,198 ; addps %xmm14,%xmm8
DB 69,15,83,192 ; rcpps %xmm8,%xmm8
DB 69,15,89,199 ; mulps %xmm15,%xmm8
- DB 68,15,40,61,221,133,1,0 ; movaps 0x185dd(%rip),%xmm15 # 2cc00 <_sk_overlay_sse2_8bit+0x1050>
+ DB 68,15,40,61,29,144,1,0 ; movaps 0x1901d(%rip),%xmm15 # 2d640 <_sk_overlay_sse2_8bit+0x10d4>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9
@@ -19080,7 +19080,7 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 68,15,93,224 ; minps %xmm0,%xmm12
DB 65,15,40,203 ; movaps %xmm11,%xmm1
DB 65,15,92,204 ; subps %xmm12,%xmm1
- DB 68,15,40,53,145,131,1,0 ; movaps 0x18391(%rip),%xmm14 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,53,209,141,1,0 ; movaps 0x18dd1(%rip),%xmm14 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,94,241 ; divps %xmm1,%xmm14
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10
@@ -19089,27 +19089,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15
- DB 68,15,84,61,248,132,1,0 ; andps 0x184f8(%rip),%xmm15 # 2cc10 <_sk_overlay_sse2_8bit+0x1060>
+ DB 68,15,84,61,56,143,1,0 ; andps 0x18f38(%rip),%xmm15 # 2d650 <_sk_overlay_sse2_8bit+0x10e4>
DB 68,15,88,248 ; addps %xmm0,%xmm15
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 68,15,40,45,235,132,1,0 ; movaps 0x184eb(%rip),%xmm13 # 2cc20 <_sk_overlay_sse2_8bit+0x1070>
+ DB 68,15,40,45,43,143,1,0 ; movaps 0x18f2b(%rip),%xmm13 # 2d660 <_sk_overlay_sse2_8bit+0x10f4>
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,88,5,231,132,1,0 ; addps 0x184e7(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1080>
+ DB 68,15,88,5,39,143,1,0 ; addps 0x18f27(%rip),%xmm8 # 2d670 <_sk_overlay_sse2_8bit+0x1104>
DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8
- DB 68,15,89,5,223,132,1,0 ; mulps 0x184df(%rip),%xmm8 # 2cc40 <_sk_overlay_sse2_8bit+0x1090>
+ DB 68,15,89,5,31,143,1,0 ; mulps 0x18f1f(%rip),%xmm8 # 2d680 <_sk_overlay_sse2_8bit+0x1114>
DB 69,15,40,203 ; movaps %xmm11,%xmm9
DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9
DB 69,15,84,193 ; andps %xmm9,%xmm8
DB 69,15,92,235 ; subps %xmm11,%xmm13
DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,5,227,130,1,0 ; movaps 0x182e3(%rip),%xmm0 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 15,40,5,35,141,1,0 ; movaps 0x18d23(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,40,211 ; movaps %xmm11,%xmm2
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
@@ -19130,7 +19130,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp)
DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
DB 68,15,40,208 ; movaps %xmm0,%xmm10
- DB 68,15,40,13,149,130,1,0 ; movaps 0x18295(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,13,213,140,1,0 ; movaps 0x18cd5(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
DB 15,40,217 ; movaps %xmm1,%xmm3
@@ -19143,19 +19143,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,20,36 ; movaps %xmm2,(%rsp)
DB 69,15,88,192 ; addps %xmm8,%xmm8
DB 68,15,92,197 ; subps %xmm5,%xmm8
- DB 68,15,40,53,81,132,1,0 ; movaps 0x18451(%rip),%xmm14 # 2cc50 <_sk_overlay_sse2_8bit+0x10a0>
+ DB 68,15,40,53,145,142,1,0 ; movaps 0x18e91(%rip),%xmm14 # 2d690 <_sk_overlay_sse2_8bit+0x1124>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0
DB 68,15,92,240 ; subps %xmm0,%xmm14
- DB 68,15,40,29,74,132,1,0 ; movaps 0x1844a(%rip),%xmm11 # 2cc60 <_sk_overlay_sse2_8bit+0x10b0>
+ DB 68,15,40,29,138,142,1,0 ; movaps 0x18e8a(%rip),%xmm11 # 2d6a0 <_sk_overlay_sse2_8bit+0x1134>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 65,15,92,240 ; subps %xmm8,%xmm6
- DB 15,40,61,227,131,1,0 ; movaps 0x183e3(%rip),%xmm7 # 2cc10 <_sk_overlay_sse2_8bit+0x1060>
+ DB 15,40,61,35,142,1,0 ; movaps 0x18e23(%rip),%xmm7 # 2d650 <_sk_overlay_sse2_8bit+0x10e4>
DB 69,15,40,238 ; movaps %xmm14,%xmm13
DB 68,15,89,239 ; mulps %xmm7,%xmm13
- DB 15,40,29,244,131,1,0 ; movaps 0x183f4(%rip),%xmm3 # 2cc30 <_sk_overlay_sse2_8bit+0x1080>
+ DB 15,40,29,52,142,1,0 ; movaps 0x18e34(%rip),%xmm3 # 2d670 <_sk_overlay_sse2_8bit+0x1104>
DB 68,15,40,227 ; movaps %xmm3,%xmm12
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 68,15,89,230 ; mulps %xmm6,%xmm12
@@ -19165,7 +19165,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,40,253 ; movaps %xmm5,%xmm15
DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15
- DB 68,15,40,37,211,131,1,0 ; movaps 0x183d3(%rip),%xmm12 # 2cc40 <_sk_overlay_sse2_8bit+0x1090>
+ DB 68,15,40,37,19,142,1,0 ; movaps 0x18e13(%rip),%xmm12 # 2d680 <_sk_overlay_sse2_8bit+0x1114>
DB 65,15,40,196 ; movaps %xmm12,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,89,238 ; mulps %xmm6,%xmm13
@@ -19199,7 +19199,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,40,198 ; movaps %xmm14,%xmm0
DB 15,40,20,36 ; movaps (%rsp),%xmm2
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,88,21,108,131,1,0 ; addps 0x1836c(%rip),%xmm10 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 68,15,88,21,172,141,1,0 ; addps 0x18dac(%rip),%xmm10 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11
@@ -19253,9 +19253,9 @@ _sk_scale_u8_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,52 ; jne 149ef <_sk_scale_u8_sse41+0x4c>
DB 102,71,15,56,49,4,16 ; pmovzxbd (%r8,%r10,1),%xmm8
- DB 102,68,15,219,5,101,129,1,0 ; pand 0x18165(%rip),%xmm8 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,68,15,219,5,165,139,1,0 ; pand 0x18ba5(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,169,130,1,0 ; mulps 0x182a9(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,89,5,233,140,1,0 ; mulps 0x18ce9(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -19297,17 +19297,17 @@ _sk_scale_565_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 15,133,159,0,0,0 ; jne 14b09 <_sk_scale_565_sse41+0xc3>
DB 102,71,15,56,51,28,80 ; pmovzxwd (%r8,%r10,2),%xmm11
- DB 102,15,111,5,23,130,1,0 ; movdqa 0x18217(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,15,111,5,87,140,1,0 ; movdqa 0x18c57(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,65,15,219,195 ; pand %xmm11,%xmm0
DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
- DB 68,15,89,13,22,130,1,0 ; mulps 0x18216(%rip),%xmm9 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,15,111,5,30,130,1,0 ; movdqa 0x1821e(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 68,15,89,13,86,140,1,0 ; mulps 0x18c56(%rip),%xmm9 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,15,111,5,94,140,1,0 ; movdqa 0x18c5e(%rip),%xmm0 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,65,15,219,195 ; pand %xmm11,%xmm0
DB 68,15,91,208 ; cvtdq2ps %xmm0,%xmm10
- DB 68,15,89,21,29,130,1,0 ; mulps 0x1821d(%rip),%xmm10 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,68,15,219,29,36,130,1,0 ; pand 0x18224(%rip),%xmm11 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 68,15,89,21,93,140,1,0 ; mulps 0x18c5d(%rip),%xmm10 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,68,15,219,29,100,140,1,0 ; pand 0x18c64(%rip),%xmm11 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11
- DB 68,15,89,29,40,130,1,0 ; mulps 0x18228(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 68,15,89,29,104,140,1,0 ; mulps 0x18c68(%rip),%xmm11 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
DB 69,15,40,226 ; movaps %xmm10,%xmm12
@@ -19380,9 +19380,9 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,72 ; jne 14bf9 <_sk_lerp_u8_sse41+0x60>
DB 102,71,15,56,49,4,16 ; pmovzxbd (%r8,%r10,1),%xmm8
- DB 102,68,15,219,5,111,127,1,0 ; pand 0x17f6f(%rip),%xmm8 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,68,15,219,5,175,137,1,0 ; pand 0x189af(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,179,128,1,0 ; mulps 0x180b3(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,89,5,243,138,1,0 ; mulps 0x18af3(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -19431,17 +19431,17 @@ _sk_lerp_565_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 15,133,165,0,0,0 ; jne 14d1c <_sk_lerp_565_sse41+0xc9>
DB 102,71,15,56,51,20,80 ; pmovzxwd (%r8,%r10,2),%xmm10
- DB 102,15,111,5,10,128,1,0 ; movdqa 0x1800a(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,15,111,5,74,138,1,0 ; movdqa 0x18a4a(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
- DB 68,15,89,13,9,128,1,0 ; mulps 0x18009(%rip),%xmm9 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,15,111,5,17,128,1,0 ; movdqa 0x18011(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 68,15,89,13,73,138,1,0 ; mulps 0x18a49(%rip),%xmm9 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,15,111,5,81,138,1,0 ; movdqa 0x18a51(%rip),%xmm0 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 68,15,91,216 ; cvtdq2ps %xmm0,%xmm11
- DB 68,15,89,29,16,128,1,0 ; mulps 0x18010(%rip),%xmm11 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,68,15,219,21,23,128,1,0 ; pand 0x18017(%rip),%xmm10 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 68,15,89,29,80,138,1,0 ; mulps 0x18a50(%rip),%xmm11 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,68,15,219,21,87,138,1,0 ; pand 0x18a57(%rip),%xmm10 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,27,128,1,0 ; mulps 0x1801b(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 68,15,89,21,91,138,1,0 ; mulps 0x18a5b(%rip),%xmm10 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -19495,7 +19495,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 243,69,15,111,4,144 ; movdqu (%r8,%rdx,4),%xmm8
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,15,111,5,157,125,1,0 ; movdqa 0x17d9d(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,5,221,135,1,0 ; movdqa 0x187dd(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,73,15,58,22,192,1 ; pextrq $0x1,%xmm0,%r8
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -19510,7 +19510,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,66,15,58,33,4,155,32 ; insertps $0x20,(%rbx,%r11,4),%xmm0
DB 102,66,15,58,33,4,3,48 ; insertps $0x30,(%rbx,%r8,1),%xmm0
DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1
- DB 102,15,56,0,13,88,125,1,0 ; pshufb 0x17d58(%rip),%xmm1 # 2cb40 <_sk_overlay_sse2_8bit+0xf90>
+ DB 102,15,56,0,13,152,135,1,0 ; pshufb 0x18798(%rip),%xmm1 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
DB 102,73,15,58,22,200,1 ; pextrq $0x1,%xmm1,%r8
DB 102,72,15,126,203 ; movq %xmm1,%rbx
DB 68,15,182,203 ; movzbl %bl,%r9d
@@ -19525,7 +19525,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
DB 76,139,64,24 ; mov 0x18(%rax),%r8
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
- DB 102,15,56,0,21,20,125,1,0 ; pshufb 0x17d14(%rip),%xmm2 # 2cb50 <_sk_overlay_sse2_8bit+0xfa0>
+ DB 102,15,56,0,21,84,135,1,0 ; pshufb 0x18754(%rip),%xmm2 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx
DB 102,72,15,126,208 ; movq %xmm2,%rax
DB 68,15,182,200 ; movzbl %al,%r9d
@@ -19540,7 +19540,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3
- DB 15,89,29,241,125,1,0 ; mulps 0x17df1(%rip),%xmm3 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,29,49,136,1,0 ; mulps 0x18831(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -19579,7 +19579,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,5,195,125,1,0 ; movdqa 0x17dc3(%rip),%xmm8 # 2ccf0 <_sk_overlay_sse2_8bit+0x1140>
+ DB 102,68,15,111,5,3,136,1,0 ; movdqa 0x18803(%rip),%xmm8 # 2d730 <_sk_overlay_sse2_8bit+0x11c4>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19597,7 +19597,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
DB 243,66,15,16,20,3 ; movss (%rbx,%r8,1),%xmm2
DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
- DB 102,15,56,0,13,114,125,1,0 ; pshufb 0x17d72(%rip),%xmm1 # 2cd00 <_sk_overlay_sse2_8bit+0x1150>
+ DB 102,15,56,0,13,178,135,1,0 ; pshufb 0x187b2(%rip),%xmm1 # 2d740 <_sk_overlay_sse2_8bit+0x11d4>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,200,1 ; pextrq $0x1,%xmm1,%r8
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19633,7 +19633,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,235,216 ; por %xmm8,%xmm3
DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,192,124,1,0 ; mulps 0x17cc0(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0x1160>
+ DB 15,89,29,0,135,1,0 ; mulps 0x18700(%rip),%xmm3 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -19671,7 +19671,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
- DB 102,68,15,111,5,9,124,1,0 ; movdqa 0x17c09(%rip),%xmm8 # 2ccf0 <_sk_overlay_sse2_8bit+0x1140>
+ DB 102,68,15,111,5,73,134,1,0 ; movdqa 0x18649(%rip),%xmm8 # 2d730 <_sk_overlay_sse2_8bit+0x11c4>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19689,7 +19689,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0
DB 243,66,15,16,28,3 ; movss (%rbx,%r8,1),%xmm3
DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0
- DB 102,15,56,0,13,216,123,1,0 ; pshufb 0x17bd8(%rip),%xmm1 # 2cd20 <_sk_overlay_sse2_8bit+0x1170>
+ DB 102,15,56,0,13,24,134,1,0 ; pshufb 0x18618(%rip),%xmm1 # 2d760 <_sk_overlay_sse2_8bit+0x11f4>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,200,1 ; pextrq $0x1,%xmm1,%r8
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19720,7 +19720,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,65,15,16,28,24 ; movss (%r8,%rbx,1),%xmm3
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,147,120,1,0 ; movaps 0x17893(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,211,130,1,0 ; movaps 0x182d3(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 255,224 ; jmpq *%rax
@@ -19750,7 +19750,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,255,120,1,0 ; movaps 0x178ff(%rip),%xmm8 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,5,63,131,1,0 ; movaps 0x1833f(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,58,22,192,1 ; pextrq $0x1,%xmm0,%r8
@@ -19769,7 +19769,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,192,121,1,0 ; movaps 0x179c0(%rip),%xmm9 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,13,0,132,1,0 ; movaps 0x18400(%rip),%xmm9 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19861,7 +19861,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,44,120,1,0 ; movaps 0x1782c(%rip),%xmm9 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,13,108,130,1,0 ; movaps 0x1826c(%rip),%xmm9 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -20029,31 +20029,31 @@ _sk_parametric_r_sse41 LABEL PROC
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8
- DB 68,15,89,5,30,118,1,0 ; mulps 0x1761e(%rip),%xmm8 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 68,15,84,21,38,118,1,0 ; andps 0x17626(%rip),%xmm10 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 68,15,86,21,62,115,1,0 ; orps 0x1733e(%rip),%xmm10 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
- DB 68,15,88,5,38,118,1,0 ; addps 0x17626(%rip),%xmm8 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
- DB 68,15,40,37,46,118,1,0 ; movaps 0x1762e(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,89,5,94,128,1,0 ; mulps 0x1805e(%rip),%xmm8 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 68,15,84,21,102,128,1,0 ; andps 0x18066(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 68,15,86,21,126,125,1,0 ; orps 0x17d7e(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,5,102,128,1,0 ; addps 0x18066(%rip),%xmm8 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 68,15,40,37,110,128,1,0 ; movaps 0x1806e(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
- DB 68,15,88,21,46,118,1,0 ; addps 0x1762e(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
- DB 68,15,40,37,54,118,1,0 ; movaps 0x17636(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,88,21,110,128,1,0 ; addps 0x1806e(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 68,15,40,37,118,128,1,0 ; movaps 0x18076(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
DB 69,15,89,195 ; mulps %xmm11,%xmm8
DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,5,35,118,1,0 ; addps 0x17623(%rip),%xmm8 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
- DB 68,15,40,21,43,118,1,0 ; movaps 0x1762b(%rip),%xmm10 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 68,15,88,5,99,128,1,0 ; addps 0x18063(%rip),%xmm8 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 68,15,40,21,107,128,1,0 ; movaps 0x1806b(%rip),%xmm10 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 69,15,92,194 ; subps %xmm10,%xmm8
- DB 68,15,40,21,43,118,1,0 ; movaps 0x1762b(%rip),%xmm10 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 68,15,40,21,107,128,1,0 ; movaps 0x1806b(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 68,15,40,29,47,118,1,0 ; movaps 0x1762f(%rip),%xmm11 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 68,15,40,29,111,128,1,0 ; movaps 0x1806f(%rip),%xmm11 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 69,15,94,218 ; divps %xmm10,%xmm11
DB 69,15,88,216 ; addps %xmm8,%xmm11
- DB 68,15,89,29,47,118,1,0 ; mulps 0x1762f(%rip),%xmm11 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 68,15,89,29,111,128,1,0 ; mulps 0x1806f(%rip),%xmm11 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10
DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
@@ -20061,7 +20061,7 @@ _sk_parametric_r_sse41 LABEL PROC
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,182,114,1,0 ; minps 0x172b6(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,93,5,246,124,1,0 ; minps 0x17cf6(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -20089,31 +20089,31 @@ _sk_parametric_g_sse41 LABEL PROC
DB 68,15,88,217 ; addps %xmm1,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,247,116,1,0 ; mulps 0x174f7(%rip),%xmm12 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 68,15,84,29,255,116,1,0 ; andps 0x174ff(%rip),%xmm11 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 68,15,86,29,23,114,1,0 ; orps 0x17217(%rip),%xmm11 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
- DB 68,15,88,37,255,116,1,0 ; addps 0x174ff(%rip),%xmm12 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
- DB 15,40,13,8,117,1,0 ; movaps 0x17508(%rip),%xmm1 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,89,37,55,127,1,0 ; mulps 0x17f37(%rip),%xmm12 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 68,15,84,29,63,127,1,0 ; andps 0x17f3f(%rip),%xmm11 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 68,15,86,29,87,124,1,0 ; orps 0x17c57(%rip),%xmm11 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,37,63,127,1,0 ; addps 0x17f3f(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 15,40,13,72,127,1,0 ; movaps 0x17f48(%rip),%xmm1 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,88,29,8,117,1,0 ; addps 0x17508(%rip),%xmm11 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
- DB 15,40,13,17,117,1,0 ; movaps 0x17511(%rip),%xmm1 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,88,29,72,127,1,0 ; addps 0x17f48(%rip),%xmm11 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 15,40,13,81,127,1,0 ; movaps 0x17f51(%rip),%xmm1 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 65,15,94,203 ; divps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,254,116,1,0 ; addps 0x174fe(%rip),%xmm12 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
- DB 15,40,13,7,117,1,0 ; movaps 0x17507(%rip),%xmm1 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 68,15,88,37,62,127,1,0 ; addps 0x17f3e(%rip),%xmm12 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 15,40,13,71,127,1,0 ; movaps 0x17f47(%rip),%xmm1 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,40,21,7,117,1,0 ; movaps 0x17507(%rip),%xmm10 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 68,15,40,21,71,127,1,0 ; movaps 0x17f47(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,13,12,117,1,0 ; movaps 0x1750c(%rip),%xmm1 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 15,40,13,76,127,1,0 ; movaps 0x17f4c(%rip),%xmm1 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,204 ; addps %xmm12,%xmm1
- DB 15,89,13,13,117,1,0 ; mulps 0x1750d(%rip),%xmm1 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 15,89,13,77,127,1,0 ; mulps 0x17f4d(%rip),%xmm1 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10
DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
@@ -20121,7 +20121,7 @@ _sk_parametric_g_sse41 LABEL PROC
DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,93,13,152,113,1,0 ; minps 0x17198(%rip),%xmm1 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,93,13,216,123,1,0 ; minps 0x17bd8(%rip),%xmm1 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -20149,31 +20149,31 @@ _sk_parametric_b_sse41 LABEL PROC
DB 68,15,88,218 ; addps %xmm2,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,217,115,1,0 ; mulps 0x173d9(%rip),%xmm12 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 68,15,84,29,225,115,1,0 ; andps 0x173e1(%rip),%xmm11 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 68,15,86,29,249,112,1,0 ; orps 0x170f9(%rip),%xmm11 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
- DB 68,15,88,37,225,115,1,0 ; addps 0x173e1(%rip),%xmm12 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
- DB 15,40,21,234,115,1,0 ; movaps 0x173ea(%rip),%xmm2 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,89,37,25,126,1,0 ; mulps 0x17e19(%rip),%xmm12 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 68,15,84,29,33,126,1,0 ; andps 0x17e21(%rip),%xmm11 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 68,15,86,29,57,123,1,0 ; orps 0x17b39(%rip),%xmm11 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,37,33,126,1,0 ; addps 0x17e21(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 15,40,21,42,126,1,0 ; movaps 0x17e2a(%rip),%xmm2 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,88,29,234,115,1,0 ; addps 0x173ea(%rip),%xmm11 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
- DB 15,40,21,243,115,1,0 ; movaps 0x173f3(%rip),%xmm2 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,88,29,42,126,1,0 ; addps 0x17e2a(%rip),%xmm11 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 15,40,21,51,126,1,0 ; movaps 0x17e33(%rip),%xmm2 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 65,15,94,211 ; divps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,224,115,1,0 ; addps 0x173e0(%rip),%xmm12 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
- DB 15,40,21,233,115,1,0 ; movaps 0x173e9(%rip),%xmm2 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 68,15,88,37,32,126,1,0 ; addps 0x17e20(%rip),%xmm12 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 15,40,21,41,126,1,0 ; movaps 0x17e29(%rip),%xmm2 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,40,21,233,115,1,0 ; movaps 0x173e9(%rip),%xmm10 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 68,15,40,21,41,126,1,0 ; movaps 0x17e29(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,21,238,115,1,0 ; movaps 0x173ee(%rip),%xmm2 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 15,40,21,46,126,1,0 ; movaps 0x17e2e(%rip),%xmm2 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 65,15,94,210 ; divps %xmm10,%xmm2
DB 65,15,88,212 ; addps %xmm12,%xmm2
- DB 15,89,21,239,115,1,0 ; mulps 0x173ef(%rip),%xmm2 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 15,89,21,47,126,1,0 ; mulps 0x17e2f(%rip),%xmm2 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10
DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
@@ -20181,7 +20181,7 @@ _sk_parametric_b_sse41 LABEL PROC
DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,93,21,122,112,1,0 ; minps 0x1707a(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,93,21,186,122,1,0 ; minps 0x17aba(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -20209,31 +20209,31 @@ _sk_parametric_a_sse41 LABEL PROC
DB 68,15,88,219 ; addps %xmm3,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,187,114,1,0 ; mulps 0x172bb(%rip),%xmm12 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 68,15,84,29,195,114,1,0 ; andps 0x172c3(%rip),%xmm11 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 68,15,86,29,219,111,1,0 ; orps 0x16fdb(%rip),%xmm11 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
- DB 68,15,88,37,195,114,1,0 ; addps 0x172c3(%rip),%xmm12 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
- DB 15,40,29,204,114,1,0 ; movaps 0x172cc(%rip),%xmm3 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,89,37,251,124,1,0 ; mulps 0x17cfb(%rip),%xmm12 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 68,15,84,29,3,125,1,0 ; andps 0x17d03(%rip),%xmm11 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 68,15,86,29,27,122,1,0 ; orps 0x17a1b(%rip),%xmm11 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,37,3,125,1,0 ; addps 0x17d03(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 15,40,29,12,125,1,0 ; movaps 0x17d0c(%rip),%xmm3 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,88,29,204,114,1,0 ; addps 0x172cc(%rip),%xmm11 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
- DB 15,40,29,213,114,1,0 ; movaps 0x172d5(%rip),%xmm3 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,88,29,12,125,1,0 ; addps 0x17d0c(%rip),%xmm11 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 15,40,29,21,125,1,0 ; movaps 0x17d15(%rip),%xmm3 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 65,15,94,219 ; divps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,194,114,1,0 ; addps 0x172c2(%rip),%xmm12 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
- DB 15,40,29,203,114,1,0 ; movaps 0x172cb(%rip),%xmm3 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 68,15,88,37,2,125,1,0 ; addps 0x17d02(%rip),%xmm12 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 15,40,29,11,125,1,0 ; movaps 0x17d0b(%rip),%xmm3 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,40,21,203,114,1,0 ; movaps 0x172cb(%rip),%xmm10 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 68,15,40,21,11,125,1,0 ; movaps 0x17d0b(%rip),%xmm10 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,29,208,114,1,0 ; movaps 0x172d0(%rip),%xmm3 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 15,40,29,16,125,1,0 ; movaps 0x17d10(%rip),%xmm3 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 65,15,94,218 ; divps %xmm10,%xmm3
DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 15,89,29,209,114,1,0 ; mulps 0x172d1(%rip),%xmm3 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 15,89,29,17,125,1,0 ; mulps 0x17d11(%rip),%xmm3 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10
DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
@@ -20241,7 +20241,7 @@ _sk_parametric_a_sse41 LABEL PROC
DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,93,29,92,111,1,0 ; minps 0x16f5c(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,93,29,156,121,1,0 ; minps 0x1799c(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -20257,20 +20257,20 @@ _sk_gamma_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,216,113,1,0 ; mulps 0x171d8(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 68,15,40,53,224,113,1,0 ; movaps 0x171e0(%rip),%xmm14 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
+ DB 15,89,5,24,124,1,0 ; mulps 0x17c18(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 68,15,40,53,32,124,1,0 ; movaps 0x17c20(%rip),%xmm14 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,37,244,110,1,0 ; movaps 0x16ef4(%rip),%xmm12 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,37,52,121,1,0 ; movaps 0x17934(%rip),%xmm12 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,86,212 ; orps %xmm12,%xmm2
- DB 68,15,40,21,216,113,1,0 ; movaps 0x171d8(%rip),%xmm10 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
+ DB 68,15,40,21,24,124,1,0 ; movaps 0x17c18(%rip),%xmm10 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,29,220,113,1,0 ; movaps 0x171dc(%rip),%xmm11 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,40,29,28,124,1,0 ; movaps 0x17c1c(%rip),%xmm11 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,13,218,113,1,0 ; movaps 0x171da(%rip),%xmm9 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
+ DB 68,15,40,13,26,124,1,0 ; movaps 0x17c1a(%rip),%xmm9 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 68,15,40,45,222,113,1,0 ; movaps 0x171de(%rip),%xmm13 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,40,45,30,124,1,0 ; movaps 0x17c1e(%rip),%xmm13 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20281,21 +20281,21 @@ _sk_gamma_sse41 LABEL PROC
DB 102,15,58,8,208,1 ; roundps $0x1,%xmm0,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,193,113,1,0 ; movaps 0x171c1(%rip),%xmm6 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
+ DB 15,40,53,1,124,1,0 ; movaps 0x17c01(%rip),%xmm6 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,215,113,1,0 ; movaps 0x171d7(%rip),%xmm7 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 15,40,61,23,124,1,0 ; movaps 0x17c17(%rip),%xmm7 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,183,113,1,0 ; movaps 0x171b7(%rip),%xmm4 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 15,40,37,247,123,1,0 ; movaps 0x17bf7(%rip),%xmm4 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,201,113,1,0 ; movaps 0x171c9(%rip),%xmm15 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 68,15,40,61,9,124,1,0 ; movaps 0x17c09(%rip),%xmm15 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,37,113,1,0 ; mulps 0x17125(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
+ DB 15,89,5,101,123,1,0 ; mulps 0x17b65(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
DB 65,15,84,206 ; andps %xmm14,%xmm1
DB 65,15,86,204 ; orps %xmm12,%xmm1
DB 65,15,88,194 ; addps %xmm10,%xmm0
@@ -20321,8 +20321,8 @@ _sk_gamma_sse41 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,198,112,1,0 ; mulps 0x170c6(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 15,84,29,207,112,1,0 ; andps 0x170cf(%rip),%xmm3 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
+ DB 15,89,5,6,123,1,0 ; mulps 0x17b06(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 15,84,29,15,123,1,0 ; andps 0x17b0f(%rip),%xmm3 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
DB 65,15,86,220 ; orps %xmm12,%xmm3
DB 65,15,88,194 ; addps %xmm10,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
@@ -20340,7 +20340,7 @@ _sk_gamma_sse41 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,23,113,1,0 ; movaps 0x17117(%rip),%xmm0 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 15,40,5,87,123,1,0 ; movaps 0x17b57(%rip),%xmm0 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -20359,29 +20359,29 @@ _sk_gamma_sse41 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse41
_sk_lab_to_xyz_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,89,5,228,112,1,0 ; mulps 0x170e4(%rip),%xmm8 # 2cde0 <_sk_overlay_sse2_8bit+0x1230>
- DB 68,15,40,13,92,110,1,0 ; movaps 0x16e5c(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,89,5,36,123,1,0 ; mulps 0x17b24(%rip),%xmm8 # 2d820 <_sk_overlay_sse2_8bit+0x12b4>
+ DB 68,15,40,13,156,120,1,0 ; movaps 0x1789c(%rip),%xmm9 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,40,5,225,112,1,0 ; movaps 0x170e1(%rip),%xmm0 # 2cdf0 <_sk_overlay_sse2_8bit+0x1240>
+ DB 15,40,5,33,123,1,0 ; movaps 0x17b21(%rip),%xmm0 # 2d830 <_sk_overlay_sse2_8bit+0x12c4>
DB 15,88,200 ; addps %xmm0,%xmm1
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,88,5,223,112,1,0 ; addps 0x170df(%rip),%xmm8 # 2ce00 <_sk_overlay_sse2_8bit+0x1250>
- DB 68,15,89,5,231,112,1,0 ; mulps 0x170e7(%rip),%xmm8 # 2ce10 <_sk_overlay_sse2_8bit+0x1260>
- DB 15,89,13,240,112,1,0 ; mulps 0x170f0(%rip),%xmm1 # 2ce20 <_sk_overlay_sse2_8bit+0x1270>
+ DB 68,15,88,5,31,123,1,0 ; addps 0x17b1f(%rip),%xmm8 # 2d840 <_sk_overlay_sse2_8bit+0x12d4>
+ DB 68,15,89,5,39,123,1,0 ; mulps 0x17b27(%rip),%xmm8 # 2d850 <_sk_overlay_sse2_8bit+0x12e4>
+ DB 15,89,13,48,123,1,0 ; mulps 0x17b30(%rip),%xmm1 # 2d860 <_sk_overlay_sse2_8bit+0x12f4>
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 15,89,21,245,112,1,0 ; mulps 0x170f5(%rip),%xmm2 # 2ce30 <_sk_overlay_sse2_8bit+0x1280>
+ DB 15,89,21,53,123,1,0 ; mulps 0x17b35(%rip),%xmm2 # 2d870 <_sk_overlay_sse2_8bit+0x1304>
DB 69,15,40,208 ; movaps %xmm8,%xmm10
DB 68,15,92,210 ; subps %xmm2,%xmm10
DB 68,15,40,217 ; movaps %xmm1,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
- DB 68,15,40,13,233,112,1,0 ; movaps 0x170e9(%rip),%xmm9 # 2ce40 <_sk_overlay_sse2_8bit+0x1290>
+ DB 68,15,40,13,41,123,1,0 ; movaps 0x17b29(%rip),%xmm9 # 2d880 <_sk_overlay_sse2_8bit+0x1314>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 15,40,21,233,112,1,0 ; movaps 0x170e9(%rip),%xmm2 # 2ce50 <_sk_overlay_sse2_8bit+0x12a0>
+ DB 15,40,21,41,123,1,0 ; movaps 0x17b29(%rip),%xmm2 # 2d890 <_sk_overlay_sse2_8bit+0x1324>
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 68,15,40,37,238,112,1,0 ; movaps 0x170ee(%rip),%xmm12 # 2ce60 <_sk_overlay_sse2_8bit+0x12b0>
+ DB 68,15,40,37,46,123,1,0 ; movaps 0x17b2e(%rip),%xmm12 # 2d8a0 <_sk_overlay_sse2_8bit+0x1334>
DB 65,15,89,204 ; mulps %xmm12,%xmm1
DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
DB 69,15,40,216 ; movaps %xmm8,%xmm11
@@ -20400,8 +20400,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC
DB 65,15,89,212 ; mulps %xmm12,%xmm2
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2
- DB 15,89,13,167,112,1,0 ; mulps 0x170a7(%rip),%xmm1 # 2ce70 <_sk_overlay_sse2_8bit+0x12c0>
- DB 15,89,21,176,112,1,0 ; mulps 0x170b0(%rip),%xmm2 # 2ce80 <_sk_overlay_sse2_8bit+0x12d0>
+ DB 15,89,13,231,122,1,0 ; mulps 0x17ae7(%rip),%xmm1 # 2d8b0 <_sk_overlay_sse2_8bit+0x1344>
+ DB 15,89,21,240,122,1,0 ; mulps 0x17af0(%rip),%xmm2 # 2d8c0 <_sk_overlay_sse2_8bit+0x1354>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,40,200 ; movaps %xmm8,%xmm1
@@ -20418,9 +20418,9 @@ _sk_load_a8_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,39 ; jne 15e1a <_sk_load_a8_sse41+0x3f>
DB 102,67,15,56,49,4,16 ; pmovzxbd (%r8,%r10,1),%xmm0
- DB 102,15,219,5,46,109,1,0 ; pand 0x16d2e(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,219,5,110,119,1,0 ; pand 0x1776e(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,116,110,1,0 ; mulps 0x16e74(%rip),%xmm3 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,29,180,120,1,0 ; mulps 0x178b4(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -20458,9 +20458,9 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,39 ; jne 15ea6 <_sk_load_a8_dst_sse41+0x3f>
DB 102,67,15,56,49,36,16 ; pmovzxbd (%r8,%r10,1),%xmm4
- DB 102,15,219,37,162,108,1,0 ; pand 0x16ca2(%rip),%xmm4 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,219,37,226,118,1,0 ; pand 0x176e2(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,232,109,1,0 ; mulps 0x16de8(%rip),%xmm7 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,61,40,120,1,0 ; mulps 0x17828(%rip),%xmm7 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
@@ -20511,7 +20511,7 @@ _sk_gather_a8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,29,109,1,0 ; mulps 0x16d1d(%rip),%xmm3 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,29,93,119,1,0 ; mulps 0x1775d(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -20527,7 +20527,7 @@ _sk_store_a8_sse41 LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
- DB 68,15,40,5,207,107,1,0 ; movaps 0x16bcf(%rip),%xmm8 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,5,15,118,1,0 ; movaps 0x1760f(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
@@ -20549,7 +20549,7 @@ _sk_store_a8_sse41 LABEL PROC
DB 65,128,249,3 ; cmp $0x3,%r9b
DB 117,217 ; jne 15fb3 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,68,16,2,8 ; pextrb $0x8,%xmm8,0x2(%r8,%r10,1)
- DB 102,68,15,56,0,5,163,110,1,0 ; pshufb 0x16ea3(%rip),%xmm8 # 2ce90 <_sk_overlay_sse2_8bit+0x12e0>
+ DB 102,68,15,56,0,5,227,120,1,0 ; pshufb 0x178e3(%rip),%xmm8 # 2d8d0 <_sk_overlay_sse2_8bit+0x1364>
DB 102,71,15,58,21,4,16,0 ; pextrw $0x0,%xmm8,(%r8,%r10,1)
DB 235,188 ; jmp 15fb3 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,4,16,0 ; pextrb $0x0,%xmm8,(%r8,%r10,1)
@@ -20566,11 +20566,11 @@ _sk_load_g8_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,42 ; jne 16043 <_sk_load_g8_sse41+0x42>
DB 102,67,15,56,49,4,16 ; pmovzxbd (%r8,%r10,1),%xmm0
- DB 102,15,219,5,8,107,1,0 ; pand 0x16b08(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,219,5,72,117,1,0 ; pand 0x17548(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,78,108,1,0 ; mulps 0x16c4e(%rip),%xmm0 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,5,142,118,1,0 ; mulps 0x1768e(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,69,106,1,0 ; movaps 0x16a45(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,133,116,1,0 ; movaps 0x17485(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -20606,11 +20606,11 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,42 ; jne 160d2 <_sk_load_g8_dst_sse41+0x42>
DB 102,67,15,56,49,36,16 ; pmovzxbd (%r8,%r10,1),%xmm4
- DB 102,15,219,37,121,106,1,0 ; pand 0x16a79(%rip),%xmm4 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,219,37,185,116,1,0 ; pand 0x174b9(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,191,107,1,0 ; mulps 0x16bbf(%rip),%xmm4 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,37,255,117,1,0 ; mulps 0x175ff(%rip),%xmm4 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,182,105,1,0 ; movaps 0x169b6(%rip),%xmm7 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,61,246,115,1,0 ; movaps 0x173f6(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
@@ -20659,9 +20659,9 @@ _sk_gather_g8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,241,106,1,0 ; mulps 0x16af1(%rip),%xmm0 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,5,49,117,1,0 ; mulps 0x17531(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,232,104,1,0 ; movaps 0x168e8(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,40,115,1,0 ; movaps 0x17328(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -20678,19 +20678,19 @@ _sk_load_565_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,80 ; jne 1620b <_sk_load_565_sse41+0x6b>
DB 102,67,15,56,51,20,80 ; pmovzxwd (%r8,%r10,2),%xmm2
- DB 102,15,111,5,198,106,1,0 ; movdqa 0x16ac6(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,15,111,5,6,117,1,0 ; movdqa 0x17506(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,200,106,1,0 ; mulps 0x16ac8(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,15,111,13,208,106,1,0 ; movdqa 0x16ad0(%rip),%xmm1 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 15,89,5,8,117,1,0 ; mulps 0x17508(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,15,111,13,16,117,1,0 ; movdqa 0x17510(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,210,106,1,0 ; mulps 0x16ad2(%rip),%xmm1 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,15,219,21,218,106,1,0 ; pand 0x16ada(%rip),%xmm2 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 15,89,13,18,117,1,0 ; mulps 0x17512(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,15,219,21,26,117,1,0 ; pand 0x1751a(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,224,106,1,0 ; mulps 0x16ae0(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 15,89,21,32,117,1,0 ; mulps 0x17520(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,119,104,1,0 ; movaps 0x16877(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,183,114,1,0 ; movaps 0x172b7(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
@@ -20724,19 +20724,19 @@ _sk_load_565_dst_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,80 ; jne 162c6 <_sk_load_565_dst_sse41+0x6b>
DB 102,67,15,56,51,52,80 ; pmovzxwd (%r8,%r10,2),%xmm6
- DB 102,15,111,37,11,106,1,0 ; movdqa 0x16a0b(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,15,111,37,75,116,1,0 ; movdqa 0x1744b(%rip),%xmm4 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,13,106,1,0 ; mulps 0x16a0d(%rip),%xmm4 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,15,111,45,21,106,1,0 ; movdqa 0x16a15(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 15,89,37,77,116,1,0 ; mulps 0x1744d(%rip),%xmm4 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,15,111,45,85,116,1,0 ; movdqa 0x17455(%rip),%xmm5 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,23,106,1,0 ; mulps 0x16a17(%rip),%xmm5 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,15,219,53,31,106,1,0 ; pand 0x16a1f(%rip),%xmm6 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 15,89,45,87,116,1,0 ; mulps 0x17457(%rip),%xmm5 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,15,219,53,95,116,1,0 ; pand 0x1745f(%rip),%xmm6 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,37,106,1,0 ; mulps 0x16a25(%rip),%xmm6 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 15,89,53,101,116,1,0 ; mulps 0x17465(%rip),%xmm6 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,188,103,1,0 ; movaps 0x167bc(%rip),%xmm7 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,61,252,113,1,0 ; movaps 0x171fc(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
@@ -20781,19 +20781,19 @@ _sk_gather_565_sse41 LABEL PROC
DB 65,15,183,4,64 ; movzwl (%r8,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2
- DB 102,15,111,5,16,105,1,0 ; movdqa 0x16910(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,15,111,5,80,115,1,0 ; movdqa 0x17350(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,18,105,1,0 ; mulps 0x16912(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,15,111,13,26,105,1,0 ; movdqa 0x1691a(%rip),%xmm1 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 15,89,5,82,115,1,0 ; mulps 0x17352(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,15,111,13,90,115,1,0 ; movdqa 0x1735a(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,28,105,1,0 ; mulps 0x1691c(%rip),%xmm1 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,15,219,21,36,105,1,0 ; pand 0x16924(%rip),%xmm2 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 15,89,13,92,115,1,0 ; mulps 0x1735c(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,15,219,21,100,115,1,0 ; pand 0x17364(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,42,105,1,0 ; mulps 0x1692a(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 15,89,21,106,115,1,0 ; mulps 0x1736a(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,193,102,1,0 ; movaps 0x166c1(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,1,113,1,0 ; movaps 0x17101(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_sse41
@@ -20805,12 +20805,12 @@ _sk_store_565_sse41 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,193,106,1,0 ; movaps 0x16ac1(%rip),%xmm8 # 2cea0 <_sk_overlay_sse2_8bit+0x12f0>
+ DB 68,15,40,5,1,117,1,0 ; movaps 0x17501(%rip),%xmm8 # 2d8e0 <_sk_overlay_sse2_8bit+0x1374>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,182,106,1,0 ; movaps 0x16ab6(%rip),%xmm10 # 2ceb0 <_sk_overlay_sse2_8bit+0x1300>
+ DB 68,15,40,21,246,116,1,0 ; movaps 0x174f6(%rip),%xmm10 # 2d8f0 <_sk_overlay_sse2_8bit+0x1384>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -20852,21 +20852,21 @@ _sk_load_4444_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,95 ; jne 164eb <_sk_load_4444_sse41+0x7a>
DB 102,67,15,56,51,28,80 ; pmovzxwd (%r8,%r10,2),%xmm3
- DB 102,15,111,5,37,106,1,0 ; movdqa 0x16a25(%rip),%xmm0 # 2cec0 <_sk_overlay_sse2_8bit+0x1310>
+ DB 102,15,111,5,101,116,1,0 ; movdqa 0x17465(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,39,106,1,0 ; mulps 0x16a27(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x1320>
- DB 102,15,111,13,47,106,1,0 ; movdqa 0x16a2f(%rip),%xmm1 # 2cee0 <_sk_overlay_sse2_8bit+0x1330>
+ DB 15,89,5,103,116,1,0 ; mulps 0x17467(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
+ DB 102,15,111,13,111,116,1,0 ; movdqa 0x1746f(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,49,106,1,0 ; mulps 0x16a31(%rip),%xmm1 # 2cef0 <_sk_overlay_sse2_8bit+0x1340>
- DB 102,15,111,21,57,106,1,0 ; movdqa 0x16a39(%rip),%xmm2 # 2cf00 <_sk_overlay_sse2_8bit+0x1350>
+ DB 15,89,13,113,116,1,0 ; mulps 0x17471(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
+ DB 102,15,111,21,121,116,1,0 ; movdqa 0x17479(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,59,106,1,0 ; mulps 0x16a3b(%rip),%xmm2 # 2cf10 <_sk_overlay_sse2_8bit+0x1360>
- DB 102,15,219,29,67,106,1,0 ; pand 0x16a43(%rip),%xmm3 # 2cf20 <_sk_overlay_sse2_8bit+0x1370>
+ DB 15,89,21,123,116,1,0 ; mulps 0x1747b(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
+ DB 102,15,219,29,131,116,1,0 ; pand 0x17483(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,73,106,1,0 ; mulps 0x16a49(%rip),%xmm3 # 2cf30 <_sk_overlay_sse2_8bit+0x1380>
+ DB 15,89,29,137,116,1,0 ; mulps 0x17489(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
@@ -20901,21 +20901,21 @@ _sk_load_4444_dst_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,95 ; jne 165b5 <_sk_load_4444_dst_sse41+0x7a>
DB 102,67,15,56,51,60,80 ; pmovzxwd (%r8,%r10,2),%xmm7
- DB 102,15,111,37,91,105,1,0 ; movdqa 0x1695b(%rip),%xmm4 # 2cec0 <_sk_overlay_sse2_8bit+0x1310>
+ DB 102,15,111,37,155,115,1,0 ; movdqa 0x1739b(%rip),%xmm4 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,93,105,1,0 ; mulps 0x1695d(%rip),%xmm4 # 2ced0 <_sk_overlay_sse2_8bit+0x1320>
- DB 102,15,111,45,101,105,1,0 ; movdqa 0x16965(%rip),%xmm5 # 2cee0 <_sk_overlay_sse2_8bit+0x1330>
+ DB 15,89,37,157,115,1,0 ; mulps 0x1739d(%rip),%xmm4 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
+ DB 102,15,111,45,165,115,1,0 ; movdqa 0x173a5(%rip),%xmm5 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,103,105,1,0 ; mulps 0x16967(%rip),%xmm5 # 2cef0 <_sk_overlay_sse2_8bit+0x1340>
- DB 102,15,111,53,111,105,1,0 ; movdqa 0x1696f(%rip),%xmm6 # 2cf00 <_sk_overlay_sse2_8bit+0x1350>
+ DB 15,89,45,167,115,1,0 ; mulps 0x173a7(%rip),%xmm5 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
+ DB 102,15,111,53,175,115,1,0 ; movdqa 0x173af(%rip),%xmm6 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,113,105,1,0 ; mulps 0x16971(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x1360>
- DB 102,15,219,61,121,105,1,0 ; pand 0x16979(%rip),%xmm7 # 2cf20 <_sk_overlay_sse2_8bit+0x1370>
+ DB 15,89,53,177,115,1,0 ; mulps 0x173b1(%rip),%xmm6 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
+ DB 102,15,219,61,185,115,1,0 ; pand 0x173b9(%rip),%xmm7 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,127,105,1,0 ; mulps 0x1697f(%rip),%xmm7 # 2cf30 <_sk_overlay_sse2_8bit+0x1380>
+ DB 15,89,61,191,115,1,0 ; mulps 0x173bf(%rip),%xmm7 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
@@ -20961,21 +20961,21 @@ _sk_gather_4444_sse41 LABEL PROC
DB 65,15,183,4,64 ; movzwl (%r8,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3
- DB 102,15,111,5,81,104,1,0 ; movdqa 0x16851(%rip),%xmm0 # 2cec0 <_sk_overlay_sse2_8bit+0x1310>
+ DB 102,15,111,5,145,114,1,0 ; movdqa 0x17291(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,83,104,1,0 ; mulps 0x16853(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x1320>
- DB 102,15,111,13,91,104,1,0 ; movdqa 0x1685b(%rip),%xmm1 # 2cee0 <_sk_overlay_sse2_8bit+0x1330>
+ DB 15,89,5,147,114,1,0 ; mulps 0x17293(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
+ DB 102,15,111,13,155,114,1,0 ; movdqa 0x1729b(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,93,104,1,0 ; mulps 0x1685d(%rip),%xmm1 # 2cef0 <_sk_overlay_sse2_8bit+0x1340>
- DB 102,15,111,21,101,104,1,0 ; movdqa 0x16865(%rip),%xmm2 # 2cf00 <_sk_overlay_sse2_8bit+0x1350>
+ DB 15,89,13,157,114,1,0 ; mulps 0x1729d(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
+ DB 102,15,111,21,165,114,1,0 ; movdqa 0x172a5(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,103,104,1,0 ; mulps 0x16867(%rip),%xmm2 # 2cf10 <_sk_overlay_sse2_8bit+0x1360>
- DB 102,15,219,29,111,104,1,0 ; pand 0x1686f(%rip),%xmm3 # 2cf20 <_sk_overlay_sse2_8bit+0x1370>
+ DB 15,89,21,167,114,1,0 ; mulps 0x172a7(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
+ DB 102,15,219,29,175,114,1,0 ; pand 0x172af(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,117,104,1,0 ; mulps 0x16875(%rip),%xmm3 # 2cf30 <_sk_overlay_sse2_8bit+0x1380>
+ DB 15,89,29,181,114,1,0 ; mulps 0x172b5(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20988,7 +20988,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,99,104,1,0 ; movaps 0x16863(%rip),%xmm8 # 2cf40 <_sk_overlay_sse2_8bit+0x1390>
+ DB 68,15,40,5,163,114,1,0 ; movaps 0x172a3(%rip),%xmm8 # 2d980 <_sk_overlay_sse2_8bit+0x1414>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -21040,17 +21040,17 @@ _sk_load_8888_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,89 ; jne 167f8 <_sk_load_8888_sse41+0x75>
DB 243,65,15,111,28,128 ; movdqu (%r8,%rax,4),%xmm3
- DB 102,15,111,5,131,99,1,0 ; movdqa 0x16383(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,5,195,109,1,0 ; movdqa 0x16dc3(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,196,100,1,0 ; movaps 0x164c4(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,4,111,1,0 ; movaps 0x16f04(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,115,99,1,0 ; pshufb 0x16373(%rip),%xmm1 # 2cb40 <_sk_overlay_sse2_8bit+0xf90>
+ DB 102,15,56,0,13,179,109,1,0 ; pshufb 0x16db3(%rip),%xmm1 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,111,99,1,0 ; pshufb 0x1636f(%rip),%xmm2 # 2cb50 <_sk_overlay_sse2_8bit+0xfa0>
+ DB 102,15,56,0,21,175,109,1,0 ; pshufb 0x16daf(%rip),%xmm2 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -21087,17 +21087,17 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,89 ; jne 168b2 <_sk_load_8888_dst_sse41+0x75>
DB 243,65,15,111,60,128 ; movdqu (%r8,%rax,4),%xmm7
- DB 102,15,111,37,201,98,1,0 ; movdqa 0x162c9(%rip),%xmm4 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,37,9,109,1,0 ; movdqa 0x16d09(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,10,100,1,0 ; movaps 0x1640a(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,74,110,1,0 ; movaps 0x16e4a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,185,98,1,0 ; pshufb 0x162b9(%rip),%xmm5 # 2cb40 <_sk_overlay_sse2_8bit+0xf90>
+ DB 102,15,56,0,45,249,108,1,0 ; pshufb 0x16cf9(%rip),%xmm5 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,181,98,1,0 ; pshufb 0x162b5(%rip),%xmm6 # 2cb50 <_sk_overlay_sse2_8bit+0xfa0>
+ DB 102,15,56,0,53,245,108,1,0 ; pshufb 0x16cf5(%rip),%xmm6 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -21142,17 +21142,17 @@ _sk_gather_8888_sse41 LABEL PROC
DB 102,65,15,58,34,28,128,1 ; pinsrd $0x1,(%r8,%rax,4),%xmm3
DB 102,67,15,58,34,28,152,2 ; pinsrd $0x2,(%r8,%r11,4),%xmm3
DB 102,67,15,58,34,28,144,3 ; pinsrd $0x3,(%r8,%r10,4),%xmm3
- DB 102,15,111,5,217,97,1,0 ; movdqa 0x161d9(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,5,25,108,1,0 ; movdqa 0x16c19(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,26,99,1,0 ; movaps 0x1631a(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,90,109,1,0 ; movaps 0x16d5a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,201,97,1,0 ; pshufb 0x161c9(%rip),%xmm1 # 2cb40 <_sk_overlay_sse2_8bit+0xf90>
+ DB 102,15,56,0,13,9,108,1,0 ; pshufb 0x16c09(%rip),%xmm1 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,197,97,1,0 ; pshufb 0x161c5(%rip),%xmm2 # 2cb50 <_sk_overlay_sse2_8bit+0xfa0>
+ DB 102,15,56,0,21,5,108,1,0 ; pshufb 0x16c05(%rip),%xmm2 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -21170,7 +21170,7 @@ _sk_store_8888_sse41 LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,159,97,1,0 ; movaps 0x1619f(%rip),%xmm8 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,5,223,107,1,0 ; movaps 0x16bdf(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -21219,17 +21219,17 @@ _sk_load_bgra_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,89 ; jne 16ac8 <_sk_load_bgra_sse41+0x75>
DB 243,65,15,111,28,128 ; movdqu (%r8,%rax,4),%xmm3
- DB 102,15,111,5,179,96,1,0 ; movdqa 0x160b3(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,5,243,106,1,0 ; movdqa 0x16af3(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,244,97,1,0 ; movaps 0x161f4(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,52,108,1,0 ; movaps 0x16c34(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,163,96,1,0 ; pshufb 0x160a3(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xf90>
+ DB 102,15,56,0,5,227,106,1,0 ; pshufb 0x16ae3(%rip),%xmm0 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,159,96,1,0 ; pshufb 0x1609f(%rip),%xmm0 # 2cb50 <_sk_overlay_sse2_8bit+0xfa0>
+ DB 102,15,56,0,5,223,106,1,0 ; pshufb 0x16adf(%rip),%xmm0 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -21266,17 +21266,17 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,89 ; jne 16b82 <_sk_load_bgra_dst_sse41+0x75>
DB 243,65,15,111,60,128 ; movdqu (%r8,%rax,4),%xmm7
- DB 102,15,111,37,249,95,1,0 ; movdqa 0x15ff9(%rip),%xmm4 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,37,57,106,1,0 ; movdqa 0x16a39(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,244 ; cvtdq2ps %xmm4,%xmm6
- DB 68,15,40,5,58,97,1,0 ; movaps 0x1613a(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,122,107,1,0 ; movaps 0x16b7a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,233,95,1,0 ; pshufb 0x15fe9(%rip),%xmm4 # 2cb40 <_sk_overlay_sse2_8bit+0xf90>
+ DB 102,15,56,0,37,41,106,1,0 ; pshufb 0x16a29(%rip),%xmm4 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
DB 15,91,236 ; cvtdq2ps %xmm4,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,229,95,1,0 ; pshufb 0x15fe5(%rip),%xmm4 # 2cb50 <_sk_overlay_sse2_8bit+0xfa0>
+ DB 102,15,56,0,37,37,106,1,0 ; pshufb 0x16a25(%rip),%xmm4 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -21321,17 +21321,17 @@ _sk_gather_bgra_sse41 LABEL PROC
DB 102,65,15,58,34,28,128,1 ; pinsrd $0x1,(%r8,%rax,4),%xmm3
DB 102,67,15,58,34,28,152,2 ; pinsrd $0x2,(%r8,%r11,4),%xmm3
DB 102,67,15,58,34,28,144,3 ; pinsrd $0x3,(%r8,%r10,4),%xmm3
- DB 102,15,111,5,9,95,1,0 ; movdqa 0x15f09(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,5,73,105,1,0 ; movdqa 0x16949(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,74,96,1,0 ; movaps 0x1604a(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,138,106,1,0 ; movaps 0x16a8a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,249,94,1,0 ; pshufb 0x15ef9(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xf90>
+ DB 102,15,56,0,5,57,105,1,0 ; pshufb 0x16939(%rip),%xmm0 # 2d580 <_sk_overlay_sse2_8bit+0x1014>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,245,94,1,0 ; pshufb 0x15ef5(%rip),%xmm0 # 2cb50 <_sk_overlay_sse2_8bit+0xfa0>
+ DB 102,15,56,0,5,53,105,1,0 ; pshufb 0x16935(%rip),%xmm0 # 2d590 <_sk_overlay_sse2_8bit+0x1024>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -21349,7 +21349,7 @@ _sk_store_bgra_sse41 LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,207,94,1,0 ; movaps 0x15ecf(%rip),%xmm8 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,5,15,105,1,0 ; movaps 0x1690f(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -21406,18 +21406,18 @@ _sk_load_f16_sse41 LABEL PROC
DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,212,97,1,0 ; movdqa 0x161d4(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x13a0>
+ DB 102,68,15,111,5,20,108,1,0 ; movdqa 0x16c14(%rip),%xmm8 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,207,97,1,0 ; movdqa 0x161cf(%rip),%xmm3 # 2cf60 <_sk_overlay_sse2_8bit+0x13b0>
+ DB 102,15,111,29,15,108,1,0 ; movdqa 0x16c0f(%rip),%xmm3 # 2d9a0 <_sk_overlay_sse2_8bit+0x1434>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,187,97,1,0 ; movdqa 0x161bb(%rip),%xmm10 # 2cf70 <_sk_overlay_sse2_8bit+0x13c0>
+ DB 102,68,15,111,21,251,107,1,0 ; movdqa 0x16bfb(%rip),%xmm10 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21491,18 +21491,18 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 102,68,15,97,220 ; punpcklwd %xmm4,%xmm11
DB 102,68,15,105,204 ; punpckhwd %xmm4,%xmm9
DB 102,65,15,56,51,235 ; pmovzxwd %xmm11,%xmm5
- DB 102,68,15,111,5,60,96,1,0 ; movdqa 0x1603c(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x13a0>
+ DB 102,68,15,111,5,124,106,1,0 ; movdqa 0x16a7c(%rip),%xmm8 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
DB 102,15,111,245 ; movdqa %xmm5,%xmm6
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,239,238 ; pxor %xmm6,%xmm5
- DB 102,15,111,61,55,96,1,0 ; movdqa 0x16037(%rip),%xmm7 # 2cf60 <_sk_overlay_sse2_8bit+0x13b0>
+ DB 102,15,111,61,119,106,1,0 ; movdqa 0x16a77(%rip),%xmm7 # 2d9a0 <_sk_overlay_sse2_8bit+0x1434>
DB 102,15,114,246,16 ; pslld $0x10,%xmm6
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,15,56,63,231 ; pmaxud %xmm7,%xmm4
DB 102,15,118,229 ; pcmpeqd %xmm5,%xmm4
DB 102,15,114,245,13 ; pslld $0xd,%xmm5
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,68,15,111,21,35,96,1,0 ; movdqa 0x16023(%rip),%xmm10 # 2cf70 <_sk_overlay_sse2_8bit+0x13c0>
+ DB 102,68,15,111,21,99,106,1,0 ; movdqa 0x16a63(%rip),%xmm10 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
DB 102,65,15,254,234 ; paddd %xmm10,%xmm5
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21585,18 +21585,18 @@ _sk_gather_f16_sse41 LABEL PROC
DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11
DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,119,94,1,0 ; movdqa 0x15e77(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x13a0>
+ DB 102,68,15,111,5,183,104,1,0 ; movdqa 0x168b7(%rip),%xmm8 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,114,94,1,0 ; movdqa 0x15e72(%rip),%xmm3 # 2cf60 <_sk_overlay_sse2_8bit+0x13b0>
+ DB 102,15,111,29,178,104,1,0 ; movdqa 0x168b2(%rip),%xmm3 # 2d9a0 <_sk_overlay_sse2_8bit+0x1434>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,94,94,1,0 ; movdqa 0x15e5e(%rip),%xmm10 # 2cf70 <_sk_overlay_sse2_8bit+0x13c0>
+ DB 102,68,15,111,21,158,104,1,0 ; movdqa 0x1689e(%rip),%xmm10 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21647,17 +21647,17 @@ _sk_store_f16_sse41 LABEL PROC
DB 73,193,224,3 ; shl $0x3,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,130,93,1,0 ; movdqa 0x15d82(%rip),%xmm10 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
+ DB 102,68,15,111,21,194,103,1,0 ; movdqa 0x167c2(%rip),%xmm10 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,235 ; pxor %xmm11,%xmm13
- DB 102,68,15,111,13,117,93,1,0 ; movdqa 0x15d75(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x13e0>
+ DB 102,68,15,111,13,181,103,1,0 ; movdqa 0x167b5(%rip),%xmm9 # 2d9d0 <_sk_overlay_sse2_8bit+0x1464>
DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,37,102,93,1,0 ; movdqa 0x15d66(%rip),%xmm12 # 2cfa0 <_sk_overlay_sse2_8bit+0x13f0>
+ DB 102,68,15,111,37,166,103,1,0 ; movdqa 0x167a6(%rip),%xmm12 # 2d9e0 <_sk_overlay_sse2_8bit+0x1474>
DB 102,69,15,235,220 ; por %xmm12,%xmm11
DB 102,69,15,254,221 ; paddd %xmm13,%xmm11
DB 102,69,15,223,195 ; pandn %xmm11,%xmm8
@@ -21744,7 +21744,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,70,89,1,0 ; movaps 0x15946(%rip),%xmm8 # 2cd10 <_sk_overlay_sse2_8bit+0x1160>
+ DB 68,15,40,5,134,99,1,0 ; movaps 0x16386(%rip),%xmm8 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21816,7 +21816,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,21,88,1,0 ; movaps 0x15815(%rip),%xmm8 # 2cd10 <_sk_overlay_sse2_8bit+0x1160>
+ DB 68,15,40,5,85,98,1,0 ; movaps 0x16255(%rip),%xmm8 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21833,7 +21833,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,60,85,1,0 ; movaps 0x1553c(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,124,95,1,0 ; movaps 0x15f7c(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,64 ; movd (%r8,%rax,2),%xmm2
DB 102,65,15,196,84,64,4,2 ; pinsrw $0x2,0x4(%r8,%rax,2),%xmm2
@@ -21865,7 +21865,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
- DB 68,15,40,21,229,89,1,0 ; movaps 0x159e5(%rip),%xmm10 # 2cfb0 <_sk_overlay_sse2_8bit+0x1400>
+ DB 68,15,40,21,37,100,1,0 ; movaps 0x16425(%rip),%xmm10 # 2d9f0 <_sk_overlay_sse2_8bit+0x1484>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -22124,7 +22124,7 @@ _sk_mirror_x_sse41 LABEL PROC
DB 65,15,92,194 ; subps %xmm10,%xmm0
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,139,70,1,0 ; mulss 0x1468b(%rip),%xmm9 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 243,68,15,89,13,71,80,1,0 ; mulss 0x15047(%rip),%xmm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -22153,7 +22153,7 @@ _sk_mirror_y_sse41 LABEL PROC
DB 65,15,92,202 ; subps %xmm10,%xmm1
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,25,70,1,0 ; mulss 0x14619(%rip),%xmm9 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 243,68,15,89,13,213,79,1,0 ; mulss 0x14fd5(%rip),%xmm9 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,201 ; mulps %xmm1,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -22176,7 +22176,7 @@ PUBLIC _sk_clamp_x_1_sse41
_sk_clamp_x_1_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,40,80,1,0 ; minps 0x15028(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,93,5,104,90,1,0 ; minps 0x15a68(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -22190,9 +22190,9 @@ _sk_repeat_x_1_sse41 LABEL PROC
PUBLIC _sk_mirror_x_1_sse41
_sk_mirror_x_1_sse41 LABEL PROC
- DB 68,15,40,5,105,80,1,0 ; movaps 0x15069(%rip),%xmm8 # 2cae0 <_sk_overlay_sse2_8bit+0xf30>
+ DB 68,15,40,5,169,90,1,0 ; movaps 0x15aa9(%rip),%xmm8 # 2d520 <_sk_overlay_sse2_8bit+0xfb4>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,221,79,1,0 ; movaps 0x14fdd(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,13,29,90,1,0 ; movaps 0x15a1d(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
DB 69,15,88,201 ; addps %xmm9,%xmm9
@@ -22207,10 +22207,10 @@ _sk_mirror_x_1_sse41 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse41
_sk_luminance_to_alpha_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,12,85,1,0 ; mulps 0x1550c(%rip),%xmm0 # 2cfc0 <_sk_overlay_sse2_8bit+0x1410>
- DB 15,89,13,21,85,1,0 ; mulps 0x15515(%rip),%xmm1 # 2cfd0 <_sk_overlay_sse2_8bit+0x1420>
+ DB 15,89,5,76,95,1,0 ; mulps 0x15f4c(%rip),%xmm0 # 2da00 <_sk_overlay_sse2_8bit+0x1494>
+ DB 15,89,13,85,95,1,0 ; mulps 0x15f55(%rip),%xmm1 # 2da10 <_sk_overlay_sse2_8bit+0x14a4>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,27,85,1,0 ; mulps 0x1551b(%rip),%xmm3 # 2cfe0 <_sk_overlay_sse2_8bit+0x1430>
+ DB 15,89,29,91,95,1,0 ; mulps 0x15f5b(%rip),%xmm3 # 2da20 <_sk_overlay_sse2_8bit+0x14b4>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -22595,15 +22595,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse41
_sk_gauss_a_to_rgba_sse41 LABEL PROC
- DB 15,40,5,202,78,1,0 ; movaps 0x14eca(%rip),%xmm0 # 2cff0 <_sk_overlay_sse2_8bit+0x1440>
+ DB 15,40,5,10,89,1,0 ; movaps 0x1590a(%rip),%xmm0 # 2da30 <_sk_overlay_sse2_8bit+0x14c4>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,208,78,1,0 ; addps 0x14ed0(%rip),%xmm0 # 2d000 <_sk_overlay_sse2_8bit+0x1450>
+ DB 15,88,5,16,89,1,0 ; addps 0x15910(%rip),%xmm0 # 2da40 <_sk_overlay_sse2_8bit+0x14d4>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,214,78,1,0 ; addps 0x14ed6(%rip),%xmm0 # 2d010 <_sk_overlay_sse2_8bit+0x1460>
+ DB 15,88,5,22,89,1,0 ; addps 0x15916(%rip),%xmm0 # 2da50 <_sk_overlay_sse2_8bit+0x14e4>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,220,78,1,0 ; addps 0x14edc(%rip),%xmm0 # 2d020 <_sk_overlay_sse2_8bit+0x1470>
+ DB 15,88,5,28,89,1,0 ; addps 0x1591c(%rip),%xmm0 # 2da60 <_sk_overlay_sse2_8bit+0x14f4>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,226,78,1,0 ; addps 0x14ee2(%rip),%xmm0 # 2d030 <_sk_overlay_sse2_8bit+0x1480>
+ DB 15,88,5,34,89,1,0 ; addps 0x15922(%rip),%xmm0 # 2da70 <_sk_overlay_sse2_8bit+0x1504>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -22621,7 +22621,7 @@ _sk_gradient_sse41 LABEL PROC
DB 73,255,200 ; dec %r8
DB 73,131,193,4 ; add $0x4,%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,16,73,1,0 ; movaps 0x14910(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 15,40,21,80,83,1,0 ; movaps 0x15350(%rip),%xmm2 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 243,65,15,16,25 ; movss (%r9),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -22756,26 +22756,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,237 ; mulps %xmm13,%xmm13
- DB 68,15,40,21,79,76,1,0 ; movaps 0x14c4f(%rip),%xmm10 # 2d040 <_sk_overlay_sse2_8bit+0x1490>
+ DB 68,15,40,21,143,86,1,0 ; movaps 0x1568f(%rip),%xmm10 # 2da80 <_sk_overlay_sse2_8bit+0x1514>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,83,76,1,0 ; addps 0x14c53(%rip),%xmm10 # 2d050 <_sk_overlay_sse2_8bit+0x14a0>
+ DB 68,15,88,21,147,86,1,0 ; addps 0x15693(%rip),%xmm10 # 2da90 <_sk_overlay_sse2_8bit+0x1524>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,87,76,1,0 ; addps 0x14c57(%rip),%xmm10 # 2d060 <_sk_overlay_sse2_8bit+0x14b0>
+ DB 68,15,88,21,151,86,1,0 ; addps 0x15697(%rip),%xmm10 # 2daa0 <_sk_overlay_sse2_8bit+0x1534>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,91,76,1,0 ; addps 0x14c5b(%rip),%xmm10 # 2d070 <_sk_overlay_sse2_8bit+0x14c0>
+ DB 68,15,88,21,155,86,1,0 ; addps 0x1569b(%rip),%xmm10 # 2dab0 <_sk_overlay_sse2_8bit+0x1544>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 68,15,40,29,90,76,1,0 ; movaps 0x14c5a(%rip),%xmm11 # 2d080 <_sk_overlay_sse2_8bit+0x14d0>
+ DB 68,15,40,29,154,86,1,0 ; movaps 0x1569a(%rip),%xmm11 # 2dac0 <_sk_overlay_sse2_8bit+0x1554>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,40,29,35,70,1,0 ; movaps 0x14623(%rip),%xmm11 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,29,99,80,1,0 ; movaps 0x15063(%rip),%xmm11 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0
- DB 68,15,40,13,37,70,1,0 ; movaps 0x14625(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,101,80,1,0 ; movaps 0x15065(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8
@@ -22805,7 +22805,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,206,75,1,0 ; mulps 0x14bce(%rip),%xmm9 # 2d090 <_sk_overlay_sse2_8bit+0x14e0>
+ DB 68,15,89,13,14,86,1,0 ; mulps 0x1560e(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22813,7 +22813,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,185,75,1,0 ; mulps 0x14bb9(%rip),%xmm10 # 2d0a0 <_sk_overlay_sse2_8bit+0x14f0>
+ DB 68,15,89,21,249,85,1,0 ; mulps 0x155f9(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1574>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22822,8 +22822,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,113,74,1,0 ; xorps 0x14a71(%rip),%xmm9 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
- DB 68,15,89,5,73,69,1,0 ; mulps 0x14549(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,87,13,177,84,1,0 ; xorps 0x154b1(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 68,15,89,5,137,79,1,0 ; mulps 0x14f89(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22842,7 +22842,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,48,75,1,0 ; mulps 0x14b30(%rip),%xmm9 # 2d090 <_sk_overlay_sse2_8bit+0x14e0>
+ DB 68,15,89,13,112,85,1,0 ; mulps 0x15570(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22850,7 +22850,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,27,75,1,0 ; mulps 0x14b1b(%rip),%xmm10 # 2d0a0 <_sk_overlay_sse2_8bit+0x14f0>
+ DB 68,15,89,21,91,85,1,0 ; mulps 0x1555b(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1574>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22859,8 +22859,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,211,73,1,0 ; xorps 0x149d3(%rip),%xmm9 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
- DB 68,15,89,5,171,68,1,0 ; mulps 0x144ab(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,87,13,19,84,1,0 ; xorps 0x15413(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 68,15,89,5,235,78,1,0 ; mulps 0x14eeb(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22876,7 +22876,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,163,74,1,0 ; mulps 0x14aa3(%rip),%xmm9 # 2d090 <_sk_overlay_sse2_8bit+0x14e0>
+ DB 68,15,89,13,227,84,1,0 ; mulps 0x154e3(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -22884,7 +22884,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,111,73,1,0 ; xorps 0x1496f(%rip),%xmm0 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
+ DB 15,87,5,175,83,1,0 ; xorps 0x153af(%rip),%xmm0 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22921,7 +22921,7 @@ _sk_apply_vector_mask_sse41 LABEL PROC
PUBLIC _sk_save_xy_sse41
_sk_save_xy_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,229,67,1,0 ; movaps 0x143e5(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,5,37,78,1,0 ; movaps 0x14e25(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -22961,8 +22961,8 @@ _sk_bilinear_nx_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,167,73,1,0 ; addps 0x149a7(%rip),%xmm0 # 2d0b0 <_sk_overlay_sse2_8bit+0x1500>
- DB 68,15,40,13,111,67,1,0 ; movaps 0x1436f(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,5,231,83,1,0 ; addps 0x153e7(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
+ DB 68,15,40,13,175,77,1,0 ; movaps 0x14daf(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22973,7 +22973,7 @@ _sk_bilinear_px_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,46,67,1,0 ; addps 0x1432e(%rip),%xmm0 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 15,88,5,110,77,1,0 ; addps 0x14d6e(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22983,8 +22983,8 @@ _sk_bilinear_ny_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,96,73,1,0 ; addps 0x14960(%rip),%xmm1 # 2d0b0 <_sk_overlay_sse2_8bit+0x1500>
- DB 68,15,40,13,40,67,1,0 ; movaps 0x14328(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,13,160,83,1,0 ; addps 0x153a0(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
+ DB 68,15,40,13,104,77,1,0 ; movaps 0x14d68(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22995,7 +22995,7 @@ _sk_bilinear_py_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,230,66,1,0 ; addps 0x142e6(%rip),%xmm1 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 15,88,13,38,77,1,0 ; addps 0x14d26(%rip),%xmm1 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23005,13 +23005,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,41,73,1,0 ; addps 0x14929(%rip),%xmm0 # 2d0c0 <_sk_overlay_sse2_8bit+0x1510>
- DB 68,15,40,13,225,66,1,0 ; movaps 0x142e1(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,5,105,83,1,0 ; addps 0x15369(%rip),%xmm0 # 2db00 <_sk_overlay_sse2_8bit+0x1594>
+ DB 68,15,40,13,33,77,1,0 ; movaps 0x14d21(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,29,73,1,0 ; mulps 0x1491d(%rip),%xmm9 # 2d0d0 <_sk_overlay_sse2_8bit+0x1520>
- DB 68,15,88,13,181,68,1,0 ; addps 0x144b5(%rip),%xmm9 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 68,15,89,13,93,83,1,0 ; mulps 0x1535d(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
+ DB 68,15,88,13,245,78,1,0 ; addps 0x14ef5(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -23022,16 +23022,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,212,72,1,0 ; addps 0x148d4(%rip),%xmm0 # 2d0b0 <_sk_overlay_sse2_8bit+0x1500>
- DB 68,15,40,13,156,66,1,0 ; movaps 0x1429c(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,5,20,83,1,0 ; addps 0x15314(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
+ DB 68,15,40,13,220,76,1,0 ; movaps 0x14cdc(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,240,72,1,0 ; movaps 0x148f0(%rip),%xmm8 # 2d0e0 <_sk_overlay_sse2_8bit+0x1530>
+ DB 68,15,40,5,48,83,1,0 ; movaps 0x15330(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,244,72,1,0 ; addps 0x148f4(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 68,15,88,5,52,83,1,0 ; addps 0x15334(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,88,66,1,0 ; addps 0x14258(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,88,5,152,76,1,0 ; addps 0x14c98(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,236,72,1,0 ; addps 0x148ec(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x1550>
+ DB 68,15,88,5,44,83,1,0 ; addps 0x1532c(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23039,17 +23039,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse41
_sk_bicubic_p1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,54,66,1,0 ; movaps 0x14236(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,5,118,76,1,0 ; movaps 0x14c76(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,162,72,1,0 ; movaps 0x148a2(%rip),%xmm10 # 2d0e0 <_sk_overlay_sse2_8bit+0x1530>
+ DB 68,15,40,21,226,82,1,0 ; movaps 0x152e2(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,166,72,1,0 ; addps 0x148a6(%rip),%xmm10 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 68,15,88,21,230,82,1,0 ; addps 0x152e6(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,162,72,1,0 ; addps 0x148a2(%rip),%xmm10 # 2d100 <_sk_overlay_sse2_8bit+0x1550>
+ DB 68,15,88,21,226,82,1,0 ; addps 0x152e2(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23059,11 +23059,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,117,72,1,0 ; addps 0x14875(%rip),%xmm0 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 15,88,5,181,82,1,0 ; addps 0x152b5(%rip),%xmm0 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,69,72,1,0 ; mulps 0x14845(%rip),%xmm8 # 2d0d0 <_sk_overlay_sse2_8bit+0x1520>
- DB 68,15,88,5,221,67,1,0 ; addps 0x143dd(%rip),%xmm8 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 68,15,89,5,133,82,1,0 ; mulps 0x15285(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
+ DB 68,15,88,5,29,78,1,0 ; addps 0x14e1d(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -23074,13 +23074,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,11,72,1,0 ; addps 0x1480b(%rip),%xmm1 # 2d0c0 <_sk_overlay_sse2_8bit+0x1510>
- DB 68,15,40,13,195,65,1,0 ; movaps 0x141c3(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,13,75,82,1,0 ; addps 0x1524b(%rip),%xmm1 # 2db00 <_sk_overlay_sse2_8bit+0x1594>
+ DB 68,15,40,13,3,76,1,0 ; movaps 0x14c03(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,255,71,1,0 ; mulps 0x147ff(%rip),%xmm9 # 2d0d0 <_sk_overlay_sse2_8bit+0x1520>
- DB 68,15,88,13,151,67,1,0 ; addps 0x14397(%rip),%xmm9 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 68,15,89,13,63,82,1,0 ; mulps 0x1523f(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
+ DB 68,15,88,13,215,77,1,0 ; addps 0x14dd7(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -23091,16 +23091,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,181,71,1,0 ; addps 0x147b5(%rip),%xmm1 # 2d0b0 <_sk_overlay_sse2_8bit+0x1500>
- DB 68,15,40,13,125,65,1,0 ; movaps 0x1417d(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,13,245,81,1,0 ; addps 0x151f5(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
+ DB 68,15,40,13,189,75,1,0 ; movaps 0x14bbd(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,209,71,1,0 ; movaps 0x147d1(%rip),%xmm8 # 2d0e0 <_sk_overlay_sse2_8bit+0x1530>
+ DB 68,15,40,5,17,82,1,0 ; movaps 0x15211(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,213,71,1,0 ; addps 0x147d5(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 68,15,88,5,21,82,1,0 ; addps 0x15215(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,57,65,1,0 ; addps 0x14139(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,88,5,121,75,1,0 ; addps 0x14b79(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,205,71,1,0 ; addps 0x147cd(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x1550>
+ DB 68,15,88,5,13,82,1,0 ; addps 0x1520d(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23108,17 +23108,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse41
_sk_bicubic_p1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,23,65,1,0 ; movaps 0x14117(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,5,87,75,1,0 ; movaps 0x14b57(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,130,71,1,0 ; movaps 0x14782(%rip),%xmm10 # 2d0e0 <_sk_overlay_sse2_8bit+0x1530>
+ DB 68,15,40,21,194,81,1,0 ; movaps 0x151c2(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,134,71,1,0 ; addps 0x14786(%rip),%xmm10 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 68,15,88,21,198,81,1,0 ; addps 0x151c6(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,130,71,1,0 ; addps 0x14782(%rip),%xmm10 # 2d100 <_sk_overlay_sse2_8bit+0x1550>
+ DB 68,15,88,21,194,81,1,0 ; addps 0x151c2(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -23128,11 +23128,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,84,71,1,0 ; addps 0x14754(%rip),%xmm1 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 15,88,13,148,81,1,0 ; addps 0x15194(%rip),%xmm1 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,36,71,1,0 ; mulps 0x14724(%rip),%xmm8 # 2d0d0 <_sk_overlay_sse2_8bit+0x1520>
- DB 68,15,88,5,188,66,1,0 ; addps 0x142bc(%rip),%xmm8 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 68,15,89,5,100,81,1,0 ; mulps 0x15164(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
+ DB 68,15,88,5,252,76,1,0 ; addps 0x14cfc(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -23259,10 +23259,10 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,56,64,227 ; pmulld %xmm3,%xmm12
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,15,254,209 ; paddd %xmm1,%xmm2
- DB 102,15,111,37,154,69,1,0 ; movdqa 0x1459a(%rip),%xmm4 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,37,218,79,1,0 ; movdqa 0x14fda(%rip),%xmm4 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
- DB 102,68,15,111,61,247,62,1,0 ; movdqa 0x13ef7(%rip),%xmm15 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,111,61,55,73,1,0 ; movdqa 0x14937(%rip),%xmm15 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,65,15,254,231 ; paddd %xmm15,%xmm4
DB 102,73,15,58,22,224,1 ; pextrq $0x1,%xmm4,%r8
@@ -23282,7 +23282,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,65,15,58,22,209,1 ; pextrd $0x1,%xmm2,%r9d
DB 102,65,15,58,22,210,2 ; pextrd $0x2,%xmm2,%r10d
DB 102,65,15,58,22,211,3 ; pextrd $0x3,%xmm2,%r11d
- DB 102,68,15,111,13,168,62,1,0 ; movdqa 0x13ea8(%rip),%xmm9 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,68,15,111,13,232,72,1,0 ; movdqa 0x148e8(%rip),%xmm9 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,65,15,254,209 ; paddd %xmm9,%xmm2
DB 102,73,15,58,22,214,1 ; pextrq $0x1,%xmm2,%r14
DB 102,72,15,126,211 ; movq %xmm2,%rbx
@@ -23296,7 +23296,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 73,193,238,32 ; shr $0x20,%r14
DB 243,66,15,16,20,176 ; movss (%rax,%r14,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
- DB 15,40,45,189,68,1,0 ; movaps 0x144bd(%rip),%xmm5 # 2d110 <_sk_overlay_sse2_8bit+0x1560>
+ DB 15,40,45,253,78,1,0 ; movaps 0x14efd(%rip),%xmm5 # 2db50 <_sk_overlay_sse2_8bit+0x15e4>
DB 68,15,88,197 ; addps %xmm5,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 15,40,215 ; movaps %xmm7,%xmm2
@@ -23465,7 +23465,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,254,232 ; paddd %xmm0,%xmm13
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
- DB 102,15,111,45,114,65,1,0 ; movdqa 0x14172(%rip),%xmm5 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,45,178,75,1,0 ; movdqa 0x14bb2(%rip),%xmm5 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,56,64,213 ; pmulld %xmm5,%xmm2
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,254,207 ; paddd %xmm15,%xmm1
@@ -23571,7 +23571,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,69,15,58,22,225,1 ; pextrd $0x1,%xmm12,%r9d
DB 102,69,15,58,22,226,2 ; pextrd $0x2,%xmm12,%r10d
DB 102,69,15,58,22,227,3 ; pextrd $0x3,%xmm12,%r11d
- DB 102,15,111,21,205,56,1,0 ; movdqa 0x138cd(%rip),%xmm2 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,111,21,13,67,1,0 ; movdqa 0x1430d(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,68,15,254,226 ; paddd %xmm2,%xmm12
DB 102,76,15,58,22,225,1 ; pextrq $0x1,%xmm12,%rcx
DB 102,76,15,126,227 ; movq %xmm12,%rbx
@@ -23744,8 +23744,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,111,197 ; movdqa %xmm13,%xmm0
DB 102,68,15,127,108,36,48 ; movdqa %xmm13,0x30(%rsp)
DB 102,15,254,193 ; paddd %xmm1,%xmm0
- DB 102,15,56,64,5,26,60,1,0 ; pmulld 0x13c1a(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
- DB 102,68,15,111,29,129,53,1,0 ; movdqa 0x13581(%rip),%xmm11 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,56,64,5,90,70,1,0 ; pmulld 0x1465a(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,68,15,111,29,193,63,1,0 ; movdqa 0x13fc1(%rip),%xmm11 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,65,15,254,211 ; paddd %xmm11,%xmm2
DB 102,73,15,58,22,208,1 ; pextrq $0x1,%xmm2,%r8
@@ -23765,7 +23765,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,68,15,111,5,50,53,1,0 ; movdqa 0x13532(%rip),%xmm8 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,68,15,111,5,114,63,1,0 ; movdqa 0x13f72(%rip),%xmm8 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,73,15,58,22,198,1 ; pextrq $0x1,%xmm0,%r14
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -23779,7 +23779,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 73,193,238,32 ; shr $0x20,%r14
DB 243,66,15,16,4,176 ; movss (%rax,%r14,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
- DB 15,40,53,71,59,1,0 ; movaps 0x13b47(%rip),%xmm6 # 2d110 <_sk_overlay_sse2_8bit+0x1560>
+ DB 15,40,53,135,69,1,0 ; movaps 0x14587(%rip),%xmm6 # 2db50 <_sk_overlay_sse2_8bit+0x15e4>
DB 68,15,88,214 ; addps %xmm6,%xmm10
DB 68,15,41,148,36,176,0,0,0 ; movaps %xmm10,0xb0(%rsp)
DB 15,88,254 ; addps %xmm6,%xmm7
@@ -23792,7 +23792,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,68,15,111,214 ; movdqa %xmm6,%xmm10
DB 102,68,15,127,84,36,32 ; movdqa %xmm10,0x20(%rsp)
- DB 102,15,56,64,13,18,59,1,0 ; pmulld 0x13b12(%rip),%xmm1 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,56,64,13,82,69,1,0 ; pmulld 0x14552(%rip),%xmm1 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,73,15,58,22,230,1 ; pextrq $0x1,%xmm4,%r14
@@ -23850,11 +23850,11 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,5,228,57,1,0 ; movdqa 0x139e4(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,5,36,68,1,0 ; movdqa 0x14424(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,56,64,200 ; pmulld %xmm0,%xmm1
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,5,61,51,1,0 ; movdqa 0x1333d(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,111,5,125,61,1,0 ; movdqa 0x13d7d(%rip),%xmm8 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,197 ; movq %xmm0,%rbp
@@ -23956,7 +23956,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,68,15,111,108,36,48 ; movdqa 0x30(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,45,170,55,1,0 ; movdqa 0x137aa(%rip),%xmm5 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,45,234,65,1,0 ; movdqa 0x141ea(%rip),%xmm5 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,56,64,205 ; pmulld %xmm5,%xmm1
DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,58,22,205,1 ; pextrd $0x1,%xmm1,%ebp
@@ -23968,7 +23968,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,211,48,1,0 ; movdqa 0x130d3(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,111,29,19,59,1,0 ; movdqa 0x13b13(%rip),%xmm3 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
DB 102,72,15,126,213 ; movq %xmm2,%rbp
@@ -24016,7 +24016,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,195,1 ; pextrd $0x1,%xmm0,%r11d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,192,3 ; pextrd $0x3,%xmm0,%r8d
- DB 102,15,254,5,251,47,1,0 ; paddd 0x12ffb(%rip),%xmm0 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,254,5,59,58,1,0 ; paddd 0x13a3b(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,195 ; movq %xmm0,%rbx
DB 137,221 ; mov %ebx,%ebp
@@ -24045,10 +24045,10 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,100,36,16 ; paddd 0x10(%rsp),%xmm4
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,65,15,254,197 ; paddd %xmm13,%xmm0
- DB 102,68,15,111,45,219,53,1,0 ; movdqa 0x135db(%rip),%xmm13 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,68,15,111,45,27,64,1,0 ; movdqa 0x1401b(%rip),%xmm13 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,65,15,56,64,197 ; pmulld %xmm13,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,111,53,57,47,1,0 ; movdqa 0x12f39(%rip),%xmm6 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,111,53,121,57,1,0 ; movdqa 0x13979(%rip),%xmm6 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,205 ; movq %xmm1,%rbp
@@ -24066,7 +24066,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,61,247,46,1,0 ; movdqa 0x12ef7(%rip),%xmm7 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,111,61,55,57,1,0 ; movdqa 0x13937(%rip),%xmm7 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,254,199 ; paddd %xmm7,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -24083,7 +24083,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,65,15,56,64,229 ; pmulld %xmm13,%xmm4
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
- DB 102,68,15,111,45,127,46,1,0 ; movdqa 0x12e7f(%rip),%xmm13 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,111,45,191,56,1,0 ; movdqa 0x138bf(%rip),%xmm13 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,65,15,254,245 ; paddd %xmm13,%xmm6
DB 102,72,15,58,22,241,1 ; pextrq $0x1,%xmm6,%rcx
DB 102,72,15,126,243 ; movq %xmm6,%rbx
@@ -24162,7 +24162,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,111,76,36,48 ; movdqa 0x30(%rsp),%xmm9
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,254,194 ; paddd %xmm2,%xmm0
- DB 102,15,111,29,137,51,1,0 ; movdqa 0x13389(%rip),%xmm3 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,29,201,61,1,0 ; movdqa 0x13dc9(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,56,64,195 ; pmulld %xmm3,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,69,15,111,213 ; movdqa %xmm13,%xmm10
@@ -24183,7 +24183,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,45,168,44,1,0 ; movdqa 0x12ca8(%rip),%xmm5 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,111,45,232,54,1,0 ; movdqa 0x136e8(%rip),%xmm5 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -24271,7 +24271,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,225,1 ; pextrd $0x1,%xmm4,%r9d
DB 102,65,15,58,22,226,2 ; pextrd $0x2,%xmm4,%r10d
DB 102,65,15,58,22,227,3 ; pextrd $0x3,%xmm4,%r11d
- DB 102,68,15,111,13,220,42,1,0 ; movdqa 0x12adc(%rip),%xmm9 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,68,15,111,13,28,53,1,0 ; movdqa 0x1351c(%rip),%xmm9 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,65,15,254,225 ; paddd %xmm9,%xmm4
DB 102,72,15,58,22,225,1 ; pextrq $0x1,%xmm4,%rcx
DB 102,72,15,126,227 ; movq %xmm4,%rbx
@@ -24353,7 +24353,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,76,36,48 ; paddd 0x30(%rsp),%xmm1
DB 102,65,15,56,64,205 ; pmulld %xmm13,%xmm1
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,37,17,41,1,0 ; movdqa 0x12911(%rip),%xmm12 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,111,37,81,51,1,0 ; movdqa 0x13351(%rip),%xmm12 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,65,15,254,196 ; paddd %xmm12,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,197 ; movq %xmm0,%rbp
@@ -24371,7 +24371,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,201,1 ; pextrd $0x1,%xmm1,%r9d
DB 102,65,15,58,22,202,2 ; pextrd $0x2,%xmm1,%r10d
DB 102,65,15,58,22,203,3 ; pextrd $0x3,%xmm1,%r11d
- DB 102,15,111,29,206,40,1,0 ; movdqa 0x128ce(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,111,29,14,51,1,0 ; movdqa 0x1330e(%rip),%xmm3 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -24440,9 +24440,9 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,254,116,36,16 ; paddd 0x10(%rsp),%xmm14
DB 102,15,111,68,36,48 ; movdqa 0x30(%rsp),%xmm0
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
- DB 102,15,56,64,5,202,45,1,0 ; pmulld 0x12dca(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,56,64,5,10,56,1,0 ; pmulld 0x1380a(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,5,46,39,1,0 ; paddd 0x1272e(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,254,5,110,49,1,0 ; paddd 0x1316e(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,197 ; movq %xmm0,%rbp
DB 137,235 ; mov %ebp,%ebx
@@ -24475,8 +24475,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
DB 102,68,15,254,116,36,32 ; paddd 0x20(%rsp),%xmm14
- DB 102,68,15,56,64,53,15,45,1,0 ; pmulld 0x12d0f(%rip),%xmm14 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
- DB 102,15,111,5,119,38,1,0 ; movdqa 0x12677(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,56,64,53,79,55,1,0 ; pmulld 0x1374f(%rip),%xmm14 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
+ DB 102,15,111,5,183,48,1,0 ; movdqa 0x130b7(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -24557,7 +24557,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,215 ; addps %xmm7,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,239,36,1,0 ; movaps 0x124ef(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,47,47,1,0 ; movaps 0x12f2f(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 72,139,76,36,120 ; mov 0x78(%rsp),%rcx
DB 15,40,164,36,208,0,0,0 ; movaps 0xd0(%rsp),%xmm4
DB 15,40,172,36,224,0,0,0 ; movaps 0xe0(%rsp),%xmm5
@@ -24660,15 +24660,15 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,21,75,35,1,0 ; movaps 0x1234b(%rip),%xmm2 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 15,40,21,139,45,1,0 ; movaps 0x12d8b(%rip),%xmm2 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 15,88,194 ; addps %xmm2,%xmm0
- DB 15,88,5,81,35,1,0 ; addps 0x12351(%rip),%xmm0 # 2ca70 <_sk_overlay_sse2_8bit+0xec0>
+ DB 15,88,5,145,45,1,0 ; addps 0x12d91(%rip),%xmm0 # 2d4b0 <_sk_overlay_sse2_8bit+0xf44>
DB 102,15,110,201 ; movd %ecx,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,73,35,1,0 ; movaps 0x12349(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,137,45,1,0 ; movaps 0x12d89(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -24681,18 +24681,18 @@ _sk_dither_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 102,68,15,110,194 ; movd %edx,%xmm8
DB 102,69,15,112,200,0 ; pshufd $0x0,%xmm8,%xmm9
- DB 102,68,15,254,13,226,34,1,0 ; paddd 0x122e2(%rip),%xmm9 # 2ca40 <_sk_overlay_sse2_8bit+0xe90>
+ DB 102,68,15,254,13,34,45,1,0 ; paddd 0x12d22(%rip),%xmm9 # 2d480 <_sk_overlay_sse2_8bit+0xf14>
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,25,35,1,0 ; movdqa 0x12319(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,111,21,89,45,1,0 ; movdqa 0x12d59(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,5,35,1,0 ; movdqa 0x12305(%rip),%xmm12 # 2caa0 <_sk_overlay_sse2_8bit+0xef0>
- DB 102,68,15,111,45,12,35,1,0 ; movdqa 0x1230c(%rip),%xmm13 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,68,15,111,37,69,45,1,0 ; movdqa 0x12d45(%rip),%xmm12 # 2d4e0 <_sk_overlay_sse2_8bit+0xf74>
+ DB 102,68,15,111,45,76,45,1,0 ; movdqa 0x12d4c(%rip),%xmm13 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -24708,8 +24708,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,199,34,1,0 ; mulps 0x122c7(%rip),%xmm8 # 2cac0 <_sk_overlay_sse2_8bit+0xf10>
- DB 68,15,88,5,207,34,1,0 ; addps 0x122cf(%rip),%xmm8 # 2cad0 <_sk_overlay_sse2_8bit+0xf20>
+ DB 68,15,89,5,7,45,1,0 ; mulps 0x12d07(%rip),%xmm8 # 2d500 <_sk_overlay_sse2_8bit+0xf94>
+ DB 68,15,88,5,15,45,1,0 ; addps 0x12d0f(%rip),%xmm8 # 2d510 <_sk_overlay_sse2_8bit+0xfa4>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -24747,7 +24747,7 @@ _sk_uniform_color_sse2 LABEL PROC
PUBLIC _sk_black_color_sse2
_sk_black_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,5,34,1,0 ; movaps 0x12205(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,69,44,1,0 ; movaps 0x12c45(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -24756,7 +24756,7 @@ _sk_black_color_sse2 LABEL PROC
PUBLIC _sk_white_color_sse2
_sk_white_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,241,33,1,0 ; movaps 0x121f1(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,5,49,44,1,0 ; movaps 0x12c31(%rip),%xmm0 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -24794,7 +24794,7 @@ _sk_clear_sse2 LABEL PROC
PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,161,33,1,0 ; movaps 0x121a1(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,225,43,1,0 ; movaps 0x12be1(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24817,7 +24817,7 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,84,33,1,0 ; movaps 0x12154(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,148,43,1,0 ; movaps 0x12b94(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -24858,7 +24858,7 @@ _sk_dstin_sse2 LABEL PROC
PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
- DB 68,15,40,5,232,32,1,0 ; movaps 0x120e8(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,40,43,1,0 ; movaps 0x12b28(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -24869,7 +24869,7 @@ _sk_srcout_sse2 LABEL PROC
PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
- DB 68,15,40,5,200,32,1,0 ; movaps 0x120c8(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,8,43,1,0 ; movaps 0x12b08(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -24884,7 +24884,7 @@ _sk_dstout_sse2 LABEL PROC
PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
- DB 68,15,40,5,155,32,1,0 ; movaps 0x1209b(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,219,42,1,0 ; movaps 0x12adb(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24902,7 +24902,7 @@ _sk_srcover_sse2 LABEL PROC
PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
- DB 68,15,40,5,95,32,1,0 ; movaps 0x1205f(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,159,42,1,0 ; movaps 0x12a9f(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -24926,7 +24926,7 @@ _sk_modulate_sse2 LABEL PROC
PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
- DB 68,15,40,5,35,32,1,0 ; movaps 0x12023(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,99,42,1,0 ; movaps 0x12a63(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -24962,7 +24962,7 @@ _sk_multiply_sse2 LABEL PROC
PUBLIC _sk_plus__sse2
_sk_plus__sse2 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 68,15,40,5,164,31,1,0 ; movaps 0x11fa4(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,228,41,1,0 ; movaps 0x129e4(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
DB 65,15,93,200 ; minps %xmm8,%xmm1
@@ -25000,7 +25000,7 @@ _sk_screen_sse2 LABEL PROC
PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,48,31,1,0 ; movaps 0x11f30(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,112,41,1,0 ; movaps 0x12970(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -25046,7 +25046,7 @@ _sk_darken_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,139,30,1,0 ; movaps 0x11e8b(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,203,40,1,0 ; movaps 0x128cb(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -25078,7 +25078,7 @@ _sk_lighten_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,32,30,1,0 ; movaps 0x11e20(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,96,40,1,0 ; movaps 0x12860(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -25113,7 +25113,7 @@ _sk_difference_sse2 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,170,29,1,0 ; movaps 0x11daa(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,234,39,1,0 ; movaps 0x127ea(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -25139,7 +25139,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,90,29,1,0 ; movaps 0x11d5a(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,21,154,39,1,0 ; movaps 0x1279a(%rip),%xmm2 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -25150,7 +25150,7 @@ _sk_exclusion_sse2 LABEL PROC
PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,13,61,29,1,0 ; movaps 0x11d3d(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,125,39,1,0 ; movaps 0x1277d(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -25243,7 +25243,7 @@ _sk_colorburn_sse2 LABEL PROC
PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,229,27,1,0 ; movaps 0x11be5(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,21,37,38,1,0 ; movaps 0x12625(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -25334,7 +25334,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,41,52,36 ; movaps %xmm6,(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 68,15,40,29,139,26,1,0 ; movaps 0x11a8b(%rip),%xmm11 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,29,203,36,1,0 ; movaps 0x124cb(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,194 ; movaps %xmm10,%xmm8
@@ -25421,7 +25421,7 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 68,15,40,193 ; movaps %xmm1,%xmm8
DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,40,13,70,25,1,0 ; movaps 0x11946(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,134,35,1,0 ; movaps 0x12386(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -25511,7 +25511,7 @@ _sk_softlight_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 68,15,94,215 ; divps %xmm7,%xmm10
DB 69,15,84,212 ; andps %xmm12,%xmm10
- DB 68,15,40,13,240,23,1,0 ; movaps 0x117f0(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,48,34,1,0 ; movaps 0x12230(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,92,250 ; subps %xmm10,%xmm15
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -25524,10 +25524,10 @@ _sk_softlight_sse2 LABEL PROC
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,53,26,24,1,0 ; movaps 0x1181a(%rip),%xmm14 # 2cae0 <_sk_overlay_sse2_8bit+0xf30>
+ DB 68,15,40,53,90,34,1,0 ; movaps 0x1225a(%rip),%xmm14 # 2d520 <_sk_overlay_sse2_8bit+0xfb4>
DB 69,15,88,222 ; addps %xmm14,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
- DB 68,15,40,21,26,24,1,0 ; movaps 0x1181a(%rip),%xmm10 # 2caf0 <_sk_overlay_sse2_8bit+0xf40>
+ DB 68,15,40,21,90,34,1,0 ; movaps 0x1225a(%rip),%xmm10 # 2d530 <_sk_overlay_sse2_8bit+0xfc4>
DB 69,15,89,234 ; mulps %xmm10,%xmm13
DB 69,15,88,235 ; addps %xmm11,%xmm13
DB 15,88,228 ; addps %xmm4,%xmm4
@@ -25672,7 +25672,7 @@ _sk_hue_sse2 LABEL PROC
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,40,5,166,21,1,0 ; movaps 0x115a6(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,230,31,1,0 ; movaps 0x11fe6(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 15,40,207 ; movaps %xmm7,%xmm1
DB 68,15,92,217 ; subps %xmm1,%xmm11
@@ -25720,12 +25720,12 @@ _sk_hue_sse2 LABEL PROC
DB 69,15,84,206 ; andps %xmm14,%xmm9
DB 69,15,84,214 ; andps %xmm14,%xmm10
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,61,99,21,1,0 ; movaps 0x11563(%rip),%xmm15 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,61,163,31,1,0 ; movaps 0x11fa3(%rip),%xmm15 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 65,15,89,231 ; mulps %xmm15,%xmm4
- DB 15,40,5,104,21,1,0 ; movaps 0x11568(%rip),%xmm0 # 2cb10 <_sk_overlay_sse2_8bit+0xf60>
+ DB 15,40,5,168,31,1,0 ; movaps 0x11fa8(%rip),%xmm0 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
- DB 68,15,40,53,106,21,1,0 ; movaps 0x1156a(%rip),%xmm14 # 2cb20 <_sk_overlay_sse2_8bit+0xf70>
+ DB 68,15,40,53,170,31,1,0 ; movaps 0x11faa(%rip),%xmm14 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
DB 68,15,40,239 ; movaps %xmm7,%xmm13
DB 69,15,89,238 ; mulps %xmm14,%xmm13
DB 68,15,88,238 ; addps %xmm6,%xmm13
@@ -25903,14 +25903,14 @@ _sk_saturation_sse2 LABEL PROC
DB 68,15,84,211 ; andps %xmm3,%xmm10
DB 68,15,84,203 ; andps %xmm3,%xmm9
DB 15,84,195 ; andps %xmm3,%xmm0
- DB 68,15,40,5,183,18,1,0 ; movaps 0x112b7(%rip),%xmm8 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,5,247,28,1,0 ; movaps 0x11cf7(%rip),%xmm8 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 15,40,214 ; movaps %xmm6,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 15,40,13,185,18,1,0 ; movaps 0x112b9(%rip),%xmm1 # 2cb10 <_sk_overlay_sse2_8bit+0xf60>
+ DB 15,40,13,249,28,1,0 ; movaps 0x11cf9(%rip),%xmm1 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,217 ; mulps %xmm1,%xmm3
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 68,15,40,37,184,18,1,0 ; movaps 0x112b8(%rip),%xmm12 # 2cb20 <_sk_overlay_sse2_8bit+0xf70>
+ DB 68,15,40,37,248,28,1,0 ; movaps 0x11cf8(%rip),%xmm12 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
DB 65,15,40,210 ; movaps %xmm10,%xmm2
@@ -25955,7 +25955,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,40,223 ; movaps %xmm7,%xmm3
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 68,15,40,5,109,17,1,0 ; movaps 0x1116d(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,173,27,1,0 ; movaps 0x11bad(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 15,88,253 ; addps %xmm5,%xmm7
@@ -26056,14 +26056,14 @@ _sk_color_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 68,15,40,45,117,16,1,0 ; movaps 0x11075(%rip),%xmm13 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,45,181,26,1,0 ; movaps 0x11ab5(%rip),%xmm13 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 68,15,40,198 ; movaps %xmm6,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,40,53,117,16,1,0 ; movaps 0x11075(%rip),%xmm14 # 2cb10 <_sk_overlay_sse2_8bit+0xf60>
+ DB 68,15,40,53,181,26,1,0 ; movaps 0x11ab5(%rip),%xmm14 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,29,113,16,1,0 ; movaps 0x11071(%rip),%xmm11 # 2cb20 <_sk_overlay_sse2_8bit+0xf70>
+ DB 68,15,40,29,177,26,1,0 ; movaps 0x11ab1(%rip),%xmm11 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
DB 69,15,89,227 ; mulps %xmm11,%xmm12
DB 68,15,88,224 ; addps %xmm0,%xmm12
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -26071,7 +26071,7 @@ _sk_color_sse2 LABEL PROC
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 68,15,40,5,173,15,1,0 ; movaps 0x10fad(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,237,25,1,0 ; movaps 0x119ed(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
DB 15,89,252 ; mulps %xmm4,%xmm7
@@ -26207,15 +26207,15 @@ _sk_luminosity_sse2 LABEL PROC
DB 68,15,40,205 ; movaps %xmm5,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 68,15,40,37,47,14,1,0 ; movaps 0x10e2f(%rip),%xmm12 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,37,111,24,1,0 ; movaps 0x1186f(%rip),%xmm12 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 68,15,40,199 ; movaps %xmm7,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,47,14,1,0 ; movaps 0x10e2f(%rip),%xmm13 # 2cb10 <_sk_overlay_sse2_8bit+0xf60>
+ DB 68,15,40,45,111,24,1,0 ; movaps 0x1186f(%rip),%xmm13 # 2d550 <_sk_overlay_sse2_8bit+0xfe4>
DB 68,15,40,241 ; movaps %xmm1,%xmm14
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 69,15,88,240 ; addps %xmm8,%xmm14
- DB 68,15,40,29,43,14,1,0 ; movaps 0x10e2b(%rip),%xmm11 # 2cb20 <_sk_overlay_sse2_8bit+0xf70>
- DB 68,15,40,5,131,13,1,0 ; movaps 0x10d83(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,29,107,24,1,0 ; movaps 0x1186b(%rip),%xmm11 # 2d560 <_sk_overlay_sse2_8bit+0xff4>
+ DB 68,15,40,5,195,23,1,0 ; movaps 0x117c3(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 68,15,92,248 ; subps %xmm0,%xmm15
@@ -26358,7 +26358,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,133,228,0,0,0 ; jne 1bfea <_sk_srcover_rgba_8888_sse2+0x104>
DB 243,69,15,111,4,128 ; movdqu (%r8,%rax,4),%xmm8
DB 72,133,255 ; test %rdi,%rdi
- DB 102,15,111,53,25,12,1,0 ; movdqa 0x10c19(%rip),%xmm6 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,53,89,22,1,0 ; movdqa 0x11659(%rip),%xmm6 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
@@ -26372,9 +26372,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7
- DB 68,15,40,5,41,11,1,0 ; movaps 0x10b29(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,105,21,1,0 ; movaps 0x11569(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,253,11,1,0 ; movaps 0x10bfd(%rip),%xmm12 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,37,61,22,1,0 ; movaps 0x1163d(%rip),%xmm12 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -26450,7 +26450,7 @@ _sk_clamp_0_sse2 LABEL PROC
PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
- DB 68,15,40,5,249,9,1,0 ; movaps 0x109f9(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,57,20,1,0 ; movaps 0x11439(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -26460,7 +26460,7 @@ _sk_clamp_1_sse2 LABEL PROC
PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
- DB 15,93,29,222,9,1,0 ; minps 0x109de(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,93,29,30,20,1,0 ; minps 0x1141e(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -26469,7 +26469,7 @@ _sk_clamp_a_sse2 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse2
_sk_clamp_a_dst_sse2 LABEL PROC
- DB 15,93,61,202,9,1,0 ; minps 0x109ca(%rip),%xmm7 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,93,61,10,20,1,0 ; minps 0x1140a(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -26498,7 +26498,7 @@ _sk_swap_rb_sse2 LABEL PROC
PUBLIC _sk_invert_sse2
_sk_invert_sse2 LABEL PROC
- DB 68,15,40,5,134,9,1,0 ; movaps 0x10986(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,5,198,19,1,0 ; movaps 0x113c6(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -26550,7 +26550,7 @@ _sk_premul_dst_sse2 LABEL PROC
PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,16,9,1,0 ; movaps 0x10910(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,80,19,1,0 ; movaps 0x11350(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -26562,20 +26562,20 @@ _sk_unpremul_sse2 LABEL PROC
PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
- DB 68,15,40,5,219,9,1,0 ; movaps 0x109db(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xfc0>
+ DB 68,15,40,5,27,20,1,0 ; movaps 0x1141b(%rip),%xmm8 # 2d5b0 <_sk_overlay_sse2_8bit+0x1044>
DB 68,15,40,232 ; movaps %xmm0,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,216 ; movaps %xmm0,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,83,9,1,0 ; movaps 0x10953(%rip),%xmm9 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,13,147,19,1,0 ; movaps 0x11393(%rip),%xmm9 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,195,9,1,0 ; movaps 0x109c3(%rip),%xmm10 # 2cb80 <_sk_overlay_sse2_8bit+0xfd0>
+ DB 68,15,40,21,3,20,1,0 ; movaps 0x11403(%rip),%xmm10 # 2d5c0 <_sk_overlay_sse2_8bit+0x1054>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,195,9,1,0 ; movaps 0x109c3(%rip),%xmm11 # 2cb90 <_sk_overlay_sse2_8bit+0xfe0>
+ DB 68,15,40,29,3,20,1,0 ; movaps 0x11403(%rip),%xmm11 # 2d5d0 <_sk_overlay_sse2_8bit+0x1064>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,199,9,1,0 ; movaps 0x109c7(%rip),%xmm12 # 2cba0 <_sk_overlay_sse2_8bit+0xff0>
+ DB 68,15,40,37,7,20,1,0 ; movaps 0x11407(%rip),%xmm12 # 2d5e0 <_sk_overlay_sse2_8bit+0x1074>
DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0
DB 68,15,84,232 ; andps %xmm0,%xmm13
DB 65,15,85,198 ; andnps %xmm14,%xmm0
@@ -26609,20 +26609,20 @@ _sk_from_srgb_sse2 LABEL PROC
PUBLIC _sk_from_srgb_dst_sse2
_sk_from_srgb_dst_sse2 LABEL PROC
- DB 68,15,40,5,24,9,1,0 ; movaps 0x10918(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xfc0>
+ DB 68,15,40,5,88,19,1,0 ; movaps 0x11358(%rip),%xmm8 # 2d5b0 <_sk_overlay_sse2_8bit+0x1044>
DB 68,15,40,236 ; movaps %xmm4,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,220 ; movaps %xmm4,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,144,8,1,0 ; movaps 0x10890(%rip),%xmm9 # 2cb00 <_sk_overlay_sse2_8bit+0xf50>
+ DB 68,15,40,13,208,18,1,0 ; movaps 0x112d0(%rip),%xmm9 # 2d540 <_sk_overlay_sse2_8bit+0xfd4>
DB 68,15,40,244 ; movaps %xmm4,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,0,9,1,0 ; movaps 0x10900(%rip),%xmm10 # 2cb80 <_sk_overlay_sse2_8bit+0xfd0>
+ DB 68,15,40,21,64,19,1,0 ; movaps 0x11340(%rip),%xmm10 # 2d5c0 <_sk_overlay_sse2_8bit+0x1054>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,0,9,1,0 ; movaps 0x10900(%rip),%xmm11 # 2cb90 <_sk_overlay_sse2_8bit+0xfe0>
+ DB 68,15,40,29,64,19,1,0 ; movaps 0x11340(%rip),%xmm11 # 2d5d0 <_sk_overlay_sse2_8bit+0x1064>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,4,9,1,0 ; movaps 0x10904(%rip),%xmm12 # 2cba0 <_sk_overlay_sse2_8bit+0xff0>
+ DB 68,15,40,37,68,19,1,0 ; movaps 0x11344(%rip),%xmm12 # 2d5e0 <_sk_overlay_sse2_8bit+0x1074>
DB 65,15,194,228,1 ; cmpltps %xmm12,%xmm4
DB 68,15,84,236 ; andps %xmm4,%xmm13
DB 65,15,85,230 ; andnps %xmm14,%xmm4
@@ -26657,22 +26657,22 @@ _sk_from_srgb_dst_sse2 LABEL PROC
PUBLIC _sk_to_srgb_sse2
_sk_to_srgb_sse2 LABEL PROC
DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13
- DB 68,15,40,5,145,8,1,0 ; movaps 0x10891(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x1000>
+ DB 68,15,40,5,209,18,1,0 ; movaps 0x112d1(%rip),%xmm8 # 2d5f0 <_sk_overlay_sse2_8bit+0x1084>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,240 ; mulps %xmm8,%xmm14
- DB 68,15,40,13,145,8,1,0 ; movaps 0x10891(%rip),%xmm9 # 2cbc0 <_sk_overlay_sse2_8bit+0x1010>
+ DB 68,15,40,13,209,18,1,0 ; movaps 0x112d1(%rip),%xmm9 # 2d600 <_sk_overlay_sse2_8bit+0x1094>
DB 69,15,40,253 ; movaps %xmm13,%xmm15
DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 68,15,40,21,145,8,1,0 ; movaps 0x10891(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x1020>
+ DB 68,15,40,21,209,18,1,0 ; movaps 0x112d1(%rip),%xmm10 # 2d610 <_sk_overlay_sse2_8bit+0x10a4>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 68,15,40,29,145,8,1,0 ; movaps 0x10891(%rip),%xmm11 # 2cbe0 <_sk_overlay_sse2_8bit+0x1030>
+ DB 68,15,40,29,209,18,1,0 ; movaps 0x112d1(%rip),%xmm11 # 2d620 <_sk_overlay_sse2_8bit+0x10b4>
DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 68,15,40,37,149,8,1,0 ; movaps 0x10895(%rip),%xmm12 # 2cbf0 <_sk_overlay_sse2_8bit+0x1040>
+ DB 68,15,40,37,213,18,1,0 ; movaps 0x112d5(%rip),%xmm12 # 2d630 <_sk_overlay_sse2_8bit+0x10c4>
DB 69,15,88,236 ; addps %xmm12,%xmm13
DB 69,15,83,237 ; rcpps %xmm13,%xmm13
DB 69,15,89,239 ; mulps %xmm15,%xmm13
- DB 68,15,40,61,145,8,1,0 ; movaps 0x10891(%rip),%xmm15 # 2cc00 <_sk_overlay_sse2_8bit+0x1050>
+ DB 68,15,40,61,209,18,1,0 ; movaps 0x112d1(%rip),%xmm15 # 2d640 <_sk_overlay_sse2_8bit+0x10d4>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,197 ; andnps %xmm13,%xmm0
@@ -26722,7 +26722,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 68,15,93,216 ; minps %xmm0,%xmm11
DB 65,15,40,202 ; movaps %xmm10,%xmm1
DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 68,15,40,45,84,6,1,0 ; movaps 0x10654(%rip),%xmm13 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,45,148,16,1,0 ; movaps 0x11094(%rip),%xmm13 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 68,15,94,233 ; divps %xmm1,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0
@@ -26731,30 +26731,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,40,241 ; movaps %xmm9,%xmm14
DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14
- DB 68,15,84,53,186,7,1,0 ; andps 0x107ba(%rip),%xmm14 # 2cc10 <_sk_overlay_sse2_8bit+0x1060>
+ DB 68,15,84,53,250,17,1,0 ; andps 0x111fa(%rip),%xmm14 # 2d650 <_sk_overlay_sse2_8bit+0x10e4>
DB 69,15,88,244 ; addps %xmm12,%xmm14
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 68,15,40,37,173,7,1,0 ; movaps 0x107ad(%rip),%xmm12 # 2cc20 <_sk_overlay_sse2_8bit+0x1070>
+ DB 68,15,40,37,237,17,1,0 ; movaps 0x111ed(%rip),%xmm12 # 2d660 <_sk_overlay_sse2_8bit+0x10f4>
DB 65,15,88,212 ; addps %xmm12,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,88,5,169,7,1,0 ; addps 0x107a9(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1080>
+ DB 68,15,88,5,233,17,1,0 ; addps 0x111e9(%rip),%xmm8 # 2d670 <_sk_overlay_sse2_8bit+0x1104>
DB 65,15,84,215 ; andps %xmm15,%xmm2
DB 69,15,85,248 ; andnps %xmm8,%xmm15
DB 68,15,86,250 ; orps %xmm2,%xmm15
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
DB 65,15,86,198 ; orps %xmm14,%xmm0
- DB 15,89,5,154,7,1,0 ; mulps 0x1079a(%rip),%xmm0 # 2cc40 <_sk_overlay_sse2_8bit+0x1090>
+ DB 15,89,5,218,17,1,0 ; mulps 0x111da(%rip),%xmm0 # 2d680 <_sk_overlay_sse2_8bit+0x1114>
DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8
DB 65,15,84,192 ; andps %xmm8,%xmm0
DB 69,15,92,226 ; subps %xmm10,%xmm12
DB 69,15,88,211 ; addps %xmm11,%xmm10
- DB 68,15,40,13,157,5,1,0 ; movaps 0x1059d(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,13,221,15,1,0 ; movaps 0x10fdd(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,40,210 ; movaps %xmm10,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9
@@ -26777,7 +26777,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp)
DB 68,15,40,218 ; movaps %xmm2,%xmm11
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 68,15,40,13,72,5,1,0 ; movaps 0x10548(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,13,136,15,1,0 ; movaps 0x10f88(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
@@ -26794,28 +26794,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 69,15,88,211 ; addps %xmm11,%xmm10
DB 69,15,88,219 ; addps %xmm11,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 15,40,5,242,6,1,0 ; movaps 0x106f2(%rip),%xmm0 # 2cc50 <_sk_overlay_sse2_8bit+0x10a0>
+ DB 15,40,5,50,17,1,0 ; movaps 0x11132(%rip),%xmm0 # 2d690 <_sk_overlay_sse2_8bit+0x1124>
DB 15,88,198 ; addps %xmm6,%xmm0
DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,194,217,1 ; cmpltps %xmm1,%xmm3
- DB 15,84,29,10,5,1,0 ; andps 0x1050a(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,84,29,74,15,1,0 ; andps 0x10f4a(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 68,15,40,45,220,6,1,0 ; movaps 0x106dc(%rip),%xmm13 # 2cc60 <_sk_overlay_sse2_8bit+0x10b0>
+ DB 68,15,40,45,28,17,1,0 ; movaps 0x1111c(%rip),%xmm13 # 2d6a0 <_sk_overlay_sse2_8bit+0x1134>
DB 69,15,40,197 ; movaps %xmm13,%xmm8
DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8
DB 69,15,40,242 ; movaps %xmm10,%xmm14
DB 69,15,92,243 ; subps %xmm11,%xmm14
DB 65,15,40,217 ; movaps %xmm9,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
- DB 15,40,21,156,6,1,0 ; movaps 0x1069c(%rip),%xmm2 # 2cc40 <_sk_overlay_sse2_8bit+0x1090>
+ DB 15,40,21,220,16,1,0 ; movaps 0x110dc(%rip),%xmm2 # 2d680 <_sk_overlay_sse2_8bit+0x1114>
DB 68,15,40,250 ; movaps %xmm2,%xmm15
DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15
- DB 15,40,13,92,6,1,0 ; movaps 0x1065c(%rip),%xmm1 # 2cc10 <_sk_overlay_sse2_8bit+0x1060>
+ DB 15,40,13,156,16,1,0 ; movaps 0x1109c(%rip),%xmm1 # 2d650 <_sk_overlay_sse2_8bit+0x10e4>
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,45,114,6,1,0 ; movaps 0x10672(%rip),%xmm5 # 2cc30 <_sk_overlay_sse2_8bit+0x1080>
+ DB 15,40,45,178,16,1,0 ; movaps 0x110b2(%rip),%xmm5 # 2d670 <_sk_overlay_sse2_8bit+0x1104>
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,92,224 ; subps %xmm0,%xmm4
DB 65,15,89,230 ; mulps %xmm14,%xmm4
@@ -26838,7 +26838,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,103,4,1,0 ; andps 0x10467(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,84,29,167,14,1,0 ; andps 0x10ea7(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 68,15,40,230 ; movaps %xmm6,%xmm12
DB 68,15,92,224 ; subps %xmm0,%xmm12
@@ -26868,12 +26868,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,60,36 ; movaps (%rsp),%xmm7
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,88,53,224,5,1,0 ; addps 0x105e0(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 15,88,53,32,16,1,0 ; addps 0x11020(%rip),%xmm6 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,219,3,1,0 ; andps 0x103db(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,84,29,27,14,1,0 ; andps 0x10e1b(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,89,206 ; mulps %xmm6,%xmm1
@@ -26938,9 +26938,9 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,71,15,110,4,16 ; movd (%r8,%r10,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,170,3,1,0 ; pand 0x103aa(%rip),%xmm8 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,68,15,219,5,234,13,1,0 ; pand 0x10dea(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,238,4,1,0 ; mulps 0x104ee(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,89,5,46,15,1,0 ; mulps 0x10f2e(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -26983,17 +26983,17 @@ _sk_scale_565_sse2 LABEL PROC
DB 15,133,173,0,0,0 ; jne 1c8cf <_sk_scale_565_sse2+0xcc>
DB 243,71,15,126,20,80 ; movq (%r8,%r10,2),%xmm10
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
- DB 102,68,15,111,5,90,4,1,0 ; movdqa 0x1045a(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,68,15,111,5,154,14,1,0 ; movdqa 0x10e9a(%rip),%xmm8 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,69,15,219,194 ; pand %xmm10,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,89,4,1,0 ; mulps 0x10459(%rip),%xmm8 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,68,15,111,13,96,4,1,0 ; movdqa 0x10460(%rip),%xmm9 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 68,15,89,5,153,14,1,0 ; mulps 0x10e99(%rip),%xmm8 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,68,15,111,13,160,14,1,0 ; movdqa 0x10ea0(%rip),%xmm9 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,69,15,219,202 ; pand %xmm10,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,95,4,1,0 ; mulps 0x1045f(%rip),%xmm9 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,68,15,219,21,102,4,1,0 ; pand 0x10466(%rip),%xmm10 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 68,15,89,13,159,14,1,0 ; mulps 0x10e9f(%rip),%xmm9 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,68,15,219,21,166,14,1,0 ; pand 0x10ea6(%rip),%xmm10 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,106,4,1,0 ; mulps 0x1046a(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 68,15,89,21,170,14,1,0 ; mulps 0x10eaa(%rip),%xmm10 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 68,15,40,219 ; movaps %xmm3,%xmm11
DB 68,15,194,223,1 ; cmpltps %xmm7,%xmm11
DB 69,15,40,225 ; movaps %xmm9,%xmm12
@@ -27070,9 +27070,9 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,71,15,110,4,16 ; movd (%r8,%r10,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,161,1,1,0 ; pand 0x101a1(%rip),%xmm8 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,68,15,219,5,225,11,1,0 ; pand 0x10be1(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,229,2,1,0 ; mulps 0x102e5(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,89,5,37,13,1,0 ; mulps 0x10d25(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -27122,17 +27122,17 @@ _sk_lerp_565_sse2 LABEL PROC
DB 15,133,173,0,0,0 ; jne 1caef <_sk_lerp_565_sse2+0xcc>
DB 243,71,15,126,4,80 ; movq (%r8,%r10,2),%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,111,13,58,2,1,0 ; movdqa 0x1023a(%rip),%xmm9 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,68,15,111,13,122,12,1,0 ; movdqa 0x10c7a(%rip),%xmm9 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,69,15,219,200 ; pand %xmm8,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,57,2,1,0 ; mulps 0x10239(%rip),%xmm9 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,68,15,111,21,64,2,1,0 ; movdqa 0x10240(%rip),%xmm10 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 68,15,89,13,121,12,1,0 ; mulps 0x10c79(%rip),%xmm9 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,68,15,111,21,128,12,1,0 ; movdqa 0x10c80(%rip),%xmm10 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,69,15,219,208 ; pand %xmm8,%xmm10
DB 69,15,91,218 ; cvtdq2ps %xmm10,%xmm11
- DB 68,15,89,29,63,2,1,0 ; mulps 0x1023f(%rip),%xmm11 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,68,15,219,5,70,2,1,0 ; pand 0x10246(%rip),%xmm8 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 68,15,89,29,127,12,1,0 ; mulps 0x10c7f(%rip),%xmm11 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,68,15,219,5,134,12,1,0 ; pand 0x10c86(%rip),%xmm8 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,74,2,1,0 ; mulps 0x1024a(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 68,15,89,5,138,12,1,0 ; mulps 0x10c8a(%rip),%xmm8 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 68,15,40,211 ; movaps %xmm3,%xmm10
DB 68,15,194,215,1 ; cmpltps %xmm7,%xmm10
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -27187,7 +27187,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 243,69,15,111,12,144 ; movdqu (%r8,%rdx,4),%xmm9
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,68,15,111,5,202,255,0,0 ; movdqa 0xffca(%rip),%xmm8 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,68,15,111,5,10,10,1,0 ; movdqa 0x10a0a(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -27243,7 +27243,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9
DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3
- DB 15,89,29,19,0,1,0 ; mulps 0x10013(%rip),%xmm3 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,29,83,10,1,0 ; mulps 0x10a53(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -27281,7 +27281,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,21,236,255,0,0 ; movdqa 0xffec(%rip),%xmm10 # 2ccf0 <_sk_overlay_sse2_8bit+0x1140>
+ DB 102,68,15,111,21,44,10,1,0 ; movdqa 0x10a2c(%rip),%xmm10 # 2d730 <_sk_overlay_sse2_8bit+0x11c4>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -27343,7 +27343,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,235,217 ; por %xmm9,%xmm3
DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,231,254,0,0 ; mulps 0xfee7(%rip),%xmm3 # 2cd10 <_sk_overlay_sse2_8bit+0x1160>
+ DB 15,89,29,39,9,1,0 ; mulps 0x10927(%rip),%xmm3 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -27382,7 +27382,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0
- DB 102,68,15,111,5,42,254,0,0 ; movdqa 0xfe2a(%rip),%xmm8 # 2ccf0 <_sk_overlay_sse2_8bit+0x1140>
+ DB 102,68,15,111,5,106,8,1,0 ; movdqa 0x1086a(%rip),%xmm8 # 2d730 <_sk_overlay_sse2_8bit+0x11c4>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -27438,7 +27438,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,181,250,0,0 ; movaps 0xfab5(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,245,4,1,0 ; movaps 0x104f5(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 255,224 ; jmpq *%rax
@@ -27468,7 +27468,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,34,251,0,0 ; movaps 0xfb22(%rip),%xmm8 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,5,98,5,1,0 ; movaps 0x10562(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,126,192 ; movq %xmm0,%r8
@@ -27496,7 +27496,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,204,251,0,0 ; movaps 0xfbcc(%rip),%xmm10 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,21,12,6,1,0 ; movaps 0x1060c(%rip),%xmm10 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27613,7 +27613,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,8,250,0,0 ; movaps 0xfa08(%rip),%xmm10 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,21,72,4,1,0 ; movaps 0x10448(%rip),%xmm10 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27801,15 +27801,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,230,247,0,0 ; mulps 0xf7e6(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 68,15,84,21,238,247,0,0 ; andps 0xf7ee(%rip),%xmm10 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 68,15,86,21,6,245,0,0 ; orps 0xf506(%rip),%xmm10 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
- DB 68,15,88,13,238,247,0,0 ; addps 0xf7ee(%rip),%xmm9 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
- DB 68,15,40,37,246,247,0,0 ; movaps 0xf7f6(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,89,13,38,2,1,0 ; mulps 0x10226(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 68,15,84,21,46,2,1,0 ; andps 0x1022e(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 68,15,86,21,70,255,0,0 ; orps 0xff46(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,13,46,2,1,0 ; addps 0x1022e(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 68,15,40,37,54,2,1,0 ; movaps 0x10236(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,246,247,0,0 ; addps 0xf7f6(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
- DB 68,15,40,37,254,247,0,0 ; movaps 0xf7fe(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,88,21,54,2,1,0 ; addps 0x10236(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 68,15,40,37,62,2,1,0 ; movaps 0x1023e(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27817,22 +27817,22 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,216,244,0,0 ; movaps 0xf4d8(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,21,24,255,0,0 ; movaps 0xff18(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,204,247,0,0 ; addps 0xf7cc(%rip),%xmm9 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
- DB 68,15,40,37,212,247,0,0 ; movaps 0xf7d4(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 68,15,88,13,12,2,1,0 ; addps 0x1020c(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 68,15,40,37,20,2,1,0 ; movaps 0x10214(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,212,247,0,0 ; movaps 0xf7d4(%rip),%xmm12 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 68,15,40,37,20,2,1,0 ; movaps 0x10214(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,216,247,0,0 ; movaps 0xf7d8(%rip),%xmm13 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 68,15,40,45,24,2,1,0 ; movaps 0x10218(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,216,247,0,0 ; mulps 0xf7d8(%rip),%xmm13 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 68,15,89,45,24,2,1,0 ; mulps 0x10218(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27866,15 +27866,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,168,246,0,0 ; mulps 0xf6a8(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 68,15,84,21,176,246,0,0 ; andps 0xf6b0(%rip),%xmm10 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 68,15,86,21,200,243,0,0 ; orps 0xf3c8(%rip),%xmm10 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
- DB 68,15,88,13,176,246,0,0 ; addps 0xf6b0(%rip),%xmm9 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
- DB 68,15,40,37,184,246,0,0 ; movaps 0xf6b8(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,89,13,232,0,1,0 ; mulps 0x100e8(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 68,15,84,21,240,0,1,0 ; andps 0x100f0(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 68,15,86,21,8,254,0,0 ; orps 0xfe08(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,13,240,0,1,0 ; addps 0x100f0(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 68,15,40,37,248,0,1,0 ; movaps 0x100f8(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,184,246,0,0 ; addps 0xf6b8(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
- DB 68,15,40,37,192,246,0,0 ; movaps 0xf6c0(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,88,21,248,0,1,0 ; addps 0x100f8(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 68,15,40,37,0,1,1,0 ; movaps 0x10100(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27882,22 +27882,22 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,154,243,0,0 ; movaps 0xf39a(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,21,218,253,0,0 ; movaps 0xfdda(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,142,246,0,0 ; addps 0xf68e(%rip),%xmm9 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
- DB 68,15,40,37,150,246,0,0 ; movaps 0xf696(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 68,15,88,13,206,0,1,0 ; addps 0x100ce(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 68,15,40,37,214,0,1,0 ; movaps 0x100d6(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,150,246,0,0 ; movaps 0xf696(%rip),%xmm12 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 68,15,40,37,214,0,1,0 ; movaps 0x100d6(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,154,246,0,0 ; movaps 0xf69a(%rip),%xmm13 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 68,15,40,45,218,0,1,0 ; movaps 0x100da(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,154,246,0,0 ; mulps 0xf69a(%rip),%xmm13 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 68,15,89,45,218,0,1,0 ; mulps 0x100da(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27931,15 +27931,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,106,245,0,0 ; mulps 0xf56a(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 68,15,84,21,114,245,0,0 ; andps 0xf572(%rip),%xmm10 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 68,15,86,21,138,242,0,0 ; orps 0xf28a(%rip),%xmm10 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
- DB 68,15,88,13,114,245,0,0 ; addps 0xf572(%rip),%xmm9 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
- DB 68,15,40,37,122,245,0,0 ; movaps 0xf57a(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,89,13,170,255,0,0 ; mulps 0xffaa(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 68,15,84,21,178,255,0,0 ; andps 0xffb2(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 68,15,86,21,202,252,0,0 ; orps 0xfcca(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,13,178,255,0,0 ; addps 0xffb2(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 68,15,40,37,186,255,0,0 ; movaps 0xffba(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,122,245,0,0 ; addps 0xf57a(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
- DB 68,15,40,37,130,245,0,0 ; movaps 0xf582(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,88,21,186,255,0,0 ; addps 0xffba(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 68,15,40,37,194,255,0,0 ; movaps 0xffc2(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27947,22 +27947,22 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,92,242,0,0 ; movaps 0xf25c(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,21,156,252,0,0 ; movaps 0xfc9c(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,80,245,0,0 ; addps 0xf550(%rip),%xmm9 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
- DB 68,15,40,37,88,245,0,0 ; movaps 0xf558(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 68,15,88,13,144,255,0,0 ; addps 0xff90(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 68,15,40,37,152,255,0,0 ; movaps 0xff98(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,88,245,0,0 ; movaps 0xf558(%rip),%xmm12 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 68,15,40,37,152,255,0,0 ; movaps 0xff98(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,92,245,0,0 ; movaps 0xf55c(%rip),%xmm13 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 68,15,40,45,156,255,0,0 ; movaps 0xff9c(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,92,245,0,0 ; mulps 0xf55c(%rip),%xmm13 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 68,15,89,45,156,255,0,0 ; mulps 0xff9c(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27996,15 +27996,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,44,244,0,0 ; mulps 0xf42c(%rip),%xmm9 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 68,15,84,21,52,244,0,0 ; andps 0xf434(%rip),%xmm10 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 68,15,86,21,76,241,0,0 ; orps 0xf14c(%rip),%xmm10 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
- DB 68,15,88,13,52,244,0,0 ; addps 0xf434(%rip),%xmm9 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
- DB 68,15,40,37,60,244,0,0 ; movaps 0xf43c(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,89,13,108,254,0,0 ; mulps 0xfe6c(%rip),%xmm9 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 68,15,84,21,116,254,0,0 ; andps 0xfe74(%rip),%xmm10 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 68,15,86,21,140,251,0,0 ; orps 0xfb8c(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
+ DB 68,15,88,13,116,254,0,0 ; addps 0xfe74(%rip),%xmm9 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
+ DB 68,15,40,37,124,254,0,0 ; movaps 0xfe7c(%rip),%xmm12 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,60,244,0,0 ; addps 0xf43c(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
- DB 68,15,40,37,68,244,0,0 ; movaps 0xf444(%rip),%xmm12 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,88,21,124,254,0,0 ; addps 0xfe7c(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
+ DB 68,15,40,37,132,254,0,0 ; movaps 0xfe84(%rip),%xmm12 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -28012,22 +28012,22 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,30,241,0,0 ; movaps 0xf11e(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,21,94,251,0,0 ; movaps 0xfb5e(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,18,244,0,0 ; addps 0xf412(%rip),%xmm9 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
- DB 68,15,40,37,26,244,0,0 ; movaps 0xf41a(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 68,15,88,13,82,254,0,0 ; addps 0xfe52(%rip),%xmm9 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
+ DB 68,15,40,37,90,254,0,0 ; movaps 0xfe5a(%rip),%xmm12 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,26,244,0,0 ; movaps 0xf41a(%rip),%xmm12 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 68,15,40,37,90,254,0,0 ; movaps 0xfe5a(%rip),%xmm12 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,30,244,0,0 ; movaps 0xf41e(%rip),%xmm13 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 68,15,40,45,94,254,0,0 ; movaps 0xfe5e(%rip),%xmm13 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,30,244,0,0 ; mulps 0xf41e(%rip),%xmm13 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 68,15,89,45,94,254,0,0 ; mulps 0xfe5e(%rip),%xmm13 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -28051,19 +28051,19 @@ _sk_gamma_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,38,243,0,0 ; mulps 0xf326(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 15,84,21,47,243,0,0 ; andps 0xf32f(%rip),%xmm2 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 68,15,40,53,71,240,0,0 ; movaps 0xf047(%rip),%xmm14 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 15,89,5,102,253,0,0 ; mulps 0xfd66(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 15,84,21,111,253,0,0 ; andps 0xfd6f(%rip),%xmm2 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 68,15,40,53,135,250,0,0 ; movaps 0xfa87(%rip),%xmm14 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,86,214 ; orps %xmm14,%xmm2
- DB 68,15,40,37,43,243,0,0 ; movaps 0xf32b(%rip),%xmm12 # 2cd50 <_sk_overlay_sse2_8bit+0x11a0>
+ DB 68,15,40,37,107,253,0,0 ; movaps 0xfd6b(%rip),%xmm12 # 2d790 <_sk_overlay_sse2_8bit+0x1224>
DB 65,15,88,196 ; addps %xmm12,%xmm0
- DB 68,15,40,29,47,243,0,0 ; movaps 0xf32f(%rip),%xmm11 # 2cd60 <_sk_overlay_sse2_8bit+0x11b0>
+ DB 68,15,40,29,111,253,0,0 ; movaps 0xfd6f(%rip),%xmm11 # 2d7a0 <_sk_overlay_sse2_8bit+0x1234>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,21,45,243,0,0 ; movaps 0xf32d(%rip),%xmm10 # 2cd70 <_sk_overlay_sse2_8bit+0x11c0>
+ DB 68,15,40,21,109,253,0,0 ; movaps 0xfd6d(%rip),%xmm10 # 2d7b0 <_sk_overlay_sse2_8bit+0x1244>
DB 65,15,88,210 ; addps %xmm10,%xmm2
- DB 68,15,40,45,49,243,0,0 ; movaps 0xf331(%rip),%xmm13 # 2cd80 <_sk_overlay_sse2_8bit+0x11d0>
+ DB 68,15,40,45,113,253,0,0 ; movaps 0xfd71(%rip),%xmm13 # 2d7c0 <_sk_overlay_sse2_8bit+0x1254>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -28075,27 +28075,27 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,226,1 ; cmpltps %xmm2,%xmm4
- DB 68,15,40,13,1,240,0,0 ; movaps 0xf001(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,13,65,250,0,0 ; movaps 0xfa41(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 65,15,84,225 ; andps %xmm9,%xmm4
DB 15,92,212 ; subps %xmm4,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,253,242,0,0 ; movaps 0xf2fd(%rip),%xmm6 # 2cd90 <_sk_overlay_sse2_8bit+0x11e0>
+ DB 15,40,53,61,253,0,0 ; movaps 0xfd3d(%rip),%xmm6 # 2d7d0 <_sk_overlay_sse2_8bit+0x1264>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,19,243,0,0 ; movaps 0xf313(%rip),%xmm7 # 2cdb0 <_sk_overlay_sse2_8bit+0x1200>
+ DB 15,40,61,83,253,0,0 ; movaps 0xfd53(%rip),%xmm7 # 2d7f0 <_sk_overlay_sse2_8bit+0x1284>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,243,242,0,0 ; movaps 0xf2f3(%rip),%xmm4 # 2cda0 <_sk_overlay_sse2_8bit+0x11f0>
+ DB 15,40,37,51,253,0,0 ; movaps 0xfd33(%rip),%xmm4 # 2d7e0 <_sk_overlay_sse2_8bit+0x1274>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,5,243,0,0 ; movaps 0xf305(%rip),%xmm15 # 2cdc0 <_sk_overlay_sse2_8bit+0x1210>
+ DB 68,15,40,61,69,253,0,0 ; movaps 0xfd45(%rip),%xmm15 # 2d800 <_sk_overlay_sse2_8bit+0x1294>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,97,242,0,0 ; mulps 0xf261(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 15,84,13,106,242,0,0 ; andps 0xf26a(%rip),%xmm1 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
+ DB 15,89,5,161,252,0,0 ; mulps 0xfca1(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 15,84,13,170,252,0,0 ; andps 0xfcaa(%rip),%xmm1 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
DB 65,15,86,206 ; orps %xmm14,%xmm1
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
@@ -28125,9 +28125,9 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,240,241,0,0 ; mulps 0xf1f0(%rip),%xmm0 # 2cd30 <_sk_overlay_sse2_8bit+0x1180>
- DB 15,84,29,249,241,0,0 ; andps 0xf1f9(%rip),%xmm3 # 2cd40 <_sk_overlay_sse2_8bit+0x1190>
- DB 15,86,29,18,239,0,0 ; orps 0xef12(%rip),%xmm3 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 15,89,5,48,252,0,0 ; mulps 0xfc30(%rip),%xmm0 # 2d770 <_sk_overlay_sse2_8bit+0x1204>
+ DB 15,84,29,57,252,0,0 ; andps 0xfc39(%rip),%xmm3 # 2d780 <_sk_overlay_sse2_8bit+0x1214>
+ DB 15,86,29,82,249,0,0 ; orps 0xf952(%rip),%xmm3 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
DB 65,15,92,195 ; subps %xmm11,%xmm0
@@ -28149,7 +28149,7 @@ _sk_gamma_sse2 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,47,242,0,0 ; movaps 0xf22f(%rip),%xmm0 # 2cdd0 <_sk_overlay_sse2_8bit+0x1220>
+ DB 15,40,5,111,252,0,0 ; movaps 0xfc6f(%rip),%xmm0 # 2d810 <_sk_overlay_sse2_8bit+0x12a4>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -28167,29 +28167,29 @@ _sk_gamma_sse2 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
- DB 15,89,5,1,242,0,0 ; mulps 0xf201(%rip),%xmm0 # 2cde0 <_sk_overlay_sse2_8bit+0x1230>
- DB 68,15,40,5,121,239,0,0 ; movaps 0xef79(%rip),%xmm8 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 15,89,5,65,252,0,0 ; mulps 0xfc41(%rip),%xmm0 # 2d820 <_sk_overlay_sse2_8bit+0x12b4>
+ DB 68,15,40,5,185,249,0,0 ; movaps 0xf9b9(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 68,15,40,13,253,241,0,0 ; movaps 0xf1fd(%rip),%xmm9 # 2cdf0 <_sk_overlay_sse2_8bit+0x1240>
+ DB 68,15,40,13,61,252,0,0 ; movaps 0xfc3d(%rip),%xmm9 # 2d830 <_sk_overlay_sse2_8bit+0x12c4>
DB 65,15,88,201 ; addps %xmm9,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 15,88,5,250,241,0,0 ; addps 0xf1fa(%rip),%xmm0 # 2ce00 <_sk_overlay_sse2_8bit+0x1250>
- DB 15,89,5,3,242,0,0 ; mulps 0xf203(%rip),%xmm0 # 2ce10 <_sk_overlay_sse2_8bit+0x1260>
- DB 15,89,13,12,242,0,0 ; mulps 0xf20c(%rip),%xmm1 # 2ce20 <_sk_overlay_sse2_8bit+0x1270>
+ DB 15,88,5,58,252,0,0 ; addps 0xfc3a(%rip),%xmm0 # 2d840 <_sk_overlay_sse2_8bit+0x12d4>
+ DB 15,89,5,67,252,0,0 ; mulps 0xfc43(%rip),%xmm0 # 2d850 <_sk_overlay_sse2_8bit+0x12e4>
+ DB 15,89,13,76,252,0,0 ; mulps 0xfc4c(%rip),%xmm1 # 2d860 <_sk_overlay_sse2_8bit+0x12f4>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,21,18,242,0,0 ; mulps 0xf212(%rip),%xmm2 # 2ce30 <_sk_overlay_sse2_8bit+0x1280>
+ DB 15,89,21,82,252,0,0 ; mulps 0xfc52(%rip),%xmm2 # 2d870 <_sk_overlay_sse2_8bit+0x1304>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 68,15,92,202 ; subps %xmm2,%xmm9
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
DB 68,15,89,225 ; mulps %xmm1,%xmm12
- DB 15,40,21,7,242,0,0 ; movaps 0xf207(%rip),%xmm2 # 2ce40 <_sk_overlay_sse2_8bit+0x1290>
+ DB 15,40,21,71,252,0,0 ; movaps 0xfc47(%rip),%xmm2 # 2d880 <_sk_overlay_sse2_8bit+0x1314>
DB 68,15,40,194 ; movaps %xmm2,%xmm8
DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8
- DB 68,15,40,21,6,242,0,0 ; movaps 0xf206(%rip),%xmm10 # 2ce50 <_sk_overlay_sse2_8bit+0x12a0>
+ DB 68,15,40,21,70,252,0,0 ; movaps 0xfc46(%rip),%xmm10 # 2d890 <_sk_overlay_sse2_8bit+0x1324>
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,40,29,10,242,0,0 ; movaps 0xf20a(%rip),%xmm11 # 2ce60 <_sk_overlay_sse2_8bit+0x12b0>
+ DB 68,15,40,29,74,252,0,0 ; movaps 0xfc4a(%rip),%xmm11 # 2d8a0 <_sk_overlay_sse2_8bit+0x1334>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 69,15,84,224 ; andps %xmm8,%xmm12
DB 68,15,85,193 ; andnps %xmm1,%xmm8
@@ -28213,8 +28213,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,84,194 ; andps %xmm2,%xmm0
DB 65,15,85,209 ; andnps %xmm9,%xmm2
DB 15,86,208 ; orps %xmm0,%xmm2
- DB 68,15,89,5,186,241,0,0 ; mulps 0xf1ba(%rip),%xmm8 # 2ce70 <_sk_overlay_sse2_8bit+0x12c0>
- DB 15,89,21,195,241,0,0 ; mulps 0xf1c3(%rip),%xmm2 # 2ce80 <_sk_overlay_sse2_8bit+0x12d0>
+ DB 68,15,89,5,250,251,0,0 ; mulps 0xfbfa(%rip),%xmm8 # 2d8b0 <_sk_overlay_sse2_8bit+0x1344>
+ DB 15,89,21,3,252,0,0 ; mulps 0xfc03(%rip),%xmm2 # 2d8c0 <_sk_overlay_sse2_8bit+0x1354>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -28232,9 +28232,9 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,67,15,110,4,16 ; movd (%r8,%r10,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,61,238,0,0 ; pand 0xee3d(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,219,5,125,248,0,0 ; pand 0xf87d(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,131,239,0,0 ; mulps 0xef83(%rip),%xmm3 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,29,195,249,0,0 ; mulps 0xf9c3(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
@@ -28275,9 +28275,9 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,67,15,110,36,16 ; movd (%r8,%r10,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,169,237,0,0 ; pand 0xeda9(%rip),%xmm4 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,219,37,233,247,0,0 ; pand 0xf7e9(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,239,238,0,0 ; mulps 0xeeef(%rip),%xmm7 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,61,47,249,0,0 ; mulps 0xf92f(%rip),%xmm7 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
@@ -28341,7 +28341,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,254,237,0,0 ; mulps 0xedfe(%rip),%xmm3 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,29,62,248,0,0 ; mulps 0xf83e(%rip),%xmm3 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -28357,7 +28357,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
- DB 68,15,40,5,176,236,0,0 ; movaps 0xecb0(%rip),%xmm8 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,5,240,246,0,0 ; movaps 0xf6f0(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8
@@ -28384,7 +28384,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp)
DB 138,68,36,24 ; mov 0x18(%rsp),%al
DB 67,136,68,16,2 ; mov %al,0x2(%r8,%r10,1)
- DB 102,68,15,219,5,15,236,0,0 ; pand 0xec0f(%rip),%xmm8 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,68,15,219,5,79,246,0,0 ; pand 0xf64f(%rip),%xmm8 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,68,15,126,192 ; movd %xmm8,%eax
@@ -28408,11 +28408,11 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,67,15,110,4,16 ; movd (%r8,%r10,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,188,235,0,0 ; pand 0xebbc(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,219,5,252,245,0,0 ; pand 0xf5fc(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,2,237,0,0 ; mulps 0xed02(%rip),%xmm0 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,5,66,247,0,0 ; mulps 0xf742(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,249,234,0,0 ; movaps 0xeaf9(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,57,245,0,0 ; movaps 0xf539(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -28451,11 +28451,11 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,67,15,110,36,16 ; movd (%r8,%r10,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,37,235,0,0 ; pand 0xeb25(%rip),%xmm4 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,219,37,101,245,0,0 ; pand 0xf565(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,107,236,0,0 ; mulps 0xec6b(%rip),%xmm4 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,37,171,246,0,0 ; mulps 0xf6ab(%rip),%xmm4 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,98,234,0,0 ; movaps 0xea62(%rip),%xmm7 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,61,162,244,0,0 ; movaps 0xf4a2(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
@@ -28517,9 +28517,9 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,119,235,0,0 ; mulps 0xeb77(%rip),%xmm0 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 15,89,5,183,245,0,0 ; mulps 0xf5b7(%rip),%xmm0 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,110,233,0,0 ; movaps 0xe96e(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,174,243,0,0 ; movaps 0xf3ae(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -28537,19 +28537,19 @@ _sk_load_565_sse2 LABEL PROC
DB 117,83 ; jne 1e188 <_sk_load_565_sse2+0x6e>
DB 243,67,15,126,20,80 ; movq (%r8,%r10,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,73,235,0,0 ; movdqa 0xeb49(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,15,111,5,137,245,0,0 ; movdqa 0xf589(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,75,235,0,0 ; mulps 0xeb4b(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,15,111,13,83,235,0,0 ; movdqa 0xeb53(%rip),%xmm1 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 15,89,5,139,245,0,0 ; mulps 0xf58b(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,15,111,13,147,245,0,0 ; movdqa 0xf593(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,85,235,0,0 ; mulps 0xeb55(%rip),%xmm1 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,15,219,21,93,235,0,0 ; pand 0xeb5d(%rip),%xmm2 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 15,89,13,149,245,0,0 ; mulps 0xf595(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,15,219,21,157,245,0,0 ; pand 0xf59d(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,99,235,0,0 ; mulps 0xeb63(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 15,89,21,163,245,0,0 ; mulps 0xf5a3(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,250,232,0,0 ; movaps 0xe8fa(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,58,243,0,0 ; movaps 0xf33a(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
@@ -28584,19 +28584,19 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 117,83 ; jne 1e243 <_sk_load_565_dst_sse2+0x6e>
DB 243,67,15,126,52,80 ; movq (%r8,%r10,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,37,142,234,0,0 ; movdqa 0xea8e(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,15,111,37,206,244,0,0 ; movdqa 0xf4ce(%rip),%xmm4 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,144,234,0,0 ; mulps 0xea90(%rip),%xmm4 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,15,111,45,152,234,0,0 ; movdqa 0xea98(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 15,89,37,208,244,0,0 ; mulps 0xf4d0(%rip),%xmm4 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,15,111,45,216,244,0,0 ; movdqa 0xf4d8(%rip),%xmm5 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,154,234,0,0 ; mulps 0xea9a(%rip),%xmm5 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,15,219,53,162,234,0,0 ; pand 0xeaa2(%rip),%xmm6 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 15,89,45,218,244,0,0 ; mulps 0xf4da(%rip),%xmm5 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,15,219,53,226,244,0,0 ; pand 0xf4e2(%rip),%xmm6 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,168,234,0,0 ; mulps 0xeaa8(%rip),%xmm6 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 15,89,53,232,244,0,0 ; mulps 0xf4e8(%rip),%xmm6 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,63,232,0,0 ; movaps 0xe83f(%rip),%xmm7 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,61,127,242,0,0 ; movaps 0xf27f(%rip),%xmm7 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
@@ -28648,19 +28648,19 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,122,233,0,0 ; movdqa 0xe97a(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x10e0>
+ DB 102,15,111,5,186,243,0,0 ; movdqa 0xf3ba(%rip),%xmm0 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,124,233,0,0 ; mulps 0xe97c(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x10f0>
- DB 102,15,111,13,132,233,0,0 ; movdqa 0xe984(%rip),%xmm1 # 2ccb0 <_sk_overlay_sse2_8bit+0x1100>
+ DB 15,89,5,188,243,0,0 ; mulps 0xf3bc(%rip),%xmm0 # 2d6e0 <_sk_overlay_sse2_8bit+0x1174>
+ DB 102,15,111,13,196,243,0,0 ; movdqa 0xf3c4(%rip),%xmm1 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,134,233,0,0 ; mulps 0xe986(%rip),%xmm1 # 2ccc0 <_sk_overlay_sse2_8bit+0x1110>
- DB 102,15,219,21,142,233,0,0 ; pand 0xe98e(%rip),%xmm2 # 2ccd0 <_sk_overlay_sse2_8bit+0x1120>
+ DB 15,89,13,198,243,0,0 ; mulps 0xf3c6(%rip),%xmm1 # 2d700 <_sk_overlay_sse2_8bit+0x1194>
+ DB 102,15,219,21,206,243,0,0 ; pand 0xf3ce(%rip),%xmm2 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,148,233,0,0 ; mulps 0xe994(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0x1130>
+ DB 15,89,21,212,243,0,0 ; mulps 0xf3d4(%rip),%xmm2 # 2d720 <_sk_overlay_sse2_8bit+0x11b4>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,43,231,0,0 ; movaps 0xe72b(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,107,241,0,0 ; movaps 0xf16b(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_sse2
@@ -28672,12 +28672,12 @@ _sk_store_565_sse2 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
- DB 68,15,40,5,43,235,0,0 ; movaps 0xeb2b(%rip),%xmm8 # 2cea0 <_sk_overlay_sse2_8bit+0x12f0>
+ DB 68,15,40,5,107,245,0,0 ; movaps 0xf56b(%rip),%xmm8 # 2d8e0 <_sk_overlay_sse2_8bit+0x1374>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,32,235,0,0 ; movaps 0xeb20(%rip),%xmm10 # 2ceb0 <_sk_overlay_sse2_8bit+0x1300>
+ DB 68,15,40,21,96,245,0,0 ; movaps 0xf560(%rip),%xmm10 # 2d8f0 <_sk_overlay_sse2_8bit+0x1384>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -28724,21 +28724,21 @@ _sk_load_4444_sse2 LABEL PROC
DB 117,98 ; jne 1e493 <_sk_load_4444_sse2+0x7d>
DB 243,67,15,126,28,80 ; movq (%r8,%r10,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,125,234,0,0 ; movdqa 0xea7d(%rip),%xmm0 # 2cec0 <_sk_overlay_sse2_8bit+0x1310>
+ DB 102,15,111,5,189,244,0,0 ; movdqa 0xf4bd(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,127,234,0,0 ; mulps 0xea7f(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x1320>
- DB 102,15,111,13,135,234,0,0 ; movdqa 0xea87(%rip),%xmm1 # 2cee0 <_sk_overlay_sse2_8bit+0x1330>
+ DB 15,89,5,191,244,0,0 ; mulps 0xf4bf(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
+ DB 102,15,111,13,199,244,0,0 ; movdqa 0xf4c7(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,137,234,0,0 ; mulps 0xea89(%rip),%xmm1 # 2cef0 <_sk_overlay_sse2_8bit+0x1340>
- DB 102,15,111,21,145,234,0,0 ; movdqa 0xea91(%rip),%xmm2 # 2cf00 <_sk_overlay_sse2_8bit+0x1350>
+ DB 15,89,13,201,244,0,0 ; mulps 0xf4c9(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
+ DB 102,15,111,21,209,244,0,0 ; movdqa 0xf4d1(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,147,234,0,0 ; mulps 0xea93(%rip),%xmm2 # 2cf10 <_sk_overlay_sse2_8bit+0x1360>
- DB 102,15,219,29,155,234,0,0 ; pand 0xea9b(%rip),%xmm3 # 2cf20 <_sk_overlay_sse2_8bit+0x1370>
+ DB 15,89,21,211,244,0,0 ; mulps 0xf4d3(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
+ DB 102,15,219,29,219,244,0,0 ; pand 0xf4db(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,161,234,0,0 ; mulps 0xeaa1(%rip),%xmm3 # 2cf30 <_sk_overlay_sse2_8bit+0x1380>
+ DB 15,89,29,225,244,0,0 ; mulps 0xf4e1(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
@@ -28774,21 +28774,21 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 117,98 ; jne 1e55d <_sk_load_4444_dst_sse2+0x7d>
DB 243,67,15,126,60,80 ; movq (%r8,%r10,2),%xmm7
DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
- DB 102,15,111,37,179,233,0,0 ; movdqa 0xe9b3(%rip),%xmm4 # 2cec0 <_sk_overlay_sse2_8bit+0x1310>
+ DB 102,15,111,37,243,243,0,0 ; movdqa 0xf3f3(%rip),%xmm4 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,181,233,0,0 ; mulps 0xe9b5(%rip),%xmm4 # 2ced0 <_sk_overlay_sse2_8bit+0x1320>
- DB 102,15,111,45,189,233,0,0 ; movdqa 0xe9bd(%rip),%xmm5 # 2cee0 <_sk_overlay_sse2_8bit+0x1330>
+ DB 15,89,37,245,243,0,0 ; mulps 0xf3f5(%rip),%xmm4 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
+ DB 102,15,111,45,253,243,0,0 ; movdqa 0xf3fd(%rip),%xmm5 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,191,233,0,0 ; mulps 0xe9bf(%rip),%xmm5 # 2cef0 <_sk_overlay_sse2_8bit+0x1340>
- DB 102,15,111,53,199,233,0,0 ; movdqa 0xe9c7(%rip),%xmm6 # 2cf00 <_sk_overlay_sse2_8bit+0x1350>
+ DB 15,89,45,255,243,0,0 ; mulps 0xf3ff(%rip),%xmm5 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
+ DB 102,15,111,53,7,244,0,0 ; movdqa 0xf407(%rip),%xmm6 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,201,233,0,0 ; mulps 0xe9c9(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x1360>
- DB 102,15,219,61,209,233,0,0 ; pand 0xe9d1(%rip),%xmm7 # 2cf20 <_sk_overlay_sse2_8bit+0x1370>
+ DB 15,89,53,9,244,0,0 ; mulps 0xf409(%rip),%xmm6 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
+ DB 102,15,219,61,17,244,0,0 ; pand 0xf411(%rip),%xmm7 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,215,233,0,0 ; mulps 0xe9d7(%rip),%xmm7 # 2cf30 <_sk_overlay_sse2_8bit+0x1380>
+ DB 15,89,61,23,244,0,0 ; mulps 0xf417(%rip),%xmm7 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,137,249 ; mov %edi,%r9d
@@ -28841,21 +28841,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,144,232,0,0 ; movdqa 0xe890(%rip),%xmm0 # 2cec0 <_sk_overlay_sse2_8bit+0x1310>
+ DB 102,15,111,5,208,242,0,0 ; movdqa 0xf2d0(%rip),%xmm0 # 2d900 <_sk_overlay_sse2_8bit+0x1394>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,146,232,0,0 ; mulps 0xe892(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x1320>
- DB 102,15,111,13,154,232,0,0 ; movdqa 0xe89a(%rip),%xmm1 # 2cee0 <_sk_overlay_sse2_8bit+0x1330>
+ DB 15,89,5,210,242,0,0 ; mulps 0xf2d2(%rip),%xmm0 # 2d910 <_sk_overlay_sse2_8bit+0x13a4>
+ DB 102,15,111,13,218,242,0,0 ; movdqa 0xf2da(%rip),%xmm1 # 2d920 <_sk_overlay_sse2_8bit+0x13b4>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,156,232,0,0 ; mulps 0xe89c(%rip),%xmm1 # 2cef0 <_sk_overlay_sse2_8bit+0x1340>
- DB 102,15,111,21,164,232,0,0 ; movdqa 0xe8a4(%rip),%xmm2 # 2cf00 <_sk_overlay_sse2_8bit+0x1350>
+ DB 15,89,13,220,242,0,0 ; mulps 0xf2dc(%rip),%xmm1 # 2d930 <_sk_overlay_sse2_8bit+0x13c4>
+ DB 102,15,111,21,228,242,0,0 ; movdqa 0xf2e4(%rip),%xmm2 # 2d940 <_sk_overlay_sse2_8bit+0x13d4>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,166,232,0,0 ; mulps 0xe8a6(%rip),%xmm2 # 2cf10 <_sk_overlay_sse2_8bit+0x1360>
- DB 102,15,219,29,174,232,0,0 ; pand 0xe8ae(%rip),%xmm3 # 2cf20 <_sk_overlay_sse2_8bit+0x1370>
+ DB 15,89,21,230,242,0,0 ; mulps 0xf2e6(%rip),%xmm2 # 2d950 <_sk_overlay_sse2_8bit+0x13e4>
+ DB 102,15,219,29,238,242,0,0 ; pand 0xf2ee(%rip),%xmm3 # 2d960 <_sk_overlay_sse2_8bit+0x13f4>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,180,232,0,0 ; mulps 0xe8b4(%rip),%xmm3 # 2cf30 <_sk_overlay_sse2_8bit+0x1380>
+ DB 15,89,29,244,242,0,0 ; mulps 0xf2f4(%rip),%xmm3 # 2d970 <_sk_overlay_sse2_8bit+0x1404>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28868,7 +28868,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,210 ; movslq %edx,%r10
- DB 68,15,40,5,162,232,0,0 ; movaps 0xe8a2(%rip),%xmm8 # 2cf40 <_sk_overlay_sse2_8bit+0x1390>
+ DB 68,15,40,5,226,242,0,0 ; movaps 0xf2e2(%rip),%xmm8 # 2d980 <_sk_overlay_sse2_8bit+0x1414>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28924,11 +28924,11 @@ _sk_load_8888_sse2 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,98 ; jne 1e7d1 <_sk_load_8888_sse2+0x7e>
DB 243,69,15,111,12,128 ; movdqu (%r8,%rax,4),%xmm9
- DB 102,15,111,21,179,227,0,0 ; movdqa 0xe3b3(%rip),%xmm2 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,21,243,237,0,0 ; movdqa 0xedf3(%rip),%xmm2 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,239,228,0,0 ; movaps 0xe4ef(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,47,239,0,0 ; movaps 0xef2f(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28973,11 +28973,11 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,98 ; jne 1e890 <_sk_load_8888_dst_sse2+0x7e>
DB 243,69,15,111,12,128 ; movdqu (%r8,%rax,4),%xmm9
- DB 102,15,111,53,244,226,0,0 ; movdqa 0xe2f4(%rip),%xmm6 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,53,52,237,0,0 ; movdqa 0xed34(%rip),%xmm6 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,65,15,111,225 ; movdqa %xmm9,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,48,228,0,0 ; movaps 0xe430(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,112,238,0,0 ; movaps 0xee70(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -29039,11 +29039,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,67,15,110,12,136 ; movd (%r8,%r9,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,222,225,0,0 ; movdqa 0xe1de(%rip),%xmm2 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,21,30,236,0,0 ; movdqa 0xec1e(%rip),%xmm2 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,26,227,0,0 ; movaps 0xe31a(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,90,237,0,0 ; movaps 0xed5a(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -29070,7 +29070,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,155,225,0,0 ; movaps 0xe19b(%rip),%xmm8 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,5,219,235,0,0 ; movaps 0xebdb(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -29120,11 +29120,11 @@ _sk_load_bgra_sse2 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,98 ; jne 1ead9 <_sk_load_bgra_sse2+0x7e>
DB 243,69,15,111,12,128 ; movdqu (%r8,%rax,4),%xmm9
- DB 102,15,111,5,171,224,0,0 ; movdqa 0xe0ab(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,5,235,234,0,0 ; movdqa 0xeaeb(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,231,225,0,0 ; movaps 0xe1e7(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,39,236,0,0 ; movaps 0xec27(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -29169,11 +29169,11 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 72,133,255 ; test %rdi,%rdi
DB 117,98 ; jne 1eb98 <_sk_load_bgra_dst_sse2+0x7e>
DB 243,69,15,111,12,128 ; movdqu (%r8,%rax,4),%xmm9
- DB 102,15,111,37,236,223,0,0 ; movdqa 0xdfec(%rip),%xmm4 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,37,44,234,0,0 ; movdqa 0xea2c(%rip),%xmm4 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 68,15,40,5,40,225,0,0 ; movaps 0xe128(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,104,235,0,0 ; movaps 0xeb68(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -29235,11 +29235,11 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,67,15,110,12,136 ; movd (%r8,%r9,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,5,214,222,0,0 ; movdqa 0xded6(%rip),%xmm0 # 2cb30 <_sk_overlay_sse2_8bit+0xf80>
+ DB 102,15,111,5,22,233,0,0 ; movdqa 0xe916(%rip),%xmm0 # 2d570 <_sk_overlay_sse2_8bit+0x1004>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,18,224,0,0 ; movaps 0xe012(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x10d0>
+ DB 68,15,40,5,82,234,0,0 ; movaps 0xea52(%rip),%xmm8 # 2d6c0 <_sk_overlay_sse2_8bit+0x1154>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -29266,7 +29266,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,147,222,0,0 ; movaps 0xde93(%rip),%xmm8 # 2cb60 <_sk_overlay_sse2_8bit+0xfb0>
+ DB 68,15,40,5,211,232,0,0 ; movaps 0xe8d3(%rip),%xmm8 # 2d5a0 <_sk_overlay_sse2_8bit+0x1034>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -29326,7 +29326,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,139,225,0,0 ; movdqa 0xe18b(%rip),%xmm9 # 2cf50 <_sk_overlay_sse2_8bit+0x13a0>
+ DB 102,68,15,111,13,203,235,0,0 ; movdqa 0xebcb(%rip),%xmm9 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -29334,11 +29334,11 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,128,225,0,0 ; movdqa 0xe180(%rip),%xmm11 # 2cf70 <_sk_overlay_sse2_8bit+0x13c0>
+ DB 102,68,15,111,29,192,235,0,0 ; movdqa 0xebc0(%rip),%xmm11 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,130,225,0,0 ; movdqa 0xe182(%rip),%xmm12 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
+ DB 102,68,15,111,37,194,235,0,0 ; movdqa 0xebc2(%rip),%xmm12 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,37,227,0,0 ; movdqa 0xe325(%rip),%xmm3 # 2d130 <_sk_overlay_sse2_8bit+0x1580>
+ DB 102,15,111,29,101,237,0,0 ; movdqa 0xed65(%rip),%xmm3 # 2db70 <_sk_overlay_sse2_8bit+0x1604>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -29420,7 +29420,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,238 ; movdqa %xmm14,%xmm5
DB 102,65,15,97,234 ; punpcklwd %xmm10,%xmm5
- DB 102,68,15,111,13,203,223,0,0 ; movdqa 0xdfcb(%rip),%xmm9 # 2cf50 <_sk_overlay_sse2_8bit+0x13a0>
+ DB 102,68,15,111,13,11,234,0,0 ; movdqa 0xea0b(%rip),%xmm9 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,65,15,219,225 ; pand %xmm9,%xmm4
DB 102,15,239,236 ; pxor %xmm4,%xmm5
@@ -29428,11 +29428,11 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,68,15,111,237 ; movdqa %xmm5,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,236 ; por %xmm4,%xmm13
- DB 102,68,15,111,29,192,223,0,0 ; movdqa 0xdfc0(%rip),%xmm11 # 2cf70 <_sk_overlay_sse2_8bit+0x13c0>
+ DB 102,68,15,111,29,0,234,0,0 ; movdqa 0xea00(%rip),%xmm11 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,194,223,0,0 ; movdqa 0xdfc2(%rip),%xmm12 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
+ DB 102,68,15,111,37,2,234,0,0 ; movdqa 0xea02(%rip),%xmm12 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
DB 102,65,15,239,236 ; pxor %xmm12,%xmm5
- DB 102,15,111,61,101,225,0,0 ; movdqa 0xe165(%rip),%xmm7 # 2d130 <_sk_overlay_sse2_8bit+0x1580>
+ DB 102,15,111,61,165,235,0,0 ; movdqa 0xeba5(%rip),%xmm7 # 2db70 <_sk_overlay_sse2_8bit+0x1604>
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,102,229 ; pcmpgtd %xmm5,%xmm4
DB 102,65,15,223,229 ; pandn %xmm13,%xmm4
@@ -29529,7 +29529,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,197,221,0,0 ; movdqa 0xddc5(%rip),%xmm9 # 2cf50 <_sk_overlay_sse2_8bit+0x13a0>
+ DB 102,68,15,111,13,5,232,0,0 ; movdqa 0xe805(%rip),%xmm9 # 2d990 <_sk_overlay_sse2_8bit+0x1424>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -29537,11 +29537,11 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,186,221,0,0 ; movdqa 0xddba(%rip),%xmm11 # 2cf70 <_sk_overlay_sse2_8bit+0x13c0>
+ DB 102,68,15,111,29,250,231,0,0 ; movdqa 0xe7fa(%rip),%xmm11 # 2d9b0 <_sk_overlay_sse2_8bit+0x1444>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,188,221,0,0 ; movdqa 0xddbc(%rip),%xmm12 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
+ DB 102,68,15,111,37,252,231,0,0 ; movdqa 0xe7fc(%rip),%xmm12 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,95,223,0,0 ; movdqa 0xdf5f(%rip),%xmm3 # 2d130 <_sk_overlay_sse2_8bit+0x1580>
+ DB 102,15,111,29,159,233,0,0 ; movdqa 0xe99f(%rip),%xmm3 # 2db70 <_sk_overlay_sse2_8bit+0x1604>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -29597,17 +29597,17 @@ _sk_store_f16_sse2 LABEL PROC
DB 73,193,224,3 ; shl $0x3,%r8
DB 76,3,0 ; add (%rax),%r8
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,181,220,0,0 ; movdqa 0xdcb5(%rip),%xmm10 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
+ DB 102,68,15,111,21,245,230,0,0 ; movdqa 0xe6f5(%rip),%xmm10 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,69,15,219,226 ; pand %xmm10,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,236 ; pxor %xmm12,%xmm13
- DB 102,68,15,111,13,168,220,0,0 ; movdqa 0xdca8(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x13e0>
+ DB 102,68,15,111,13,232,230,0,0 ; movdqa 0xe6e8(%rip),%xmm9 # 2d9d0 <_sk_overlay_sse2_8bit+0x1464>
DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,29,153,220,0,0 ; movdqa 0xdc99(%rip),%xmm11 # 2cfa0 <_sk_overlay_sse2_8bit+0x13f0>
+ DB 102,68,15,111,29,217,230,0,0 ; movdqa 0xe6d9(%rip),%xmm11 # 2d9e0 <_sk_overlay_sse2_8bit+0x1474>
DB 102,69,15,235,227 ; por %xmm11,%xmm12
DB 102,69,15,254,229 ; paddd %xmm13,%xmm12
DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12
@@ -29703,7 +29703,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,5,72,216,0,0 ; movaps 0xd848(%rip),%xmm8 # 2cd10 <_sk_overlay_sse2_8bit+0x1160>
+ DB 68,15,40,5,136,226,0,0 ; movaps 0xe288(%rip),%xmm8 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29777,7 +29777,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,13,14,215,0,0 ; movaps 0xd70e(%rip),%xmm9 # 2cd10 <_sk_overlay_sse2_8bit+0x1160>
+ DB 68,15,40,13,78,225,0,0 ; movaps 0xe14e(%rip),%xmm9 # 2d750 <_sk_overlay_sse2_8bit+0x11e4>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29794,7 +29794,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,53,212,0,0 ; movaps 0xd435(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,117,222,0,0 ; movaps 0xde75(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,64 ; movd (%r8,%rax,2),%xmm2
DB 102,65,15,196,84,64,4,2 ; pinsrw $0x2,0x4(%r8,%rax,2),%xmm2
@@ -29826,7 +29826,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 77,1,192 ; add %r8,%r8
DB 76,3,0 ; add (%rax),%r8
DB 73,99,193 ; movslq %r9d,%rax
- DB 68,15,40,21,222,216,0,0 ; movaps 0xd8de(%rip),%xmm10 # 2cfb0 <_sk_overlay_sse2_8bit+0x1400>
+ DB 68,15,40,21,30,227,0,0 ; movaps 0xe31e(%rip),%xmm10 # 2d9f0 <_sk_overlay_sse2_8bit+0x1484>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -30053,7 +30053,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,75,208,0,0 ; andps 0xd04b(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,84,21,139,218,0,0 ; andps 0xda8b(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -30077,7 +30077,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,241,207,0,0 ; andps 0xcff1(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,84,21,49,218,0,0 ; andps 0xda31(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -30101,13 +30101,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 65,15,92,193 ; subps %xmm9,%xmm0
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,50,197,0,0 ; mulss 0xc532(%rip),%xmm11 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 243,68,15,89,29,238,206,0,0 ; mulss 0xceee(%rip),%xmm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,119,207,0,0 ; andps 0xcf77(%rip),%xmm11 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,84,29,183,217,0,0 ; andps 0xd9b7(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -30134,13 +30134,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 65,15,92,201 ; subps %xmm9,%xmm1
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,173,196,0,0 ; mulss 0xc4ad(%rip),%xmm11 # 2c01c <_sk_overlay_sse2_8bit+0x46c>
+ DB 243,68,15,89,29,105,206,0,0 ; mulss 0xce69(%rip),%xmm11 # 2c9d8 <_sk_overlay_sse2_8bit+0x46c>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,242,206,0,0 ; andps 0xcef2(%rip),%xmm11 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,84,29,50,217,0,0 ; andps 0xd932(%rip),%xmm11 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -30161,7 +30161,7 @@ PUBLIC _sk_clamp_x_1_sse2
_sk_clamp_x_1_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,169,206,0,0 ; minps 0xcea9(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,93,5,233,216,0,0 ; minps 0xd8e9(%rip),%xmm8 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -30172,7 +30172,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,84,13,135,206,0,0 ; andps 0xce87(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,84,13,199,216,0,0 ; andps 0xd8c7(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30180,14 +30180,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
PUBLIC _sk_mirror_x_1_sse2
_sk_mirror_x_1_sse2 LABEL PROC
- DB 68,15,40,5,211,206,0,0 ; movaps 0xced3(%rip),%xmm8 # 2cae0 <_sk_overlay_sse2_8bit+0xf30>
+ DB 68,15,40,5,19,217,0,0 ; movaps 0xd913(%rip),%xmm8 # 2d520 <_sk_overlay_sse2_8bit+0xfb4>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,71,206,0,0 ; movaps 0xce47(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,13,135,216,0,0 ; movaps 0xd887(%rip),%xmm9 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,77,206,0,0 ; andps 0xce4d(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,84,13,141,216,0,0 ; andps 0xd88d(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,88,210 ; addps %xmm10,%xmm10
@@ -30201,10 +30201,10 @@ _sk_mirror_x_1_sse2 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,99,211,0,0 ; mulps 0xd363(%rip),%xmm0 # 2cfc0 <_sk_overlay_sse2_8bit+0x1410>
- DB 15,89,13,108,211,0,0 ; mulps 0xd36c(%rip),%xmm1 # 2cfd0 <_sk_overlay_sse2_8bit+0x1420>
+ DB 15,89,5,163,221,0,0 ; mulps 0xdda3(%rip),%xmm0 # 2da00 <_sk_overlay_sse2_8bit+0x1494>
+ DB 15,89,13,172,221,0,0 ; mulps 0xddac(%rip),%xmm1 # 2da10 <_sk_overlay_sse2_8bit+0x14a4>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,114,211,0,0 ; mulps 0xd372(%rip),%xmm3 # 2cfe0 <_sk_overlay_sse2_8bit+0x1430>
+ DB 15,89,29,178,221,0,0 ; mulps 0xddb2(%rip),%xmm3 # 2da20 <_sk_overlay_sse2_8bit+0x14b4>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -30598,15 +30598,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse2
_sk_gauss_a_to_rgba_sse2 LABEL PROC
- DB 15,40,5,65,205,0,0 ; movaps 0xcd41(%rip),%xmm0 # 2cff0 <_sk_overlay_sse2_8bit+0x1440>
+ DB 15,40,5,129,215,0,0 ; movaps 0xd781(%rip),%xmm0 # 2da30 <_sk_overlay_sse2_8bit+0x14c4>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,71,205,0,0 ; addps 0xcd47(%rip),%xmm0 # 2d000 <_sk_overlay_sse2_8bit+0x1450>
+ DB 15,88,5,135,215,0,0 ; addps 0xd787(%rip),%xmm0 # 2da40 <_sk_overlay_sse2_8bit+0x14d4>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,77,205,0,0 ; addps 0xcd4d(%rip),%xmm0 # 2d010 <_sk_overlay_sse2_8bit+0x1460>
+ DB 15,88,5,141,215,0,0 ; addps 0xd78d(%rip),%xmm0 # 2da50 <_sk_overlay_sse2_8bit+0x14e4>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,83,205,0,0 ; addps 0xcd53(%rip),%xmm0 # 2d020 <_sk_overlay_sse2_8bit+0x1470>
+ DB 15,88,5,147,215,0,0 ; addps 0xd793(%rip),%xmm0 # 2da60 <_sk_overlay_sse2_8bit+0x14f4>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,89,205,0,0 ; addps 0xcd59(%rip),%xmm0 # 2d030 <_sk_overlay_sse2_8bit+0x1480>
+ DB 15,88,5,153,215,0,0 ; addps 0xd799(%rip),%xmm0 # 2da70 <_sk_overlay_sse2_8bit+0x1504>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -30624,7 +30624,7 @@ _sk_gradient_sse2 LABEL PROC
DB 73,255,200 ; dec %r8
DB 73,131,193,4 ; add $0x4,%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,135,199,0,0 ; movaps 0xc787(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 15,40,21,199,209,0,0 ; movaps 0xd1c7(%rip),%xmm2 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 243,65,15,16,25 ; movss (%r9),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -30768,29 +30768,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 69,15,94,220 ; divps %xmm12,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
- DB 68,15,40,45,230,202,0,0 ; movaps 0xcae6(%rip),%xmm13 # 2d040 <_sk_overlay_sse2_8bit+0x1490>
+ DB 68,15,40,45,38,213,0,0 ; movaps 0xd526(%rip),%xmm13 # 2da80 <_sk_overlay_sse2_8bit+0x1514>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,234,202,0,0 ; addps 0xcaea(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x14a0>
+ DB 68,15,88,45,42,213,0,0 ; addps 0xd52a(%rip),%xmm13 # 2da90 <_sk_overlay_sse2_8bit+0x1524>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,238,202,0,0 ; addps 0xcaee(%rip),%xmm13 # 2d060 <_sk_overlay_sse2_8bit+0x14b0>
+ DB 68,15,88,45,46,213,0,0 ; addps 0xd52e(%rip),%xmm13 # 2daa0 <_sk_overlay_sse2_8bit+0x1534>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,242,202,0,0 ; addps 0xcaf2(%rip),%xmm13 # 2d070 <_sk_overlay_sse2_8bit+0x14c0>
+ DB 68,15,88,45,50,213,0,0 ; addps 0xd532(%rip),%xmm13 # 2dab0 <_sk_overlay_sse2_8bit+0x1544>
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,40,21,241,202,0,0 ; movaps 0xcaf1(%rip),%xmm10 # 2d080 <_sk_overlay_sse2_8bit+0x14d0>
+ DB 68,15,40,21,49,213,0,0 ; movaps 0xd531(%rip),%xmm10 # 2dac0 <_sk_overlay_sse2_8bit+0x1554>
DB 69,15,92,213 ; subps %xmm13,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,205 ; andnps %xmm13,%xmm9
DB 69,15,86,202 ; orps %xmm10,%xmm9
DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8
- DB 68,15,40,21,180,196,0,0 ; movaps 0xc4b4(%rip),%xmm10 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,21,244,206,0,0 ; movaps 0xcef4(%rip),%xmm10 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,84,208 ; andps %xmm8,%xmm10
DB 69,15,85,193 ; andnps %xmm9,%xmm8
DB 69,15,86,194 ; orps %xmm10,%xmm8
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9
- DB 68,15,40,21,179,196,0,0 ; movaps 0xc4b3(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,21,243,206,0,0 ; movaps 0xcef3(%rip),%xmm10 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,208 ; subps %xmm8,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,200 ; andnps %xmm8,%xmm9
@@ -30821,7 +30821,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,90,202,0,0 ; mulps 0xca5a(%rip),%xmm9 # 2d090 <_sk_overlay_sse2_8bit+0x14e0>
+ DB 68,15,89,13,154,212,0,0 ; mulps 0xd49a(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30829,7 +30829,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,69,202,0,0 ; mulps 0xca45(%rip),%xmm10 # 2d0a0 <_sk_overlay_sse2_8bit+0x14f0>
+ DB 68,15,89,21,133,212,0,0 ; mulps 0xd485(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1574>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30838,8 +30838,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,253,200,0,0 ; xorps 0xc8fd(%rip),%xmm9 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
- DB 68,15,89,5,213,195,0,0 ; mulps 0xc3d5(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,87,13,61,211,0,0 ; xorps 0xd33d(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 68,15,89,5,21,206,0,0 ; mulps 0xce15(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30858,7 +30858,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,188,201,0,0 ; mulps 0xc9bc(%rip),%xmm9 # 2d090 <_sk_overlay_sse2_8bit+0x14e0>
+ DB 68,15,89,13,252,211,0,0 ; mulps 0xd3fc(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30866,7 +30866,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,167,201,0,0 ; mulps 0xc9a7(%rip),%xmm10 # 2d0a0 <_sk_overlay_sse2_8bit+0x14f0>
+ DB 68,15,89,21,231,211,0,0 ; mulps 0xd3e7(%rip),%xmm10 # 2dae0 <_sk_overlay_sse2_8bit+0x1574>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30875,8 +30875,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,95,200,0,0 ; xorps 0xc85f(%rip),%xmm9 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
- DB 68,15,89,5,55,195,0,0 ; mulps 0xc337(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,87,13,159,210,0,0 ; xorps 0xd29f(%rip),%xmm9 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
+ DB 68,15,89,5,119,205,0,0 ; mulps 0xcd77(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30892,7 +30892,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,47,201,0,0 ; mulps 0xc92f(%rip),%xmm9 # 2d090 <_sk_overlay_sse2_8bit+0x14e0>
+ DB 68,15,89,13,111,211,0,0 ; mulps 0xd36f(%rip),%xmm9 # 2dad0 <_sk_overlay_sse2_8bit+0x1564>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -30900,7 +30900,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,251,199,0,0 ; xorps 0xc7fb(%rip),%xmm0 # 2cf80 <_sk_overlay_sse2_8bit+0x13d0>
+ DB 15,87,5,59,210,0,0 ; xorps 0xd23b(%rip),%xmm0 # 2d9c0 <_sk_overlay_sse2_8bit+0x1454>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30937,7 +30937,7 @@ _sk_apply_vector_mask_sse2 LABEL PROC
PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,113,194,0,0 ; movaps 0xc271(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,5,177,204,0,0 ; movaps 0xccb1(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -30945,7 +30945,7 @@ _sk_save_xy_sse2 LABEL PROC
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,40,217 ; movaps %xmm9,%xmm11
DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11
- DB 68,15,40,37,108,194,0,0 ; movaps 0xc26c(%rip),%xmm12 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 68,15,40,37,172,204,0,0 ; movaps 0xccac(%rip),%xmm12 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,84,220 ; andps %xmm12,%xmm11
DB 69,15,92,211 ; subps %xmm11,%xmm10
DB 69,15,92,202 ; subps %xmm10,%xmm9
@@ -30988,8 +30988,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,5,200,0,0 ; addps 0xc805(%rip),%xmm0 # 2d0b0 <_sk_overlay_sse2_8bit+0x1500>
- DB 68,15,40,13,205,193,0,0 ; movaps 0xc1cd(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,5,69,210,0,0 ; addps 0xd245(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
+ DB 68,15,40,13,13,204,0,0 ; movaps 0xcc0d(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31000,7 +31000,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,140,193,0,0 ; addps 0xc18c(%rip),%xmm0 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 15,88,5,204,203,0,0 ; addps 0xcbcc(%rip),%xmm0 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31010,8 +31010,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,190,199,0,0 ; addps 0xc7be(%rip),%xmm1 # 2d0b0 <_sk_overlay_sse2_8bit+0x1500>
- DB 68,15,40,13,134,193,0,0 ; movaps 0xc186(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,13,254,209,0,0 ; addps 0xd1fe(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
+ DB 68,15,40,13,198,203,0,0 ; movaps 0xcbc6(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31022,7 +31022,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,68,193,0,0 ; addps 0xc144(%rip),%xmm1 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 15,88,13,132,203,0,0 ; addps 0xcb84(%rip),%xmm1 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31032,13 +31032,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,135,199,0,0 ; addps 0xc787(%rip),%xmm0 # 2d0c0 <_sk_overlay_sse2_8bit+0x1510>
- DB 68,15,40,13,63,193,0,0 ; movaps 0xc13f(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,5,199,209,0,0 ; addps 0xd1c7(%rip),%xmm0 # 2db00 <_sk_overlay_sse2_8bit+0x1594>
+ DB 68,15,40,13,127,203,0,0 ; movaps 0xcb7f(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,123,199,0,0 ; mulps 0xc77b(%rip),%xmm9 # 2d0d0 <_sk_overlay_sse2_8bit+0x1520>
- DB 68,15,88,13,19,195,0,0 ; addps 0xc313(%rip),%xmm9 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 68,15,89,13,187,209,0,0 ; mulps 0xd1bb(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
+ DB 68,15,88,13,83,205,0,0 ; addps 0xcd53(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31049,16 +31049,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,50,199,0,0 ; addps 0xc732(%rip),%xmm0 # 2d0b0 <_sk_overlay_sse2_8bit+0x1500>
- DB 68,15,40,13,250,192,0,0 ; movaps 0xc0fa(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,5,114,209,0,0 ; addps 0xd172(%rip),%xmm0 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
+ DB 68,15,40,13,58,203,0,0 ; movaps 0xcb3a(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,78,199,0,0 ; movaps 0xc74e(%rip),%xmm8 # 2d0e0 <_sk_overlay_sse2_8bit+0x1530>
+ DB 68,15,40,5,142,209,0,0 ; movaps 0xd18e(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,82,199,0,0 ; addps 0xc752(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 68,15,88,5,146,209,0,0 ; addps 0xd192(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,182,192,0,0 ; addps 0xc0b6(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,88,5,246,202,0,0 ; addps 0xcaf6(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,74,199,0,0 ; addps 0xc74a(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x1550>
+ DB 68,15,88,5,138,209,0,0 ; addps 0xd18a(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31066,17 +31066,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,148,192,0,0 ; movaps 0xc094(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,5,212,202,0,0 ; movaps 0xcad4(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,0,199,0,0 ; movaps 0xc700(%rip),%xmm10 # 2d0e0 <_sk_overlay_sse2_8bit+0x1530>
+ DB 68,15,40,21,64,209,0,0 ; movaps 0xd140(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,4,199,0,0 ; addps 0xc704(%rip),%xmm10 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 68,15,88,21,68,209,0,0 ; addps 0xd144(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,0,199,0,0 ; addps 0xc700(%rip),%xmm10 # 2d100 <_sk_overlay_sse2_8bit+0x1550>
+ DB 68,15,88,21,64,209,0,0 ; addps 0xd140(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31086,11 +31086,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,211,198,0,0 ; addps 0xc6d3(%rip),%xmm0 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 15,88,5,19,209,0,0 ; addps 0xd113(%rip),%xmm0 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,163,198,0,0 ; mulps 0xc6a3(%rip),%xmm8 # 2d0d0 <_sk_overlay_sse2_8bit+0x1520>
- DB 68,15,88,5,59,194,0,0 ; addps 0xc23b(%rip),%xmm8 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 68,15,89,5,227,208,0,0 ; mulps 0xd0e3(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
+ DB 68,15,88,5,123,204,0,0 ; addps 0xcc7b(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31101,13 +31101,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,105,198,0,0 ; addps 0xc669(%rip),%xmm1 # 2d0c0 <_sk_overlay_sse2_8bit+0x1510>
- DB 68,15,40,13,33,192,0,0 ; movaps 0xc021(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,13,169,208,0,0 ; addps 0xd0a9(%rip),%xmm1 # 2db00 <_sk_overlay_sse2_8bit+0x1594>
+ DB 68,15,40,13,97,202,0,0 ; movaps 0xca61(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,93,198,0,0 ; mulps 0xc65d(%rip),%xmm9 # 2d0d0 <_sk_overlay_sse2_8bit+0x1520>
- DB 68,15,88,13,245,193,0,0 ; addps 0xc1f5(%rip),%xmm9 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 68,15,89,13,157,208,0,0 ; mulps 0xd09d(%rip),%xmm9 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
+ DB 68,15,88,13,53,204,0,0 ; addps 0xcc35(%rip),%xmm9 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31118,16 +31118,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,19,198,0,0 ; addps 0xc613(%rip),%xmm1 # 2d0b0 <_sk_overlay_sse2_8bit+0x1500>
- DB 68,15,40,13,219,191,0,0 ; movaps 0xbfdb(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,88,13,83,208,0,0 ; addps 0xd053(%rip),%xmm1 # 2daf0 <_sk_overlay_sse2_8bit+0x1584>
+ DB 68,15,40,13,27,202,0,0 ; movaps 0xca1b(%rip),%xmm9 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,47,198,0,0 ; movaps 0xc62f(%rip),%xmm8 # 2d0e0 <_sk_overlay_sse2_8bit+0x1530>
+ DB 68,15,40,5,111,208,0,0 ; movaps 0xd06f(%rip),%xmm8 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,51,198,0,0 ; addps 0xc633(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 68,15,88,5,115,208,0,0 ; addps 0xd073(%rip),%xmm8 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,151,191,0,0 ; addps 0xbf97(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,88,5,215,201,0,0 ; addps 0xc9d7(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,43,198,0,0 ; addps 0xc62b(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x1550>
+ DB 68,15,88,5,107,208,0,0 ; addps 0xd06b(%rip),%xmm8 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31135,17 +31135,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,117,191,0,0 ; movaps 0xbf75(%rip),%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xeb0>
+ DB 68,15,40,5,181,201,0,0 ; movaps 0xc9b5(%rip),%xmm8 # 2d4a0 <_sk_overlay_sse2_8bit+0xf34>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,224,197,0,0 ; movaps 0xc5e0(%rip),%xmm10 # 2d0e0 <_sk_overlay_sse2_8bit+0x1530>
+ DB 68,15,40,21,32,208,0,0 ; movaps 0xd020(%rip),%xmm10 # 2db20 <_sk_overlay_sse2_8bit+0x15b4>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,228,197,0,0 ; addps 0xc5e4(%rip),%xmm10 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 68,15,88,21,36,208,0,0 ; addps 0xd024(%rip),%xmm10 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,224,197,0,0 ; addps 0xc5e0(%rip),%xmm10 # 2d100 <_sk_overlay_sse2_8bit+0x1550>
+ DB 68,15,88,21,32,208,0,0 ; addps 0xd020(%rip),%xmm10 # 2db40 <_sk_overlay_sse2_8bit+0x15d4>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -31155,11 +31155,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,178,197,0,0 ; addps 0xc5b2(%rip),%xmm1 # 2d0f0 <_sk_overlay_sse2_8bit+0x1540>
+ DB 15,88,13,242,207,0,0 ; addps 0xcff2(%rip),%xmm1 # 2db30 <_sk_overlay_sse2_8bit+0x15c4>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,130,197,0,0 ; mulps 0xc582(%rip),%xmm8 # 2d0d0 <_sk_overlay_sse2_8bit+0x1520>
- DB 68,15,88,5,26,193,0,0 ; addps 0xc11a(%rip),%xmm8 # 2cc70 <_sk_overlay_sse2_8bit+0x10c0>
+ DB 68,15,89,5,194,207,0,0 ; mulps 0xcfc2(%rip),%xmm8 # 2db10 <_sk_overlay_sse2_8bit+0x15a4>
+ DB 68,15,88,5,90,203,0,0 ; addps 0xcb5a(%rip),%xmm8 # 2d6b0 <_sk_overlay_sse2_8bit+0x1144>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31289,7 +31289,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,65,15,111,198 ; movdqa %xmm14,%xmm0
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,45,218,195,0,0 ; movdqa 0xc3da(%rip),%xmm5 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,45,26,206,0,0 ; movdqa 0xce1a(%rip),%xmm5 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
@@ -31312,7 +31312,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,241 ; unpcklps %xmm1,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,221,188,0,0 ; paddd 0xbcdd(%rip),%xmm1 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,254,13,29,199,0,0 ; paddd 0xc71d(%rip),%xmm1 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -31329,7 +31329,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,253 ; unpcklps %xmm5,%xmm7
DB 15,20,249 ; unpcklps %xmm1,%xmm7
- DB 102,15,254,5,177,188,0,0 ; paddd 0xbcb1(%rip),%xmm0 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,254,5,241,198,0,0 ; paddd 0xc6f1(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,200 ; movq %xmm1,%r8
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -31346,7 +31346,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,200 ; unpcklps %xmm0,%xmm1
- DB 15,40,45,198,194,0,0 ; movaps 0xc2c6(%rip),%xmm5 # 2d110 <_sk_overlay_sse2_8bit+0x1560>
+ DB 15,40,45,6,205,0,0 ; movaps 0xcd06(%rip),%xmm5 # 2db50 <_sk_overlay_sse2_8bit+0x15e4>
DB 15,88,229 ; addps %xmm5,%xmm4
DB 15,41,100,36,64 ; movaps %xmm4,0x40(%rsp)
DB 68,15,88,213 ; addps %xmm5,%xmm10
@@ -31361,7 +31361,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,127,68,36,32 ; movdqa %xmm0,0x20(%rsp)
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,15,111,5,143,194,0,0 ; movdqa 0xc28f(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,5,207,204,0,0 ; movdqa 0xcccf(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
@@ -31383,7 +31383,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,227 ; unpcklps %xmm3,%xmm4
DB 15,20,229 ; unpcklps %xmm5,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 102,15,254,29,150,187,0,0 ; paddd 0xbb96(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,254,29,214,197,0,0 ; paddd 0xc5d6(%rip),%xmm3 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,112,235,78 ; pshufd $0x4e,%xmm3,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -31400,7 +31400,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,4,131 ; movss (%r11,%r8,4),%xmm0
DB 15,20,216 ; unpcklps %xmm0,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
- DB 102,15,254,21,106,187,0,0 ; paddd 0xbb6a(%rip),%xmm2 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,254,21,170,197,0,0 ; paddd 0xc5aa(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
DB 102,73,15,126,192 ; movq %xmm0,%r8
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -31462,7 +31462,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,193 ; unpcklps %xmm1,%xmm8
DB 68,15,20,199 ; unpcklps %xmm7,%xmm8
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,21,50,186,0,0 ; movdqa 0xba32(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,111,21,114,196,0,0 ; movdqa 0xc472(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,112,249,78 ; pshufd $0x4e,%xmm1,%xmm7
DB 102,73,15,126,248 ; movq %xmm7,%r8
@@ -31480,7 +31480,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,111,45,1,186,0,0 ; movdqa 0xba01(%rip),%xmm5 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,111,45,65,196,0,0 ; movdqa 0xc441(%rip),%xmm5 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
@@ -31538,7 +31538,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 68,15,20,223 ; unpcklps %xmm7,%xmm11
DB 68,15,20,221 ; unpcklps %xmm5,%xmm11
- DB 102,15,111,45,248,184,0,0 ; movdqa 0xb8f8(%rip),%xmm5 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,111,45,56,195,0,0 ; movdqa 0xc338(%rip),%xmm5 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,254,245 ; paddd %xmm5,%xmm6
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,112,238,78 ; pshufd $0x4e,%xmm6,%xmm5
@@ -31585,7 +31585,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,5,154,190,0,0 ; movdqa 0xbe9a(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,5,218,200,0,0 ; movdqa 0xc8da(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
DB 102,15,112,217,232 ; pshufd $0xe8,%xmm1,%xmm3
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
@@ -31607,7 +31607,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,202 ; unpcklps %xmm2,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,111,5,162,183,0,0 ; movdqa 0xb7a2(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,111,5,226,193,0,0 ; movdqa 0xc1e2(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
@@ -31683,7 +31683,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,4,131 ; movss (%r11,%r8,4),%xmm0
DB 15,20,240 ; unpcklps %xmm0,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,29,108,182,0,0 ; paddd 0xb66c(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,254,29,172,192,0,0 ; paddd 0xc0ac(%rip),%xmm3 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
DB 102,73,15,126,192 ; movq %xmm0,%r8
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -31734,7 +31734,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,102,181,0,0 ; paddd 0xb566(%rip),%xmm1 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,254,13,166,191,0,0 ; paddd 0xbfa6(%rip),%xmm1 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,208 ; movq %xmm2,%r8
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -31751,7 +31751,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,20,131 ; movss (%r11,%r8,4),%xmm2
DB 68,15,20,242 ; unpcklps %xmm2,%xmm14
DB 68,15,20,241 ; unpcklps %xmm1,%xmm14
- DB 102,15,254,5,56,181,0,0 ; paddd 0xb538(%rip),%xmm0 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,254,5,120,191,0,0 ; paddd 0xbf78(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,200 ; movq %xmm1,%r8
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -31789,7 +31789,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,37,103,180,0,0 ; movdqa 0xb467(%rip),%xmm4 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,111,37,167,190,0,0 ; movdqa 0xbea7(%rip),%xmm4 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,254,226 ; paddd %xmm2,%xmm4
DB 102,15,112,204,78 ; pshufd $0x4e,%xmm4,%xmm1
DB 102,73,15,126,200 ; movq %xmm1,%r8
@@ -31807,7 +31807,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,67,15,16,36,131 ; movss (%r11,%r8,4),%xmm4
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,55,180,0,0 ; paddd 0xb437(%rip),%xmm2 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,254,21,119,190,0,0 ; paddd 0xbe77(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -31956,7 +31956,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,209 ; paddd %xmm1,%xmm2
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,254,218 ; paddd %xmm2,%xmm3
- DB 102,68,15,111,21,3,184,0,0 ; movdqa 0xb803(%rip),%xmm10 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,68,15,111,21,67,194,0,0 ; movdqa 0xc243(%rip),%xmm10 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,112,235,245 ; pshufd $0xf5,%xmm3,%xmm5
DB 102,65,15,244,218 ; pmuludq %xmm10,%xmm3
DB 102,15,112,227,232 ; pshufd $0xe8,%xmm3,%xmm4
@@ -31979,7 +31979,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,222 ; unpcklps %xmm6,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
- DB 102,15,254,45,4,177,0,0 ; paddd 0xb104(%rip),%xmm5 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,254,45,68,187,0,0 ; paddd 0xbb44(%rip),%xmm5 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,112,245,78 ; pshufd $0x4e,%xmm5,%xmm6
DB 102,73,15,126,240 ; movq %xmm6,%r8
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -31996,7 +31996,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 15,20,247 ; unpcklps %xmm7,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,37,216,176,0,0 ; paddd 0xb0d8(%rip),%xmm4 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,254,37,24,187,0,0 ; paddd 0xbb18(%rip),%xmm4 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -32013,7 +32013,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 15,20,239 ; unpcklps %xmm7,%xmm5
DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,40,61,237,182,0,0 ; movaps 0xb6ed(%rip),%xmm7 # 2d110 <_sk_overlay_sse2_8bit+0x1560>
+ DB 15,40,61,45,193,0,0 ; movaps 0xc12d(%rip),%xmm7 # 2db50 <_sk_overlay_sse2_8bit+0x15e4>
DB 68,15,88,199 ; addps %xmm7,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 68,15,88,207 ; addps %xmm7,%xmm9
@@ -32051,7 +32051,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,234 ; unpcklps %xmm2,%xmm13
DB 68,15,20,239 ; unpcklps %xmm7,%xmm13
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
- DB 102,15,254,21,172,175,0,0 ; paddd 0xafac(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,254,21,236,185,0,0 ; paddd 0xb9ec(%rip),%xmm2 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,248 ; movq %xmm7,%r8
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -32068,7 +32068,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,71,15,16,12,131 ; movss (%r11,%r8,4),%xmm9
DB 65,15,20,209 ; unpcklps %xmm9,%xmm2
DB 15,20,215 ; unpcklps %xmm7,%xmm2
- DB 102,15,254,5,127,175,0,0 ; paddd 0xaf7f(%rip),%xmm0 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,254,5,191,185,0,0 ; paddd 0xb9bf(%rip),%xmm0 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,112,248,78 ; pshufd $0x4e,%xmm0,%xmm7
DB 102,73,15,126,248 ; movq %xmm7,%r8
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -32109,7 +32109,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
DB 102,15,254,92,36,32 ; paddd 0x20(%rsp),%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,68,15,111,53,59,181,0,0 ; movdqa 0xb53b(%rip),%xmm14 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,68,15,111,53,123,191,0,0 ; movdqa 0xbf7b(%rip),%xmm14 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3
DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
DB 102,65,15,244,230 ; pmuludq %xmm14,%xmm4
@@ -32130,7 +32130,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,228 ; unpcklps %xmm4,%xmm12
DB 68,15,20,229 ; unpcklps %xmm5,%xmm12
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,111,61,67,174,0,0 ; movdqa 0xae43(%rip),%xmm7 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,111,61,131,184,0,0 ; movdqa 0xb883(%rip),%xmm7 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,254,231 ; paddd %xmm7,%xmm4
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
@@ -32148,7 +32148,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 15,20,244 ; unpcklps %xmm4,%xmm6
- DB 102,68,15,111,5,18,174,0,0 ; movdqa 0xae12(%rip),%xmm8 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,68,15,111,5,82,184,0,0 ; movdqa 0xb852(%rip),%xmm8 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,65,15,254,216 ; paddd %xmm8,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
@@ -32262,7 +32262,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,68,15,111,108,36,32 ; movdqa 0x20(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,112,178,0,0 ; movdqa 0xb270(%rip),%xmm3 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,29,176,188,0,0 ; movdqa 0xbcb0(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -32284,7 +32284,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,205 ; unpcklps %xmm5,%xmm9
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,118,171,0,0 ; movdqa 0xab76(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,111,29,182,181,0,0 ; movdqa 0xb5b6(%rip),%xmm3 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5
DB 102,73,15,126,232 ; movq %xmm5,%r8
@@ -32392,7 +32392,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,211 ; movdqa %xmm11,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
DB 102,15,112,218,245 ; pshufd $0xf5,%xmm2,%xmm3
- DB 102,15,111,5,43,176,0,0 ; movdqa 0xb02b(%rip),%xmm0 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,5,107,186,0,0 ; movdqa 0xba6b(%rip),%xmm0 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
DB 102,15,112,250,232 ; pshufd $0xe8,%xmm2,%xmm7
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
@@ -32413,7 +32413,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,203 ; unpcklps %xmm3,%xmm9
DB 102,15,111,215 ; movdqa %xmm7,%xmm2
- DB 102,15,111,5,53,169,0,0 ; movdqa 0xa935(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,111,5,117,179,0,0 ; movdqa 0xb375(%rip),%xmm0 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
DB 102,73,15,126,216 ; movq %xmm3,%r8
@@ -32431,7 +32431,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,28,131 ; movss (%r11,%r8,4),%xmm3
DB 15,20,243 ; unpcklps %xmm3,%xmm6
DB 15,20,242 ; unpcklps %xmm2,%xmm6
- DB 102,68,15,111,45,4,169,0,0 ; movdqa 0xa904(%rip),%xmm13 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,68,15,111,45,68,179,0,0 ; movdqa 0xb344(%rip),%xmm13 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,65,15,254,253 ; paddd %xmm13,%xmm7
DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2
DB 102,73,15,126,208 ; movq %xmm2,%r8
@@ -32451,7 +32451,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,250 ; unpcklps %xmm2,%xmm7
DB 102,68,15,254,220 ; paddd %xmm4,%xmm11
DB 102,65,15,112,219,245 ; pshufd $0xf5,%xmm11,%xmm3
- DB 102,15,111,37,24,175,0,0 ; movdqa 0xaf18(%rip),%xmm4 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,37,88,185,0,0 ; movdqa 0xb958(%rip),%xmm4 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,68,15,244,220 ; pmuludq %xmm4,%xmm11
DB 102,65,15,112,211,232 ; pshufd $0xe8,%xmm11,%xmm2
DB 102,15,244,220 ; pmuludq %xmm4,%xmm3
@@ -32552,7 +32552,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,202 ; movdqa %xmm10,%xmm1
DB 102,15,254,200 ; paddd %xmm0,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,75,173,0,0 ; movdqa 0xad4b(%rip),%xmm3 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,29,139,183,0,0 ; movdqa 0xb78b(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -32574,7 +32574,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,212 ; unpcklps %xmm4,%xmm2
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
- DB 102,15,111,61,82,166,0,0 ; movdqa 0xa652(%rip),%xmm7 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,111,61,146,176,0,0 ; movdqa 0xb092(%rip),%xmm7 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,254,223 ; paddd %xmm7,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
@@ -32592,7 +32592,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,44,131 ; movss (%r11,%r8,4),%xmm5
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,20,220 ; unpcklps %xmm4,%xmm3
- DB 102,68,15,111,13,33,166,0,0 ; movdqa 0xa621(%rip),%xmm9 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,68,15,111,13,97,176,0,0 ; movdqa 0xb061(%rip),%xmm9 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,73,15,126,224 ; movq %xmm4,%r8
@@ -32704,7 +32704,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,246 ; unpcklps %xmm6,%xmm14
DB 68,15,20,243 ; unpcklps %xmm3,%xmm14
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
- DB 102,68,15,111,21,8,164,0,0 ; movdqa 0xa408(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,111,21,72,174,0,0 ; movdqa 0xae48(%rip),%xmm10 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,65,15,254,218 ; paddd %xmm10,%xmm3
DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6
DB 102,73,15,126,240 ; movq %xmm6,%r8
@@ -32825,7 +32825,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,116,36,32 ; movdqa 0x20(%rsp),%xmm6
DB 102,15,254,198 ; paddd %xmm6,%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,29,120,168,0,0 ; movdqa 0xa878(%rip),%xmm3 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,29,184,178,0,0 ; movdqa 0xb2b8(%rip),%xmm3 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
@@ -32847,7 +32847,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,195 ; unpcklps %xmm3,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,68,15,111,5,126,161,0,0 ; movdqa 0xa17e(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,68,15,111,5,190,171,0,0 ; movdqa 0xabbe(%rip),%xmm8 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,65,15,254,200 ; paddd %xmm8,%xmm1
DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3
DB 102,73,15,126,216 ; movq %xmm3,%r8
@@ -32953,7 +32953,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,60,36 ; paddd (%rsp),%xmm7
DB 102,15,254,247 ; paddd %xmm7,%xmm6
DB 102,15,112,206,245 ; pshufd $0xf5,%xmm6,%xmm1
- DB 102,15,111,21,57,166,0,0 ; movdqa 0xa639(%rip),%xmm2 # 2d120 <_sk_overlay_sse2_8bit+0x1570>
+ DB 102,15,111,21,121,176,0,0 ; movdqa 0xb079(%rip),%xmm2 # 2db60 <_sk_overlay_sse2_8bit+0x15f4>
DB 102,15,244,242 ; pmuludq %xmm2,%xmm6
DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -32975,7 +32975,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,63,159,0,0 ; paddd 0x9f3f(%rip),%xmm1 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,254,13,127,169,0,0 ; paddd 0xa97f(%rip),%xmm1 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,208 ; movq %xmm2,%r8
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -33031,7 +33031,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,67,15,16,60,131 ; movss (%r11,%r8,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,53,59,158,0,0 ; movdqa 0x9e3b(%rip),%xmm6 # 2ca90 <_sk_overlay_sse2_8bit+0xee0>
+ DB 102,15,111,53,123,168,0,0 ; movdqa 0xa87b(%rip),%xmm6 # 2d4d0 <_sk_overlay_sse2_8bit+0xf64>
DB 102,15,254,242 ; paddd %xmm2,%xmm6
DB 102,15,112,206,78 ; pshufd $0x4e,%xmm6,%xmm1
DB 102,73,15,126,200 ; movq %xmm1,%r8
@@ -33049,7 +33049,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,71,15,16,60,131 ; movss (%r11,%r8,4),%xmm15
DB 65,15,20,207 ; unpcklps %xmm15,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,10,158,0,0 ; paddd 0x9e0a(%rip),%xmm2 # 2cab0 <_sk_overlay_sse2_8bit+0xf00>
+ DB 102,15,254,21,74,168,0,0 ; paddd 0xa84a(%rip),%xmm2 # 2d4f0 <_sk_overlay_sse2_8bit+0xf84>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,248 ; movq %xmm7,%r8
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -33111,7 +33111,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,228,156,0,0 ; movaps 0x9ce4(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xed0>
+ DB 15,40,29,36,167,0,0 ; movaps 0xa724(%rip),%xmm3 # 2d4c0 <_sk_overlay_sse2_8bit+0xf54>
DB 15,40,164,36,240,0,0,0 ; movaps 0xf0(%rsp),%xmm4
DB 15,40,172,36,0,1,0,0 ; movaps 0x100(%rsp),%xmm5
DB 15,40,180,36,16,1,0,0 ; movaps 0x110(%rsp),%xmm6
@@ -33217,7 +33217,7 @@ _sk_uniform_color_hsw_8bit LABEL PROC
PUBLIC _sk_set_rgb_hsw_8bit
_sk_set_rgb_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 197,250,16,37,42,145,0,0 ; vmovss 0x912a(%rip),%xmm4 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 197,250,16,37,230,154,0,0 ; vmovss 0x9ae6(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 197,218,89,40 ; vmulss (%rax),%xmm4,%xmm5
DB 196,97,250,44,197 ; vcvttss2si %xmm5,%r8
DB 197,218,89,104,4 ; vmulss 0x4(%rax),%xmm4,%xmm5
@@ -33230,7 +33230,7 @@ _sk_set_rgb_hsw_8bit LABEL PROC
DB 68,9,200 ; or %r9d,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,88,228 ; vpbroadcastd %xmm4,%ymm4
- DB 197,253,111,45,195,150,0,0 ; vmovdqa 0x96c3(%rip),%ymm5 # 2c620 <_sk_overlay_sse2_8bit+0xa70>
+ DB 197,253,111,45,131,160,0,0 ; vmovdqa 0xa083(%rip),%ymm5 # 2cfe0 <_sk_overlay_sse2_8bit+0xa74>
DB 197,245,219,205 ; vpand %ymm5,%ymm1,%ymm1
DB 197,253,219,197 ; vpand %ymm5,%ymm0,%ymm0
DB 197,221,235,192 ; vpor %ymm0,%ymm4,%ymm0
@@ -33240,10 +33240,10 @@ _sk_set_rgb_hsw_8bit LABEL PROC
PUBLIC _sk_premul_hsw_8bit
_sk_premul_hsw_8bit LABEL PROC
- DB 197,253,111,37,199,150,0,0 ; vmovdqa 0x96c7(%rip),%ymm4 # 2c640 <_sk_overlay_sse2_8bit+0xa90>
+ DB 197,253,111,37,135,160,0,0 ; vmovdqa 0xa087(%rip),%ymm4 # 2d000 <_sk_overlay_sse2_8bit+0xa94>
DB 196,226,125,0,236 ; vpshufb %ymm4,%ymm0,%ymm5
DB 196,226,117,0,228 ; vpshufb %ymm4,%ymm1,%ymm4
- DB 197,253,111,53,213,150,0,0 ; vmovdqa 0x96d5(%rip),%ymm6 # 2c660 <_sk_overlay_sse2_8bit+0xab0>
+ DB 197,253,111,53,149,160,0,0 ; vmovdqa 0xa095(%rip),%ymm6 # 2d020 <_sk_overlay_sse2_8bit+0xab4>
DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4
DB 197,213,235,238 ; vpor %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -33281,7 +33281,7 @@ _sk_premul_hsw_8bit LABEL PROC
PUBLIC _sk_swap_rb_hsw_8bit
_sk_swap_rb_hsw_8bit LABEL PROC
- DB 197,253,111,37,77,150,0,0 ; vmovdqa 0x964d(%rip),%ymm4 # 2c680 <_sk_overlay_sse2_8bit+0xad0>
+ DB 197,253,111,37,13,160,0,0 ; vmovdqa 0xa00d(%rip),%ymm4 # 2d040 <_sk_overlay_sse2_8bit+0xad4>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33622,7 +33622,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 117,35 ; jne 2350b <_sk_load_bgra_hsw_8bit+0x3f>
DB 196,129,126,111,76,152,32 ; vmovdqu 0x20(%r8,%r11,4),%ymm1
DB 196,129,126,111,4,152 ; vmovdqu (%r8,%r11,4),%ymm0
- DB 197,253,111,37,163,145,0,0 ; vmovdqa 0x91a3(%rip),%ymm4 # 2c6a0 <_sk_overlay_sse2_8bit+0xaf0>
+ DB 197,253,111,37,99,155,0,0 ; vmovdqa 0x9b63(%rip),%ymm4 # 2d060 <_sk_overlay_sse2_8bit+0xaf4>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33735,7 +33735,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 117,35 ; jne 236bf <_sk_load_bgra_dst_hsw_8bit+0x3f>
DB 196,129,126,111,92,152,32 ; vmovdqu 0x20(%r8,%r11,4),%ymm3
DB 196,129,126,111,20,152 ; vmovdqu (%r8,%r11,4),%ymm2
- DB 197,253,111,37,15,144,0,0 ; vmovdqa 0x900f(%rip),%ymm4 # 2c6c0 <_sk_overlay_sse2_8bit+0xb10>
+ DB 197,253,111,37,207,153,0,0 ; vmovdqa 0x99cf(%rip),%ymm4 # 2d080 <_sk_overlay_sse2_8bit+0xb14>
DB 196,226,109,0,212 ; vpshufb %ymm4,%ymm2,%ymm2
DB 196,226,101,0,220 ; vpshufb %ymm4,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33844,7 +33844,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 197,253,111,37,141,142,0,0 ; vmovdqa 0x8e8d(%rip),%ymm4 # 2c6e0 <_sk_overlay_sse2_8bit+0xb30>
+ DB 197,253,111,37,77,152,0,0 ; vmovdqa 0x984d(%rip),%ymm4 # 2d0a0 <_sk_overlay_sse2_8bit+0xb34>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 72,133,255 ; test %rdi,%rdi
@@ -33926,6 +33926,262 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; .byte 0xff
+PUBLIC _sk_store_565_hsw_8bit
+_sk_store_565_hsw_8bit LABEL PROC
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,72,8 ; movslq 0x8(%rax),%r9
+ DB 76,99,193 ; movslq %ecx,%r8
+ DB 77,15,175,193 ; imul %r9,%r8
+ DB 77,1,192 ; add %r8,%r8
+ DB 76,3,0 ; add (%rax),%r8
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 197,253,111,37,38,151,0,0 ; vmovdqa 0x9726(%rip),%ymm4 # 2d0c0 <_sk_overlay_sse2_8bit+0xb54>
+ DB 197,253,219,236 ; vpand %ymm4,%ymm0,%ymm5
+ DB 197,245,219,228 ; vpand %ymm4,%ymm1,%ymm4
+ DB 197,221,114,244,8 ; vpslld $0x8,%ymm4,%ymm4
+ DB 197,213,114,245,8 ; vpslld $0x8,%ymm5,%ymm5
+ DB 197,253,111,53,44,151,0,0 ; vmovdqa 0x972c(%rip),%ymm6 # 2d0e0 <_sk_overlay_sse2_8bit+0xb74>
+ DB 197,253,219,254 ; vpand %ymm6,%ymm0,%ymm7
+ DB 197,245,219,246 ; vpand %ymm6,%ymm1,%ymm6
+ DB 197,205,114,214,5 ; vpsrld $0x5,%ymm6,%ymm6
+ DB 197,197,114,215,5 ; vpsrld $0x5,%ymm7,%ymm7
+ DB 197,125,111,5,50,151,0,0 ; vmovdqa 0x9732(%rip),%ymm8 # 2d100 <_sk_overlay_sse2_8bit+0xb94>
+ DB 196,65,117,219,200 ; vpand %ymm8,%ymm1,%ymm9
+ DB 196,65,125,219,192 ; vpand %ymm8,%ymm0,%ymm8
+ DB 196,193,61,114,208,19 ; vpsrld $0x13,%ymm8,%ymm8
+ DB 196,193,53,114,209,19 ; vpsrld $0x13,%ymm9,%ymm9
+ DB 197,213,235,239 ; vpor %ymm7,%ymm5,%ymm5
+ DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4
+ DB 196,193,93,235,225 ; vpor %ymm9,%ymm4,%ymm4
+ DB 196,193,85,235,232 ; vpor %ymm8,%ymm5,%ymm5
+ DB 197,253,111,53,34,151,0,0 ; vmovdqa 0x9722(%rip),%ymm6 # 2d120 <_sk_overlay_sse2_8bit+0xbb4>
+ DB 196,226,85,0,238 ; vpshufb %ymm6,%ymm5,%ymm5
+ DB 196,227,253,0,237,232 ; vpermq $0xe8,%ymm5,%ymm5
+ DB 196,226,93,0,230 ; vpshufb %ymm6,%ymm4,%ymm4
+ DB 196,227,253,0,228,232 ; vpermq $0xe8,%ymm4,%ymm4
+ DB 196,227,85,56,228,1 ; vinserti128 $0x1,%xmm4,%ymm5,%ymm4
+ DB 72,133,255 ; test %rdi,%rdi
+ DB 117,10 ; jne 23a29 <_sk_store_565_hsw_8bit+0xad>
+ DB 196,129,126,127,36,88 ; vmovdqu %ymm4,(%r8,%r11,2)
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,137,249 ; mov %edi,%r9d
+ DB 65,128,225,15 ; and $0xf,%r9b
+ DB 65,254,201 ; dec %r9b
+ DB 65,128,249,14 ; cmp $0xe,%r9b
+ DB 119,236 ; ja 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 69,15,182,201 ; movzbl %r9b,%r9d
+ DB 76,141,21,176,0,0,0 ; lea 0xb0(%rip),%r10 # 23af4 <_sk_store_565_hsw_8bit+0x178>
+ DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
+ DB 76,1,208 ; add %r10,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 196,131,121,21,36,88,0 ; vpextrw $0x0,%xmm4,(%r8,%r11,2)
+ DB 235,207 ; jmp 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 196,131,121,21,100,88,4,2 ; vpextrw $0x2,%xmm4,0x4(%r8,%r11,2)
+ DB 196,129,121,126,36,88 ; vmovd %xmm4,(%r8,%r11,2)
+ DB 235,191 ; jmp 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 196,131,121,21,100,88,12,6 ; vpextrw $0x6,%xmm4,0xc(%r8,%r11,2)
+ DB 196,131,121,21,100,88,10,5 ; vpextrw $0x5,%xmm4,0xa(%r8,%r11,2)
+ DB 196,131,121,21,100,88,8,4 ; vpextrw $0x4,%xmm4,0x8(%r8,%r11,2)
+ DB 196,129,121,214,36,88 ; vmovq %xmm4,(%r8,%r11,2)
+ DB 235,159 ; jmp 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
+ DB 196,131,121,21,108,88,20,2 ; vpextrw $0x2,%xmm5,0x14(%r8,%r11,2)
+ DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
+ DB 196,131,121,21,108,88,18,1 ; vpextrw $0x1,%xmm5,0x12(%r8,%r11,2)
+ DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
+ DB 196,131,121,21,108,88,16,0 ; vpextrw $0x0,%xmm5,0x10(%r8,%r11,2)
+ DB 235,55 ; jmp 23ae9 <_sk_store_565_hsw_8bit+0x16d>
+ DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
+ DB 196,131,121,21,108,88,28,6 ; vpextrw $0x6,%xmm5,0x1c(%r8,%r11,2)
+ DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
+ DB 196,131,121,21,108,88,26,5 ; vpextrw $0x5,%xmm5,0x1a(%r8,%r11,2)
+ DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
+ DB 196,131,121,21,108,88,24,4 ; vpextrw $0x4,%xmm5,0x18(%r8,%r11,2)
+ DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
+ DB 196,129,121,214,108,88,16 ; vmovq %xmm5,0x10(%r8,%r11,2)
+ DB 196,129,122,127,36,88 ; vmovdqu %xmm4,(%r8,%r11,2)
+ DB 233,49,255,255,255 ; jmpq 23a25 <_sk_store_565_hsw_8bit+0xa9>
+ DB 89 ; pop %rcx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,106,255 ; ljmp *-0x1(%rdx)
+ DB 255 ; (bad)
+ DB 255,98,255 ; jmpq *-0x1(%rdx)
+ DB 255 ; (bad)
+ DB 255,138,255,255,255,130 ; decl -0x7d000001(%rdx)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 122,255 ; jp 23b09 <_sk_store_565_hsw_8bit+0x18d>
+ DB 255 ; (bad)
+ DB 255,114,255 ; pushq -0x1(%rdx)
+ DB 255 ; (bad)
+ DB 255,245 ; push %rbp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,174,255,255,255,160 ; ljmp *-0x5f000001(%rsi)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,146,255,255,255,232 ; callq *-0x17000001(%rdx)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 218,255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,204 ; dec %esp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 190 ; .byte 0xbe
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
+PUBLIC _sk_load_565_dst_hsw_8bit
+_sk_load_565_dst_hsw_8bit LABEL PROC
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,72,8 ; movslq 0x8(%rax),%r9
+ DB 76,99,193 ; movslq %ecx,%r8
+ DB 77,15,175,193 ; imul %r9,%r8
+ DB 77,1,192 ; add %r8,%r8
+ DB 76,3,0 ; add (%rax),%r8
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 72,133,255 ; test %rdi,%rdi
+ DB 15,133,222,0,0,0 ; jne 23c2d <_sk_load_565_dst_hsw_8bit+0xfd>
+ DB 196,129,126,111,20,88 ; vmovdqu (%r8,%r11,2),%ymm2
+ DB 196,227,125,57,211,1 ; vextracti128 $0x1,%ymm2,%xmm3
+ DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
+ DB 196,226,125,51,210 ; vpmovzxwd %xmm2,%ymm2
+ DB 196,226,125,88,37,230,142,0,0 ; vpbroadcastd 0x8ee6(%rip),%ymm4 # 2ca54 <_sk_overlay_sse2_8bit+0x4e8>
+ DB 197,237,219,236 ; vpand %ymm4,%ymm2,%ymm5
+ DB 197,229,219,228 ; vpand %ymm4,%ymm3,%ymm4
+ DB 197,221,114,212,8 ; vpsrld $0x8,%ymm4,%ymm4
+ DB 197,213,114,213,8 ; vpsrld $0x8,%ymm5,%ymm5
+ DB 196,226,125,88,53,219,142,0,0 ; vpbroadcastd 0x8edb(%rip),%ymm6 # 2ca64 <_sk_overlay_sse2_8bit+0x4f8>
+ DB 197,237,219,254 ; vpand %ymm6,%ymm2,%ymm7
+ DB 197,229,219,246 ; vpand %ymm6,%ymm3,%ymm6
+ DB 197,205,114,246,19 ; vpslld $0x13,%ymm6,%ymm6
+ DB 197,197,114,247,19 ; vpslld $0x13,%ymm7,%ymm7
+ DB 197,213,235,239 ; vpor %ymm7,%ymm5,%ymm5
+ DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4
+ DB 197,205,114,212,5 ; vpsrld $0x5,%ymm4,%ymm6
+ DB 197,197,114,213,5 ; vpsrld $0x5,%ymm5,%ymm7
+ DB 196,98,125,88,5,182,143,0,0 ; vpbroadcastd 0x8fb6(%rip),%ymm8 # 2cb6c <_sk_overlay_sse2_8bit+0x600>
+ DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7
+ DB 196,193,77,219,240 ; vpand %ymm8,%ymm6,%ymm6
+ DB 196,98,125,88,5,147,142,0,0 ; vpbroadcastd 0x8e93(%rip),%ymm8 # 2ca5c <_sk_overlay_sse2_8bit+0x4f0>
+ DB 196,65,101,219,200 ; vpand %ymm8,%ymm3,%ymm9
+ DB 196,65,109,219,192 ; vpand %ymm8,%ymm2,%ymm8
+ DB 196,193,61,114,240,5 ; vpslld $0x5,%ymm8,%ymm8
+ DB 196,193,53,114,241,5 ; vpslld $0x5,%ymm9,%ymm9
+ DB 196,98,125,88,21,136,143,0,0 ; vpbroadcastd 0x8f88(%rip),%ymm10 # 2cb70 <_sk_overlay_sse2_8bit+0x604>
+ DB 196,193,101,219,218 ; vpand %ymm10,%ymm3,%ymm3
+ DB 196,193,109,219,210 ; vpand %ymm10,%ymm2,%ymm2
+ DB 197,237,114,210,1 ; vpsrld $0x1,%ymm2,%ymm2
+ DB 197,229,114,211,1 ; vpsrld $0x1,%ymm3,%ymm3
+ DB 196,193,101,235,217 ; vpor %ymm9,%ymm3,%ymm3
+ DB 196,193,109,235,208 ; vpor %ymm8,%ymm2,%ymm2
+ DB 196,98,125,88,5,101,143,0,0 ; vpbroadcastd 0x8f65(%rip),%ymm8 # 2cb74 <_sk_overlay_sse2_8bit+0x608>
+ DB 197,237,235,213 ; vpor %ymm5,%ymm2,%ymm2
+ DB 197,229,235,220 ; vpor %ymm4,%ymm3,%ymm3
+ DB 196,193,109,235,208 ; vpor %ymm8,%ymm2,%ymm2
+ DB 197,197,235,210 ; vpor %ymm2,%ymm7,%ymm2
+ DB 196,193,101,235,216 ; vpor %ymm8,%ymm3,%ymm3
+ DB 197,205,235,219 ; vpor %ymm3,%ymm6,%ymm3
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,137,249 ; mov %edi,%r9d
+ DB 65,128,225,15 ; and $0xf,%r9b
+ DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
+ DB 65,254,201 ; dec %r9b
+ DB 65,128,249,14 ; cmp $0xe,%r9b
+ DB 15,135,16,255,255,255 ; ja 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 69,15,182,201 ; movzbl %r9b,%r9d
+ DB 76,141,21,28,1,0,0 ; lea 0x11c(%rip),%r10 # 23d6c <_sk_load_565_dst_hsw_8bit+0x23c>
+ DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
+ DB 76,1,208 ; add %r10,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
+ DB 197,249,110,208 ; vmovd %eax,%xmm2
+ DB 233,238,254,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,129,105,196,92,88,4,2 ; vpinsrw $0x2,0x4(%r8,%r11,2),%xmm2,%xmm3
+ DB 196,227,101,56,210,1 ; vinserti128 $0x1,%xmm2,%ymm3,%ymm2
+ DB 196,129,121,110,28,88 ; vmovd (%r8,%r11,2),%xmm3
+ DB 196,227,109,2,211,1 ; vpblendd $0x1,%ymm3,%ymm2,%ymm2
+ DB 233,203,254,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,129,105,196,92,88,12,6 ; vpinsrw $0x6,0xc(%r8,%r11,2),%xmm2,%xmm3
+ DB 196,227,101,56,210,1 ; vinserti128 $0x1,%xmm2,%ymm3,%ymm2
+ DB 196,129,105,196,92,88,10,5 ; vpinsrw $0x5,0xa(%r8,%r11,2),%xmm2,%xmm3
+ DB 196,227,109,2,211,15 ; vpblendd $0xf,%ymm3,%ymm2,%ymm2
+ DB 196,129,105,196,92,88,8,4 ; vpinsrw $0x4,0x8(%r8,%r11,2),%xmm2,%xmm3
+ DB 196,227,109,2,211,15 ; vpblendd $0xf,%ymm3,%ymm2,%ymm2
+ DB 196,129,122,126,28,88 ; vmovq (%r8,%r11,2),%xmm3
+ DB 196,227,109,2,211,3 ; vpblendd $0x3,%ymm3,%ymm2,%ymm2
+ DB 233,140,254,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,129,105,196,92,88,20,2 ; vpinsrw $0x2,0x14(%r8,%r11,2),%xmm2,%xmm3
+ DB 196,227,109,56,211,1 ; vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ DB 196,227,125,57,211,1 ; vextracti128 $0x1,%ymm2,%xmm3
+ DB 196,129,97,196,92,88,18,1 ; vpinsrw $0x1,0x12(%r8,%r11,2),%xmm3,%xmm3
+ DB 196,227,109,56,211,1 ; vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ DB 196,227,125,57,211,1 ; vextracti128 $0x1,%ymm2,%xmm3
+ DB 196,129,97,196,92,88,16,0 ; vpinsrw $0x0,0x10(%r8,%r11,2),%xmm3,%xmm3
+ DB 196,227,109,56,211,1 ; vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ DB 196,129,122,111,28,88 ; vmovdqu (%r8,%r11,2),%xmm3
+ DB 196,227,101,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm3,%ymm2
+ DB 233,65,254,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,129,105,196,92,88,28,6 ; vpinsrw $0x6,0x1c(%r8,%r11,2),%xmm2,%xmm3
+ DB 196,227,109,56,211,1 ; vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ DB 196,227,125,57,211,1 ; vextracti128 $0x1,%ymm2,%xmm3
+ DB 196,129,97,196,92,88,26,5 ; vpinsrw $0x5,0x1a(%r8,%r11,2),%xmm3,%xmm3
+ DB 196,227,109,56,211,1 ; vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ DB 196,227,125,57,211,1 ; vextracti128 $0x1,%ymm2,%xmm3
+ DB 196,129,97,196,92,88,24,4 ; vpinsrw $0x4,0x18(%r8,%r11,2),%xmm3,%xmm3
+ DB 196,227,109,56,211,1 ; vinserti128 $0x1,%xmm3,%ymm2,%ymm2
+ DB 196,129,122,126,92,88,16 ; vmovq 0x10(%r8,%r11,2),%xmm3
+ DB 196,129,122,111,36,88 ; vmovdqu (%r8,%r11,2),%xmm4
+ DB 196,227,93,56,219,1 ; vinserti128 $0x1,%xmm3,%ymm4,%ymm3
+ DB 196,227,101,2,210,192 ; vpblendd $0xc0,%ymm2,%ymm3,%ymm2
+ DB 233,233,253,255,255 ; jmpq 23b55 <_sk_load_565_dst_hsw_8bit+0x25>
+ DB 237 ; in (%dx),%eax
+ DB 254 ; (bad)
+ DB 255 ; (bad)
+ DB 255,13,255,255,255,251 ; decl -0x4000001(%rip) # fffffffffc023d74 <_sk_overlay_sse2_8bit+0xfffffffffbff7808>
+ DB 254 ; (bad)
+ DB 255 ; (bad)
+ DB 255,76,255,255 ; decl -0x1(%rdi,%rdi,8)
+ DB 255 ; (bad)
+ DB 62,255 ; ds (bad)
+ DB 255 ; (bad)
+ DB 255,48 ; pushq (%rax)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,30 ; lcall *(%rsi)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,151,255,255,255,131 ; callq *-0x7c000001(%rdi)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,111,255 ; ljmp *-0x1(%rdi)
+ DB 255 ; (bad)
+ DB 255,93,255 ; lcall *-0x1(%rbp)
+ DB 255 ; (bad)
+ DB 255,226 ; jmpq *%rdx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,206 ; dec %esi
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 186,255,255,255,168 ; mov $0xa8ffffff,%edx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
PUBLIC _sk_load_a8_hsw_8bit
_sk_load_a8_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33935,7 +34191,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 239b7 <_sk_load_a8_hsw_8bit+0x3b>
+ DB 117,35 ; jne 23de3 <_sk_load_a8_hsw_8bit+0x3b>
DB 196,129,122,111,4,24 ; vmovdqu (%r8,%r11,1),%xmm0
DB 197,249,112,200,78 ; vpshufd $0x4e,%xmm0,%xmm1
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
@@ -33949,35 +34205,35 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,207 ; ja 2399a <_sk_load_a8_hsw_8bit+0x1e>
+ DB 119,207 ; ja 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 23a98 <_sk_load_a8_hsw_8bit+0x11c>
+ DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 23ec4 <_sk_load_a8_hsw_8bit+0x11c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,176 ; jmp 2399a <_sk_load_a8_hsw_8bit+0x1e>
+ DB 235,176 ; jmp 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm0,%xmm0
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 235,147 ; jmp 2399a <_sk_load_a8_hsw_8bit+0x1e>
+ DB 235,147 ; jmp 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm0,%xmm0
DB 196,129,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,102,255,255,255 ; jmpq 2399a <_sk_load_a8_hsw_8bit+0x1e>
+ DB 233,102,255,255,255 ; jmpq 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm0,%xmm0
DB 196,129,122,126,12,24 ; vmovq (%r8,%r11,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,57,255,255,255 ; jmpq 2399a <_sk_load_a8_hsw_8bit+0x1e>
+ DB 233,57,255,255,255 ; jmpq 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm0,%xmm0
@@ -33985,7 +34241,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 196,129,122,126,12,24 ; vmovq (%r8,%r11,1),%xmm1
DB 196,131,113,34,76,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,4,255,255,255 ; jmpq 2399a <_sk_load_a8_hsw_8bit+0x1e>
+ DB 233,4,255,255,255 ; jmpq 23dc6 <_sk_load_a8_hsw_8bit+0x1e>
DB 102,144 ; xchg %ax,%ax
DB 71,255 ; rex.RXB (bad)
DB 255 ; (bad)
@@ -33997,7 +34253,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 123,255 ; jnp 23aad <_sk_load_a8_hsw_8bit+0x131>
+ DB 123,255 ; jnp 23ed9 <_sk_load_a8_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,111,255 ; ljmp *-0x1(%rdi)
DB 255 ; (bad)
@@ -34031,7 +34287,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 23b0f <_sk_load_a8_dst_hsw_8bit+0x3b>
+ DB 117,35 ; jne 23f3b <_sk_load_a8_dst_hsw_8bit+0x3b>
DB 196,129,122,111,20,24 ; vmovdqu (%r8,%r11,1),%xmm2
DB 197,249,112,218,78 ; vpshufd $0x4e,%xmm2,%xmm3
DB 196,226,125,49,219 ; vpmovzxbd %xmm3,%ymm3
@@ -34045,35 +34301,35 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,207 ; ja 23af2 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 119,207 ; ja 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 23bf0 <_sk_load_a8_dst_hsw_8bit+0x11c>
+ DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 2401c <_sk_load_a8_dst_hsw_8bit+0x11c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,176 ; jmp 23af2 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 235,176 ; jmp 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm2,%xmm2
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 235,147 ; jmp 23af2 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 235,147 ; jmp 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm2,%xmm2
DB 196,129,121,110,28,24 ; vmovd (%r8,%r11,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,102,255,255,255 ; jmpq 23af2 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 233,102,255,255,255 ; jmpq 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm2,%xmm2
DB 196,129,122,126,28,24 ; vmovq (%r8,%r11,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,57,255,255,255 ; jmpq 23af2 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 233,57,255,255,255 ; jmpq 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm2,%xmm2
@@ -34081,7 +34337,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 196,129,122,126,28,24 ; vmovq (%r8,%r11,1),%xmm3
DB 196,131,97,34,92,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,4,255,255,255 ; jmpq 23af2 <_sk_load_a8_dst_hsw_8bit+0x1e>
+ DB 233,4,255,255,255 ; jmpq 23f1e <_sk_load_a8_dst_hsw_8bit+0x1e>
DB 102,144 ; xchg %ax,%ax
DB 71,255 ; rex.RXB (bad)
DB 255 ; (bad)
@@ -34093,7 +34349,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 123,255 ; jnp 23c05 <_sk_load_a8_dst_hsw_8bit+0x131>
+ DB 123,255 ; jnp 24031 <_sk_load_a8_dst_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,111,255 ; ljmp *-0x1(%rdi)
DB 255 ; (bad)
@@ -34126,17 +34382,17 @@ _sk_store_a8_hsw_8bit LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 197,253,111,37,185,138,0,0 ; vmovdqa 0x8ab9(%rip),%ymm4 # 2c700 <_sk_overlay_sse2_8bit+0xb50>
+ DB 197,253,111,37,205,144,0,0 ; vmovdqa 0x90cd(%rip),%ymm4 # 2d140 <_sk_overlay_sse2_8bit+0xbd4>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,227,253,0,237,232 ; vpermq $0xe8,%ymm5,%ymm5
- DB 197,249,111,53,230,148,0,0 ; vmovdqa 0x94e6(%rip),%xmm6 # 2d140 <_sk_overlay_sse2_8bit+0x1590>
+ DB 197,249,111,53,250,154,0,0 ; vmovdqa 0x9afa(%rip),%xmm6 # 2db80 <_sk_overlay_sse2_8bit+0x1614>
DB 196,226,81,0,238 ; vpshufb %xmm6,%xmm5,%xmm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,227,253,0,228,232 ; vpermq $0xe8,%ymm4,%ymm4
DB 196,226,89,0,230 ; vpshufb %xmm6,%xmm4,%xmm4
DB 197,217,108,229 ; vpunpcklqdq %xmm5,%xmm4,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,10 ; jne 23c82 <_sk_store_a8_hsw_8bit+0x56>
+ DB 117,10 ; jne 240ae <_sk_store_a8_hsw_8bit+0x56>
DB 196,129,122,127,36,24 ; vmovdqu %xmm4,(%r8,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -34144,34 +34400,34 @@ _sk_store_a8_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,236 ; ja 23c7e <_sk_store_a8_hsw_8bit+0x52>
+ DB 119,236 ; ja 240aa <_sk_store_a8_hsw_8bit+0x52>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,139,0,0,0 ; lea 0x8b(%rip),%r10 # 23d28 <_sk_store_a8_hsw_8bit+0xfc>
+ DB 76,141,21,139,0,0,0 ; lea 0x8b(%rip),%r10 # 24154 <_sk_store_a8_hsw_8bit+0xfc>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,131,121,20,36,24,0 ; vpextrb $0x0,%xmm4,(%r8,%r11,1)
- DB 235,207 ; jmp 23c7e <_sk_store_a8_hsw_8bit+0x52>
+ DB 235,207 ; jmp 240aa <_sk_store_a8_hsw_8bit+0x52>
DB 196,131,121,20,100,24,2,2 ; vpextrb $0x2,%xmm4,0x2(%r8,%r11,1)
DB 196,131,121,21,36,24,0 ; vpextrw $0x0,%xmm4,(%r8,%r11,1)
- DB 235,190 ; jmp 23c7e <_sk_store_a8_hsw_8bit+0x52>
+ DB 235,190 ; jmp 240aa <_sk_store_a8_hsw_8bit+0x52>
DB 196,131,121,20,100,24,6,6 ; vpextrb $0x6,%xmm4,0x6(%r8,%r11,1)
DB 196,131,121,20,100,24,5,5 ; vpextrb $0x5,%xmm4,0x5(%r8,%r11,1)
DB 196,131,121,20,100,24,4,4 ; vpextrb $0x4,%xmm4,0x4(%r8,%r11,1)
DB 196,129,121,126,36,24 ; vmovd %xmm4,(%r8,%r11,1)
- DB 235,158 ; jmp 23c7e <_sk_store_a8_hsw_8bit+0x52>
+ DB 235,158 ; jmp 240aa <_sk_store_a8_hsw_8bit+0x52>
DB 196,131,121,20,100,24,10,10 ; vpextrb $0xa,%xmm4,0xa(%r8,%r11,1)
DB 196,131,121,20,100,24,9,9 ; vpextrb $0x9,%xmm4,0x9(%r8,%r11,1)
DB 196,131,121,20,100,24,8,8 ; vpextrb $0x8,%xmm4,0x8(%r8,%r11,1)
- DB 235,32 ; jmp 23d1a <_sk_store_a8_hsw_8bit+0xee>
+ DB 235,32 ; jmp 24146 <_sk_store_a8_hsw_8bit+0xee>
DB 196,131,121,20,100,24,14,14 ; vpextrb $0xe,%xmm4,0xe(%r8,%r11,1)
DB 196,131,121,20,100,24,13,13 ; vpextrb $0xd,%xmm4,0xd(%r8,%r11,1)
DB 196,131,121,20,100,24,12,12 ; vpextrb $0xc,%xmm4,0xc(%r8,%r11,1)
DB 196,131,121,22,100,24,8,2 ; vpextrd $0x2,%xmm4,0x8(%r8,%r11,1)
DB 196,129,121,214,36,24 ; vmovq %xmm4,(%r8,%r11,1)
- DB 233,89,255,255,255 ; jmpq 23c7e <_sk_store_a8_hsw_8bit+0x52>
+ DB 233,89,255,255,255 ; jmpq 240aa <_sk_store_a8_hsw_8bit+0x52>
DB 15,31,0 ; nopl (%rax)
- DB 126,255 ; jle 23d29 <_sk_store_a8_hsw_8bit+0xfd>
+ DB 126,255 ; jle 24155 <_sk_store_a8_hsw_8bit+0xfd>
DB 255 ; (bad)
DB 255,143,255,255,255,135 ; decl -0x78000001(%rdi)
DB 255 ; (bad)
@@ -34215,15 +34471,15 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,61 ; jne 23db9 <_sk_load_g8_hsw_8bit+0x55>
+ DB 117,61 ; jne 241e5 <_sk_load_g8_hsw_8bit+0x55>
DB 196,129,122,111,4,24 ; vmovdqu (%r8,%r11,1),%xmm0
DB 196,226,125,49,200 ; vpmovzxbd %xmm0,%ymm1
DB 197,249,112,192,78 ; vpshufd $0x4e,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
- DB 196,226,125,88,37,22,132,0,0 ; vpbroadcastd 0x8416(%rip),%ymm4 # 2c1b0 <_sk_overlay_sse2_8bit+0x600>
+ DB 196,226,125,88,37,178,137,0,0 ; vpbroadcastd 0x89b2(%rip),%ymm4 # 2cb78 <_sk_overlay_sse2_8bit+0x60c>
DB 196,226,125,64,236 ; vpmulld %ymm4,%ymm0,%ymm5
DB 196,226,117,64,196 ; vpmulld %ymm4,%ymm1,%ymm0
- DB 196,226,125,88,13,7,132,0,0 ; vpbroadcastd 0x8407(%rip),%ymm1 # 2c1b4 <_sk_overlay_sse2_8bit+0x604>
+ DB 196,226,125,88,13,155,137,0,0 ; vpbroadcastd 0x899b(%rip),%ymm1 # 2cb74 <_sk_overlay_sse2_8bit+0x608>
DB 197,253,235,193 ; vpor %ymm1,%ymm0,%ymm0
DB 197,213,235,201 ; vpor %ymm1,%ymm5,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -34233,35 +34489,35 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,181 ; ja 23d82 <_sk_load_g8_hsw_8bit+0x1e>
+ DB 119,181 ; ja 241ae <_sk_load_g8_hsw_8bit+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,196,0,0,0 ; lea 0xc4(%rip),%r10 # 23e9c <_sk_load_g8_hsw_8bit+0x138>
+ DB 76,141,21,196,0,0,0 ; lea 0xc4(%rip),%r10 # 242c8 <_sk_load_g8_hsw_8bit+0x138>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,150 ; jmp 23d82 <_sk_load_g8_hsw_8bit+0x1e>
+ DB 235,150 ; jmp 241ae <_sk_load_g8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm0,%xmm0
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 233,118,255,255,255 ; jmpq 23d82 <_sk_load_g8_hsw_8bit+0x1e>
+ DB 233,118,255,255,255 ; jmpq 241ae <_sk_load_g8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm0,%xmm0
DB 196,129,121,110,12,24 ; vmovd (%r8,%r11,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,73,255,255,255 ; jmpq 23d82 <_sk_load_g8_hsw_8bit+0x1e>
+ DB 233,73,255,255,255 ; jmpq 241ae <_sk_load_g8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm0,%xmm0
DB 196,129,122,126,12,24 ; vmovq (%r8,%r11,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,28,255,255,255 ; jmpq 23d82 <_sk_load_g8_hsw_8bit+0x1e>
+ DB 233,28,255,255,255 ; jmpq 241ae <_sk_load_g8_hsw_8bit+0x1e>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,131,121,32,68,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm0,%xmm0
DB 196,131,121,32,68,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm0,%xmm0
@@ -34269,7 +34525,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 196,129,122,126,12,24 ; vmovq (%r8,%r11,1),%xmm1
DB 196,131,113,34,76,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,231,254,255,255 ; jmpq 23d82 <_sk_load_g8_hsw_8bit+0x1e>
+ DB 233,231,254,255,255 ; jmpq 241ae <_sk_load_g8_hsw_8bit+0x1e>
DB 144 ; nop
DB 69,255 ; rex.RB (bad)
DB 255 ; (bad)
@@ -34279,7 +34535,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 255,140,255,255,255,132,255 ; decl -0x7b0001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 124,255 ; jl 23eb1 <_sk_load_g8_hsw_8bit+0x14d>
+ DB 124,255 ; jl 242dd <_sk_load_g8_hsw_8bit+0x14d>
DB 255 ; (bad)
DB 255,112,255 ; pushq -0x1(%rax)
DB 255 ; (bad)
@@ -34313,15 +34569,15 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,61 ; jne 23f2d <_sk_load_g8_dst_hsw_8bit+0x55>
+ DB 117,61 ; jne 24359 <_sk_load_g8_dst_hsw_8bit+0x55>
DB 196,129,122,111,20,24 ; vmovdqu (%r8,%r11,1),%xmm2
DB 196,226,125,49,218 ; vpmovzxbd %xmm2,%ymm3
DB 197,249,112,210,78 ; vpshufd $0x4e,%xmm2,%xmm2
DB 196,226,125,49,210 ; vpmovzxbd %xmm2,%ymm2
- DB 196,226,125,88,37,162,130,0,0 ; vpbroadcastd 0x82a2(%rip),%ymm4 # 2c1b0 <_sk_overlay_sse2_8bit+0x600>
+ DB 196,226,125,88,37,62,136,0,0 ; vpbroadcastd 0x883e(%rip),%ymm4 # 2cb78 <_sk_overlay_sse2_8bit+0x60c>
DB 196,226,109,64,236 ; vpmulld %ymm4,%ymm2,%ymm5
DB 196,226,101,64,212 ; vpmulld %ymm4,%ymm3,%ymm2
- DB 196,226,125,88,29,147,130,0,0 ; vpbroadcastd 0x8293(%rip),%ymm3 # 2c1b4 <_sk_overlay_sse2_8bit+0x604>
+ DB 196,226,125,88,29,39,136,0,0 ; vpbroadcastd 0x8827(%rip),%ymm3 # 2cb74 <_sk_overlay_sse2_8bit+0x608>
DB 197,237,235,211 ; vpor %ymm3,%ymm2,%ymm2
DB 197,213,235,219 ; vpor %ymm3,%ymm5,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -34331,35 +34587,35 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,181 ; ja 23ef6 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 119,181 ; ja 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,196,0,0,0 ; lea 0xc4(%rip),%r10 # 24010 <_sk_load_g8_dst_hsw_8bit+0x138>
+ DB 76,141,21,196,0,0,0 ; lea 0xc4(%rip),%r10 # 2443c <_sk_load_g8_dst_hsw_8bit+0x138>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,150 ; jmp 23ef6 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 235,150 ; jmp 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm2,%xmm2
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 233,118,255,255,255 ; jmpq 23ef6 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 233,118,255,255,255 ; jmpq 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm2,%xmm2
DB 196,129,121,110,28,24 ; vmovd (%r8,%r11,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,73,255,255,255 ; jmpq 23ef6 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 233,73,255,255,255 ; jmpq 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm2,%xmm2
DB 196,129,122,126,28,24 ; vmovq (%r8,%r11,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,28,255,255,255 ; jmpq 23ef6 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 233,28,255,255,255 ; jmpq 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,131,105,32,84,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm2,%xmm2
DB 196,131,105,32,84,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm2,%xmm2
@@ -34367,7 +34623,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 196,129,122,126,28,24 ; vmovq (%r8,%r11,1),%xmm3
DB 196,131,97,34,92,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,231,254,255,255 ; jmpq 23ef6 <_sk_load_g8_dst_hsw_8bit+0x1e>
+ DB 233,231,254,255,255 ; jmpq 24322 <_sk_load_g8_dst_hsw_8bit+0x1e>
DB 144 ; nop
DB 69,255 ; rex.RB (bad)
DB 255 ; (bad)
@@ -34377,7 +34633,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 255,140,255,255,255,132,255 ; decl -0x7b0001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 124,255 ; jl 24025 <_sk_load_g8_dst_hsw_8bit+0x14d>
+ DB 124,255 ; jl 24451 <_sk_load_g8_dst_hsw_8bit+0x14d>
DB 255 ; (bad)
DB 255,112,255 ; pushq -0x1(%rax)
DB 255 ; (bad)
@@ -34412,10 +34668,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,222,0,0,0 ; jne 2414a <_sk_srcover_rgba_8888_hsw_8bit+0xfe>
+ DB 15,133,222,0,0,0 ; jne 24576 <_sk_srcover_rgba_8888_hsw_8bit+0xfe>
DB 196,1,126,111,76,152,32 ; vmovdqu 0x20(%r8,%r11,4),%ymm9
DB 196,1,126,111,28,152 ; vmovdqu (%r8,%r11,4),%ymm11
- DB 197,253,111,53,159,134,0,0 ; vmovdqa 0x869f(%rip),%ymm6 # 2c720 <_sk_overlay_sse2_8bit+0xb70>
+ DB 197,253,111,53,179,140,0,0 ; vmovdqa 0x8cb3(%rip),%ymm6 # 2d160 <_sk_overlay_sse2_8bit+0xbf4>
DB 196,226,117,0,254 ; vpshufb %ymm6,%ymm1,%ymm7
DB 196,226,125,0,246 ; vpshufb %ymm6,%ymm0,%ymm6
DB 196,66,125,48,195 ; vpmovzxbw %xmm11,%ymm8
@@ -34453,7 +34709,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 197,221,252,224 ; vpaddb %ymm0,%ymm4,%ymm4
DB 197,213,252,233 ; vpaddb %ymm1,%ymm5,%ymm5
DB 72,133,255 ; test %rdi,%rdi
- DB 117,78 ; jne 24187 <_sk_srcover_rgba_8888_hsw_8bit+0x13b>
+ DB 117,78 ; jne 245b3 <_sk_srcover_rgba_8888_hsw_8bit+0x13b>
DB 196,129,126,127,36,152 ; vmovdqu %ymm4,(%r8,%r11,4)
DB 196,129,126,127,108,152,32 ; vmovdqu %ymm5,0x20(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -34464,26 +34720,26 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,65,37,239,219 ; vpxor %ymm11,%ymm11,%ymm11
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,17,255,255,255 ; ja 24079 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 15,135,17,255,255,255 ; ja 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,237,1,0,0 ; lea 0x1ed(%rip),%r10 # 24360 <_sk_srcover_rgba_8888_hsw_8bit+0x314>
+ DB 76,141,21,237,1,0,0 ; lea 0x1ed(%rip),%r10 # 2478c <_sk_srcover_rgba_8888_hsw_8bit+0x314>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,1,121,110,28,152 ; vmovd (%r8,%r11,4),%xmm11
- DB 233,242,254,255,255 ; jmpq 24079 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 233,242,254,255,255 ; jmpq 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,175 ; ja 24146 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 119,175 ; ja 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 76,141,13,250,1,0,0 ; lea 0x1fa(%rip),%r9 # 2439c <_sk_srcover_rgba_8888_hsw_8bit+0x350>
+ DB 76,141,13,250,1,0,0 ; lea 0x1fa(%rip),%r9 # 247c8 <_sk_srcover_rgba_8888_hsw_8bit+0x350>
DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
DB 196,129,121,126,36,152 ; vmovd %xmm4,(%r8,%r11,4)
- DB 235,147 ; jmp 24146 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 235,147 ; jmp 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 196,129,121,110,100,152,8 ; vmovd 0x8(%r8,%r11,4),%xmm4
DB 196,226,121,89,236 ; vpbroadcastq %xmm4,%xmm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -34491,7 +34747,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,130,121,53,52,152 ; vpmovzxdq (%r8,%r11,4),%xmm6
DB 197,249,112,246,232 ; vpshufd $0xe8,%xmm6,%xmm6
DB 196,99,37,2,222,3 ; vpblendd $0x3,%ymm6,%ymm11,%ymm11
- DB 233,153,254,255,255 ; jmpq 24079 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 233,153,254,255,255 ; jmpq 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 196,129,121,110,100,152,24 ; vmovd 0x18(%r8,%r11,4),%xmm4
DB 196,226,125,89,236 ; vpbroadcastq %xmm4,%ymm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -34504,7 +34760,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,37,56,222,1 ; vinserti128 $0x1,%xmm6,%ymm11,%ymm11
DB 196,129,122,111,52,152 ; vmovdqu (%r8,%r11,4),%xmm6
DB 196,67,77,2,219,240 ; vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- DB 233,73,254,255,255 ; jmpq 24079 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 233,73,254,255,255 ; jmpq 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 196,129,121,110,100,152,40 ; vmovd 0x28(%r8,%r11,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -34513,7 +34769,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,53,2,205,15 ; vpblendd $0xf,%ymm5,%ymm9,%ymm9
DB 196,129,121,110,108,152,32 ; vmovd 0x20(%r8,%r11,4),%xmm5
DB 196,99,53,2,205,1 ; vpblendd $0x1,%ymm5,%ymm9,%ymm9
- DB 233,13,254,255,255 ; jmpq 24073 <_sk_srcover_rgba_8888_hsw_8bit+0x27>
+ DB 233,13,254,255,255 ; jmpq 2449f <_sk_srcover_rgba_8888_hsw_8bit+0x27>
DB 196,129,121,110,100,152,56 ; vmovd 0x38(%r8,%r11,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -34527,10 +34783,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,1,126,111,28,152 ; vmovdqu (%r8,%r11,4),%ymm11
DB 196,129,122,111,116,152,32 ; vmovdqu 0x20(%r8,%r11,4),%xmm6
DB 196,67,77,2,201,240 ; vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- DB 233,189,253,255,255 ; jmpq 24079 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
+ DB 233,189,253,255,255 ; jmpq 244a5 <_sk_srcover_rgba_8888_hsw_8bit+0x2d>
DB 196,131,121,22,100,152,8,2 ; vpextrd $0x2,%xmm4,0x8(%r8,%r11,4)
DB 196,129,121,214,36,152 ; vmovq %xmm4,(%r8,%r11,4)
- DB 233,119,254,255,255 ; jmpq 24146 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 233,119,254,255,255 ; jmpq 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,131,121,22,108,152,24,2 ; vpextrd $0x2,%xmm5,0x18(%r8,%r11,4)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -34538,12 +34794,12 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,129,121,126,108,152,16 ; vmovd %xmm5,0x10(%r8,%r11,4)
DB 196,129,122,127,36,152 ; vmovdqu %xmm4,(%r8,%r11,4)
- DB 233,67,254,255,255 ; jmpq 24146 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 233,67,254,255,255 ; jmpq 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 196,131,121,22,108,152,40,2 ; vpextrd $0x2,%xmm5,0x28(%r8,%r11,4)
DB 196,131,121,22,108,152,36,1 ; vpextrd $0x1,%xmm5,0x24(%r8,%r11,4)
DB 196,129,121,126,108,152,32 ; vmovd %xmm5,0x20(%r8,%r11,4)
DB 196,129,126,127,36,152 ; vmovdqu %ymm4,(%r8,%r11,4)
- DB 233,33,254,255,255 ; jmpq 24146 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 233,33,254,255,255 ; jmpq 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
DB 196,131,121,22,116,152,56,2 ; vpextrd $0x2,%xmm6,0x38(%r8,%r11,4)
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
@@ -34552,7 +34808,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,129,121,126,116,152,48 ; vmovd %xmm6,0x30(%r8,%r11,4)
DB 196,129,126,127,36,152 ; vmovdqu %ymm4,(%r8,%r11,4)
DB 196,129,122,127,108,152,32 ; vmovdqu %xmm5,0x20(%r8,%r11,4)
- DB 233,230,253,255,255 ; jmpq 24146 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
+ DB 233,230,253,255,255 ; jmpq 24572 <_sk_srcover_rgba_8888_hsw_8bit+0xfa>
DB 28,254 ; sbb $0xfe,%al
DB 255 ; (bad)
DB 255,106,254 ; ljmp *-0x2(%rdx)
@@ -34605,7 +34861,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 126,255 ; jle 243b9 <_sk_srcover_rgba_8888_hsw_8bit+0x36d>
+ DB 126,255 ; jle 247e5 <_sk_srcover_rgba_8888_hsw_8bit+0x36d>
DB 255 ; (bad)
DB 255,119,255 ; pushq -0x1(%rdi)
DB 255 ; (bad)
@@ -34625,7 +34881,7 @@ PUBLIC _sk_scale_1_float_hsw_8bit
_sk_scale_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,102,124,0,0 ; vmulss 0x7c66(%rip),%xmm4,%xmm4 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 197,218,89,37,246,129,0,0 ; vmulss 0x81f6(%rip),%xmm4,%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -34635,7 +34891,7 @@ _sk_scale_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,37,37,131,0,0 ; vpand 0x8325(%rip),%ymm4,%ymm4 # 2c740 <_sk_overlay_sse2_8bit+0xb90>
+ DB 197,221,219,37,57,137,0,0 ; vpand 0x8939(%rip),%ymm4,%ymm4 # 2d180 <_sk_overlay_sse2_8bit+0xc14>
DB 197,221,213,249 ; vpmullw %ymm1,%ymm4,%ymm7
DB 197,93,213,198 ; vpmullw %ymm6,%ymm4,%ymm8
DB 197,93,213,200 ; vpmullw %ymm0,%ymm4,%ymm9
@@ -34666,12 +34922,12 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,191,0,0,0 ; jne 2454e <_sk_scale_u8_hsw_8bit+0xdb>
+ DB 15,133,191,0,0,0 ; jne 2497a <_sk_scale_u8_hsw_8bit+0xdb>
DB 196,129,122,111,36,24 ; vmovdqu (%r8,%r11,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,180,130,0,0 ; vmovdqa 0x82b4(%rip),%ymm6 # 2c760 <_sk_overlay_sse2_8bit+0xbb0>
+ DB 197,253,111,53,200,136,0,0 ; vmovdqa 0x88c8(%rip),%ymm6 # 2d1a0 <_sk_overlay_sse2_8bit+0xc34>
DB 196,226,93,0,230 ; vpshufb %ymm6,%ymm4,%ymm4
DB 196,226,85,0,238 ; vpshufb %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34711,35 +34967,35 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,47,255,255,255 ; ja 24495 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 15,135,47,255,255,255 ; ja 248c1 <_sk_scale_u8_hsw_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,199,0,0,0 ; lea 0xc7(%rip),%r10 # 24638 <_sk_scale_u8_hsw_8bit+0x1c5>
+ DB 76,141,21,199,0,0,0 ; lea 0xc7(%rip),%r10 # 24a64 <_sk_scale_u8_hsw_8bit+0x1c5>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,13,255,255,255 ; jmpq 24495 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,13,255,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm4,%xmm4
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,237,254,255,255 ; jmpq 24495 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,237,254,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm4,%xmm4
DB 196,129,121,110,44,24 ; vmovd (%r8,%r11,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,192,254,255,255 ; jmpq 24495 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,192,254,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm4,%xmm4
DB 196,129,122,126,44,24 ; vmovq (%r8,%r11,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,147,254,255,255 ; jmpq 24495 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,147,254,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm4,%xmm4
@@ -34747,7 +35003,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 196,129,122,126,44,24 ; vmovq (%r8,%r11,1),%xmm5
DB 196,131,81,34,108,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,94,254,255,255 ; jmpq 24495 <_sk_scale_u8_hsw_8bit+0x22>
+ DB 233,94,254,255,255 ; jmpq 248c1 <_sk_scale_u8_hsw_8bit+0x22>
DB 144 ; nop
DB 66,255 ; rex.X (bad)
DB 255 ; (bad)
@@ -34757,7 +35013,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 255,140,255,255,255,132,255 ; decl -0x7b0001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 124,255 ; jl 2464d <_sk_scale_u8_hsw_8bit+0x1da>
+ DB 124,255 ; jl 24a79 <_sk_scale_u8_hsw_8bit+0x1da>
DB 255 ; (bad)
DB 255,112,255 ; pushq -0x1(%rax)
DB 255 ; (bad)
@@ -34786,7 +35042,7 @@ PUBLIC _sk_lerp_1_float_hsw_8bit
_sk_lerp_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,202,121,0,0 ; vmulss 0x79ca(%rip),%xmm4,%xmm4 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 197,218,89,37,90,127,0,0 ; vmulss 0x7f5a(%rip),%xmm4,%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -34796,7 +35052,7 @@ _sk_lerp_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,61,201,128,0,0 ; vpand 0x80c9(%rip),%ymm4,%ymm7 # 2c780 <_sk_overlay_sse2_8bit+0xbd0>
+ DB 197,221,219,61,221,134,0,0 ; vpand 0x86dd(%rip),%ymm4,%ymm7 # 2d1c0 <_sk_overlay_sse2_8bit+0xc54>
DB 197,69,213,193 ; vpmullw %ymm1,%ymm7,%ymm8
DB 197,69,213,206 ; vpmullw %ymm6,%ymm7,%ymm9
DB 197,69,213,208 ; vpmullw %ymm0,%ymm7,%ymm10
@@ -34858,12 +35114,12 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,106,1,0,0 ; jne 2492a <_sk_lerp_u8_hsw_8bit+0x186>
+ DB 15,133,106,1,0,0 ; jne 24d56 <_sk_lerp_u8_hsw_8bit+0x186>
DB 196,129,122,111,36,24 ; vmovdqu (%r8,%r11,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,195,127,0,0 ; vmovdqa 0x7fc3(%rip),%ymm6 # 2c7a0 <_sk_overlay_sse2_8bit+0xbf0>
+ DB 197,253,111,53,215,133,0,0 ; vmovdqa 0x85d7(%rip),%ymm6 # 2d1e0 <_sk_overlay_sse2_8bit+0xc74>
DB 196,98,93,0,206 ; vpshufb %ymm6,%ymm4,%ymm9
DB 196,98,85,0,222 ; vpshufb %ymm6,%ymm5,%ymm11
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34938,35 +35194,35 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,132,254,255,255 ; ja 247c6 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 15,135,132,254,255,255 ; ja 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,199,0,0,0 ; lea 0xc7(%rip),%r10 # 24a14 <_sk_lerp_u8_hsw_8bit+0x270>
+ DB 76,141,21,199,0,0,0 ; lea 0xc7(%rip),%r10 # 24e40 <_sk_lerp_u8_hsw_8bit+0x270>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,98,254,255,255 ; jmpq 247c6 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,98,254,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,2,2 ; vpinsrb $0x2,0x2(%r8,%r11,1),%xmm4,%xmm4
DB 67,15,183,4,24 ; movzwl (%r8,%r11,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,66,254,255,255 ; jmpq 247c6 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,66,254,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,6,6 ; vpinsrb $0x6,0x6(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,5,5 ; vpinsrb $0x5,0x5(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,4,4 ; vpinsrb $0x4,0x4(%r8,%r11,1),%xmm4,%xmm4
DB 196,129,121,110,44,24 ; vmovd (%r8,%r11,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,21,254,255,255 ; jmpq 247c6 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,21,254,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,10,10 ; vpinsrb $0xa,0xa(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,9,9 ; vpinsrb $0x9,0x9(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,8,8 ; vpinsrb $0x8,0x8(%r8,%r11,1),%xmm4,%xmm4
DB 196,129,122,126,44,24 ; vmovq (%r8,%r11,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,232,253,255,255 ; jmpq 247c6 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,232,253,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,131,89,32,100,24,14,14 ; vpinsrb $0xe,0xe(%r8,%r11,1),%xmm4,%xmm4
DB 196,131,89,32,100,24,13,13 ; vpinsrb $0xd,0xd(%r8,%r11,1),%xmm4,%xmm4
@@ -34974,7 +35230,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 196,129,122,126,44,24 ; vmovq (%r8,%r11,1),%xmm5
DB 196,131,81,34,108,24,8,2 ; vpinsrd $0x2,0x8(%r8,%r11,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,179,253,255,255 ; jmpq 247c6 <_sk_lerp_u8_hsw_8bit+0x22>
+ DB 233,179,253,255,255 ; jmpq 24bf2 <_sk_lerp_u8_hsw_8bit+0x22>
DB 144 ; nop
DB 66,255 ; rex.X (bad)
DB 255 ; (bad)
@@ -34984,7 +35240,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 255,140,255,255,255,132,255 ; decl -0x7b0001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 124,255 ; jl 24a29 <_sk_lerp_u8_hsw_8bit+0x285>
+ DB 124,255 ; jl 24e55 <_sk_lerp_u8_hsw_8bit+0x285>
DB 255 ; (bad)
DB 255,112,255 ; pushq -0x1(%rax)
DB 255 ; (bad)
@@ -35026,7 +35282,7 @@ _sk_move_dst_src_hsw_8bit LABEL PROC
PUBLIC _sk_black_color_hsw_8bit
_sk_black_color_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,65,119,0,0 ; vbroadcastss 0x7741(%rip),%ymm0 # 2c1b4 <_sk_overlay_sse2_8bit+0x604>
+ DB 196,226,125,24,5,213,124,0,0 ; vbroadcastss 0x7cd5(%rip),%ymm0 # 2cb74 <_sk_overlay_sse2_8bit+0x608>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 255,224 ; jmpq *%rax
@@ -35046,7 +35302,7 @@ _sk_clear_hsw_8bit LABEL PROC
PUBLIC _sk_srcatop_hsw_8bit
_sk_srcatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,39,125,0,0 ; vmovdqa 0x7d27(%rip),%ymm8 # 2c7c0 <_sk_overlay_sse2_8bit+0xc10>
+ DB 197,125,111,5,59,131,0,0 ; vmovdqa 0x833b(%rip),%ymm8 # 2d200 <_sk_overlay_sse2_8bit+0xc94>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,232 ; vpshufb %ymm8,%ymm2,%ymm5
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35121,7 +35377,7 @@ _sk_srcatop_hsw_8bit LABEL PROC
PUBLIC _sk_dstatop_hsw_8bit
_sk_dstatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,226,123,0,0 ; vmovdqa 0x7be2(%rip),%ymm8 # 2c7e0 <_sk_overlay_sse2_8bit+0xc30>
+ DB 197,125,111,5,246,129,0,0 ; vmovdqa 0x81f6(%rip),%ymm8 # 2d220 <_sk_overlay_sse2_8bit+0xcb4>
DB 196,194,117,0,224 ; vpshufb %ymm8,%ymm1,%ymm4
DB 196,194,125,0,232 ; vpshufb %ymm8,%ymm0,%ymm5
DB 196,98,125,48,210 ; vpmovzxbw %xmm2,%ymm10
@@ -35196,7 +35452,7 @@ _sk_dstatop_hsw_8bit LABEL PROC
PUBLIC _sk_srcin_hsw_8bit
_sk_srcin_hsw_8bit LABEL PROC
- DB 197,253,111,37,153,122,0,0 ; vmovdqa 0x7a99(%rip),%ymm4 # 2c800 <_sk_overlay_sse2_8bit+0xc50>
+ DB 197,253,111,37,173,128,0,0 ; vmovdqa 0x80ad(%rip),%ymm4 # 2d240 <_sk_overlay_sse2_8bit+0xcd4>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -35234,7 +35490,7 @@ _sk_srcin_hsw_8bit LABEL PROC
PUBLIC _sk_dstin_hsw_8bit
_sk_dstin_hsw_8bit LABEL PROC
- DB 197,253,111,37,15,122,0,0 ; vmovdqa 0x7a0f(%rip),%ymm4 # 2c820 <_sk_overlay_sse2_8bit+0xc70>
+ DB 197,253,111,37,35,128,0,0 ; vmovdqa 0x8023(%rip),%ymm4 # 2d260 <_sk_overlay_sse2_8bit+0xcf4>
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,125,48,226 ; vpmovzxbw %xmm2,%ymm4
@@ -35272,7 +35528,7 @@ _sk_dstin_hsw_8bit LABEL PROC
PUBLIC _sk_srcout_hsw_8bit
_sk_srcout_hsw_8bit LABEL PROC
- DB 197,253,111,37,131,121,0,0 ; vmovdqa 0x7983(%rip),%ymm4 # 2c840 <_sk_overlay_sse2_8bit+0xc90>
+ DB 197,253,111,37,151,127,0,0 ; vmovdqa 0x7f97(%rip),%ymm4 # 2d280 <_sk_overlay_sse2_8bit+0xd14>
DB 196,226,109,0,236 ; vpshufb %ymm4,%ymm2,%ymm5
DB 196,226,101,0,228 ; vpshufb %ymm4,%ymm3,%ymm4
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -35313,7 +35569,7 @@ _sk_srcout_hsw_8bit LABEL PROC
PUBLIC _sk_dstout_hsw_8bit
_sk_dstout_hsw_8bit LABEL PROC
- DB 197,253,111,37,237,120,0,0 ; vmovdqa 0x78ed(%rip),%ymm4 # 2c860 <_sk_overlay_sse2_8bit+0xcb0>
+ DB 197,253,111,37,1,127,0,0 ; vmovdqa 0x7f01(%rip),%ymm4 # 2d2a0 <_sk_overlay_sse2_8bit+0xd34>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -35354,7 +35610,7 @@ _sk_dstout_hsw_8bit LABEL PROC
PUBLIC _sk_srcover_hsw_8bit
_sk_srcover_hsw_8bit LABEL PROC
- DB 197,253,111,37,85,120,0,0 ; vmovdqa 0x7855(%rip),%ymm4 # 2c880 <_sk_overlay_sse2_8bit+0xcd0>
+ DB 197,253,111,37,105,126,0,0 ; vmovdqa 0x7e69(%rip),%ymm4 # 2d2c0 <_sk_overlay_sse2_8bit+0xd54>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,98,125,48,202 ; vpmovzxbw %xmm2,%ymm9
@@ -35396,7 +35652,7 @@ _sk_srcover_hsw_8bit LABEL PROC
PUBLIC _sk_dstover_hsw_8bit
_sk_dstover_hsw_8bit LABEL PROC
- DB 197,253,111,37,182,119,0,0 ; vmovdqa 0x77b6(%rip),%ymm4 # 2c8a0 <_sk_overlay_sse2_8bit+0xcf0>
+ DB 197,253,111,37,202,125,0,0 ; vmovdqa 0x7dca(%rip),%ymm4 # 2d2e0 <_sk_overlay_sse2_8bit+0xd74>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,98,125,48,200 ; vpmovzxbw %xmm0,%ymm9
@@ -35476,7 +35732,7 @@ _sk_multiply_hsw_8bit LABEL PROC
DB 72,131,236,56 ; sub $0x38,%rsp
DB 197,253,111,243 ; vmovdqa %ymm3,%ymm6
DB 197,253,111,218 ; vmovdqa %ymm2,%ymm3
- DB 197,125,111,13,115,118,0,0 ; vmovdqa 0x7673(%rip),%ymm9 # 2c8c0 <_sk_overlay_sse2_8bit+0xd10>
+ DB 197,125,111,13,135,124,0,0 ; vmovdqa 0x7c87(%rip),%ymm9 # 2d300 <_sk_overlay_sse2_8bit+0xd94>
DB 196,194,101,0,225 ; vpshufb %ymm9,%ymm3,%ymm4
DB 196,194,77,0,233 ; vpshufb %ymm9,%ymm6,%ymm5
DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -35617,7 +35873,7 @@ _sk_screen_hsw_8bit LABEL PROC
PUBLIC _sk_xor__hsw_8bit
_sk_xor__hsw_8bit LABEL PROC
- DB 197,125,111,13,255,115,0,0 ; vmovdqa 0x73ff(%rip),%ymm9 # 2c8e0 <_sk_overlay_sse2_8bit+0xd30>
+ DB 197,125,111,13,19,122,0,0 ; vmovdqa 0x7a13(%rip),%ymm9 # 2d320 <_sk_overlay_sse2_8bit+0xdb4>
DB 196,194,109,0,225 ; vpshufb %ymm9,%ymm2,%ymm4
DB 196,194,101,0,249 ; vpshufb %ymm9,%ymm3,%ymm7
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -35701,7 +35957,7 @@ _sk_plus__hsw_8bit LABEL PROC
PUBLIC _sk_darken_hsw_8bit
_sk_darken_hsw_8bit LABEL PROC
- DB 197,125,111,5,161,114,0,0 ; vmovdqa 0x72a1(%rip),%ymm8 # 2c900 <_sk_overlay_sse2_8bit+0xd50>
+ DB 197,125,111,5,181,120,0,0 ; vmovdqa 0x78b5(%rip),%ymm8 # 2d340 <_sk_overlay_sse2_8bit+0xdd4>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35774,7 +36030,7 @@ _sk_darken_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,234,105,0,0 ; vpbroadcastd 0x69ea(%rip),%ymm4 # 2c1b8 <_sk_overlay_sse2_8bit+0x608>
+ DB 196,226,125,88,37,130,111,0,0 ; vpbroadcastd 0x6f82(%rip),%ymm4 # 2cb7c <_sk_overlay_sse2_8bit+0x610>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35782,7 +36038,7 @@ _sk_darken_hsw_8bit LABEL PROC
PUBLIC _sk_lighten_hsw_8bit
_sk_lighten_hsw_8bit LABEL PROC
- DB 197,125,111,5,58,113,0,0 ; vmovdqa 0x713a(%rip),%ymm8 # 2c920 <_sk_overlay_sse2_8bit+0xd70>
+ DB 197,125,111,5,78,119,0,0 ; vmovdqa 0x774e(%rip),%ymm8 # 2d360 <_sk_overlay_sse2_8bit+0xdf4>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35855,7 +36111,7 @@ _sk_lighten_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,99,104,0,0 ; vpbroadcastd 0x6863(%rip),%ymm4 # 2c1b8 <_sk_overlay_sse2_8bit+0x608>
+ DB 196,226,125,88,37,251,109,0,0 ; vpbroadcastd 0x6dfb(%rip),%ymm4 # 2cb7c <_sk_overlay_sse2_8bit+0x610>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35893,7 +36149,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
DB 196,227,77,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm6,%ymm7
DB 196,227,77,70,228,49 ; vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
DB 197,197,103,228 ; vpackuswb %ymm4,%ymm7,%ymm4
- DB 197,253,111,53,60,111,0,0 ; vmovdqa 0x6f3c(%rip),%ymm6 # 2c940 <_sk_overlay_sse2_8bit+0xd90>
+ DB 197,253,111,53,80,117,0,0 ; vmovdqa 0x7550(%rip),%ymm6 # 2d380 <_sk_overlay_sse2_8bit+0xe14>
DB 197,221,219,254 ; vpand %ymm6,%ymm4,%ymm7
DB 197,213,219,246 ; vpand %ymm6,%ymm5,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -35907,7 +36163,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
PUBLIC _sk_difference_hsw_8bit
_sk_difference_hsw_8bit LABEL PROC
- DB 197,125,111,5,48,111,0,0 ; vmovdqa 0x6f30(%rip),%ymm8 # 2c960 <_sk_overlay_sse2_8bit+0xdb0>
+ DB 197,125,111,5,68,117,0,0 ; vmovdqa 0x7544(%rip),%ymm8 # 2d3a0 <_sk_overlay_sse2_8bit+0xe34>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35974,7 +36230,7 @@ _sk_difference_hsw_8bit LABEL PROC
DB 197,197,103,237 ; vpackuswb %ymm5,%ymm7,%ymm5
DB 197,181,218,228 ; vpminub %ymm4,%ymm9,%ymm4
DB 197,165,218,237 ; vpminub %ymm5,%ymm11,%ymm5
- DB 197,253,111,53,250,109,0,0 ; vmovdqa 0x6dfa(%rip),%ymm6 # 2c980 <_sk_overlay_sse2_8bit+0xdd0>
+ DB 197,253,111,53,14,116,0,0 ; vmovdqa 0x740e(%rip),%ymm6 # 2d3c0 <_sk_overlay_sse2_8bit+0xe54>
DB 197,213,219,254 ; vpand %ymm6,%ymm5,%ymm7
DB 197,221,219,246 ; vpand %ymm6,%ymm4,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -35997,7 +36253,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
DB 196,98,125,48,196 ; vpmovzxbw %xmm4,%ymm8
DB 197,126,127,132,36,224,0,0,0 ; vmovdqu %ymm8,0xe0(%rsp)
- DB 197,253,111,45,186,109,0,0 ; vmovdqa 0x6dba(%rip),%ymm5 # 2c9a0 <_sk_overlay_sse2_8bit+0xdf0>
+ DB 197,253,111,45,206,115,0,0 ; vmovdqa 0x73ce(%rip),%ymm5 # 2d3e0 <_sk_overlay_sse2_8bit+0xe74>
DB 196,226,125,0,229 ; vpshufb %ymm5,%ymm0,%ymm4
DB 196,226,117,0,205 ; vpshufb %ymm5,%ymm1,%ymm1
DB 196,227,125,57,200,1 ; vextracti128 $0x1,%ymm1,%xmm0
@@ -36023,10 +36279,10 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,253,117,193 ; vpcmpeqw %ymm1,%ymm0,%ymm0
DB 197,254,127,132,36,0,1,0,0 ; vmovdqu %ymm0,0x100(%rsp)
DB 197,253,111,226 ; vmovdqa %ymm2,%ymm4
- DB 197,125,111,37,40,109,0,0 ; vmovdqa 0x6d28(%rip),%ymm12 # 2c9a0 <_sk_overlay_sse2_8bit+0xdf0>
+ DB 197,125,111,37,60,115,0,0 ; vmovdqa 0x733c(%rip),%ymm12 # 2d3e0 <_sk_overlay_sse2_8bit+0xe74>
DB 196,66,93,0,196 ; vpshufb %ymm12,%ymm4,%ymm8
DB 196,194,125,48,208 ; vpmovzxbw %xmm8,%ymm2
- DB 196,226,125,121,5,53,109,0,0 ; vpbroadcastw 0x6d35(%rip),%ymm0 # 2c9c0 <_sk_overlay_sse2_8bit+0xe10>
+ DB 196,226,125,121,5,73,115,0,0 ; vpbroadcastw 0x7349(%rip),%ymm0 # 2d400 <_sk_overlay_sse2_8bit+0xe94>
DB 197,109,239,232 ; vpxor %ymm0,%ymm2,%ymm13
DB 197,149,213,207 ; vpmullw %ymm7,%ymm13,%ymm1
DB 197,254,127,140,36,96,1,0,0 ; vmovdqu %ymm1,0x160(%rsp)
@@ -36126,7 +36382,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,254,111,116,36,32 ; vmovdqu 0x20(%rsp),%ymm6
DB 197,205,253,116,36,64 ; vpaddw 0x40(%rsp),%ymm6,%ymm6
DB 196,193,53,253,252 ; vpaddw %ymm12,%ymm9,%ymm7
- DB 196,98,125,121,5,34,107,0,0 ; vpbroadcastw 0x6b22(%rip),%ymm8 # 2c9c2 <_sk_overlay_sse2_8bit+0xe12>
+ DB 196,98,125,121,5,54,113,0,0 ; vpbroadcastw 0x7136(%rip),%ymm8 # 2d402 <_sk_overlay_sse2_8bit+0xe96>
DB 196,193,93,253,224 ; vpaddw %ymm8,%ymm4,%ymm4
DB 197,229,253,220 ; vpaddw %ymm4,%ymm3,%ymm3
DB 196,193,85,253,224 ; vpaddw %ymm8,%ymm5,%ymm4
@@ -36135,7 +36391,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,247,106,0,0 ; vpbroadcastw 0x6af7(%rip),%ymm4 # 2c9c4 <_sk_overlay_sse2_8bit+0xe14>
+ DB 196,226,125,121,37,11,113,0,0 ; vpbroadcastw 0x710b(%rip),%ymm4 # 2d404 <_sk_overlay_sse2_8bit+0xe98>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,237,228,212 ; vpmulhuw %ymm4,%ymm2,%ymm2
@@ -36160,7 +36416,7 @@ PUBLIC _sk_overlay_hsw_8bit
_sk_overlay_hsw_8bit LABEL PROC
DB 72,129,236,24,2,0,0 ; sub $0x218,%rsp
DB 197,252,17,140,36,192,1,0,0 ; vmovups %ymm1,0x1c0(%rsp)
- DB 197,253,111,45,154,106,0,0 ; vmovdqa 0x6a9a(%rip),%ymm5 # 2c9e0 <_sk_overlay_sse2_8bit+0xe30>
+ DB 197,253,111,45,174,112,0,0 ; vmovdqa 0x70ae(%rip),%ymm5 # 2d420 <_sk_overlay_sse2_8bit+0xeb4>
DB 197,253,111,226 ; vmovdqa %ymm2,%ymm4
DB 196,227,125,57,225,1 ; vextracti128 $0x1,%ymm4,%xmm1
DB 196,98,125,48,193 ; vpmovzxbw %xmm1,%ymm8
@@ -36195,7 +36451,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,93,117,251 ; vpcmpeqw %ymm3,%ymm4,%ymm15
DB 197,253,111,216 ; vmovdqa %ymm0,%ymm3
DB 196,226,125,48,227 ; vpmovzxbw %xmm3,%ymm4
- DB 196,226,125,121,5,244,105,0,0 ; vpbroadcastw 0x69f4(%rip),%ymm0 # 2ca00 <_sk_overlay_sse2_8bit+0xe50>
+ DB 196,226,125,121,5,8,112,0,0 ; vpbroadcastw 0x7008(%rip),%ymm0 # 2d440 <_sk_overlay_sse2_8bit+0xed4>
DB 197,117,239,232 ; vpxor %ymm0,%ymm1,%ymm13
DB 197,21,213,212 ; vpmullw %ymm4,%ymm13,%ymm10
DB 197,126,127,148,36,64,1,0,0 ; vmovdqu %ymm10,0x140(%rsp)
@@ -36296,7 +36552,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,254,111,116,36,64 ; vmovdqu 0x40(%rsp),%ymm6
DB 197,205,253,116,36,96 ; vpaddw 0x60(%rsp),%ymm6,%ymm6
DB 196,193,29,253,253 ; vpaddw %ymm13,%ymm12,%ymm7
- DB 196,98,125,121,5,231,103,0,0 ; vpbroadcastw 0x67e7(%rip),%ymm8 # 2ca02 <_sk_overlay_sse2_8bit+0xe52>
+ DB 196,98,125,121,5,251,109,0,0 ; vpbroadcastw 0x6dfb(%rip),%ymm8 # 2d442 <_sk_overlay_sse2_8bit+0xed6>
DB 196,193,109,253,208 ; vpaddw %ymm8,%ymm2,%ymm2
DB 197,229,253,210 ; vpaddw %ymm2,%ymm3,%ymm2
DB 196,193,85,253,216 ; vpaddw %ymm8,%ymm5,%ymm3
@@ -36305,7 +36561,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,188,103,0,0 ; vpbroadcastw 0x67bc(%rip),%ymm4 # 2ca04 <_sk_overlay_sse2_8bit+0xe54>
+ DB 196,226,125,121,37,208,109,0,0 ; vpbroadcastw 0x6dd0(%rip),%ymm4 # 2d444 <_sk_overlay_sse2_8bit+0xed8>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,229,228,220 ; vpmulhuw %ymm4,%ymm3,%ymm3
@@ -36360,13 +36616,13 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,101 ; jae 2638e <_sk_start_pipeline_sse41_8bit+0xe2>
+ DB 115,101 ; jae 267ba <_sk_start_pipeline_sse41_8bit+0xe2>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,38 ; ja 26371 <_sk_start_pipeline_sse41_8bit+0xc5>
+ DB 119,38 ; ja 2679d <_sk_start_pipeline_sse41_8bit+0xc5>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 49,255 ; xor %edi,%edi
DB 76,137,246 ; mov %r14,%rsi
@@ -36377,16 +36633,16 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 73,131,196,16 ; add $0x10,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,225 ; jbe 26352 <_sk_start_pipeline_sse41_8bit+0xa6>
+ DB 118,225 ; jbe 2677e <_sk_start_pipeline_sse41_8bit+0xa6>
DB 76,137,255 ; mov %r15,%rdi
DB 72,41,215 ; sub %rdx,%rdi
- DB 116,9 ; je 26382 <_sk_start_pipeline_sse41_8bit+0xd6>
+ DB 116,9 ; je 267ae <_sk_start_pipeline_sse41_8bit+0xd6>
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,173 ; jne 2633b <_sk_start_pipeline_sse41_8bit+0x8f>
+ DB 117,173 ; jne 26767 <_sk_start_pipeline_sse41_8bit+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -36424,7 +36680,7 @@ _sk_uniform_color_sse41_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse41_8bit
_sk_set_rgb_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,73,92,0,0 ; movss 0x5c49(%rip),%xmm4 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,16,37,217,97,0,0 ; movss 0x61d9(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,76,15,44,197 ; cvttss2si %xmm5,%r8
@@ -36439,7 +36695,7 @@ _sk_set_rgb_sse41_8bit LABEL PROC
DB 68,9,200 ; or %r9d,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,10,109,0,0 ; movdqa 0x6d0a(%rip),%xmm5 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 102,15,111,45,30,115,0,0 ; movdqa 0x731e(%rip),%xmm5 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -36451,12 +36707,12 @@ PUBLIC _sk_premul_sse41_8bit
_sk_premul_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,246,108,0,0 ; movdqa 0x6cf6(%rip),%xmm0 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,5,10,115,0,0 ; movdqa 0x730a(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
- DB 102,15,111,5,204,108,0,0 ; movdqa 0x6ccc(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 102,15,111,5,224,114,0,0 ; movdqa 0x72e0(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -36487,7 +36743,7 @@ _sk_premul_sse41_8bit LABEL PROC
PUBLIC _sk_swap_rb_sse41_8bit
_sk_swap_rb_sse41_8bit LABEL PROC
- DB 102,15,111,37,105,108,0,0 ; movdqa 0x6c69(%rip),%xmm4 # 2d170 <_sk_overlay_sse2_8bit+0x15c0>
+ DB 102,15,111,37,125,114,0,0 ; movdqa 0x727d(%rip),%xmm4 # 2dbb0 <_sk_overlay_sse2_8bit+0x1644>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36511,7 +36767,7 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 26552 <_sk_load_8888_sse41_8bit+0x2d>
+ DB 117,17 ; jne 2697e <_sk_load_8888_sse41_8bit+0x2d>
DB 243,67,15,111,76,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm1
DB 243,67,15,111,4,152 ; movdqu (%r8,%r11,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36522,24 +36778,24 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,228 ; ja 2654e <_sk_load_8888_sse41_8bit+0x29>
+ DB 119,228 ; ja 2697a <_sk_load_8888_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,75,0,0,0 ; lea 0x4b(%rip),%r10 # 265c0 <_sk_load_8888_sse41_8bit+0x9b>
+ DB 76,141,21,75,0,0,0 ; lea 0x4b(%rip),%r10 # 269ec <_sk_load_8888_sse41_8bit+0x9b>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,110,4,152 ; movd (%r8,%r11,4),%xmm0
- DB 235,200 ; jmp 2654e <_sk_load_8888_sse41_8bit+0x29>
+ DB 235,200 ; jmp 2697a <_sk_load_8888_sse41_8bit+0x29>
DB 102,67,15,110,68,152,8 ; movd 0x8(%r8,%r11,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,174 ; jmp 2654e <_sk_load_8888_sse41_8bit+0x29>
+ DB 235,174 ; jmp 2697a <_sk_load_8888_sse41_8bit+0x29>
DB 102,67,15,110,68,152,24 ; movd 0x18(%r8,%r11,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,67,15,58,34,76,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm1
DB 102,67,15,58,34,76,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm1
- DB 235,136 ; jmp 26548 <_sk_load_8888_sse41_8bit+0x23>
+ DB 235,136 ; jmp 26974 <_sk_load_8888_sse41_8bit+0x23>
DB 190,255,255,255,210 ; mov $0xd2ffffff,%esi
DB 255 ; (bad)
DB 255 ; (bad)
@@ -36568,7 +36824,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 26609 <_sk_load_8888_dst_sse41_8bit+0x2d>
+ DB 117,17 ; jne 26a35 <_sk_load_8888_dst_sse41_8bit+0x2d>
DB 243,67,15,111,92,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm3
DB 243,67,15,111,20,152 ; movdqu (%r8,%r11,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36579,24 +36835,24 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,228 ; ja 26605 <_sk_load_8888_dst_sse41_8bit+0x29>
+ DB 119,228 ; ja 26a31 <_sk_load_8888_dst_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 26678 <_sk_load_8888_dst_sse41_8bit+0x9c>
+ DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 26aa4 <_sk_load_8888_dst_sse41_8bit+0x9c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,110,20,152 ; movd (%r8,%r11,4),%xmm2
- DB 235,200 ; jmp 26605 <_sk_load_8888_dst_sse41_8bit+0x29>
+ DB 235,200 ; jmp 26a31 <_sk_load_8888_dst_sse41_8bit+0x29>
DB 102,67,15,110,84,152,8 ; movd 0x8(%r8,%r11,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,174 ; jmp 26605 <_sk_load_8888_dst_sse41_8bit+0x29>
+ DB 235,174 ; jmp 26a31 <_sk_load_8888_dst_sse41_8bit+0x29>
DB 102,67,15,110,84,152,24 ; movd 0x18(%r8,%r11,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,67,15,58,34,92,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm3
DB 102,67,15,58,34,92,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm3
- DB 235,136 ; jmp 265ff <_sk_load_8888_dst_sse41_8bit+0x23>
+ DB 235,136 ; jmp 26a2b <_sk_load_8888_dst_sse41_8bit+0x23>
DB 144 ; nop
DB 189,255,255,255,209 ; mov $0xd1ffffff,%ebp
DB 255 ; (bad)
@@ -36608,7 +36864,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 2668d <_sk_load_8888_dst_sse41_8bit+0xb1>
+ DB 235,255 ; jmp 26ab9 <_sk_load_8888_dst_sse41_8bit+0xb1>
DB 255 ; (bad)
DB 255 ; (bad)
DB 223,255 ; (bad)
@@ -36625,7 +36881,7 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 266c1 <_sk_store_8888_sse41_8bit+0x2d>
+ DB 117,17 ; jne 26aed <_sk_store_8888_sse41_8bit+0x2d>
DB 243,67,15,127,4,152 ; movdqu %xmm0,(%r8,%r11,4)
DB 243,67,15,127,76,152,16 ; movdqu %xmm1,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36634,22 +36890,22 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 266bd <_sk_store_8888_sse41_8bit+0x29>
+ DB 119,236 ; ja 26ae9 <_sk_store_8888_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,68,0,0,0 ; lea 0x44(%rip),%r10 # 26720 <_sk_store_8888_sse41_8bit+0x8c>
+ DB 76,141,21,68,0,0,0 ; lea 0x44(%rip),%r10 # 26b4c <_sk_store_8888_sse41_8bit+0x8c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,126,4,152 ; movd %xmm0,(%r8,%r11,4)
- DB 235,208 ; jmp 266bd <_sk_store_8888_sse41_8bit+0x29>
+ DB 235,208 ; jmp 26ae9 <_sk_store_8888_sse41_8bit+0x29>
DB 102,67,15,58,22,68,152,8,2 ; pextrd $0x2,%xmm0,0x8(%r8,%r11,4)
DB 102,67,15,214,4,152 ; movq %xmm0,(%r8,%r11,4)
- DB 235,191 ; jmp 266bd <_sk_store_8888_sse41_8bit+0x29>
+ DB 235,191 ; jmp 26ae9 <_sk_store_8888_sse41_8bit+0x29>
DB 102,67,15,58,22,76,152,24,2 ; pextrd $0x2,%xmm1,0x18(%r8,%r11,4)
DB 102,67,15,58,22,76,152,20,1 ; pextrd $0x1,%xmm1,0x14(%r8,%r11,4)
DB 102,67,15,126,76,152,16 ; movd %xmm1,0x10(%r8,%r11,4)
DB 243,67,15,127,4,152 ; movdqu %xmm0,(%r8,%r11,4)
- DB 235,158 ; jmp 266bd <_sk_store_8888_sse41_8bit+0x29>
+ DB 235,158 ; jmp 26ae9 <_sk_store_8888_sse41_8bit+0x29>
DB 144 ; nop
DB 197,255,255 ; (bad)
DB 255,214 ; callq *%rsi
@@ -36682,10 +36938,10 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 2677b <_sk_load_bgra_sse41_8bit+0x3f>
+ DB 117,35 ; jne 26ba7 <_sk_load_bgra_sse41_8bit+0x3f>
DB 243,67,15,111,76,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm1
DB 243,67,15,111,4,152 ; movdqu (%r8,%r11,4),%xmm0
- DB 102,15,111,37,3,106,0,0 ; movdqa 0x6a03(%rip),%xmm4 # 2d170 <_sk_overlay_sse2_8bit+0x15c0>
+ DB 102,15,111,37,23,112,0,0 ; movdqa 0x7017(%rip),%xmm4 # 2dbb0 <_sk_overlay_sse2_8bit+0x1644>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36696,24 +36952,24 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,210 ; ja 26765 <_sk_load_bgra_sse41_8bit+0x29>
+ DB 119,210 ; ja 26b91 <_sk_load_bgra_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,78,0,0,0 ; lea 0x4e(%rip),%r10 # 267ec <_sk_load_bgra_sse41_8bit+0xb0>
+ DB 76,141,21,78,0,0,0 ; lea 0x4e(%rip),%r10 # 26c18 <_sk_load_bgra_sse41_8bit+0xb0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,110,4,152 ; movd (%r8,%r11,4),%xmm0
- DB 235,182 ; jmp 26765 <_sk_load_bgra_sse41_8bit+0x29>
+ DB 235,182 ; jmp 26b91 <_sk_load_bgra_sse41_8bit+0x29>
DB 102,67,15,110,68,152,8 ; movd 0x8(%r8,%r11,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,156 ; jmp 26765 <_sk_load_bgra_sse41_8bit+0x29>
+ DB 235,156 ; jmp 26b91 <_sk_load_bgra_sse41_8bit+0x29>
DB 102,67,15,110,68,152,24 ; movd 0x18(%r8,%r11,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,67,15,58,34,76,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm1
DB 102,67,15,58,34,76,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm1
- DB 233,115,255,255,255 ; jmpq 2675f <_sk_load_bgra_sse41_8bit+0x23>
+ DB 233,115,255,255,255 ; jmpq 26b8b <_sk_load_bgra_sse41_8bit+0x23>
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -36726,7 +36982,7 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,221 ; jmpq ffffffffde026804 <_sk_overlay_sse2_8bit+0xffffffffddffac54>
+ DB 233,255,255,255,221 ; jmpq ffffffffde026c30 <_sk_overlay_sse2_8bit+0xffffffffddffa6c4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -36741,10 +36997,10 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,35 ; jne 26847 <_sk_load_bgra_dst_sse41_8bit+0x3f>
+ DB 117,35 ; jne 26c73 <_sk_load_bgra_dst_sse41_8bit+0x3f>
DB 243,67,15,111,92,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm3
DB 243,67,15,111,20,152 ; movdqu (%r8,%r11,4),%xmm2
- DB 102,15,111,37,55,105,0,0 ; movdqa 0x6937(%rip),%xmm4 # 2d170 <_sk_overlay_sse2_8bit+0x15c0>
+ DB 102,15,111,37,75,111,0,0 ; movdqa 0x6f4b(%rip),%xmm4 # 2dbb0 <_sk_overlay_sse2_8bit+0x1644>
DB 102,15,56,0,212 ; pshufb %xmm4,%xmm2
DB 102,15,56,0,220 ; pshufb %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36755,24 +37011,24 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,210 ; ja 26831 <_sk_load_bgra_dst_sse41_8bit+0x29>
+ DB 119,210 ; ja 26c5d <_sk_load_bgra_dst_sse41_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,78,0,0,0 ; lea 0x4e(%rip),%r10 # 268b8 <_sk_load_bgra_dst_sse41_8bit+0xb0>
+ DB 76,141,21,78,0,0,0 ; lea 0x4e(%rip),%r10 # 26ce4 <_sk_load_bgra_dst_sse41_8bit+0xb0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,110,20,152 ; movd (%r8,%r11,4),%xmm2
- DB 235,182 ; jmp 26831 <_sk_load_bgra_dst_sse41_8bit+0x29>
+ DB 235,182 ; jmp 26c5d <_sk_load_bgra_dst_sse41_8bit+0x29>
DB 102,67,15,110,84,152,8 ; movd 0x8(%r8,%r11,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,156 ; jmp 26831 <_sk_load_bgra_dst_sse41_8bit+0x29>
+ DB 235,156 ; jmp 26c5d <_sk_load_bgra_dst_sse41_8bit+0x29>
DB 102,67,15,110,84,152,24 ; movd 0x18(%r8,%r11,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,67,15,58,34,92,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm3
DB 102,67,15,58,34,92,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm3
- DB 233,115,255,255,255 ; jmpq 2682b <_sk_load_bgra_dst_sse41_8bit+0x23>
+ DB 233,115,255,255,255 ; jmpq 26c57 <_sk_load_bgra_dst_sse41_8bit+0x23>
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -36785,7 +37041,7 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,221 ; jmpq ffffffffde0268d0 <_sk_overlay_sse2_8bit+0xffffffffddffad20>
+ DB 233,255,255,255,221 ; jmpq ffffffffde026cfc <_sk_overlay_sse2_8bit+0xffffffffddffa790>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -36799,13 +37055,13 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 73,193,224,2 ; shl $0x2,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 102,15,111,53,125,104,0,0 ; movdqa 0x687d(%rip),%xmm6 # 2d170 <_sk_overlay_sse2_8bit+0x15c0>
+ DB 102,15,111,53,145,110,0,0 ; movdqa 0x6e91(%rip),%xmm6 # 2dbb0 <_sk_overlay_sse2_8bit+0x1644>
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,56,0,238 ; pshufb %xmm6,%xmm5
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,230 ; pshufb %xmm6,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 2691b <_sk_store_bgra_sse41_8bit+0x47>
+ DB 117,17 ; jne 26d47 <_sk_store_bgra_sse41_8bit+0x47>
DB 243,67,15,127,36,152 ; movdqu %xmm4,(%r8,%r11,4)
DB 243,67,15,127,108,152,16 ; movdqu %xmm5,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36814,22 +37070,22 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 26917 <_sk_store_bgra_sse41_8bit+0x43>
+ DB 119,236 ; ja 26d43 <_sk_store_bgra_sse41_8bit+0x43>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,70,0,0,0 ; lea 0x46(%rip),%r10 # 2697c <_sk_store_bgra_sse41_8bit+0xa8>
+ DB 76,141,21,70,0,0,0 ; lea 0x46(%rip),%r10 # 26da8 <_sk_store_bgra_sse41_8bit+0xa8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,126,36,152 ; movd %xmm4,(%r8,%r11,4)
- DB 235,208 ; jmp 26917 <_sk_store_bgra_sse41_8bit+0x43>
+ DB 235,208 ; jmp 26d43 <_sk_store_bgra_sse41_8bit+0x43>
DB 102,67,15,58,22,100,152,8,2 ; pextrd $0x2,%xmm4,0x8(%r8,%r11,4)
DB 102,67,15,214,36,152 ; movq %xmm4,(%r8,%r11,4)
- DB 235,191 ; jmp 26917 <_sk_store_bgra_sse41_8bit+0x43>
+ DB 235,191 ; jmp 26d43 <_sk_store_bgra_sse41_8bit+0x43>
DB 102,67,15,58,22,108,152,24,2 ; pextrd $0x2,%xmm5,0x18(%r8,%r11,4)
DB 102,67,15,58,22,108,152,20,1 ; pextrd $0x1,%xmm5,0x14(%r8,%r11,4)
DB 102,67,15,126,108,152,16 ; movd %xmm5,0x10(%r8,%r11,4)
DB 243,67,15,127,36,152 ; movdqu %xmm4,(%r8,%r11,4)
- DB 235,158 ; jmp 26917 <_sk_store_bgra_sse41_8bit+0x43>
+ DB 235,158 ; jmp 26d43 <_sk_store_bgra_sse41_8bit+0x43>
DB 15,31,0 ; nopl (%rax)
DB 195 ; retq
DB 255 ; (bad)
@@ -36855,6 +37111,192 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; .byte 0xff
+PUBLIC _sk_store_565_sse41_8bit
+_sk_store_565_sse41_8bit LABEL PROC
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,72,8 ; movslq 0x8(%rax),%r9
+ DB 76,99,193 ; movslq %ecx,%r8
+ DB 77,15,175,193 ; imul %r9,%r8
+ DB 77,1,192 ; add %r8,%r8
+ DB 76,3,0 ; add (%rax),%r8
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 102,68,15,111,13,221,109,0,0 ; movdqa 0x6ddd(%rip),%xmm9 # 2dbc0 <_sk_overlay_sse2_8bit+0x1654>
+ DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8
+ DB 102,69,15,219,193 ; pand %xmm9,%xmm8
+ DB 102,68,15,219,200 ; pand %xmm0,%xmm9
+ DB 102,65,15,114,241,8 ; pslld $0x8,%xmm9
+ DB 102,65,15,114,240,8 ; pslld $0x8,%xmm8
+ DB 102,15,111,37,202,109,0,0 ; movdqa 0x6dca(%rip),%xmm4 # 2dbd0 <_sk_overlay_sse2_8bit+0x1664>
+ DB 102,15,111,249 ; movdqa %xmm1,%xmm7
+ DB 102,15,219,252 ; pand %xmm4,%xmm7
+ DB 102,15,219,224 ; pand %xmm0,%xmm4
+ DB 102,15,114,212,5 ; psrld $0x5,%xmm4
+ DB 102,15,114,215,5 ; psrld $0x5,%xmm7
+ DB 102,15,111,53,188,109,0,0 ; movdqa 0x6dbc(%rip),%xmm6 # 2dbe0 <_sk_overlay_sse2_8bit+0x1674>
+ DB 102,15,111,232 ; movdqa %xmm0,%xmm5
+ DB 102,15,219,238 ; pand %xmm6,%xmm5
+ DB 102,15,219,241 ; pand %xmm1,%xmm6
+ DB 102,15,114,214,19 ; psrld $0x13,%xmm6
+ DB 102,15,114,213,19 ; psrld $0x13,%xmm5
+ DB 102,65,15,235,248 ; por %xmm8,%xmm7
+ DB 102,65,15,235,225 ; por %xmm9,%xmm4
+ DB 102,15,235,229 ; por %xmm5,%xmm4
+ DB 102,15,235,254 ; por %xmm6,%xmm7
+ DB 102,15,111,45,156,109,0,0 ; movdqa 0x6d9c(%rip),%xmm5 # 2dbf0 <_sk_overlay_sse2_8bit+0x1684>
+ DB 102,15,56,0,253 ; pshufb %xmm5,%xmm7
+ DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4
+ DB 102,15,108,231 ; punpcklqdq %xmm7,%xmm4
+ DB 72,133,255 ; test %rdi,%rdi
+ DB 117,10 ; jne 26e71 <_sk_store_565_sse41_8bit+0xad>
+ DB 243,67,15,127,36,88 ; movdqu %xmm4,(%r8,%r11,2)
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,137,249 ; mov %edi,%r9d
+ DB 65,128,225,7 ; and $0x7,%r9b
+ DB 65,254,201 ; dec %r9b
+ DB 65,128,249,6 ; cmp $0x6,%r9b
+ DB 119,236 ; ja 26e6d <_sk_store_565_sse41_8bit+0xa9>
+ DB 69,15,182,201 ; movzbl %r9b,%r9d
+ DB 76,141,21,72,0,0,0 ; lea 0x48(%rip),%r10 # 26ed4 <_sk_store_565_sse41_8bit+0x110>
+ DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
+ DB 76,1,208 ; add %r10,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 102,67,15,58,21,36,88,0 ; pextrw $0x0,%xmm4,(%r8,%r11,2)
+ DB 235,206 ; jmp 26e6d <_sk_store_565_sse41_8bit+0xa9>
+ DB 102,67,15,58,21,100,88,4,2 ; pextrw $0x2,%xmm4,0x4(%r8,%r11,2)
+ DB 102,67,15,126,36,88 ; movd %xmm4,(%r8,%r11,2)
+ DB 235,189 ; jmp 26e6d <_sk_store_565_sse41_8bit+0xa9>
+ DB 102,67,15,58,21,100,88,12,6 ; pextrw $0x6,%xmm4,0xc(%r8,%r11,2)
+ DB 102,67,15,58,21,100,88,10,5 ; pextrw $0x5,%xmm4,0xa(%r8,%r11,2)
+ DB 102,67,15,58,21,100,88,8,4 ; pextrw $0x4,%xmm4,0x8(%r8,%r11,2)
+ DB 102,67,15,214,36,88 ; movq %xmm4,(%r8,%r11,2)
+ DB 235,154 ; jmp 26e6d <_sk_store_565_sse41_8bit+0xa9>
+ DB 144 ; nop
+ DB 193,255,255 ; sar $0xff,%edi
+ DB 255,212 ; callq *%rsp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,203 ; dec %ebx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,247 ; push %rdi
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 238 ; out %al,(%dx)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,229 ; jmpq *%rbp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
+PUBLIC _sk_load_565_dst_sse41_8bit
+_sk_load_565_dst_sse41_8bit LABEL PROC
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,72,8 ; movslq 0x8(%rax),%r9
+ DB 76,99,193 ; movslq %ecx,%r8
+ DB 77,15,175,193 ; imul %r9,%r8
+ DB 77,1,192 ; add %r8,%r8
+ DB 76,3,0 ; add (%rax),%r8
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 72,133,255 ; test %rdi,%rdi
+ DB 15,133,216,0,0,0 ; jne 26fe7 <_sk_load_565_dst_sse41_8bit+0xf7>
+ DB 243,67,15,111,28,88 ; movdqu (%r8,%r11,2),%xmm3
+ DB 102,15,239,228 ; pxor %xmm4,%xmm4
+ DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
+ DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
+ DB 102,15,111,53,166,103,0,0 ; movdqa 0x67a6(%rip),%xmm6 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,250 ; movdqa %xmm2,%xmm7
+ DB 102,15,219,254 ; pand %xmm6,%xmm7
+ DB 102,15,219,243 ; pand %xmm3,%xmm6
+ DB 102,15,114,214,8 ; psrld $0x8,%xmm6
+ DB 102,15,114,215,8 ; psrld $0x8,%xmm7
+ DB 102,15,111,45,200,103,0,0 ; movdqa 0x67c8(%rip),%xmm5 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 102,15,111,226 ; movdqa %xmm2,%xmm4
+ DB 102,15,219,229 ; pand %xmm5,%xmm4
+ DB 102,15,219,235 ; pand %xmm3,%xmm5
+ DB 102,15,114,245,19 ; pslld $0x13,%xmm5
+ DB 102,15,114,244,19 ; pslld $0x13,%xmm4
+ DB 102,15,235,231 ; por %xmm7,%xmm4
+ DB 102,15,235,238 ; por %xmm6,%xmm5
+ DB 102,15,111,53,130,103,0,0 ; movdqa 0x6782(%rip),%xmm6 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 102,15,111,251 ; movdqa %xmm3,%xmm7
+ DB 102,15,219,254 ; pand %xmm6,%xmm7
+ DB 102,15,114,247,5 ; pslld $0x5,%xmm7
+ DB 102,68,15,111,5,140,108,0,0 ; movdqa 0x6c8c(%rip),%xmm8 # 2dc10 <_sk_overlay_sse2_8bit+0x16a4>
+ DB 102,65,15,219,216 ; pand %xmm8,%xmm3
+ DB 102,15,114,211,1 ; psrld $0x1,%xmm3
+ DB 102,15,235,223 ; por %xmm7,%xmm3
+ DB 102,15,235,221 ; por %xmm5,%xmm3
+ DB 102,15,114,213,5 ; psrld $0x5,%xmm5
+ DB 102,15,219,242 ; pand %xmm2,%xmm6
+ DB 102,15,114,246,5 ; pslld $0x5,%xmm6
+ DB 102,65,15,219,208 ; pand %xmm8,%xmm2
+ DB 102,15,114,210,1 ; psrld $0x1,%xmm2
+ DB 102,15,235,214 ; por %xmm6,%xmm2
+ DB 102,15,235,212 ; por %xmm4,%xmm2
+ DB 102,15,114,212,5 ; psrld $0x5,%xmm4
+ DB 102,15,111,53,61,108,0,0 ; movdqa 0x6c3d(%rip),%xmm6 # 2dc00 <_sk_overlay_sse2_8bit+0x1694>
+ DB 102,15,219,230 ; pand %xmm6,%xmm4
+ DB 102,15,219,238 ; pand %xmm6,%xmm5
+ DB 102,15,111,53,189,107,0,0 ; movdqa 0x6bbd(%rip),%xmm6 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,235,214 ; por %xmm6,%xmm2
+ DB 102,15,235,212 ; por %xmm4,%xmm2
+ DB 102,15,235,222 ; por %xmm6,%xmm3
+ DB 102,15,235,221 ; por %xmm5,%xmm3
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,137,249 ; mov %edi,%r9d
+ DB 65,128,225,7 ; and $0x7,%r9b
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
+ DB 65,254,201 ; dec %r9b
+ DB 65,128,249,6 ; cmp $0x6,%r9b
+ DB 15,135,22,255,255,255 ; ja 26f15 <_sk_load_565_dst_sse41_8bit+0x25>
+ DB 69,15,182,201 ; movzbl %r9b,%r9d
+ DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # 2706c <_sk_load_565_dst_sse41_8bit+0x17c>
+ DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
+ DB 76,1,208 ; add %r10,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
+ DB 102,15,110,216 ; movd %eax,%xmm3
+ DB 233,244,254,255,255 ; jmpq 26f15 <_sk_load_565_dst_sse41_8bit+0x25>
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
+ DB 102,67,15,196,92,88,4,2 ; pinsrw $0x2,0x4(%r8,%r11,2),%xmm3
+ DB 102,67,15,110,20,88 ; movd (%r8,%r11,2),%xmm2
+ DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
+ DB 233,215,254,255,255 ; jmpq 26f15 <_sk_load_565_dst_sse41_8bit+0x25>
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
+ DB 102,67,15,196,92,88,12,6 ; pinsrw $0x6,0xc(%r8,%r11,2),%xmm3
+ DB 102,67,15,196,92,88,10,5 ; pinsrw $0x5,0xa(%r8,%r11,2),%xmm3
+ DB 102,67,15,196,92,88,8,4 ; pinsrw $0x4,0x8(%r8,%r11,2),%xmm3
+ DB 243,67,15,126,20,88 ; movq (%r8,%r11,2),%xmm2
+ DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
+ DB 233,170,254,255,255 ; jmpq 26f15 <_sk_load_565_dst_sse41_8bit+0x25>
+ DB 144 ; nop
+ DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,193 ; inc %ecx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,181,255,255,255,238 ; pushq -0x11000001(%rbp)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,230 ; jmpq *%rsi
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 222,255 ; fdivrp %st,%st(7)
+ DB 255 ; (bad)
+ DB 255,210 ; callq *%rdx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
PUBLIC _sk_load_a8_sse41_8bit
_sk_load_a8_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36864,9 +37306,9 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,42 ; jne 269da <_sk_load_a8_sse41_8bit+0x42>
+ DB 117,42 ; jne 270ca <_sk_load_a8_sse41_8bit+0x42>
DB 102,67,15,56,48,12,24 ; pmovzxbw (%r8,%r11,1),%xmm1
- DB 102,15,219,13,81,96,0,0 ; pand 0x6051(%rip),%xmm1 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,13,161,99,0,0 ; pand 0x63a1(%rip),%xmm1 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -36879,15 +37321,15 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 269b7 <_sk_load_a8_sse41_8bit+0x1f>
+ DB 119,201 ; ja 270a7 <_sk_load_a8_sse41_8bit+0x1f>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 26a70 <_sk_load_a8_sse41_8bit+0xd8>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 27160 <_sk_load_a8_sse41_8bit+0xd8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,170 ; jmp 269b7 <_sk_load_a8_sse41_8bit+0x1f>
+ DB 235,170 ; jmp 270a7 <_sk_load_a8_sse41_8bit+0x1f>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -36895,7 +37337,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 235,133 ; jmp 269b7 <_sk_load_a8_sse41_8bit+0x1f>
+ DB 235,133 ; jmp 270a7 <_sk_load_a8_sse41_8bit+0x1f>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -36906,7 +37348,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,67,15,110,4,24 ; movd (%r8,%r11,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,74,255,255,255 ; jmpq 269b7 <_sk_load_a8_sse41_8bit+0x1f>
+ DB 233,74,255,255,255 ; jmpq 270a7 <_sk_load_a8_sse41_8bit+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -36936,9 +37378,9 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,42 ; jne 26ace <_sk_load_a8_dst_sse41_8bit+0x42>
+ DB 117,42 ; jne 271be <_sk_load_a8_dst_sse41_8bit+0x42>
DB 102,67,15,56,48,28,24 ; pmovzxbw (%r8,%r11,1),%xmm3
- DB 102,15,219,29,93,95,0,0 ; pand 0x5f5d(%rip),%xmm3 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,29,173,98,0,0 ; pand 0x62ad(%rip),%xmm3 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -36951,15 +37393,15 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 26aab <_sk_load_a8_dst_sse41_8bit+0x1f>
+ DB 119,201 ; ja 2719b <_sk_load_a8_dst_sse41_8bit+0x1f>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 26b64 <_sk_load_a8_dst_sse41_8bit+0xd8>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 27254 <_sk_load_a8_dst_sse41_8bit+0xd8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,170 ; jmp 26aab <_sk_load_a8_dst_sse41_8bit+0x1f>
+ DB 235,170 ; jmp 2719b <_sk_load_a8_dst_sse41_8bit+0x1f>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -36967,7 +37409,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 235,133 ; jmp 26aab <_sk_load_a8_dst_sse41_8bit+0x1f>
+ DB 235,133 ; jmp 2719b <_sk_load_a8_dst_sse41_8bit+0x1f>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -36978,7 +37420,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,67,15,110,20,24 ; movd (%r8,%r11,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,74,255,255,255 ; jmpq 26aab <_sk_load_a8_dst_sse41_8bit+0x1f>
+ DB 233,74,255,255,255 ; jmpq 2719b <_sk_load_a8_dst_sse41_8bit+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -37007,15 +37449,15 @@ _sk_store_a8_sse41_8bit LABEL PROC
DB 77,15,175,193 ; imul %r9,%r8
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
- DB 102,15,111,45,229,101,0,0 ; movdqa 0x65e5(%rip),%xmm5 # 2d180 <_sk_overlay_sse2_8bit+0x15d0>
+ DB 102,15,111,45,149,105,0,0 ; movdqa 0x6995(%rip),%xmm5 # 2dc20 <_sk_overlay_sse2_8bit+0x16b4>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4
DB 102,15,108,230 ; punpcklqdq %xmm6,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,19 ; jne 26bc9 <_sk_store_a8_sse41_8bit+0x49>
- DB 102,15,56,0,37,129,101,0,0 ; pshufb 0x6581(%rip),%xmm4 # 2d140 <_sk_overlay_sse2_8bit+0x1590>
+ DB 117,19 ; jne 272b9 <_sk_store_a8_sse41_8bit+0x49>
+ DB 102,15,56,0,37,209,104,0,0 ; pshufb 0x68d1(%rip),%xmm4 # 2db80 <_sk_overlay_sse2_8bit+0x1614>
DB 102,67,15,214,36,24 ; movq %xmm4,(%r8,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -37023,24 +37465,24 @@ _sk_store_a8_sse41_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 26bc5 <_sk_store_a8_sse41_8bit+0x45>
+ DB 119,236 ; ja 272b5 <_sk_store_a8_sse41_8bit+0x45>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,92,0,0,0 ; lea 0x5c(%rip),%r10 # 26c40 <_sk_store_a8_sse41_8bit+0xc0>
+ DB 76,141,21,92,0,0,0 ; lea 0x5c(%rip),%r10 # 27330 <_sk_store_a8_sse41_8bit+0xc0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,58,20,36,24,0 ; pextrb $0x0,%xmm4,(%r8,%r11,1)
- DB 235,206 ; jmp 26bc5 <_sk_store_a8_sse41_8bit+0x45>
+ DB 235,206 ; jmp 272b5 <_sk_store_a8_sse41_8bit+0x45>
DB 102,67,15,58,20,100,24,2,4 ; pextrb $0x4,%xmm4,0x2(%r8,%r11,1)
- DB 102,15,56,0,37,23,94,0,0 ; pshufb 0x5e17(%rip),%xmm4 # 2ca20 <_sk_overlay_sse2_8bit+0xe70>
+ DB 102,15,56,0,37,103,97,0,0 ; pshufb 0x6167(%rip),%xmm4 # 2d460 <_sk_overlay_sse2_8bit+0xef4>
DB 102,67,15,58,21,36,24,0 ; pextrw $0x0,%xmm4,(%r8,%r11,1)
- DB 235,178 ; jmp 26bc5 <_sk_store_a8_sse41_8bit+0x45>
+ DB 235,178 ; jmp 272b5 <_sk_store_a8_sse41_8bit+0x45>
DB 102,67,15,58,20,100,24,6,12 ; pextrb $0xc,%xmm4,0x6(%r8,%r11,1)
DB 102,67,15,58,20,100,24,5,10 ; pextrb $0xa,%xmm4,0x5(%r8,%r11,1)
DB 102,67,15,58,20,100,24,4,8 ; pextrb $0x8,%xmm4,0x4(%r8,%r11,1)
- DB 102,15,56,0,37,249,93,0,0 ; pshufb 0x5df9(%rip),%xmm4 # 2ca30 <_sk_overlay_sse2_8bit+0xe80>
+ DB 102,15,56,0,37,73,97,0,0 ; pshufb 0x6149(%rip),%xmm4 # 2d470 <_sk_overlay_sse2_8bit+0xf04>
DB 102,67,15,126,36,24 ; movd %xmm4,(%r8,%r11,1)
- DB 235,134 ; jmp 26bc5 <_sk_store_a8_sse41_8bit+0x45>
+ DB 235,134 ; jmp 272b5 <_sk_store_a8_sse41_8bit+0x45>
DB 144 ; nop
DB 173 ; lods %ds:(%rsi),%eax
DB 255 ; (bad)
@@ -37071,16 +37513,16 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne 26cb6 <_sk_load_g8_sse41_8bit+0x5a>
+ DB 117,66 ; jne 273a6 <_sk_load_g8_sse41_8bit+0x5a>
DB 102,67,15,56,48,12,24 ; pmovzxbw (%r8,%r11,1),%xmm1
- DB 102,15,219,13,141,93,0,0 ; pand 0x5d8d(%rip),%xmm1 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,13,221,96,0,0 ; pand 0x60dd(%rip),%xmm1 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
- DB 102,15,111,37,248,100,0,0 ; movdqa 0x64f8(%rip),%xmm4 # 2d190 <_sk_overlay_sse2_8bit+0x15e0>
+ DB 102,15,111,37,168,104,0,0 ; movdqa 0x68a8(%rip),%xmm4 # 2dc30 <_sk_overlay_sse2_8bit+0x16c4>
DB 102,15,56,64,204 ; pmulld %xmm4,%xmm1
DB 102,15,56,64,196 ; pmulld %xmm4,%xmm0
- DB 102,15,111,37,166,100,0,0 ; movdqa 0x64a6(%rip),%xmm4 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 102,15,111,37,246,103,0,0 ; movdqa 0x67f6(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37090,15 +37532,15 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,177 ; ja 26c7b <_sk_load_g8_sse41_8bit+0x1f>
+ DB 119,177 ; ja 2736b <_sk_load_g8_sse41_8bit+0x1f>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 26d4c <_sk_load_g8_sse41_8bit+0xf0>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 2743c <_sk_load_g8_sse41_8bit+0xf0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,146 ; jmp 26c7b <_sk_load_g8_sse41_8bit+0x1f>
+ DB 235,146 ; jmp 2736b <_sk_load_g8_sse41_8bit+0x1f>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -37106,7 +37548,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 233,106,255,255,255 ; jmpq 26c7b <_sk_load_g8_sse41_8bit+0x1f>
+ DB 233,106,255,255,255 ; jmpq 2736b <_sk_load_g8_sse41_8bit+0x1f>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -37117,7 +37559,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,67,15,110,4,24 ; movd (%r8,%r11,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,47,255,255,255 ; jmpq 26c7b <_sk_load_g8_sse41_8bit+0x1f>
+ DB 233,47,255,255,255 ; jmpq 2736b <_sk_load_g8_sse41_8bit+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -37147,16 +37589,16 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,66 ; jne 26dc2 <_sk_load_g8_dst_sse41_8bit+0x5a>
+ DB 117,66 ; jne 274b2 <_sk_load_g8_dst_sse41_8bit+0x5a>
DB 102,67,15,56,48,28,24 ; pmovzxbw (%r8,%r11,1),%xmm3
- DB 102,15,219,29,129,92,0,0 ; pand 0x5c81(%rip),%xmm3 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,29,209,95,0,0 ; pand 0x5fd1(%rip),%xmm3 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
- DB 102,15,111,37,236,99,0,0 ; movdqa 0x63ec(%rip),%xmm4 # 2d190 <_sk_overlay_sse2_8bit+0x15e0>
+ DB 102,15,111,37,156,103,0,0 ; movdqa 0x679c(%rip),%xmm4 # 2dc30 <_sk_overlay_sse2_8bit+0x16c4>
DB 102,15,56,64,220 ; pmulld %xmm4,%xmm3
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
- DB 102,15,111,37,154,99,0,0 ; movdqa 0x639a(%rip),%xmm4 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 102,15,111,37,234,102,0,0 ; movdqa 0x66ea(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37166,15 +37608,15 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,177 ; ja 26d87 <_sk_load_g8_dst_sse41_8bit+0x1f>
+ DB 119,177 ; ja 27477 <_sk_load_g8_dst_sse41_8bit+0x1f>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 26e58 <_sk_load_g8_dst_sse41_8bit+0xf0>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 27548 <_sk_load_g8_dst_sse41_8bit+0xf0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,146 ; jmp 26d87 <_sk_load_g8_dst_sse41_8bit+0x1f>
+ DB 235,146 ; jmp 27477 <_sk_load_g8_dst_sse41_8bit+0x1f>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -37182,7 +37624,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 233,106,255,255,255 ; jmpq 26d87 <_sk_load_g8_dst_sse41_8bit+0x1f>
+ DB 233,106,255,255,255 ; jmpq 27477 <_sk_load_g8_dst_sse41_8bit+0x1f>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -37193,7 +37635,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,67,15,110,20,24 ; movd (%r8,%r11,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,47,255,255,255 ; jmpq 26d87 <_sk_load_g8_dst_sse41_8bit+0x1f>
+ DB 233,47,255,255,255 ; jmpq 27477 <_sk_load_g8_dst_sse41_8bit+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -37224,11 +37666,11 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,206,0,0,0 ; jne 26f62 <_sk_srcover_rgba_8888_sse41_8bit+0xee>
+ DB 15,133,206,0,0,0 ; jne 27652 <_sk_srcover_rgba_8888_sse41_8bit+0xee>
DB 243,71,15,111,68,152,16 ; movdqu 0x10(%r8,%r11,4),%xmm8
DB 243,71,15,111,12,152 ; movdqu (%r8,%r11,4),%xmm9
DB 72,133,255 ; test %rdi,%rdi
- DB 102,15,111,37,180,98,0,0 ; movdqa 0x62b4(%rip),%xmm4 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,37,4,102,0,0 ; movdqa 0x6604(%rip),%xmm4 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,244 ; pshufb %xmm4,%xmm6
DB 102,15,111,248 ; movdqa %xmm0,%xmm7
@@ -37262,7 +37704,7 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,68,15,248,204 ; psubb %xmm4,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,78 ; jne 26f9f <_sk_srcover_rgba_8888_sse41_8bit+0x12b>
+ DB 117,78 ; jne 2768f <_sk_srcover_rgba_8888_sse41_8bit+0x12b>
DB 243,71,15,127,12,152 ; movdqu %xmm9,(%r8,%r11,4)
DB 243,71,15,127,68,152,16 ; movdqu %xmm8,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37273,44 +37715,44 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,33,255,255,255 ; ja 26ea1 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ DB 15,135,33,255,255,255 ; ja 27591 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,189,0,0,0 ; lea 0xbd(%rip),%r10 # 27048 <_sk_srcover_rgba_8888_sse41_8bit+0x1d4>
+ DB 76,141,21,189,0,0,0 ; lea 0xbd(%rip),%r10 # 27738 <_sk_srcover_rgba_8888_sse41_8bit+0x1d4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,71,15,110,12,152 ; movd (%r8,%r11,4),%xmm9
- DB 233,2,255,255,255 ; jmpq 26ea1 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ DB 233,2,255,255,255 ; jmpq 27591 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,175 ; ja 26f5e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ DB 119,175 ; ja 2764e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 76,141,13,170,0,0,0 ; lea 0xaa(%rip),%r9 # 27064 <_sk_srcover_rgba_8888_sse41_8bit+0x1f0>
+ DB 76,141,13,170,0,0,0 ; lea 0xaa(%rip),%r9 # 27754 <_sk_srcover_rgba_8888_sse41_8bit+0x1f0>
DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
DB 102,71,15,126,12,152 ; movd %xmm9,(%r8,%r11,4)
- DB 235,147 ; jmp 26f5e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ DB 235,147 ; jmp 2764e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
DB 102,67,15,110,100,152,8 ; movd 0x8(%r8,%r11,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 243,67,15,126,36,152 ; movq (%r8,%r11,4),%xmm4
DB 102,68,15,58,14,204,15 ; pblendw $0xf,%xmm4,%xmm9
- DB 233,183,254,255,255 ; jmpq 26ea1 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
+ DB 233,183,254,255,255 ; jmpq 27591 <_sk_srcover_rgba_8888_sse41_8bit+0x2d>
DB 102,67,15,110,100,152,24 ; movd 0x18(%r8,%r11,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 102,71,15,58,34,68,152,20,1 ; pinsrd $0x1,0x14(%r8,%r11,4),%xmm8
DB 102,71,15,58,34,68,152,16,0 ; pinsrd $0x0,0x10(%r8,%r11,4),%xmm8
- DB 233,141,254,255,255 ; jmpq 26e9b <_sk_srcover_rgba_8888_sse41_8bit+0x27>
+ DB 233,141,254,255,255 ; jmpq 2758b <_sk_srcover_rgba_8888_sse41_8bit+0x27>
DB 102,71,15,58,22,76,152,8,2 ; pextrd $0x2,%xmm9,0x8(%r8,%r11,4)
DB 102,71,15,214,12,152 ; movq %xmm9,(%r8,%r11,4)
- DB 233,60,255,255,255 ; jmpq 26f5e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ DB 233,60,255,255,255 ; jmpq 2764e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
DB 102,71,15,58,22,68,152,24,2 ; pextrd $0x2,%xmm8,0x18(%r8,%r11,4)
DB 102,71,15,58,22,68,152,20,1 ; pextrd $0x1,%xmm8,0x14(%r8,%r11,4)
DB 102,71,15,126,68,152,16 ; movd %xmm8,0x10(%r8,%r11,4)
DB 243,71,15,127,12,152 ; movdqu %xmm9,(%r8,%r11,4)
- DB 233,24,255,255,255 ; jmpq 26f5e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
+ DB 233,24,255,255,255 ; jmpq 2764e <_sk_srcover_rgba_8888_sse41_8bit+0xea>
DB 102,144 ; xchg %ax,%ax
DB 76,255 ; rex.WR (bad)
DB 255 ; (bad)
@@ -37350,7 +37792,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,182,79,0,0 ; mulss 0x4fb6(%rip),%xmm0 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,89,5,130,82,0,0 ; mulss 0x5282(%rip),%xmm0 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,68,15,56,48,197 ; pmovzxbw %xmm5,%xmm8
@@ -37358,7 +37800,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,68,15,56,48,204 ; pmovzxbw %xmm4,%xmm9
DB 102,15,104,224 ; punpckhbw %xmm0,%xmm4
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 102,15,56,0,53,226,96,0,0 ; pshufb 0x60e2(%rip),%xmm6 # 2d1a0 <_sk_overlay_sse2_8bit+0x15f0>
+ DB 102,15,56,0,53,146,100,0,0 ; pshufb 0x6492(%rip),%xmm6 # 2dc40 <_sk_overlay_sse2_8bit+0x16d4>
DB 102,15,111,206 ; movdqa %xmm6,%xmm1
DB 102,65,15,213,201 ; pmullw %xmm9,%xmm1
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
@@ -37388,13 +37830,13 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,160,0,0,0 ; jne 271ca <_sk_scale_u8_sse41_8bit+0xbc>
+ DB 15,133,160,0,0,0 ; jne 278ba <_sk_scale_u8_sse41_8bit+0xbc>
DB 102,67,15,56,48,52,24 ; pmovzxbw (%r8,%r11,1),%xmm6
- DB 102,15,219,53,215,88,0,0 ; pand 0x58d7(%rip),%xmm6 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,53,39,92,0,0 ; pand 0x5c27(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
- DB 102,15,56,0,61,101,96,0,0 ; pshufb 0x6065(%rip),%xmm7 # 2d1b0 <_sk_overlay_sse2_8bit+0x1600>
- DB 102,15,56,0,53,108,96,0,0 ; pshufb 0x606c(%rip),%xmm6 # 2d1c0 <_sk_overlay_sse2_8bit+0x1610>
+ DB 102,15,56,0,61,21,100,0,0 ; pshufb 0x6415(%rip),%xmm7 # 2dc50 <_sk_overlay_sse2_8bit+0x16e4>
+ DB 102,15,56,0,53,28,100,0,0 ; pshufb 0x641c(%rip),%xmm6 # 2dc60 <_sk_overlay_sse2_8bit+0x16f4>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -37426,15 +37868,15 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,79,255,255,255 ; ja 27131 <_sk_scale_u8_sse41_8bit+0x23>
+ DB 15,135,79,255,255,255 ; ja 27821 <_sk_scale_u8_sse41_8bit+0x23>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 27268 <_sk_scale_u8_sse41_8bit+0x15a>
+ DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 27958 <_sk_scale_u8_sse41_8bit+0x15a>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,45,255,255,255 ; jmpq 27131 <_sk_scale_u8_sse41_8bit+0x23>
+ DB 233,45,255,255,255 ; jmpq 27821 <_sk_scale_u8_sse41_8bit+0x23>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,2 ; pinsrw $0x2,%eax,%xmm6
@@ -37442,7 +37884,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,3 ; pblendw $0x3,%xmm4,%xmm6
- DB 233,5,255,255,255 ; jmpq 27131 <_sk_scale_u8_sse41_8bit+0x23>
+ DB 233,5,255,255,255 ; jmpq 27821 <_sk_scale_u8_sse41_8bit+0x23>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,6 ; pinsrw $0x6,%eax,%xmm6
@@ -37453,7 +37895,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,67,15,110,36,24 ; movd (%r8,%r11,1),%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,202,254,255,255 ; jmpq 27131 <_sk_scale_u8_sse41_8bit+0x23>
+ DB 233,202,254,255,255 ; jmpq 27821 <_sk_scale_u8_sse41_8bit+0x23>
DB 144 ; nop
DB 142,255 ; mov %edi,%?
DB 255 ; (bad)
@@ -37461,7 +37903,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf027278 <_sk_overlay_sse2_8bit+0xffffffffdeffb6c8>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf027968 <_sk_overlay_sse2_8bit+0xffffffffdeffb3fc>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -37476,7 +37918,7 @@ PUBLIC _sk_lerp_1_float_sse41_8bit
_sk_lerp_1_float_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,186,77,0,0 ; mulss 0x4dba(%rip),%xmm4 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,89,37,134,80,0,0 ; mulss 0x5086(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -37487,7 +37929,7 @@ _sk_lerp_1_float_sse41_8bit LABEL PROC
DB 102,65,15,104,193 ; punpckhbw %xmm9,%xmm0
DB 102,68,15,56,48,217 ; pmovzxbw %xmm1,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,56,0,61,3,95,0,0 ; pshufb 0x5f03(%rip),%xmm7 # 2d1d0 <_sk_overlay_sse2_8bit+0x1620>
+ DB 102,15,56,0,61,179,98,0,0 ; pshufb 0x62b3(%rip),%xmm7 # 2dc70 <_sk_overlay_sse2_8bit+0x1704>
DB 102,68,15,111,231 ; movdqa %xmm7,%xmm12
DB 102,69,15,213,227 ; pmullw %xmm11,%xmm12
DB 102,68,15,111,239 ; movdqa %xmm7,%xmm13
@@ -37545,13 +37987,13 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,46,1,0,0 ; jne 274f0 <_sk_lerp_u8_sse41_8bit+0x14a>
+ DB 15,133,46,1,0,0 ; jne 27be0 <_sk_lerp_u8_sse41_8bit+0x14a>
DB 102,67,15,56,48,60,24 ; pmovzxbw (%r8,%r11,1),%xmm7
- DB 102,15,219,61,63,86,0,0 ; pand 0x563f(%rip),%xmm7 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,61,143,89,0,0 ; pand 0x598f(%rip),%xmm7 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,205,93,0,0 ; pshufb 0x5dcd(%rip),%xmm6 # 2d1b0 <_sk_overlay_sse2_8bit+0x1600>
- DB 102,15,56,0,61,212,93,0,0 ; pshufb 0x5dd4(%rip),%xmm7 # 2d1c0 <_sk_overlay_sse2_8bit+0x1610>
+ DB 102,15,56,0,53,125,97,0,0 ; pshufb 0x617d(%rip),%xmm6 # 2dc50 <_sk_overlay_sse2_8bit+0x16e4>
+ DB 102,15,56,0,61,132,97,0,0 ; pshufb 0x6184(%rip),%xmm7 # 2dc60 <_sk_overlay_sse2_8bit+0x16f4>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -37612,15 +38054,15 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,193,254,255,255 ; ja 273c9 <_sk_lerp_u8_sse41_8bit+0x23>
+ DB 15,135,193,254,255,255 ; ja 27ab9 <_sk_lerp_u8_sse41_8bit+0x23>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,125,0,0,0 ; lea 0x7d(%rip),%r10 # 27590 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ DB 76,141,21,125,0,0,0 ; lea 0x7d(%rip),%r10 # 27c80 <_sk_lerp_u8_sse41_8bit+0x1ea>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,159,254,255,255 ; jmpq 273c9 <_sk_lerp_u8_sse41_8bit+0x23>
+ DB 233,159,254,255,255 ; jmpq 27ab9 <_sk_lerp_u8_sse41_8bit+0x23>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,2 ; pinsrw $0x2,%eax,%xmm7
@@ -37628,7 +38070,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,3 ; pblendw $0x3,%xmm5,%xmm7
- DB 233,119,254,255,255 ; jmpq 273c9 <_sk_lerp_u8_sse41_8bit+0x23>
+ DB 233,119,254,255,255 ; jmpq 27ab9 <_sk_lerp_u8_sse41_8bit+0x23>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,6 ; pinsrw $0x6,%eax,%xmm7
@@ -37639,7 +38081,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,67,15,110,44,24 ; movd (%r8,%r11,1),%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,15 ; pblendw $0xf,%xmm5,%xmm7
- DB 233,60,254,255,255 ; jmpq 273c9 <_sk_lerp_u8_sse41_8bit+0x23>
+ DB 233,60,254,255,255 ; jmpq 27ab9 <_sk_lerp_u8_sse41_8bit+0x23>
DB 15,31,0 ; nopl (%rax)
DB 140,255 ; mov %?,%edi
DB 255 ; (bad)
@@ -37677,7 +38119,7 @@ _sk_move_dst_src_sse41_8bit LABEL PROC
PUBLIC _sk_black_color_sse41_8bit
_sk_black_color_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,135,91,0,0 ; movaps 0x5b87(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 15,40,5,215,94,0,0 ; movaps 0x5ed7(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -37697,7 +38139,7 @@ _sk_clear_sse41_8bit LABEL PROC
PUBLIC _sk_srcatop_sse41_8bit
_sk_srcatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,21,115,91,0,0 ; movdqa 0x5b73(%rip),%xmm10 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,68,15,111,21,195,94,0,0 ; movdqa 0x5ec3(%rip),%xmm10 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,195 ; pmovzxbw %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
@@ -37765,7 +38207,7 @@ _sk_srcatop_sse41_8bit LABEL PROC
PUBLIC _sk_dstatop_sse41_8bit
_sk_dstatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,29,56,90,0,0 ; movdqa 0x5a38(%rip),%xmm11 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,68,15,111,29,136,93,0,0 ; movdqa 0x5d88(%rip),%xmm11 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,69,15,56,0,235 ; pshufb %xmm11,%xmm13
DB 102,68,15,111,248 ; movdqa %xmm0,%xmm15
@@ -37835,7 +38277,7 @@ PUBLIC _sk_srcin_sse41_8bit
_sk_srcin_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,239,88,0,0 ; movdqa 0x58ef(%rip),%xmm0 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,5,63,92,0,0 ; movdqa 0x5c3f(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
@@ -37869,7 +38311,7 @@ _sk_srcin_sse41_8bit LABEL PROC
PUBLIC _sk_dstin_sse41_8bit
_sk_dstin_sse41_8bit LABEL PROC
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,94,88,0,0 ; movdqa 0x585e(%rip),%xmm0 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,5,174,91,0,0 ; movdqa 0x5bae(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,15,56,0,200 ; pshufb %xmm0,%xmm1
DB 102,15,56,0,232 ; pshufb %xmm0,%xmm5
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
@@ -37905,7 +38347,7 @@ PUBLIC _sk_srcout_sse41_8bit
_sk_srcout_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,197,87,0,0 ; movdqa 0x57c5(%rip),%xmm0 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,5,21,91,0,0 ; movdqa 0x5b15(%rip),%xmm0 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37941,7 +38383,7 @@ _sk_srcout_sse41_8bit LABEL PROC
PUBLIC _sk_dstout_sse41_8bit
_sk_dstout_sse41_8bit LABEL PROC
- DB 102,15,111,37,44,87,0,0 ; movdqa 0x572c(%rip),%xmm4 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,37,124,90,0,0 ; movdqa 0x5a7c(%rip),%xmm4 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,118,228 ; pcmpeqd %xmm4,%xmm4
@@ -37979,7 +38421,7 @@ _sk_dstout_sse41_8bit LABEL PROC
PUBLIC _sk_srcover_sse41_8bit
_sk_srcover_sse41_8bit LABEL PROC
- DB 102,15,111,53,139,86,0,0 ; movdqa 0x568b(%rip),%xmm6 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,53,219,89,0,0 ; movdqa 0x59db(%rip),%xmm6 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,68,15,56,0,222 ; pshufb %xmm6,%xmm11
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
@@ -38018,7 +38460,7 @@ _sk_srcover_sse41_8bit LABEL PROC
PUBLIC _sk_dstover_sse41_8bit
_sk_dstover_sse41_8bit LABEL PROC
- DB 102,68,15,111,5,219,85,0,0 ; movdqa 0x55db(%rip),%xmm8 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,68,15,111,5,43,89,0,0 ; movdqa 0x592b(%rip),%xmm8 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,111,209 ; movdqa %xmm1,%xmm10
DB 102,68,15,56,48,201 ; pmovzxbw %xmm1,%xmm9
DB 102,15,252,203 ; paddb %xmm3,%xmm1
@@ -38093,7 +38535,7 @@ _sk_multiply_sse41_8bit LABEL PROC
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,53,153,84,0,0 ; movdqa 0x5499(%rip),%xmm14 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,68,15,111,53,233,87,0,0 ; movdqa 0x57e9(%rip),%xmm14 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,111,195 ; movdqa %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,65,15,56,0,238 ; pshufb %xmm14,%xmm5
@@ -38218,7 +38660,7 @@ _sk_screen_sse41_8bit LABEL PROC
PUBLIC _sk_xor__sse41_8bit
_sk_xor__sse41_8bit LABEL PROC
- DB 102,68,15,111,21,87,82,0,0 ; movdqa 0x5257(%rip),%xmm10 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,68,15,111,21,167,85,0,0 ; movdqa 0x55a7(%rip),%xmm10 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,111,226 ; movdqa %xmm2,%xmm12
DB 102,68,15,56,48,194 ; pmovzxbw %xmm2,%xmm8
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
@@ -38296,7 +38738,7 @@ _sk_plus__sse41_8bit LABEL PROC
PUBLIC _sk_darken_sse41_8bit
_sk_darken_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,254,80,0,0 ; movdqa 0x50fe(%rip),%xmm8 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,68,15,111,5,78,84,0,0 ; movdqa 0x544e(%rip),%xmm8 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38363,7 +38805,7 @@ _sk_darken_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,50,80,0,0 ; movaps 0x5032(%rip),%xmm0 # 2d1e0 <_sk_overlay_sse2_8bit+0x1630>
+ DB 15,40,5,226,83,0,0 ; movaps 0x53e2(%rip),%xmm0 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38373,7 +38815,7 @@ _sk_darken_sse41_8bit LABEL PROC
PUBLIC _sk_lighten_sse41_8bit
_sk_lighten_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,143,79,0,0 ; movdqa 0x4f8f(%rip),%xmm8 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,68,15,111,5,223,82,0,0 ; movdqa 0x52df(%rip),%xmm8 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38440,7 +38882,7 @@ _sk_lighten_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,195,78,0,0 ; movaps 0x4ec3(%rip),%xmm0 # 2d1e0 <_sk_overlay_sse2_8bit+0x1630>
+ DB 15,40,5,115,82,0,0 ; movaps 0x5273(%rip),%xmm0 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38478,7 +38920,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,253 ; packuswb %xmm5,%xmm7
DB 102,15,103,230 ; packuswb %xmm6,%xmm4
- DB 102,15,111,45,25,78,0,0 ; movdqa 0x4e19(%rip),%xmm5 # 2d1e0 <_sk_overlay_sse2_8bit+0x1630>
+ DB 102,15,111,45,201,81,0,0 ; movdqa 0x51c9(%rip),%xmm5 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
DB 102,15,248,204 ; psubb %xmm4,%xmm1
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,15,219,239 ; pand %xmm7,%xmm5
@@ -38491,7 +38933,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
PUBLIC _sk_difference_sse41_8bit
_sk_difference_sse41_8bit LABEL PROC
DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8
- DB 102,15,111,13,112,77,0,0 ; movdqa 0x4d70(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,13,192,80,0,0 ; movdqa 0x50c0(%rip),%xmm1 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38529,7 +38971,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,254 ; packuswb %xmm6,%xmm7
- DB 102,15,111,37,181,76,0,0 ; movdqa 0x4cb5(%rip),%xmm4 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,37,5,80,0,0 ; movdqa 0x5005(%rip),%xmm4 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,56,0,236 ; pshufb %xmm4,%xmm5
DB 102,69,15,104,236 ; punpckhbw %xmm12,%xmm13
@@ -38554,7 +38996,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,103,241 ; packuswb %xmm1,%xmm6
DB 102,65,15,218,230 ; pminub %xmm14,%xmm4
DB 102,15,218,247 ; pminub %xmm7,%xmm6
- DB 102,15,111,13,184,76,0,0 ; movdqa 0x4cb8(%rip),%xmm1 # 2d1e0 <_sk_overlay_sse2_8bit+0x1630>
+ DB 102,15,111,13,104,80,0,0 ; movdqa 0x5068(%rip),%xmm1 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
DB 102,68,15,248,198 ; psubb %xmm6,%xmm8
DB 102,15,219,241 ; pand %xmm1,%xmm6
DB 102,15,219,204 ; pand %xmm4,%xmm1
@@ -38580,7 +39022,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,69,15,56,48,221 ; pmovzxbw %xmm13,%xmm11
DB 102,68,15,127,156,36,176,0,0,0 ; movdqa %xmm11,0xb0(%rsp)
- DB 102,15,111,13,198,75,0,0 ; movdqa 0x4bc6(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,13,22,79,0,0 ; movdqa 0x4f16(%rip),%xmm1 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,68,15,56,0,233 ; pshufb %xmm1,%xmm13
DB 102,69,15,56,48,197 ; pmovzxbw %xmm13,%xmm8
@@ -38630,7 +39072,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,65,15,56,58,247 ; pminuw %xmm15,%xmm6
DB 102,15,117,240 ; pcmpeqw %xmm0,%xmm6
DB 102,15,127,180,36,192,0,0,0 ; movdqa %xmm6,0xc0(%rsp)
- DB 102,15,111,53,110,67,0,0 ; movdqa 0x436e(%rip),%xmm6 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,111,53,190,70,0,0 ; movdqa 0x46be(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,15,213,196 ; pmullw %xmm4,%xmm0
@@ -38741,7 +39183,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,68,15,253,68,36,32 ; paddw 0x20(%rsp),%xmm8
DB 102,15,253,60,36 ; paddw (%rsp),%xmm7
- DB 102,15,111,5,251,72,0,0 ; movdqa 0x48fb(%rip),%xmm0 # 2d1f0 <_sk_overlay_sse2_8bit+0x1640>
+ DB 102,15,111,5,171,76,0,0 ; movdqa 0x4cab(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1724>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,68,15,253,219 ; paddw %xmm3,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -38750,7 +39192,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,68,15,253,196 ; paddw %xmm4,%xmm8
DB 102,15,253,248 ; paddw %xmm0,%xmm7
DB 102,15,253,250 ; paddw %xmm2,%xmm7
- DB 102,15,111,5,223,72,0,0 ; movdqa 0x48df(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x1650>
+ DB 102,15,111,5,143,76,0,0 ; movdqa 0x4c8f(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1734>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,248 ; pmulhuw %xmm0,%xmm7
@@ -38783,7 +39225,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,65,15,56,48,206 ; pmovzxbw %xmm14,%xmm1
DB 102,15,127,140,36,16,1,0,0 ; movdqa %xmm1,0x110(%rsp)
- DB 102,15,111,13,166,71,0,0 ; movdqa 0x47a6(%rip),%xmm1 # 2d160 <_sk_overlay_sse2_8bit+0x15b0>
+ DB 102,15,111,13,246,74,0,0 ; movdqa 0x4af6(%rip),%xmm1 # 2dba0 <_sk_overlay_sse2_8bit+0x1634>
DB 102,68,15,56,0,249 ; pshufb %xmm1,%xmm15
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,65,15,56,48,238 ; pmovzxbw %xmm14,%xmm5
@@ -38835,7 +39277,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,65,15,56,58,221 ; pminuw %xmm13,%xmm3
DB 102,15,117,216 ; pcmpeqw %xmm0,%xmm3
DB 102,15,127,156,36,176,0,0,0 ; movdqa %xmm3,0xb0(%rsp)
- DB 102,15,111,53,57,63,0,0 ; movdqa 0x3f39(%rip),%xmm6 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,111,53,137,66,0,0 ; movdqa 0x4289(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,15,213,196 ; pmullw %xmm4,%xmm0
@@ -38944,7 +39386,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,68,15,253,132,36,128,0,0,0 ; paddw 0x80(%rsp),%xmm8
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,213,68,0,0 ; movdqa 0x44d5(%rip),%xmm0 # 2d1f0 <_sk_overlay_sse2_8bit+0x1640>
+ DB 102,15,111,5,133,72,0,0 ; movdqa 0x4885(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1724>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,69,15,253,217 ; paddw %xmm9,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -38953,7 +39395,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,68,15,253,195 ; paddw %xmm3,%xmm8
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,234 ; paddw %xmm2,%xmm5
- DB 102,15,111,5,185,68,0,0 ; movdqa 0x44b9(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x1650>
+ DB 102,15,111,5,105,72,0,0 ; movdqa 0x4869(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1734>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
@@ -39003,13 +39445,13 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,101 ; jae 28e7e <_sk_start_pipeline_sse2_8bit+0xe2>
+ DB 115,101 ; jae 2956e <_sk_start_pipeline_sse2_8bit+0xe2>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,38 ; ja 28e61 <_sk_start_pipeline_sse2_8bit+0xc5>
+ DB 119,38 ; ja 29551 <_sk_start_pipeline_sse2_8bit+0xc5>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 49,255 ; xor %edi,%edi
DB 76,137,246 ; mov %r14,%rsi
@@ -39020,16 +39462,16 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 73,131,196,16 ; add $0x10,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,225 ; jbe 28e42 <_sk_start_pipeline_sse2_8bit+0xa6>
+ DB 118,225 ; jbe 29532 <_sk_start_pipeline_sse2_8bit+0xa6>
DB 76,137,255 ; mov %r15,%rdi
DB 72,41,215 ; sub %rdx,%rdi
- DB 116,9 ; je 28e72 <_sk_start_pipeline_sse2_8bit+0xd6>
+ DB 116,9 ; je 29562 <_sk_start_pipeline_sse2_8bit+0xd6>
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,173 ; jne 28e2b <_sk_start_pipeline_sse2_8bit+0x8f>
+ DB 117,173 ; jne 2951b <_sk_start_pipeline_sse2_8bit+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -39067,7 +39509,7 @@ _sk_uniform_color_sse2_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse2_8bit
_sk_set_rgb_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,89,49,0,0 ; movss 0x3159(%rip),%xmm4 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,16,37,37,52,0,0 ; movss 0x3425(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,76,15,44,197 ; cvttss2si %xmm5,%r8
@@ -39082,7 +39524,7 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 68,9,200 ; or %r9d,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,26,66,0,0 ; movdqa 0x421a(%rip),%xmm5 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 102,15,111,45,106,69,0,0 ; movdqa 0x456a(%rip),%xmm5 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -39105,7 +39547,7 @@ _sk_premul_sse2_8bit LABEL PROC
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 242,15,112,192,95 ; pshuflw $0x5f,%xmm0,%xmm0
DB 243,15,112,248,95 ; pshufhw $0x5f,%xmm0,%xmm7
- DB 102,15,111,5,190,65,0,0 ; movdqa 0x41be(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 102,15,111,5,14,69,0,0 ; movdqa 0x450e(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -39179,7 +39621,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,16 ; jne 290ad <_sk_load_8888_sse2_8bit+0x2c>
+ DB 117,16 ; jne 2979d <_sk_load_8888_sse2_8bit+0x2c>
DB 67,15,16,76,152,16 ; movups 0x10(%r8,%r11,4),%xmm1
DB 102,67,15,16,4,152 ; movupd (%r8,%r11,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39190,18 +39632,18 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,228 ; ja 290a9 <_sk_load_8888_sse2_8bit+0x28>
+ DB 119,228 ; ja 29799 <_sk_load_8888_sse2_8bit+0x28>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,80,0,0,0 ; lea 0x50(%rip),%r10 # 29120 <_sk_load_8888_sse2_8bit+0x9f>
+ DB 76,141,21,80,0,0,0 ; lea 0x50(%rip),%r10 # 29810 <_sk_load_8888_sse2_8bit+0x9f>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,67,15,16,4,152 ; movss (%r8,%r11,4),%xmm0
- DB 235,200 ; jmp 290a9 <_sk_load_8888_sse2_8bit+0x28>
+ DB 235,200 ; jmp 29799 <_sk_load_8888_sse2_8bit+0x28>
DB 102,67,15,110,68,152,8 ; movd 0x8(%r8,%r11,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,67,15,18,4,152 ; movlpd (%r8,%r11,4),%xmm0
- DB 235,180 ; jmp 290a9 <_sk_load_8888_sse2_8bit+0x28>
+ DB 235,180 ; jmp 29799 <_sk_load_8888_sse2_8bit+0x28>
DB 102,67,15,110,68,152,24 ; movd 0x18(%r8,%r11,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,67,15,16,68,152,20 ; movss 0x14(%r8,%r11,4),%xmm0
@@ -39210,7 +39652,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,67,15,16,68,152,16 ; movss 0x10(%r8,%r11,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 235,131 ; jmp 290a3 <_sk_load_8888_sse2_8bit+0x22>
+ DB 235,131 ; jmp 29793 <_sk_load_8888_sse2_8bit+0x22>
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -39238,7 +39680,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,16 ; jne 29168 <_sk_load_8888_dst_sse2_8bit+0x2c>
+ DB 117,16 ; jne 29858 <_sk_load_8888_dst_sse2_8bit+0x2c>
DB 67,15,16,92,152,16 ; movups 0x10(%r8,%r11,4),%xmm3
DB 102,67,15,16,20,152 ; movupd (%r8,%r11,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39249,18 +39691,18 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,228 ; ja 29164 <_sk_load_8888_dst_sse2_8bit+0x28>
+ DB 119,228 ; ja 29854 <_sk_load_8888_dst_sse2_8bit+0x28>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,81,0,0,0 ; lea 0x51(%rip),%r10 # 291dc <_sk_load_8888_dst_sse2_8bit+0xa0>
+ DB 76,141,21,81,0,0,0 ; lea 0x51(%rip),%r10 # 298cc <_sk_load_8888_dst_sse2_8bit+0xa0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,67,15,16,20,152 ; movss (%r8,%r11,4),%xmm2
- DB 235,200 ; jmp 29164 <_sk_load_8888_dst_sse2_8bit+0x28>
+ DB 235,200 ; jmp 29854 <_sk_load_8888_dst_sse2_8bit+0x28>
DB 102,67,15,110,84,152,8 ; movd 0x8(%r8,%r11,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,67,15,18,20,152 ; movlpd (%r8,%r11,4),%xmm2
- DB 235,180 ; jmp 29164 <_sk_load_8888_dst_sse2_8bit+0x28>
+ DB 235,180 ; jmp 29854 <_sk_load_8888_dst_sse2_8bit+0x28>
DB 102,67,15,110,84,152,24 ; movd 0x18(%r8,%r11,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,67,15,16,84,152,20 ; movss 0x14(%r8,%r11,4),%xmm2
@@ -39269,7 +39711,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,67,15,16,84,152,16 ; movss 0x10(%r8,%r11,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 235,131 ; jmp 2915e <_sk_load_8888_dst_sse2_8bit+0x22>
+ DB 235,131 ; jmp 2984e <_sk_load_8888_dst_sse2_8bit+0x22>
DB 144 ; nop
DB 184,255,255,255,204 ; mov $0xccffffff,%eax
DB 255 ; (bad)
@@ -39298,7 +39740,7 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 29225 <_sk_store_8888_sse2_8bit+0x2d>
+ DB 117,17 ; jne 29915 <_sk_store_8888_sse2_8bit+0x2d>
DB 243,67,15,127,4,152 ; movdqu %xmm0,(%r8,%r11,4)
DB 243,67,15,127,76,152,16 ; movdqu %xmm1,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39307,25 +39749,25 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 29221 <_sk_store_8888_sse2_8bit+0x29>
+ DB 119,236 ; ja 29911 <_sk_store_8888_sse2_8bit+0x29>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 2928c <_sk_store_8888_sse2_8bit+0x94>
+ DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 2997c <_sk_store_8888_sse2_8bit+0x94>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,126,4,152 ; movd %xmm0,(%r8,%r11,4)
- DB 235,208 ; jmp 29221 <_sk_store_8888_sse2_8bit+0x29>
+ DB 235,208 ; jmp 29911 <_sk_store_8888_sse2_8bit+0x29>
DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4
DB 102,67,15,126,100,152,8 ; movd %xmm4,0x8(%r8,%r11,4)
DB 102,67,15,214,4,152 ; movq %xmm0,(%r8,%r11,4)
- DB 235,188 ; jmp 29221 <_sk_store_8888_sse2_8bit+0x29>
+ DB 235,188 ; jmp 29911 <_sk_store_8888_sse2_8bit+0x29>
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,67,15,126,100,152,24 ; movd %xmm4,0x18(%r8,%r11,4)
DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
DB 102,67,15,126,100,152,20 ; movd %xmm4,0x14(%r8,%r11,4)
DB 102,67,15,126,76,152,16 ; movd %xmm1,0x10(%r8,%r11,4)
DB 243,67,15,127,4,152 ; movdqu %xmm0,(%r8,%r11,4)
- DB 235,149 ; jmp 29221 <_sk_store_8888_sse2_8bit+0x29>
+ DB 235,149 ; jmp 29911 <_sk_store_8888_sse2_8bit+0x29>
DB 189,255,255,255,209 ; mov $0xd1ffffff,%ebp
DB 255 ; (bad)
DB 255 ; (bad)
@@ -39357,7 +39799,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,92 ; jne 29320 <_sk_load_bgra_sse2_8bit+0x78>
+ DB 117,92 ; jne 29a10 <_sk_load_bgra_sse2_8bit+0x78>
DB 67,15,16,76,152,16 ; movups 0x10(%r8,%r11,4),%xmm1
DB 102,67,15,16,4,152 ; movupd (%r8,%r11,4),%xmm0
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -39385,18 +39827,18 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,152 ; ja 292d0 <_sk_load_bgra_sse2_8bit+0x28>
+ DB 119,152 ; ja 299c0 <_sk_load_bgra_sse2_8bit+0x28>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,89,0,0,0 ; lea 0x59(%rip),%r10 # 2939c <_sk_load_bgra_sse2_8bit+0xf4>
+ DB 76,141,21,89,0,0,0 ; lea 0x59(%rip),%r10 # 29a8c <_sk_load_bgra_sse2_8bit+0xf4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,67,15,16,4,152 ; movss (%r8,%r11,4),%xmm0
- DB 233,121,255,255,255 ; jmpq 292d0 <_sk_load_bgra_sse2_8bit+0x28>
+ DB 233,121,255,255,255 ; jmpq 299c0 <_sk_load_bgra_sse2_8bit+0x28>
DB 102,67,15,110,68,152,8 ; movd 0x8(%r8,%r11,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,67,15,18,4,152 ; movlpd (%r8,%r11,4),%xmm0
- DB 233,98,255,255,255 ; jmpq 292d0 <_sk_load_bgra_sse2_8bit+0x28>
+ DB 233,98,255,255,255 ; jmpq 299c0 <_sk_load_bgra_sse2_8bit+0x28>
DB 102,67,15,110,68,152,24 ; movd 0x18(%r8,%r11,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,67,15,16,68,152,20 ; movss 0x14(%r8,%r11,4),%xmm0
@@ -39405,7 +39847,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,67,15,16,68,152,16 ; movss 0x10(%r8,%r11,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 233,46,255,255,255 ; jmpq 292ca <_sk_load_bgra_sse2_8bit+0x22>
+ DB 233,46,255,255,255 ; jmpq 299ba <_sk_load_bgra_sse2_8bit+0x22>
DB 176,255 ; mov $0xff,%al
DB 255 ; (bad)
DB 255,199 ; inc %edi
@@ -39436,7 +39878,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,92 ; jne 29430 <_sk_load_bgra_dst_sse2_8bit+0x78>
+ DB 117,92 ; jne 29b20 <_sk_load_bgra_dst_sse2_8bit+0x78>
DB 67,15,16,92,152,16 ; movups 0x10(%r8,%r11,4),%xmm3
DB 102,67,15,16,20,152 ; movupd (%r8,%r11,4),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -39464,18 +39906,18 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,152 ; ja 293e0 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ DB 119,152 ; ja 29ad0 <_sk_load_bgra_dst_sse2_8bit+0x28>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,89,0,0,0 ; lea 0x59(%rip),%r10 # 294ac <_sk_load_bgra_dst_sse2_8bit+0xf4>
+ DB 76,141,21,89,0,0,0 ; lea 0x59(%rip),%r10 # 29b9c <_sk_load_bgra_dst_sse2_8bit+0xf4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,67,15,16,20,152 ; movss (%r8,%r11,4),%xmm2
- DB 233,121,255,255,255 ; jmpq 293e0 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ DB 233,121,255,255,255 ; jmpq 29ad0 <_sk_load_bgra_dst_sse2_8bit+0x28>
DB 102,67,15,110,84,152,8 ; movd 0x8(%r8,%r11,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,67,15,18,20,152 ; movlpd (%r8,%r11,4),%xmm2
- DB 233,98,255,255,255 ; jmpq 293e0 <_sk_load_bgra_dst_sse2_8bit+0x28>
+ DB 233,98,255,255,255 ; jmpq 29ad0 <_sk_load_bgra_dst_sse2_8bit+0x28>
DB 102,67,15,110,84,152,24 ; movd 0x18(%r8,%r11,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,67,15,16,84,152,20 ; movss 0x14(%r8,%r11,4),%xmm2
@@ -39484,7 +39926,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,67,15,16,84,152,16 ; movss 0x10(%r8,%r11,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 233,46,255,255,255 ; jmpq 293da <_sk_load_bgra_dst_sse2_8bit+0x22>
+ DB 233,46,255,255,255 ; jmpq 29aca <_sk_load_bgra_dst_sse2_8bit+0x22>
DB 176,255 ; mov $0xff,%al
DB 255 ; (bad)
DB 255,199 ; inc %edi
@@ -39534,7 +39976,7 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 243,15,112,237,198 ; pshufhw $0xc6,%xmm5,%xmm5
DB 102,15,103,238 ; packuswb %xmm6,%xmm5
DB 72,133,255 ; test %rdi,%rdi
- DB 117,17 ; jne 29549 <_sk_store_bgra_sse2_8bit+0x81>
+ DB 117,17 ; jne 29c39 <_sk_store_bgra_sse2_8bit+0x81>
DB 243,67,15,127,44,152 ; movdqu %xmm5,(%r8,%r11,4)
DB 243,67,15,127,100,152,16 ; movdqu %xmm4,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39543,25 +39985,25 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 29545 <_sk_store_bgra_sse2_8bit+0x7d>
+ DB 119,236 ; ja 29c35 <_sk_store_bgra_sse2_8bit+0x7d>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 295b0 <_sk_store_bgra_sse2_8bit+0xe8>
+ DB 76,141,21,76,0,0,0 ; lea 0x4c(%rip),%r10 # 29ca0 <_sk_store_bgra_sse2_8bit+0xe8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,67,15,126,44,152 ; movd %xmm5,(%r8,%r11,4)
- DB 235,208 ; jmp 29545 <_sk_store_bgra_sse2_8bit+0x7d>
+ DB 235,208 ; jmp 29c35 <_sk_store_bgra_sse2_8bit+0x7d>
DB 102,15,112,229,78 ; pshufd $0x4e,%xmm5,%xmm4
DB 102,67,15,126,100,152,8 ; movd %xmm4,0x8(%r8,%r11,4)
DB 102,67,15,214,44,152 ; movq %xmm5,(%r8,%r11,4)
- DB 235,188 ; jmp 29545 <_sk_store_bgra_sse2_8bit+0x7d>
+ DB 235,188 ; jmp 29c35 <_sk_store_bgra_sse2_8bit+0x7d>
DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6
DB 102,67,15,126,116,152,24 ; movd %xmm6,0x18(%r8,%r11,4)
DB 102,15,112,244,229 ; pshufd $0xe5,%xmm4,%xmm6
DB 102,67,15,126,116,152,20 ; movd %xmm6,0x14(%r8,%r11,4)
DB 102,67,15,126,100,152,16 ; movd %xmm4,0x10(%r8,%r11,4)
DB 243,67,15,127,44,152 ; movdqu %xmm5,(%r8,%r11,4)
- DB 235,149 ; jmp 29545 <_sk_store_bgra_sse2_8bit+0x7d>
+ DB 235,149 ; jmp 29c35 <_sk_store_bgra_sse2_8bit+0x7d>
DB 189,255,255,255,209 ; mov $0xd1ffffff,%ebp
DB 255 ; (bad)
DB 255 ; (bad)
@@ -39583,6 +40025,199 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; .byte 0xff
+PUBLIC _sk_store_565_sse2_8bit
+_sk_store_565_sse2_8bit LABEL PROC
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,72,8 ; movslq 0x8(%rax),%r9
+ DB 76,99,193 ; movslq %ecx,%r8
+ DB 77,15,175,193 ; imul %r9,%r8
+ DB 77,1,192 ; add %r8,%r8
+ DB 76,3,0 ; add (%rax),%r8
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 102,68,15,111,13,229,62,0,0 ; movdqa 0x3ee5(%rip),%xmm9 # 2dbc0 <_sk_overlay_sse2_8bit+0x1654>
+ DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8
+ DB 102,69,15,219,193 ; pand %xmm9,%xmm8
+ DB 102,68,15,219,200 ; pand %xmm0,%xmm9
+ DB 102,65,15,114,241,8 ; pslld $0x8,%xmm9
+ DB 102,65,15,114,240,8 ; pslld $0x8,%xmm8
+ DB 102,15,111,37,210,62,0,0 ; movdqa 0x3ed2(%rip),%xmm4 # 2dbd0 <_sk_overlay_sse2_8bit+0x1664>
+ DB 102,15,111,233 ; movdqa %xmm1,%xmm5
+ DB 102,15,219,236 ; pand %xmm4,%xmm5
+ DB 102,15,219,224 ; pand %xmm0,%xmm4
+ DB 102,15,114,212,5 ; psrld $0x5,%xmm4
+ DB 102,15,114,213,5 ; psrld $0x5,%xmm5
+ DB 102,15,111,61,196,62,0,0 ; movdqa 0x3ec4(%rip),%xmm7 # 2dbe0 <_sk_overlay_sse2_8bit+0x1674>
+ DB 102,15,111,240 ; movdqa %xmm0,%xmm6
+ DB 102,15,219,247 ; pand %xmm7,%xmm6
+ DB 102,15,219,249 ; pand %xmm1,%xmm7
+ DB 102,15,114,215,19 ; psrld $0x13,%xmm7
+ DB 102,15,114,214,19 ; psrld $0x13,%xmm6
+ DB 102,65,15,235,232 ; por %xmm8,%xmm5
+ DB 102,65,15,235,225 ; por %xmm9,%xmm4
+ DB 102,15,235,230 ; por %xmm6,%xmm4
+ DB 102,15,235,239 ; por %xmm7,%xmm5
+ DB 102,15,114,245,16 ; pslld $0x10,%xmm5
+ DB 102,15,114,229,16 ; psrad $0x10,%xmm5
+ DB 102,15,114,244,16 ; pslld $0x10,%xmm4
+ DB 102,15,114,228,16 ; psrad $0x10,%xmm4
+ DB 102,15,107,229 ; packssdw %xmm5,%xmm4
+ DB 72,133,255 ; test %rdi,%rdi
+ DB 117,10 ; jne 29d6b <_sk_store_565_sse2_8bit+0xaf>
+ DB 243,67,15,127,36,88 ; movdqu %xmm4,(%r8,%r11,2)
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,137,249 ; mov %edi,%r9d
+ DB 65,128,225,7 ; and $0x7,%r9b
+ DB 65,254,201 ; dec %r9b
+ DB 65,128,249,6 ; cmp $0x6,%r9b
+ DB 119,236 ; ja 29d67 <_sk_store_565_sse2_8bit+0xab>
+ DB 69,15,182,201 ; movzbl %r9b,%r9d
+ DB 76,141,21,82,0,0,0 ; lea 0x52(%rip),%r10 # 29dd8 <_sk_store_565_sse2_8bit+0x11c>
+ DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
+ DB 76,1,208 ; add %r10,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,67,137,4,88 ; mov %ax,(%r8,%r11,2)
+ DB 235,205 ; jmp 29d67 <_sk_store_565_sse2_8bit+0xab>
+ DB 102,15,197,196,2 ; pextrw $0x2,%xmm4,%eax
+ DB 102,67,137,68,88,4 ; mov %ax,0x4(%r8,%r11,2)
+ DB 102,67,15,126,36,88 ; movd %xmm4,(%r8,%r11,2)
+ DB 235,186 ; jmp 29d67 <_sk_store_565_sse2_8bit+0xab>
+ DB 102,15,197,196,6 ; pextrw $0x6,%xmm4,%eax
+ DB 102,67,137,68,88,12 ; mov %ax,0xc(%r8,%r11,2)
+ DB 102,15,197,196,5 ; pextrw $0x5,%xmm4,%eax
+ DB 102,67,137,68,88,10 ; mov %ax,0xa(%r8,%r11,2)
+ DB 102,15,197,196,4 ; pextrw $0x4,%xmm4,%eax
+ DB 102,67,137,68,88,8 ; mov %ax,0x8(%r8,%r11,2)
+ DB 102,67,15,214,36,88 ; movq %xmm4,(%r8,%r11,2)
+ DB 235,145 ; jmp 29d67 <_sk_store_565_sse2_8bit+0xab>
+ DB 102,144 ; xchg %ax,%ax
+ DB 183,255 ; mov $0xff,%bh
+ DB 255 ; (bad)
+ DB 255,205 ; dec %ebp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,194 ; inc %edx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,246 ; push %rsi
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 235,255 ; jmp 29de9 <_sk_store_565_sse2_8bit+0x12d>
+ DB 255 ; (bad)
+ DB 255,224 ; jmpq *%rax
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,213 ; callq *%rbp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
+PUBLIC _sk_load_565_dst_sse2_8bit
+_sk_load_565_dst_sse2_8bit LABEL PROC
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 76,99,72,8 ; movslq 0x8(%rax),%r9
+ DB 76,99,193 ; movslq %ecx,%r8
+ DB 77,15,175,193 ; imul %r9,%r8
+ DB 77,1,192 ; add %r8,%r8
+ DB 76,3,0 ; add (%rax),%r8
+ DB 76,99,218 ; movslq %edx,%r11
+ DB 72,133,255 ; test %rdi,%rdi
+ DB 15,133,219,0,0,0 ; jne 29eee <_sk_load_565_dst_sse2_8bit+0xfa>
+ DB 243,67,15,111,20,88 ; movdqu (%r8,%r11,2),%xmm2
+ DB 102,15,239,228 ; pxor %xmm4,%xmm4
+ DB 102,15,111,218 ; movdqa %xmm2,%xmm3
+ DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
+ DB 102,15,97,212 ; punpcklwd %xmm4,%xmm2
+ DB 102,15,111,53,159,56,0,0 ; movdqa 0x389f(%rip),%xmm6 # 2d6d0 <_sk_overlay_sse2_8bit+0x1164>
+ DB 102,15,111,250 ; movdqa %xmm2,%xmm7
+ DB 102,15,219,254 ; pand %xmm6,%xmm7
+ DB 102,15,219,243 ; pand %xmm3,%xmm6
+ DB 102,15,114,214,8 ; psrld $0x8,%xmm6
+ DB 102,15,114,215,8 ; psrld $0x8,%xmm7
+ DB 102,15,111,45,193,56,0,0 ; movdqa 0x38c1(%rip),%xmm5 # 2d710 <_sk_overlay_sse2_8bit+0x11a4>
+ DB 102,15,111,226 ; movdqa %xmm2,%xmm4
+ DB 102,15,219,229 ; pand %xmm5,%xmm4
+ DB 102,15,219,235 ; pand %xmm3,%xmm5
+ DB 102,15,114,245,19 ; pslld $0x13,%xmm5
+ DB 102,15,114,244,19 ; pslld $0x13,%xmm4
+ DB 102,15,235,231 ; por %xmm7,%xmm4
+ DB 102,15,235,238 ; por %xmm6,%xmm5
+ DB 102,15,111,53,123,56,0,0 ; movdqa 0x387b(%rip),%xmm6 # 2d6f0 <_sk_overlay_sse2_8bit+0x1184>
+ DB 102,15,111,251 ; movdqa %xmm3,%xmm7
+ DB 102,15,219,254 ; pand %xmm6,%xmm7
+ DB 102,15,114,247,5 ; pslld $0x5,%xmm7
+ DB 102,68,15,111,5,133,61,0,0 ; movdqa 0x3d85(%rip),%xmm8 # 2dc10 <_sk_overlay_sse2_8bit+0x16a4>
+ DB 102,65,15,219,216 ; pand %xmm8,%xmm3
+ DB 102,15,114,211,1 ; psrld $0x1,%xmm3
+ DB 102,15,235,223 ; por %xmm7,%xmm3
+ DB 102,15,235,221 ; por %xmm5,%xmm3
+ DB 102,15,114,213,5 ; psrld $0x5,%xmm5
+ DB 102,15,219,242 ; pand %xmm2,%xmm6
+ DB 102,15,114,246,5 ; pslld $0x5,%xmm6
+ DB 102,65,15,219,208 ; pand %xmm8,%xmm2
+ DB 102,15,114,210,1 ; psrld $0x1,%xmm2
+ DB 102,15,235,214 ; por %xmm6,%xmm2
+ DB 102,15,235,212 ; por %xmm4,%xmm2
+ DB 102,15,114,212,5 ; psrld $0x5,%xmm4
+ DB 102,15,111,53,54,61,0,0 ; movdqa 0x3d36(%rip),%xmm6 # 2dc00 <_sk_overlay_sse2_8bit+0x1694>
+ DB 102,15,219,230 ; pand %xmm6,%xmm4
+ DB 102,15,219,238 ; pand %xmm6,%xmm5
+ DB 102,15,111,53,182,60,0,0 ; movdqa 0x3cb6(%rip),%xmm6 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
+ DB 102,15,235,214 ; por %xmm6,%xmm2
+ DB 102,15,235,212 ; por %xmm4,%xmm2
+ DB 102,15,235,222 ; por %xmm6,%xmm3
+ DB 102,15,235,221 ; por %xmm5,%xmm3
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 255,224 ; jmpq *%rax
+ DB 65,137,249 ; mov %edi,%r9d
+ DB 65,128,225,7 ; and $0x7,%r9b
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
+ DB 65,254,201 ; dec %r9b
+ DB 65,128,249,6 ; cmp $0x6,%r9b
+ DB 15,135,19,255,255,255 ; ja 29e19 <_sk_load_565_dst_sse2_8bit+0x25>
+ DB 69,15,182,201 ; movzbl %r9b,%r9d
+ DB 76,141,21,91,0,0,0 ; lea 0x5b(%rip),%r10 # 29f6c <_sk_load_565_dst_sse2_8bit+0x178>
+ DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
+ DB 76,1,208 ; add %r10,%rax
+ DB 255,224 ; jmpq *%rax
+ DB 67,15,183,4,88 ; movzwl (%r8,%r11,2),%eax
+ DB 102,15,110,208 ; movd %eax,%xmm2
+ DB 233,241,254,255,255 ; jmpq 29e19 <_sk_load_565_dst_sse2_8bit+0x25>
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
+ DB 102,67,15,196,84,88,4,2 ; pinsrw $0x2,0x4(%r8,%r11,2),%xmm2
+ DB 243,67,15,16,28,88 ; movss (%r8,%r11,2),%xmm3
+ DB 243,15,16,211 ; movss %xmm3,%xmm2
+ DB 233,214,254,255,255 ; jmpq 29e19 <_sk_load_565_dst_sse2_8bit+0x25>
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
+ DB 102,67,15,196,84,88,12,6 ; pinsrw $0x6,0xc(%r8,%r11,2),%xmm2
+ DB 102,67,15,196,84,88,10,5 ; pinsrw $0x5,0xa(%r8,%r11,2),%xmm2
+ DB 102,67,15,196,84,88,8,4 ; pinsrw $0x4,0x8(%r8,%r11,2),%xmm2
+ DB 102,67,15,18,20,88 ; movlpd (%r8,%r11,2),%xmm2
+ DB 233,175,254,255,255 ; jmpq 29e19 <_sk_load_565_dst_sse2_8bit+0x25>
+ DB 102,144 ; xchg %ax,%ax
+ DB 174 ; scas %es:(%rdi),%al
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,200 ; dec %eax
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 188,255,255,255,243 ; mov $0xf3ffffff,%esp
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 235,255 ; jmp 29f7d <_sk_load_565_dst_sse2_8bit+0x189>
+ DB 255 ; (bad)
+ DB 255,227 ; jmpq *%rbx
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,215 ; callq *%rdi
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 255 ; .byte 0xff
+
PUBLIC _sk_load_a8_sse2_8bit
_sk_load_a8_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39592,10 +40227,10 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,48 ; jne 29614 <_sk_load_a8_sse2_8bit+0x48>
+ DB 117,48 ; jne 29fd0 <_sk_load_a8_sse2_8bit+0x48>
DB 243,67,15,126,4,24 ; movq (%r8,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,219,5,26,52,0,0 ; pand 0x341a(%rip),%xmm0 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,5,158,52,0,0 ; pand 0x349e(%rip),%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -39609,15 +40244,15 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,198 ; ja 295ee <_sk_load_a8_sse2_8bit+0x22>
+ DB 119,198 ; ja 29faa <_sk_load_a8_sse2_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 296a4 <_sk_load_a8_sse2_8bit+0xd8>
+ DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 2a060 <_sk_load_a8_sse2_8bit+0xd8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,167 ; jmp 295ee <_sk_load_a8_sse2_8bit+0x22>
+ DB 235,167 ; jmp 29faa <_sk_load_a8_sse2_8bit+0x22>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -39625,7 +40260,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 235,133 ; jmp 295ee <_sk_load_a8_sse2_8bit+0x22>
+ DB 235,133 ; jmp 29faa <_sk_load_a8_sse2_8bit+0x22>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -39636,7 +40271,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,67,15,110,12,24 ; movd (%r8,%r11,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,77,255,255,255 ; jmpq 295ee <_sk_load_a8_sse2_8bit+0x22>
+ DB 233,77,255,255,255 ; jmpq 29faa <_sk_load_a8_sse2_8bit+0x22>
DB 15,31,0 ; nopl (%rax)
DB 152 ; cwtl
DB 255 ; (bad)
@@ -39668,10 +40303,10 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,48 ; jne 29708 <_sk_load_a8_dst_sse2_8bit+0x48>
+ DB 117,48 ; jne 2a0c4 <_sk_load_a8_dst_sse2_8bit+0x48>
DB 243,67,15,126,20,24 ; movq (%r8,%r11,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,219,21,38,51,0,0 ; pand 0x3326(%rip),%xmm2 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,21,170,51,0,0 ; pand 0x33aa(%rip),%xmm2 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -39685,15 +40320,15 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,198 ; ja 296e2 <_sk_load_a8_dst_sse2_8bit+0x22>
+ DB 119,198 ; ja 2a09e <_sk_load_a8_dst_sse2_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 29798 <_sk_load_a8_dst_sse2_8bit+0xd8>
+ DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 2a154 <_sk_load_a8_dst_sse2_8bit+0xd8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 235,167 ; jmp 296e2 <_sk_load_a8_dst_sse2_8bit+0x22>
+ DB 235,167 ; jmp 2a09e <_sk_load_a8_dst_sse2_8bit+0x22>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -39701,7 +40336,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 235,133 ; jmp 296e2 <_sk_load_a8_dst_sse2_8bit+0x22>
+ DB 235,133 ; jmp 2a09e <_sk_load_a8_dst_sse2_8bit+0x22>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -39712,7 +40347,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,67,15,110,28,24 ; movd (%r8,%r11,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,77,255,255,255 ; jmpq 296e2 <_sk_load_a8_dst_sse2_8bit+0x22>
+ DB 233,77,255,255,255 ; jmpq 2a09e <_sk_load_a8_dst_sse2_8bit+0x22>
DB 15,31,0 ; nopl (%rax)
DB 152 ; cwtl
DB 255 ; (bad)
@@ -39754,8 +40389,8 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,114,228,16 ; psrad $0x10,%xmm4
DB 102,15,107,229 ; packssdw %xmm5,%xmm4
DB 72,133,255 ; test %rdi,%rdi
- DB 117,26 ; jne 29814 <_sk_store_a8_sse2_8bit+0x60>
- DB 102,15,219,37,14,50,0,0 ; pand 0x320e(%rip),%xmm4 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 117,26 ; jne 2a1d0 <_sk_store_a8_sse2_8bit+0x60>
+ DB 102,15,219,37,146,50,0,0 ; pand 0x3292(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,67,15,214,36,24 ; movq %xmm4,(%r8,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39765,24 +40400,24 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,232 ; ja 2980c <_sk_store_a8_sse2_8bit+0x58>
+ DB 119,232 ; ja 2a1c8 <_sk_store_a8_sse2_8bit+0x58>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,133,0,0,0 ; lea 0x85(%rip),%r10 # 298b4 <_sk_store_a8_sse2_8bit+0x100>
+ DB 76,141,21,133,0,0,0 ; lea 0x85(%rip),%r10 # 2a270 <_sk_store_a8_sse2_8bit+0x100>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 102,15,127,100,36,64 ; movdqa %xmm4,0x40(%rsp)
DB 138,68,36,64 ; mov 0x40(%rsp),%al
DB 67,136,4,24 ; mov %al,(%r8,%r11,1)
- DB 235,196 ; jmp 2980c <_sk_store_a8_sse2_8bit+0x58>
+ DB 235,196 ; jmp 2a1c8 <_sk_store_a8_sse2_8bit+0x58>
DB 102,15,127,100,36,48 ; movdqa %xmm4,0x30(%rsp)
DB 138,68,36,52 ; mov 0x34(%rsp),%al
DB 67,136,68,24,2 ; mov %al,0x2(%r8,%r11,1)
- DB 102,15,219,37,177,49,0,0 ; pand 0x31b1(%rip),%xmm4 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,37,53,50,0,0 ; pand 0x3235(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,67,137,4,24 ; mov %ax,(%r8,%r11,1)
- DB 235,158 ; jmp 2980c <_sk_store_a8_sse2_8bit+0x58>
+ DB 235,158 ; jmp 2a1c8 <_sk_store_a8_sse2_8bit+0x58>
DB 102,15,127,100,36,32 ; movdqa %xmm4,0x20(%rsp)
DB 138,68,36,44 ; mov 0x2c(%rsp),%al
DB 67,136,68,24,6 ; mov %al,0x6(%r8,%r11,1)
@@ -39792,10 +40427,10 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,127,36,36 ; movdqa %xmm4,(%rsp)
DB 138,68,36,8 ; mov 0x8(%rsp),%al
DB 67,136,68,24,4 ; mov %al,0x4(%r8,%r11,1)
- DB 102,15,219,37,110,49,0,0 ; pand 0x316e(%rip),%xmm4 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,37,242,49,0,0 ; pand 0x31f2(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,67,15,126,36,24 ; movd %xmm4,(%r8,%r11,1)
- DB 233,91,255,255,255 ; jmpq 2980c <_sk_store_a8_sse2_8bit+0x58>
+ DB 233,91,255,255,255 ; jmpq 2a1c8 <_sk_store_a8_sse2_8bit+0x58>
DB 15,31,0 ; nopl (%rax)
DB 132,255 ; test %bh,%bh
DB 255 ; (bad)
@@ -39826,15 +40461,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,116 ; jne 2995c <_sk_load_g8_sse2_8bit+0x8c>
+ DB 117,116 ; jne 2a318 <_sk_load_g8_sse2_8bit+0x8c>
DB 243,67,15,126,4,24 ; movq (%r8,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,219,5,22,49,0,0 ; pand 0x3116(%rip),%xmm0 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,5,154,49,0,0 ; pand 0x319a(%rip),%xmm0 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
- DB 102,15,111,45,126,56,0,0 ; movdqa 0x387e(%rip),%xmm5 # 2d190 <_sk_overlay_sse2_8bit+0x15e0>
+ DB 102,15,111,45,98,57,0,0 ; movdqa 0x3962(%rip),%xmm5 # 2dc30 <_sk_overlay_sse2_8bit+0x16c4>
DB 102,15,112,240,245 ; pshufd $0xf5,%xmm0,%xmm6
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,200,232 ; pshufd $0xe8,%xmm0,%xmm1
@@ -39847,7 +40482,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,196 ; punpckldq %xmm4,%xmm0
- DB 102,15,111,37,0,56,0,0 ; movdqa 0x3800(%rip),%xmm4 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 102,15,111,37,132,56,0,0 ; movdqa 0x3884(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39857,15 +40492,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,130 ; ja 298f2 <_sk_load_g8_sse2_8bit+0x22>
+ DB 119,130 ; ja 2a2ae <_sk_load_g8_sse2_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 299f0 <_sk_load_g8_sse2_8bit+0x120>
+ DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 2a3ac <_sk_load_g8_sse2_8bit+0x120>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 233,96,255,255,255 ; jmpq 298f2 <_sk_load_g8_sse2_8bit+0x22>
+ DB 233,96,255,255,255 ; jmpq 2a2ae <_sk_load_g8_sse2_8bit+0x22>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -39873,7 +40508,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 233,59,255,255,255 ; jmpq 298f2 <_sk_load_g8_sse2_8bit+0x22>
+ DB 233,59,255,255,255 ; jmpq 2a2ae <_sk_load_g8_sse2_8bit+0x22>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -39884,7 +40519,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,67,15,110,12,24 ; movd (%r8,%r11,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,3,255,255,255 ; jmpq 298f2 <_sk_load_g8_sse2_8bit+0x22>
+ DB 233,3,255,255,255 ; jmpq 2a2ae <_sk_load_g8_sse2_8bit+0x22>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -39916,15 +40551,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 117,116 ; jne 29a98 <_sk_load_g8_dst_sse2_8bit+0x8c>
+ DB 117,116 ; jne 2a454 <_sk_load_g8_dst_sse2_8bit+0x8c>
DB 243,67,15,126,20,24 ; movq (%r8,%r11,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,219,21,218,47,0,0 ; pand 0x2fda(%rip),%xmm2 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,21,94,48,0,0 ; pand 0x305e(%rip),%xmm2 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,15,97,227 ; punpcklwd %xmm3,%xmm4
DB 102,15,105,211 ; punpckhwd %xmm3,%xmm2
- DB 102,15,111,45,66,55,0,0 ; movdqa 0x3742(%rip),%xmm5 # 2d190 <_sk_overlay_sse2_8bit+0x15e0>
+ DB 102,15,111,45,38,56,0,0 ; movdqa 0x3826(%rip),%xmm5 # 2dc30 <_sk_overlay_sse2_8bit+0x16c4>
DB 102,15,112,242,245 ; pshufd $0xf5,%xmm2,%xmm6
DB 102,15,244,213 ; pmuludq %xmm5,%xmm2
DB 102,15,112,218,232 ; pshufd $0xe8,%xmm2,%xmm3
@@ -39937,7 +40572,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,212 ; punpckldq %xmm4,%xmm2
- DB 102,15,111,37,196,54,0,0 ; movdqa 0x36c4(%rip),%xmm4 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 102,15,111,37,72,55,0,0 ; movdqa 0x3748(%rip),%xmm4 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39947,15 +40582,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,130 ; ja 29a2e <_sk_load_g8_dst_sse2_8bit+0x22>
+ DB 119,130 ; ja 2a3ea <_sk_load_g8_dst_sse2_8bit+0x22>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 29b2c <_sk_load_g8_dst_sse2_8bit+0x120>
+ DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 2a4e8 <_sk_load_g8_dst_sse2_8bit+0x120>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,96,255,255,255 ; jmpq 29a2e <_sk_load_g8_dst_sse2_8bit+0x22>
+ DB 233,96,255,255,255 ; jmpq 2a3ea <_sk_load_g8_dst_sse2_8bit+0x22>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -39963,7 +40598,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 233,59,255,255,255 ; jmpq 29a2e <_sk_load_g8_dst_sse2_8bit+0x22>
+ DB 233,59,255,255,255 ; jmpq 2a3ea <_sk_load_g8_dst_sse2_8bit+0x22>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -39974,7 +40609,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,67,15,110,28,24 ; movd (%r8,%r11,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,3,255,255,255 ; jmpq 29a2e <_sk_load_g8_dst_sse2_8bit+0x22>
+ DB 233,3,255,255,255 ; jmpq 2a3ea <_sk_load_g8_dst_sse2_8bit+0x22>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -40007,7 +40642,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,253,0,0,0 ; jne 29c65 <_sk_srcover_rgba_8888_sse2_8bit+0x11d>
+ DB 15,133,253,0,0,0 ; jne 2a621 <_sk_srcover_rgba_8888_sse2_8bit+0x11d>
DB 71,15,16,68,152,16 ; movups 0x10(%r8,%r11,4),%xmm8
DB 102,71,15,16,12,152 ; movupd (%r8,%r11,4),%xmm9
DB 72,133,255 ; test %rdi,%rdi
@@ -40056,7 +40691,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,68,15,248,207 ; psubb %xmm7,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,78 ; jne 29ca2 <_sk_srcover_rgba_8888_sse2_8bit+0x15a>
+ DB 117,78 ; jne 2a65e <_sk_srcover_rgba_8888_sse2_8bit+0x15a>
DB 243,71,15,127,12,152 ; movdqu %xmm9,(%r8,%r11,4)
DB 243,71,15,127,68,152,16 ; movdqu %xmm8,0x10(%r8,%r11,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -40067,30 +40702,30 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,241,254,255,255 ; ja 29b74 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ DB 15,135,241,254,255,255 ; ja 2a530 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,210,0,0,0 ; lea 0xd2(%rip),%r10 # 29d60 <_sk_srcover_rgba_8888_sse2_8bit+0x218>
+ DB 76,141,21,210,0,0,0 ; lea 0xd2(%rip),%r10 # 2a71c <_sk_srcover_rgba_8888_sse2_8bit+0x218>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 243,71,15,16,12,152 ; movss (%r8,%r11,4),%xmm9
- DB 233,210,254,255,255 ; jmpq 29b74 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ DB 233,210,254,255,255 ; jmpq 2a530 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
DB 65,137,249 ; mov %edi,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,175 ; ja 29c61 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ DB 119,175 ; ja 2a61d <_sk_srcover_rgba_8888_sse2_8bit+0x119>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 76,141,13,191,0,0,0 ; lea 0xbf(%rip),%r9 # 29d7c <_sk_srcover_rgba_8888_sse2_8bit+0x234>
+ DB 76,141,13,191,0,0,0 ; lea 0xbf(%rip),%r9 # 2a738 <_sk_srcover_rgba_8888_sse2_8bit+0x234>
DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
DB 102,71,15,126,12,152 ; movd %xmm9,(%r8,%r11,4)
- DB 235,147 ; jmp 29c61 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ DB 235,147 ; jmp 2a61d <_sk_srcover_rgba_8888_sse2_8bit+0x119>
DB 102,67,15,110,100,152,8 ; movd 0x8(%r8,%r11,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,71,15,18,12,152 ; movlpd (%r8,%r11,4),%xmm9
- DB 233,142,254,255,255 ; jmpq 29b74 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
+ DB 233,142,254,255,255 ; jmpq 2a530 <_sk_srcover_rgba_8888_sse2_8bit+0x2c>
DB 102,67,15,110,100,152,24 ; movd 0x18(%r8,%r11,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 243,67,15,16,100,152,20 ; movss 0x14(%r8,%r11,4),%xmm4
@@ -40099,24 +40734,24 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 68,15,40,196 ; movaps %xmm4,%xmm8
DB 243,67,15,16,100,152,16 ; movss 0x10(%r8,%r11,4),%xmm4
DB 243,68,15,16,196 ; movss %xmm4,%xmm8
- DB 233,85,254,255,255 ; jmpq 29b6e <_sk_srcover_rgba_8888_sse2_8bit+0x26>
+ DB 233,85,254,255,255 ; jmpq 2a52a <_sk_srcover_rgba_8888_sse2_8bit+0x26>
DB 102,65,15,112,225,78 ; pshufd $0x4e,%xmm9,%xmm4
DB 102,67,15,126,100,152,8 ; movd %xmm4,0x8(%r8,%r11,4)
DB 102,71,15,214,12,152 ; movq %xmm9,(%r8,%r11,4)
- DB 233,48,255,255,255 ; jmpq 29c61 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ DB 233,48,255,255,255 ; jmpq 2a61d <_sk_srcover_rgba_8888_sse2_8bit+0x119>
DB 102,65,15,112,224,78 ; pshufd $0x4e,%xmm8,%xmm4
DB 102,67,15,126,100,152,24 ; movd %xmm4,0x18(%r8,%r11,4)
DB 102,65,15,112,224,229 ; pshufd $0xe5,%xmm8,%xmm4
DB 102,67,15,126,100,152,20 ; movd %xmm4,0x14(%r8,%r11,4)
DB 102,71,15,126,68,152,16 ; movd %xmm8,0x10(%r8,%r11,4)
DB 243,71,15,127,12,152 ; movdqu %xmm9,(%r8,%r11,4)
- DB 233,4,255,255,255 ; jmpq 29c61 <_sk_srcover_rgba_8888_sse2_8bit+0x119>
+ DB 233,4,255,255,255 ; jmpq 2a61d <_sk_srcover_rgba_8888_sse2_8bit+0x119>
DB 15,31,0 ; nopl (%rax)
DB 55 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 123,255 ; jnp 29d65 <_sk_srcover_rgba_8888_sse2_8bit+0x21d>
+ DB 123,255 ; jnp 2a721 <_sk_srcover_rgba_8888_sse2_8bit+0x21d>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -40152,7 +40787,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,156,34,0,0 ; mulss 0x229c(%rip),%xmm0 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,89,5,156,34,0,0 ; mulss 0x229c(%rip),%xmm0 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
@@ -40164,7 +40799,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,15,96,246 ; punpcklbw %xmm6,%xmm6
DB 242,15,112,246,0 ; pshuflw $0x0,%xmm6,%xmm6
DB 102,15,112,246,80 ; pshufd $0x50,%xmm6,%xmm6
- DB 102,15,219,53,39,44,0,0 ; pand 0x2c27(%rip),%xmm6 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,53,171,44,0,0 ; pand 0x2cab(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,65,15,213,248 ; pmullw %xmm8,%xmm7
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
@@ -40194,10 +40829,10 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,239,0,0,0 ; jne 29f44 <_sk_scale_u8_sse2_8bit+0x10b>
+ DB 15,133,239,0,0,0 ; jne 2a900 <_sk_scale_u8_sse2_8bit+0x10b>
DB 243,67,15,126,36,24 ; movq (%r8,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
- DB 102,15,219,37,169,43,0,0 ; pand 0x2ba9(%rip),%xmm4 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,37,45,44,0,0 ; pand 0x2c2d(%rip),%xmm4 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
DB 102,65,15,105,232 ; punpckhwd %xmm8,%xmm5
@@ -40251,15 +40886,15 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,3,255,255,255 ; ja 29e5f <_sk_scale_u8_sse2_8bit+0x26>
+ DB 15,135,3,255,255,255 ; ja 2a81b <_sk_scale_u8_sse2_8bit+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 29fdc <_sk_scale_u8_sse2_8bit+0x1a3>
+ DB 76,141,21,117,0,0,0 ; lea 0x75(%rip),%r10 # 2a998 <_sk_scale_u8_sse2_8bit+0x1a3>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 233,225,254,255,255 ; jmpq 29e5f <_sk_scale_u8_sse2_8bit+0x26>
+ DB 233,225,254,255,255 ; jmpq 2a81b <_sk_scale_u8_sse2_8bit+0x26>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,2 ; pinsrw $0x2,%eax,%xmm4
@@ -40267,7 +40902,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 243,15,16,229 ; movss %xmm5,%xmm4
- DB 233,188,254,255,255 ; jmpq 29e5f <_sk_scale_u8_sse2_8bit+0x26>
+ DB 233,188,254,255,255 ; jmpq 2a81b <_sk_scale_u8_sse2_8bit+0x26>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,6 ; pinsrw $0x6,%eax,%xmm4
@@ -40278,7 +40913,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,67,15,110,44,24 ; movd (%r8,%r11,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,132,254,255,255 ; jmpq 29e5f <_sk_scale_u8_sse2_8bit+0x26>
+ DB 233,132,254,255,255 ; jmpq 2a81b <_sk_scale_u8_sse2_8bit+0x26>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -40305,7 +40940,7 @@ PUBLIC _sk_lerp_1_float_sse2_8bit
_sk_lerp_1_float_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,70,32,0,0 ; mulss 0x2046(%rip),%xmm4 # 2c04c <_sk_overlay_sse2_8bit+0x49c>
+ DB 243,15,89,37,70,32,0,0 ; mulss 0x2046(%rip),%xmm4 # 2ca08 <_sk_overlay_sse2_8bit+0x49c>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -40318,7 +40953,7 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,69,15,96,217 ; punpcklbw %xmm9,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,111,53,201,41,0,0 ; movdqa 0x29c9(%rip),%xmm6 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,111,53,77,42,0,0 ; movdqa 0x2a4d(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
DB 102,15,213,225 ; pmullw %xmm1,%xmm4
@@ -40380,10 +41015,10 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 76,3,0 ; add (%rax),%r8
DB 76,99,218 ; movslq %edx,%r11
DB 72,133,255 ; test %rdi,%rdi
- DB 15,133,141,1,0,0 ; jne 2a2d7 <_sk_lerp_u8_sse2_8bit+0x1a9>
+ DB 15,133,141,1,0,0 ; jne 2ac93 <_sk_lerp_u8_sse2_8bit+0x1a9>
DB 243,67,15,126,44,24 ; movq (%r8,%r11,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
- DB 102,15,219,45,180,40,0,0 ; pand 0x28b4(%rip),%xmm5 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,219,45,56,41,0,0 ; pand 0x2938(%rip),%xmm5 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,65,15,105,224 ; punpckhwd %xmm8,%xmm4
@@ -40470,15 +41105,15 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,101,254,255,255 ; ja 2a154 <_sk_lerp_u8_sse2_8bit+0x26>
+ DB 15,135,101,254,255,255 ; ja 2ab10 <_sk_lerp_u8_sse2_8bit+0x26>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,118,0,0,0 ; lea 0x76(%rip),%r10 # 2a370 <_sk_lerp_u8_sse2_8bit+0x242>
+ DB 76,141,21,118,0,0,0 ; lea 0x76(%rip),%r10 # 2ad2c <_sk_lerp_u8_sse2_8bit+0x242>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 67,15,182,4,24 ; movzbl (%r8,%r11,1),%eax
DB 102,15,110,232 ; movd %eax,%xmm5
- DB 233,67,254,255,255 ; jmpq 2a154 <_sk_lerp_u8_sse2_8bit+0x26>
+ DB 233,67,254,255,255 ; jmpq 2ab10 <_sk_lerp_u8_sse2_8bit+0x26>
DB 67,15,182,68,24,2 ; movzbl 0x2(%r8,%r11,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,2 ; pinsrw $0x2,%eax,%xmm5
@@ -40486,7 +41121,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 243,15,16,236 ; movss %xmm4,%xmm5
- DB 233,30,254,255,255 ; jmpq 2a154 <_sk_lerp_u8_sse2_8bit+0x26>
+ DB 233,30,254,255,255 ; jmpq 2ab10 <_sk_lerp_u8_sse2_8bit+0x26>
DB 67,15,182,68,24,6 ; movzbl 0x6(%r8,%r11,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,6 ; pinsrw $0x6,%eax,%xmm5
@@ -40497,7 +41132,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,67,15,110,36,24 ; movd (%r8,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 242,15,16,236 ; movsd %xmm4,%xmm5
- DB 233,230,253,255,255 ; jmpq 2a154 <_sk_lerp_u8_sse2_8bit+0x26>
+ DB 233,230,253,255,255 ; jmpq 2ab10 <_sk_lerp_u8_sse2_8bit+0x26>
DB 102,144 ; xchg %ax,%ax
DB 147 ; xchg %eax,%ebx
DB 255 ; (bad)
@@ -40506,7 +41141,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 2a37d <_sk_lerp_u8_sse2_8bit+0x24f>
+ DB 235,255 ; jmp 2ad39 <_sk_lerp_u8_sse2_8bit+0x24f>
DB 255 ; (bad)
DB 255,224 ; jmpq *%rax
DB 255 ; (bad)
@@ -40536,7 +41171,7 @@ _sk_move_dst_src_sse2_8bit LABEL PROC
PUBLIC _sk_black_color_sse2_8bit
_sk_black_color_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,167,45,0,0 ; movaps 0x2da7(%rip),%xmm0 # 2d150 <_sk_overlay_sse2_8bit+0x15a0>
+ DB 15,40,5,43,46,0,0 ; movaps 0x2e2b(%rip),%xmm0 # 2db90 <_sk_overlay_sse2_8bit+0x1624>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -41407,7 +42042,7 @@ _sk_darken_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,49,31,0,0 ; movdqa 0x1f31(%rip),%xmm4 # 2d1e0 <_sk_overlay_sse2_8bit+0x1630>
+ DB 102,15,111,37,21,32,0,0 ; movdqa 0x2015(%rip),%xmm4 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -41513,7 +42148,7 @@ _sk_lighten_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,69,29,0,0 ; movdqa 0x1d45(%rip),%xmm4 # 2d1e0 <_sk_overlay_sse2_8bit+0x1630>
+ DB 102,15,111,37,41,30,0,0 ; movdqa 0x1e29(%rip),%xmm4 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -41561,7 +42196,7 @@ _sk_exclusion_sse2_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,103,244 ; packuswb %xmm4,%xmm6
DB 102,15,103,239 ; packuswb %xmm7,%xmm5
- DB 102,15,111,37,120,28,0,0 ; movdqa 0x1c78(%rip),%xmm4 # 2d1e0 <_sk_overlay_sse2_8bit+0x1630>
+ DB 102,15,111,37,92,29,0,0 ; movdqa 0x1d5c(%rip),%xmm4 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
DB 102,15,248,205 ; psubb %xmm5,%xmm1
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,219,230 ; pand %xmm6,%xmm4
@@ -41658,7 +42293,7 @@ _sk_difference_sse2_8bit LABEL PROC
DB 102,65,15,103,244 ; packuswb %xmm12,%xmm6
DB 102,65,15,218,226 ; pminub %xmm10,%xmm4
DB 102,65,15,218,243 ; pminub %xmm11,%xmm6
- DB 102,15,111,45,181,26,0,0 ; movdqa 0x1ab5(%rip),%xmm5 # 2d1e0 <_sk_overlay_sse2_8bit+0x1630>
+ DB 102,15,111,45,153,27,0,0 ; movdqa 0x1b99(%rip),%xmm5 # 2dc80 <_sk_overlay_sse2_8bit+0x1714>
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 102,15,219,236 ; pand %xmm4,%xmm5
@@ -41753,7 +42388,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
DB 102,69,15,217,211 ; psubusw %xmm11,%xmm10
DB 102,68,15,117,213 ; pcmpeqw %xmm5,%xmm10
- DB 102,15,111,45,24,17,0,0 ; movdqa 0x1118(%rip),%xmm5 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,111,45,156,17,0,0 ; movdqa 0x119c(%rip),%xmm5 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
DB 102,15,239,197 ; pxor %xmm5,%xmm0
DB 102,65,15,213,198 ; pmullw %xmm14,%xmm0
@@ -41857,7 +42492,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,253,188,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm15
DB 102,68,15,253,68,36,16 ; paddw 0x10(%rsp),%xmm8
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,198,22,0,0 ; movdqa 0x16c6(%rip),%xmm0 # 2d1f0 <_sk_overlay_sse2_8bit+0x1640>
+ DB 102,15,111,5,170,23,0,0 ; movdqa 0x17aa(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1724>
DB 102,15,253,208 ; paddw %xmm0,%xmm2
DB 102,68,15,253,210 ; paddw %xmm2,%xmm10
DB 102,68,15,253,248 ; paddw %xmm0,%xmm15
@@ -41866,7 +42501,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,69,15,253,200 ; paddw %xmm8,%xmm9
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,233 ; paddw %xmm1,%xmm5
- DB 102,15,111,5,169,22,0,0 ; movdqa 0x16a9(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x1650>
+ DB 102,15,111,5,141,23,0,0 ; movdqa 0x178d(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1734>
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,200 ; pmulhuw %xmm0,%xmm9
DB 102,68,15,228,248 ; pmulhuw %xmm0,%xmm15
@@ -41969,7 +42604,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,217,234 ; psubusw %xmm2,%xmm5
DB 102,15,117,236 ; pcmpeqw %xmm4,%xmm5
DB 102,15,127,172,36,160,0,0,0 ; movdqa %xmm5,0xa0(%rsp)
- DB 102,15,111,53,173,12,0,0 ; movdqa 0xcad(%rip),%xmm6 # 2ca10 <_sk_overlay_sse2_8bit+0xe60>
+ DB 102,15,111,53,49,13,0,0 ; movdqa 0xd31(%rip),%xmm6 # 2d450 <_sk_overlay_sse2_8bit+0xee4>
DB 102,15,111,194 ; movdqa %xmm2,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,65,15,213,199 ; pmullw %xmm15,%xmm0
@@ -42077,7 +42712,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,68,15,253,92,36,112 ; paddw 0x70(%rsp),%xmm11
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
DB 102,15,253,116,36,16 ; paddw 0x10(%rsp),%xmm6
- DB 102,15,111,5,87,18,0,0 ; movdqa 0x1257(%rip),%xmm0 # 2d1f0 <_sk_overlay_sse2_8bit+0x1640>
+ DB 102,15,111,5,59,19,0,0 ; movdqa 0x133b(%rip),%xmm0 # 2dc90 <_sk_overlay_sse2_8bit+0x1724>
DB 102,68,15,253,224 ; paddw %xmm0,%xmm12
DB 102,68,15,253,227 ; paddw %xmm3,%xmm12
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
@@ -42086,7 +42721,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,253,234 ; paddw %xmm2,%xmm5
DB 102,15,253,240 ; paddw %xmm0,%xmm6
DB 102,15,253,241 ; paddw %xmm1,%xmm6
- DB 102,15,111,5,59,18,0,0 ; movdqa 0x123b(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x1650>
+ DB 102,15,111,5,31,19,0,0 ; movdqa 0x131f(%rip),%xmm0 # 2dca0 <_sk_overlay_sse2_8bit+0x1734>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
@@ -42120,14 +42755,14 @@ ALIGN 4
DB 252 ; cld
DB 190,0,0,128,191 ; mov $0xbf800000,%esi
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c080 <.literal4+0x64>
+ DB 224,64 ; loopne 2ca3c <.literal4+0x64>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 2c089 <.literal4+0x6d>
+ DB 71,225,61 ; rex.RXB loope 2ca45 <.literal4+0x6d>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c093 <.literal4+0x77>
+ DB 127,67 ; jg 2ca4f <.literal4+0x77>
DB 145 ; xchg %eax,%ecx
DB 131,158,61,92,143,50,63 ; sbbl $0x3f,0x328f5c3d(%rsi)
DB 10,215 ; or %bh,%dl
@@ -42160,7 +42795,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 2c0a9 <.literal4+0x8d>
+ DB 224,7 ; loopne 2ca65 <.literal4+0x8d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -42171,8 +42806,8 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 2c0bc <.literal4+0xa0>
- DB 119,115 ; ja 2c131 <.literal4+0x115>
+ DB 127,0 ; jg 2ca78 <.literal4+0xa0>
+ DB 119,115 ; ja 2caed <.literal4+0x115>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -42195,12 +42830,12 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c147 <.literal4+0x12b>
+ DB 118,63 ; jbe 2cb03 <.literal4+0x12b>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 2c156 <.literal4+0x13a>
+ DB 124,66 ; jl 2cb12 <.literal4+0x13a>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -42210,9 +42845,9 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 2c179 <.literal4+0x15d>
+ DB 112,65 ; jo 2cb35 <.literal4+0x15d>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2c183 <.literal4+0x167>
+ DB 127,71 ; jg 2cb3f <.literal4+0x167>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,89 ; ds pop %rcx
@@ -42239,15 +42874,15 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,0,0 ; addb $0x0,(%rax)
DB 0,191,0,0,192,191 ; add %bh,-0x40400000(%rdi)
- DB 114,28 ; jb 2c1a2 <.literal4+0x186>
+ DB 114,28 ; jb 2cb5e <.literal4+0x186>
DB 199 ; (bad)
DB 62,0,0 ; add %al,%ds:(%rax)
DB 192,63,85 ; sarb $0x55,(%rdi)
DB 85 ; push %rbp
DB 149 ; xchg %eax,%ebp
DB 191,57,142,99,61 ; mov $0x3d638e39,%edi
- DB 114,249 ; jb 2c18f <.literal4+0x173>
- DB 127,63 ; jg 2c1d7 <_sk_overlay_sse2_8bit+0x627>
+ DB 114,249 ; jb 2cb4b <.literal4+0x173>
+ DB 127,63 ; jg 2cb93 <_sk_overlay_sse2_8bit+0x627>
DB 3,0 ; add (%rax),%eax
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,4 ; add %al,0x4000000(%rax)
@@ -42255,12 +42890,15 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,56,0 ; cmpb $0x0,(%rax)
DB 64,254 ; rex (bad)
- DB 255,1 ; incl (%rcx)
- DB 1,1 ; add %eax,(%rcx)
+ DB 255,7 ; incl (%rdi)
+ DB 0,7 ; add %al,(%rdi)
DB 0,0 ; add %al,(%rax)
+ DB 12,0 ; or $0x0,%al
DB 0,0 ; add %al,(%rax)
- DB 255 ; (bad)
- DB 255 ; (bad)
+ DB 0,0 ; add %al,(%rax)
+ DB 255,1 ; incl (%rcx)
+ DB 1,1 ; add %eax,(%rcx)
+ DB 0,255 ; add %bh,%bh
DB 255 ; (bad)
DB 255,0 ; incl (%rax)
@@ -42308,16 +42946,16 @@ ALIGN 32
DB 0,1 ; add %al,(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c228 <_sk_overlay_sse2_8bit+0xa000678>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cbe8 <_sk_overlay_sse2_8bit+0xa00067c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c230 <_sk_overlay_sse2_8bit+0x12000680>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cbf0 <_sk_overlay_sse2_8bit+0x12000684>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c238 <_sk_overlay_sse2_8bit+0x1a000688>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cbf8 <_sk_overlay_sse2_8bit+0x1a00068c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c240 <_sk_overlay_sse2_8bit+0x3000690>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cc00 <_sk_overlay_sse2_8bit+0x3000694>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42360,16 +42998,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c288 <_sk_overlay_sse2_8bit+0xa0006d8>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cc48 <_sk_overlay_sse2_8bit+0xa0006dc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c290 <_sk_overlay_sse2_8bit+0x120006e0>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cc50 <_sk_overlay_sse2_8bit+0x120006e4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c298 <_sk_overlay_sse2_8bit+0x1a0006e8>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cc58 <_sk_overlay_sse2_8bit+0x1a0006ec>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c2a0 <_sk_overlay_sse2_8bit+0x30006f0>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cc60 <_sk_overlay_sse2_8bit+0x30006f4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42412,16 +43050,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c2e8 <_sk_overlay_sse2_8bit+0xa000738>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cca8 <_sk_overlay_sse2_8bit+0xa00073c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c2f0 <_sk_overlay_sse2_8bit+0x12000740>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ccb0 <_sk_overlay_sse2_8bit+0x12000744>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c2f8 <_sk_overlay_sse2_8bit+0x1a000748>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ccb8 <_sk_overlay_sse2_8bit+0x1a00074c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c300 <_sk_overlay_sse2_8bit+0x3000750>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302ccc0 <_sk_overlay_sse2_8bit+0x3000754>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42464,16 +43102,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c348 <_sk_overlay_sse2_8bit+0xa000798>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cd08 <_sk_overlay_sse2_8bit+0xa00079c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c350 <_sk_overlay_sse2_8bit+0x120007a0>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cd10 <_sk_overlay_sse2_8bit+0x120007a4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c358 <_sk_overlay_sse2_8bit+0x1a0007a8>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cd18 <_sk_overlay_sse2_8bit+0x1a0007ac>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c360 <_sk_overlay_sse2_8bit+0x30007b0>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cd20 <_sk_overlay_sse2_8bit+0x30007b4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42516,16 +43154,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c3a8 <_sk_overlay_sse2_8bit+0xa0007f8>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cd68 <_sk_overlay_sse2_8bit+0xa0007fc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c3b0 <_sk_overlay_sse2_8bit+0x12000800>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cd70 <_sk_overlay_sse2_8bit+0x12000804>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c3b8 <_sk_overlay_sse2_8bit+0x1a000808>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cd78 <_sk_overlay_sse2_8bit+0x1a00080c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c3c0 <_sk_overlay_sse2_8bit+0x3000810>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cd80 <_sk_overlay_sse2_8bit+0x3000814>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42568,16 +43206,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c408 <_sk_overlay_sse2_8bit+0xa000858>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cdc8 <_sk_overlay_sse2_8bit+0xa00085c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c410 <_sk_overlay_sse2_8bit+0x12000860>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202cdd0 <_sk_overlay_sse2_8bit+0x12000864>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c418 <_sk_overlay_sse2_8bit+0x1a000868>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02cdd8 <_sk_overlay_sse2_8bit+0x1a00086c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c420 <_sk_overlay_sse2_8bit+0x3000870>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cde0 <_sk_overlay_sse2_8bit+0x3000874>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42620,16 +43258,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c468 <_sk_overlay_sse2_8bit+0xa0008b8>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02ce28 <_sk_overlay_sse2_8bit+0xa0008bc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c470 <_sk_overlay_sse2_8bit+0x120008c0>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ce30 <_sk_overlay_sse2_8bit+0x120008c4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c478 <_sk_overlay_sse2_8bit+0x1a0008c8>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ce38 <_sk_overlay_sse2_8bit+0x1a0008cc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c480 <_sk_overlay_sse2_8bit+0x30008d0>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302ce40 <_sk_overlay_sse2_8bit+0x30008d4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42672,16 +43310,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c4c8 <_sk_overlay_sse2_8bit+0xa000918>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02ce88 <_sk_overlay_sse2_8bit+0xa00091c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c4d0 <_sk_overlay_sse2_8bit+0x12000920>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202ce90 <_sk_overlay_sse2_8bit+0x12000924>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c4d8 <_sk_overlay_sse2_8bit+0x1a000928>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02ce98 <_sk_overlay_sse2_8bit+0x1a00092c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c4e0 <_sk_overlay_sse2_8bit+0x3000930>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302cea0 <_sk_overlay_sse2_8bit+0x3000934>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42944,7 +43582,64 @@ ALIGN 32
DB 5,4,7,10,9 ; add $0x90a0704,%eax
DB 8,11 ; or %cl,(%rbx)
DB 14 ; (bad)
- DB 13,12,15,3,255 ; or $0xff030f0c,%eax
+ DB 13,12,15,248,0 ; or $0xf80f0c,%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 248 ; clc
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 252 ; cld
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 248 ; clc
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 1,4,5,8,9,12,13 ; add %eax,0xd0c0908(,%rax,1)
+ DB 128,128,128,128,128,128,128 ; addb $0x80,-0x7f7f7f80(%rax)
+ DB 128,0,1 ; addb $0x1,(%rax)
+ DB 4,5 ; add $0x5,%al
+ DB 8,9 ; or %cl,(%rcx)
+ DB 12,13 ; or $0xd,%al
+ DB 128,128,128,128,128,128,128 ; addb $0x80,-0x7f7f7f80(%rax)
+ DB 128,3,255 ; addb $0xff,(%rbx)
DB 7 ; (bad)
DB 255,11 ; decl (%rbx)
DB 255,15 ; decl (%rdi)
@@ -43548,11 +44243,11 @@ ALIGN 16
DB 0,128,191,0,0,128 ; add %al,-0x7fffff41(%rax)
DB 191,0,0,224,64 ; mov $0x40e00000,%edi
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2cb38 <.literal16+0x128>
+ DB 224,64 ; loopne 2d578 <.literal16+0x128>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2cb3c <.literal16+0x12c>
+ DB 224,64 ; loopne 2d57c <.literal16+0x12c>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2cb40 <.literal16+0x130>
+ DB 224,64 ; loopne 2d580 <.literal16+0x130>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -43572,13 +44267,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2cb61 <.literal16+0x151>
+ DB 71,225,61 ; rex.RXB loope 2d5a1 <.literal16+0x151>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2cb65 <.literal16+0x155>
+ DB 71,225,61 ; rex.RXB loope 2d5a5 <.literal16+0x155>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2cb69 <.literal16+0x159>
+ DB 71,225,61 ; rex.RXB loope 2d5a9 <.literal16+0x159>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2cb6d <.literal16+0x15d>
+ DB 71,225,61 ; rex.RXB loope 2d5ad <.literal16+0x15d>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -43589,10 +44284,10 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cb48 <_sk_overlay_sse2_8bit+0xa000f98>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02d588 <_sk_overlay_sse2_8bit+0xa00101c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302cb50 <_sk_overlay_sse2_8bit+0x3000fa0>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302d590 <_sk_overlay_sse2_8bit+0x3001024>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43607,11 +44302,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2cbab <.literal16+0x19b>
+ DB 127,67 ; jg 2d5eb <.literal16+0x19b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2cbaf <.literal16+0x19f>
+ DB 127,67 ; jg 2d5ef <.literal16+0x19f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2cbb3 <.literal16+0x1a3>
+ DB 127,67 ; jg 2d5f3 <.literal16+0x1a3>
DB 145 ; xchg %eax,%ecx
DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%rsi)
DB 145 ; xchg %eax,%ecx
@@ -43762,13 +44457,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 2ccb9 <.literal16+0x2a9>
+ DB 224,7 ; loopne 2d6f9 <.literal16+0x2a9>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2ccbd <.literal16+0x2ad>
+ DB 224,7 ; loopne 2d6fd <.literal16+0x2ad>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2ccc1 <.literal16+0x2b1>
+ DB 224,7 ; loopne 2d701 <.literal16+0x2b1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2ccc5 <.literal16+0x2b5>
+ DB 224,7 ; loopne 2d705 <.literal16+0x2b5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -43828,17 +44523,17 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 2cd44 <.literal16+0x334>
+ DB 127,0 ; jg 2d784 <.literal16+0x334>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2cd48 <.literal16+0x338>
+ DB 127,0 ; jg 2d788 <.literal16+0x338>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2cd4c <.literal16+0x33c>
+ DB 127,0 ; jg 2d78c <.literal16+0x33c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2cd50 <.literal16+0x340>
- DB 119,115 ; ja 2cdc5 <.literal16+0x3b5>
+ DB 127,0 ; jg 2d790 <.literal16+0x340>
+ DB 119,115 ; ja 2d805 <.literal16+0x3b5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -43849,7 +44544,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 2cd29 <.literal16+0x319>
+ DB 117,191 ; jne 2d769 <.literal16+0x319>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -43861,7 +44556,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a60d6a <_sk_overlay_sse2_8bit+0xffffffffe9a351ba>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a617aa <_sk_overlay_sse2_8bit+0xffffffffe9a3523e>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -43951,16 +44646,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2ceb3 <.literal16+0x4a3>
+ DB 118,63 ; jbe 2d8f3 <.literal16+0x4a3>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2ceb7 <.literal16+0x4a7>
+ DB 118,63 ; jbe 2d8f7 <.literal16+0x4a7>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2cebb <.literal16+0x4ab>
+ DB 118,63 ; jbe 2d8fb <.literal16+0x4ab>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2cebf <.literal16+0x4af>
+ DB 118,63 ; jbe 2d8ff <.literal16+0x4af>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -43981,13 +44676,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 2cef6 <.literal16+0x4e6>
+ DB 124,66 ; jl 2d936 <.literal16+0x4e6>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2cefa <.literal16+0x4ea>
+ DB 124,66 ; jl 2d93a <.literal16+0x4ea>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2cefe <.literal16+0x4ee>
+ DB 124,66 ; jl 2d93e <.literal16+0x4ee>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2cf02 <.literal16+0x4f2>
+ DB 124,66 ; jl 2d942 <.literal16+0x4f2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -44033,13 +44728,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2cf85 <.literal16+0x575>
+ DB 112,65 ; jo 2d9c5 <.literal16+0x575>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2cf89 <.literal16+0x579>
+ DB 112,65 ; jo 2d9c9 <.literal16+0x579>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2cf8d <.literal16+0x57d>
+ DB 112,65 ; jo 2d9cd <.literal16+0x57d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2cf91 <.literal16+0x581>
+ DB 112,65 ; jo 2d9d1 <.literal16+0x581>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -44078,13 +44773,13 @@ ALIGN 16
DB 64,254 ; rex (bad)
DB 255,0 ; incl (%rax)
DB 255 ; (bad)
- DB 127,71 ; jg 2cffb <.literal16+0x5eb>
+ DB 127,71 ; jg 2da3b <.literal16+0x5eb>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2cfff <.literal16+0x5ef>
+ DB 127,71 ; jg 2da3f <.literal16+0x5ef>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2d003 <.literal16+0x5f3>
+ DB 127,71 ; jg 2da43 <.literal16+0x5f3>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2d007 <.literal16+0x5f7>
+ DB 127,71 ; jg 2da47 <.literal16+0x5f7>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,208 ; ds (bad)
@@ -44114,10 +44809,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2e10a <_sk_overlay_sse2_8bit+0x2dc0255a>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2eb4a <_sk_overlay_sse2_8bit+0x2dc025de>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 2d03c <.literal16+0x62c>
+ DB 120,57 ; js 2da7c <.literal16+0x62c>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -44182,13 +44877,13 @@ ALIGN 16
DB 192,191,0,0,192,191,0 ; sarb $0x0,-0x40400000(%rdi)
DB 0,192 ; add %al,%al
DB 191,0,0,192,191 ; mov $0xbfc00000,%edi
- DB 114,28 ; jb 2d0ee <.literal16+0x6de>
+ DB 114,28 ; jb 2db2e <.literal16+0x6de>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2d0f2 <.literal16+0x6e2>
+ DB 62,114,28 ; jb,pt 2db32 <.literal16+0x6e2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2d0f6 <.literal16+0x6e6>
+ DB 62,114,28 ; jb,pt 2db36 <.literal16+0x6e6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2d0fa <.literal16+0x6ea>
+ DB 62,114,28 ; jb,pt 2db3a <.literal16+0x6ea>
DB 199 ; (bad)
DB 62,85 ; ds push %rbp
DB 85 ; push %rbp
@@ -44207,15 +44902,15 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d665f45 <_sk_overlay_sse2_8bit+0x3d63a395>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d666985 <_sk_overlay_sse2_8bit+0x3d63a419>
DB 57,142,99,61,114,249 ; cmp %ecx,-0x68dc29d(%rsi)
- DB 127,63 ; jg 2d153 <.literal16+0x743>
- DB 114,249 ; jb 2d10f <.literal16+0x6ff>
- DB 127,63 ; jg 2d157 <.literal16+0x747>
- DB 114,249 ; jb 2d113 <.literal16+0x703>
- DB 127,63 ; jg 2d15b <.literal16+0x74b>
- DB 114,249 ; jb 2d117 <.literal16+0x707>
- DB 127,63 ; jg 2d15f <.literal16+0x74f>
+ DB 127,63 ; jg 2db93 <.literal16+0x743>
+ DB 114,249 ; jb 2db4f <.literal16+0x6ff>
+ DB 127,63 ; jg 2db97 <.literal16+0x747>
+ DB 114,249 ; jb 2db53 <.literal16+0x703>
+ DB 127,63 ; jg 2db9b <.literal16+0x74b>
+ DB 114,249 ; jb 2db57 <.literal16+0x707>
+ DB 127,63 ; jg 2db9f <.literal16+0x74f>
DB 3,0 ; add (%rax),%eax
DB 0,0 ; add %al,(%rax)
DB 3,0 ; add (%rax),%eax
@@ -44261,8 +44956,55 @@ ALIGN 16
DB 5,4,7,10,9 ; add $0x90a0704,%eax
DB 8,11 ; or %cl,(%rbx)
DB 14 ; (bad)
- DB 13,12,15,3,255 ; or $0xff030f0c,%eax
- DB 7 ; (bad)
+ DB 13,12,15,248,0 ; or $0xf80f0c,%eax
+ DB 0,0 ; add %al,(%rax)
+ DB 248 ; clc
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 252 ; cld
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 248 ; clc
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 1,4,5,8,9,12,13 ; add %eax,0xd0c0908(,%rax,1)
+ DB 8,9 ; or %cl,(%rcx)
+ DB 12,13 ; or $0xd,%al
+ DB 12,13 ; or $0xd,%al
+ DB 14 ; (bad)
+ DB 15,7 ; sysret
+ DB 0,7 ; add %al,(%rdi)
+ DB 0,7 ; add %al,(%rdi)
+ DB 0,7 ; add %al,(%rdi)
+ DB 0,7 ; add %al,(%rdi)
+ DB 0,7 ; add %al,(%rdi)
+ DB 0,7 ; add %al,(%rdi)
+ DB 0,7 ; add %al,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 12,0 ; or $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 12,0 ; or $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 12,0 ; or $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 12,0 ; or $0x0,%al
+ DB 0,3 ; add %al,(%rbx)
+ DB 255,7 ; incl (%rdi)
DB 255,11 ; decl (%rbx)
DB 255,15 ; decl (%rdi)
DB 255,11 ; decl (%rbx)
@@ -44322,14 +45064,14 @@ ALIGN 16
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,0 ; incl (%rax)
- DB 127,0 ; jg 2d1f2 <.literal16+0x7e2>
- DB 127,0 ; jg 2d1f4 <.literal16+0x7e4>
- DB 127,0 ; jg 2d1f6 <.literal16+0x7e6>
- DB 127,0 ; jg 2d1f8 <.literal16+0x7e8>
- DB 127,0 ; jg 2d1fa <.literal16+0x7ea>
- DB 127,0 ; jg 2d1fc <.literal16+0x7ec>
- DB 127,0 ; jg 2d1fe <.literal16+0x7ee>
- DB 127,0 ; jg 2d200 <.literal16+0x7f0>
+ DB 127,0 ; jg 2dc92 <.literal16+0x842>
+ DB 127,0 ; jg 2dc94 <.literal16+0x844>
+ DB 127,0 ; jg 2dc96 <.literal16+0x846>
+ DB 127,0 ; jg 2dc98 <.literal16+0x848>
+ DB 127,0 ; jg 2dc9a <.literal16+0x84a>
+ DB 127,0 ; jg 2dc9c <.literal16+0x84c>
+ DB 127,0 ; jg 2dc9e <.literal16+0x84e>
+ DB 127,0 ; jg 2dca0 <.literal16+0x850>
DB 129,128,129,128,129,128,129,128,129,128; addl $0x80818081,-0x7f7e7f7f(%rax)
DB 129 ; .byte 0x81
DB 128 ; .byte 0x80
@@ -44421,9 +45163,9 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,2 ; movd (%edx),%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,144,157,204,0,0 ; movaps 0xcc9d(%eax),%xmm2
+ DB 15,40,144,141,207,0,0 ; movaps 0xcf8d(%eax),%xmm2
DB 15,88,194 ; addps %xmm2,%xmm0
- DB 15,88,128,173,204,0,0 ; addps 0xccad(%eax),%xmm0
+ DB 15,88,128,157,207,0,0 ; addps 0xcf9d(%eax),%xmm0
DB 102,15,110,74,4 ; movd 0x4(%edx),%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
@@ -44435,7 +45177,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,41,82,32 ; movaps %xmm2,0x20(%edx)
DB 15,41,82,16 ; movaps %xmm2,0x10(%edx)
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,144,189,204,0,0 ; movaps 0xccbd(%eax),%xmm2
+ DB 15,40,144,173,207,0,0 ; movaps 0xcfad(%eax),%xmm2
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 86 ; push %esi
DB 82 ; push %edx
@@ -44460,20 +45202,20 @@ _sk_dither_sse2 LABEL PROC
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 102,15,110,32 ; movd (%eax),%xmm4
DB 102,15,112,236,0 ; pshufd $0x0,%xmm4,%xmm5
- DB 102,15,254,169,82,204,0,0 ; paddd 0xcc52(%ecx),%xmm5
+ DB 102,15,254,169,66,207,0,0 ; paddd 0xcf42(%ecx),%xmm5
DB 102,15,110,96,4 ; movd 0x4(%eax),%xmm4
DB 102,15,112,252,0 ; pshufd $0x0,%xmm4,%xmm7
DB 102,15,239,253 ; pxor %xmm5,%xmm7
- DB 102,15,111,177,98,204,0,0 ; movdqa 0xcc62(%ecx),%xmm6
+ DB 102,15,111,177,82,207,0,0 ; movdqa 0xcf52(%ecx),%xmm6
DB 102,15,111,207 ; movdqa %xmm7,%xmm1
DB 102,15,219,206 ; pand %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
- DB 102,15,111,129,130,204,0,0 ; movdqa 0xcc82(%ecx),%xmm0
+ DB 102,15,111,129,114,207,0,0 ; movdqa 0xcf72(%ecx),%xmm0
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,219,197 ; pand %xmm5,%xmm0
- DB 102,15,219,185,114,204,0,0 ; pand 0xcc72(%ecx),%xmm7
- DB 102,15,219,169,114,204,0,0 ; pand 0xcc72(%ecx),%xmm5
+ DB 102,15,219,185,98,207,0,0 ; pand 0xcf62(%ecx),%xmm7
+ DB 102,15,219,169,98,207,0,0 ; pand 0xcf62(%ecx),%xmm5
DB 102,15,114,246,4 ; pslld $0x4,%xmm6
DB 102,15,254,192 ; paddd %xmm0,%xmm0
DB 102,15,235,198 ; por %xmm6,%xmm0
@@ -44488,8 +45230,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,114,215,1 ; psrld $0x1,%xmm7
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 15,91,196 ; cvtdq2ps %xmm4,%xmm0
- DB 15,89,129,146,204,0,0 ; mulps 0xcc92(%ecx),%xmm0
- DB 15,88,129,162,204,0,0 ; addps 0xcca2(%ecx),%xmm0
+ DB 15,89,129,130,207,0,0 ; mulps 0xcf82(%ecx),%xmm0
+ DB 15,88,129,146,207,0,0 ; addps 0xcf92(%ecx),%xmm0
DB 243,15,16,14 ; movss (%esi),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -44553,7 +45295,7 @@ _sk_black_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,152,6,203,0,0 ; movaps 0xcb06(%eax),%xmm3
+ DB 15,40,152,246,205,0,0 ; movaps 0xcdf6(%eax),%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -44574,7 +45316,7 @@ _sk_white_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,128,214,202,0,0 ; movaps 0xcad6(%eax),%xmm0
+ DB 15,40,128,198,205,0,0 ; movaps 0xcdc6(%eax),%xmm0
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -44656,7 +45398,7 @@ _sk_srcatop_sse2 LABEL PROC
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,170,39,202,0,0 ; movaps 0xca27(%edx),%xmm5
+ DB 15,40,170,23,205,0,0 ; movaps 0xcd17(%edx),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
@@ -44693,7 +45435,7 @@ _sk_dstatop_sse2 LABEL PROC
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,40,162,200,201,0,0 ; movaps 0xc9c8(%edx),%xmm4
+ DB 15,40,162,184,204,0,0 ; movaps 0xccb8(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,198 ; addps %xmm6,%xmm0
@@ -44771,7 +45513,7 @@ _sk_srcout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,7,201,0,0 ; movaps 0xc907(%eax),%xmm4
+ DB 15,40,160,247,203,0,0 ; movaps 0xcbf7(%eax),%xmm4
DB 15,92,98,64 ; subps 0x40(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
@@ -44795,7 +45537,7 @@ _sk_dstout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,207,200,0,0 ; movaps 0xc8cf(%eax),%xmm4
+ DB 15,40,160,191,203,0,0 ; movaps 0xcbbf(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,66,16 ; movaps 0x10(%edx),%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -44823,7 +45565,7 @@ _sk_srcover_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,136,200,0,0 ; movaps 0xc888(%eax),%xmm4
+ DB 15,40,160,120,203,0,0 ; movaps 0xcb78(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -44855,7 +45597,7 @@ _sk_dstover_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,106,64 ; movaps 0x40(%edx),%xmm5
- DB 15,40,160,56,200,0,0 ; movaps 0xc838(%eax),%xmm4
+ DB 15,40,160,40,203,0,0 ; movaps 0xcb28(%eax),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
@@ -44907,7 +45649,7 @@ _sk_multiply_sse2 LABEL PROC
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
- DB 15,40,129,185,199,0,0 ; movaps 0xc7b9(%ecx),%xmm0
+ DB 15,40,129,169,202,0,0 ; movaps 0xcaa9(%ecx),%xmm0
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
@@ -44965,7 +45707,7 @@ _sk_plus__sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
- DB 15,40,160,19,199,0,0 ; movaps 0xc713(%eax),%xmm4
+ DB 15,40,160,3,202,0,0 ; movaps 0xca03(%eax),%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
DB 15,88,74,32 ; addps 0x20(%edx),%xmm1
DB 15,93,204 ; minps %xmm4,%xmm1
@@ -45033,7 +45775,7 @@ _sk_xor__sse2 LABEL PROC
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
- DB 15,40,154,101,198,0,0 ; movaps 0xc665(%edx),%xmm3
+ DB 15,40,154,85,201,0,0 ; movaps 0xc955(%edx),%xmm3
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,89,198 ; mulps %xmm6,%xmm0
@@ -45093,7 +45835,7 @@ _sk_darken_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,95,209 ; maxps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,253,197,0,0 ; movaps 0xc5fd(%edx),%xmm1
+ DB 15,40,138,237,200,0,0 ; movaps 0xc8ed(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -45140,7 +45882,7 @@ _sk_lighten_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,93,209 ; minps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,125,197,0,0 ; movaps 0xc57d(%edx),%xmm1
+ DB 15,40,138,109,200,0,0 ; movaps 0xc86d(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -45191,7 +45933,7 @@ _sk_difference_sse2 LABEL PROC
DB 15,93,214 ; minps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,146,250,196,0,0 ; movaps 0xc4fa(%edx),%xmm2
+ DB 15,40,146,234,199,0,0 ; movaps 0xc7ea(%edx),%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -45233,7 +45975,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,202 ; mulps %xmm2,%xmm1
DB 15,88,201 ; addps %xmm1,%xmm1
DB 15,92,233 ; subps %xmm1,%xmm5
- DB 15,40,138,116,196,0,0 ; movaps 0xc474(%edx),%xmm1
+ DB 15,40,138,100,199,0,0 ; movaps 0xc764(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,73,64 ; mulps 0x40(%ecx),%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -45272,7 +46014,7 @@ _sk_colorburn_sse2 LABEL PROC
DB 15,93,198 ; minps %xmm6,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
- DB 15,40,177,245,195,0,0 ; movaps 0xc3f5(%ecx),%xmm6
+ DB 15,40,177,229,198,0,0 ; movaps 0xc6e5(%ecx),%xmm6
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
@@ -45387,7 +46129,7 @@ _sk_colordodge_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
- DB 15,40,145,108,194,0,0 ; movaps 0xc26c(%ecx),%xmm2
+ DB 15,40,145,92,197,0,0 ; movaps 0xc55c(%ecx),%xmm2
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,40,250 ; movaps %xmm2,%xmm7
@@ -45502,7 +46244,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
- DB 15,40,145,11,193,0,0 ; movaps 0xc10b(%ecx),%xmm2
+ DB 15,40,145,251,195,0,0 ; movaps 0xc3fb(%ecx),%xmm2
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,40,225 ; movaps %xmm1,%xmm4
@@ -45610,7 +46352,7 @@ _sk_overlay_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
- DB 15,40,161,192,191,0,0 ; movaps 0xbfc0(%ecx),%xmm4
+ DB 15,40,161,176,194,0,0 ; movaps 0xc2b0(%ecx),%xmm4
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
@@ -45736,17 +46478,17 @@ _sk_softlight_sse2 LABEL PROC
DB 232,0,0,0,0 ; call f30 <_sk_softlight_sse2+0x52>
DB 89 ; pop %ecx
DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,137,160,190,0,0 ; movaps 0xbea0(%ecx),%xmm1
+ DB 15,40,137,144,193,0,0 ; movaps 0xc190(%ecx),%xmm1
DB 15,41,141,104,255,255,255 ; movaps %xmm1,-0x98(%ebp)
DB 15,88,193 ; addps %xmm1,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,185,48,190,0,0 ; movaps 0xbe30(%ecx),%xmm7
+ DB 15,40,185,32,193,0,0 ; movaps 0xc120(%ecx),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,82,242 ; rsqrtps %xmm2,%xmm6
DB 15,83,206 ; rcpps %xmm6,%xmm1
DB 15,92,202 ; subps %xmm2,%xmm1
- DB 15,40,161,176,190,0,0 ; movaps 0xbeb0(%ecx),%xmm4
+ DB 15,40,161,160,193,0,0 ; movaps 0xc1a0(%ecx),%xmm4
DB 15,41,101,152 ; movaps %xmm4,-0x68(%ebp)
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
@@ -45950,7 +46692,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 15,40,169,111,187,0,0 ; movaps 0xbb6f(%ecx),%xmm5
+ DB 15,40,169,95,190,0,0 ; movaps 0xbe5f(%ecx),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
@@ -45983,17 +46725,17 @@ _sk_hue_sse2 LABEL PROC
DB 15,89,233 ; mulps %xmm1,%xmm5
DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,153,255,187,0,0 ; movaps 0xbbff(%ecx),%xmm3
+ DB 15,40,153,239,190,0,0 ; movaps 0xbeef(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,153,15,188,0,0 ; movaps 0xbc0f(%ecx),%xmm3
+ DB 15,40,153,255,190,0,0 ; movaps 0xbeff(%ecx),%xmm3
DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,89,251 ; mulps %xmm3,%xmm7
DB 15,88,249 ; addps %xmm1,%xmm7
- DB 15,40,137,111,187,0,0 ; movaps 0xbb6f(%ecx),%xmm1
+ DB 15,40,137,95,190,0,0 ; movaps 0xbe5f(%ecx),%xmm1
DB 15,92,77,184 ; subps -0x48(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp)
@@ -46003,7 +46745,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp)
- DB 15,40,169,31,188,0,0 ; movaps 0xbc1f(%ecx),%xmm5
+ DB 15,40,169,15,191,0,0 ; movaps 0xbf0f(%ecx),%xmm5
DB 15,89,205 ; mulps %xmm5,%xmm1
DB 15,88,207 ; addps %xmm7,%xmm1
DB 15,94,212 ; divps %xmm4,%xmm2
@@ -46194,17 +46936,17 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,253 ; mulps %xmm5,%xmm7
DB 232,0,0,0,0 ; call 1545 <_sk_saturation_sse2+0xb0>
DB 89 ; pop %ecx
- DB 15,40,153,171,184,0,0 ; movaps 0xb8ab(%ecx),%xmm3
+ DB 15,40,153,155,187,0,0 ; movaps 0xbb9b(%ecx),%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,153,187,184,0,0 ; movaps 0xb8bb(%ecx),%xmm3
+ DB 15,40,153,171,187,0,0 ; movaps 0xbbab(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,129,27,184,0,0 ; movaps 0xb81b(%ecx),%xmm0
+ DB 15,40,129,11,187,0,0 ; movaps 0xbb0b(%ecx),%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 15,92,69,216 ; subps -0x28(%ebp),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -46216,7 +46958,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,129,203,184,0,0 ; movaps 0xb8cb(%ecx),%xmm0
+ DB 15,40,129,187,187,0,0 ; movaps 0xbbbb(%ecx),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
@@ -46373,16 +47115,16 @@ _sk_color_sse2 LABEL PROC
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,16 ; movaps 0x10(%eax),%xmm2
DB 15,40,72,32 ; movaps 0x20(%eax),%xmm1
- DB 15,40,177,80,182,0,0 ; movaps 0xb650(%ecx),%xmm6
+ DB 15,40,177,64,185,0,0 ; movaps 0xb940(%ecx),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,153,96,182,0,0 ; movaps 0xb660(%ecx),%xmm3
+ DB 15,40,153,80,185,0,0 ; movaps 0xb950(%ecx),%xmm3
DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 15,40,129,192,181,0,0 ; movaps 0xb5c0(%ecx),%xmm0
+ DB 15,40,129,176,184,0,0 ; movaps 0xb8b0(%ecx),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,69,200 ; subps -0x38(%ebp),%xmm0
DB 15,89,208 ; mulps %xmm0,%xmm2
@@ -46392,7 +47134,7 @@ _sk_color_sse2 LABEL PROC
DB 15,40,80,48 ; movaps 0x30(%eax),%xmm2
DB 15,89,194 ; mulps %xmm2,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
- DB 15,40,137,112,182,0,0 ; movaps 0xb670(%ecx),%xmm1
+ DB 15,40,137,96,185,0,0 ; movaps 0xb960(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,40,88,64 ; movaps 0x40(%eax),%xmm3
@@ -46549,18 +47291,18 @@ _sk_luminosity_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1a03 <_sk_luminosity_sse2+0x11>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 15,40,161,237,179,0,0 ; movaps 0xb3ed(%ecx),%xmm4
+ DB 15,40,161,221,182,0,0 ; movaps 0xb6dd(%ecx),%xmm4
DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,161,253,179,0,0 ; movaps 0xb3fd(%ecx),%xmm4
+ DB 15,40,161,237,182,0,0 ; movaps 0xb6ed(%ecx),%xmm4
DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,40,161,93,179,0,0 ; movaps 0xb35d(%ecx),%xmm4
+ DB 15,40,161,77,182,0,0 ; movaps 0xb64d(%ecx),%xmm4
DB 15,40,252 ; movaps %xmm4,%xmm7
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -46570,7 +47312,7 @@ _sk_luminosity_sse2 LABEL PROC
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,41,189,104,255,255,255 ; movaps %xmm7,-0x98(%ebp)
DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,40,137,13,180,0,0 ; movaps 0xb40d(%ecx),%xmm1
+ DB 15,40,137,253,182,0,0 ; movaps 0xb6fd(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,213 ; addps %xmm5,%xmm2
DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
@@ -46744,7 +47486,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 139,49 ; mov (%ecx),%esi
DB 15,133,224,0,0,0 ; jne 1d70 <_sk_srcover_rgba_8888_sse2+0x119>
DB 243,15,111,20,178 ; movdqu (%edx,%esi,4),%xmm2
- DB 102,15,111,167,178,177,0,0 ; movdqa 0xb1b2(%edi),%xmm4
+ DB 102,15,111,167,162,180,0,0 ; movdqa 0xb4a2(%edi),%xmm4
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
@@ -46755,9 +47497,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,219,252 ; pand %xmm4,%xmm7
DB 15,91,229 ; cvtdq2ps %xmm5,%xmm4
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,175,242,176,0,0 ; movaps 0xb0f2(%edi),%xmm5
+ DB 15,40,175,226,179,0,0 ; movaps 0xb3e2(%edi),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
- DB 15,40,143,194,177,0,0 ; movaps 0xb1c2(%edi),%xmm1
+ DB 15,40,143,178,180,0,0 ; movaps 0xb4b2(%edi),%xmm1
DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
@@ -46867,7 +47609,7 @@ _sk_clamp_1_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1e1a <_sk_clamp_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,70,175,0,0 ; movaps 0xaf46(%eax),%xmm4
+ DB 15,40,160,54,178,0,0 ; movaps 0xb236(%eax),%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
DB 15,93,204 ; minps %xmm4,%xmm1
DB 15,93,212 ; minps %xmm4,%xmm2
@@ -46889,7 +47631,7 @@ _sk_clamp_a_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1e4d <_sk_clamp_a_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,93,152,19,175,0,0 ; minps 0xaf13(%eax),%xmm3
+ DB 15,93,152,3,178,0,0 ; minps 0xb203(%eax),%xmm3
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -46912,7 +47654,7 @@ _sk_clamp_a_dst_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,98,64 ; movaps 0x40(%edx),%xmm4
- DB 15,93,160,227,174,0,0 ; minps 0xaee3(%eax),%xmm4
+ DB 15,93,160,211,177,0,0 ; minps 0xb1d3(%eax),%xmm4
DB 15,41,98,64 ; movaps %xmm4,0x40(%edx)
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,93,236 ; minps %xmm4,%xmm5
@@ -46980,7 +47722,7 @@ _sk_invert_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1f28 <_sk_invert_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,56,174,0,0 ; movaps 0xae38(%eax),%xmm4
+ DB 15,40,160,40,177,0,0 ; movaps 0xb128(%eax),%xmm4
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
@@ -47093,7 +47835,7 @@ _sk_unpremul_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,40,168,58,173,0,0 ; movaps 0xad3a(%eax),%xmm5
+ DB 15,40,168,42,176,0,0 ; movaps 0xb02a(%eax),%xmm5
DB 15,94,235 ; divps %xmm3,%xmm5
DB 15,194,227,4 ; cmpneqps %xmm3,%xmm4
DB 15,84,229 ; andps %xmm5,%xmm4
@@ -47122,19 +47864,19 @@ _sk_from_srgb_sse2 LABEL PROC
DB 88 ; pop %eax
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,201 ; mulps %xmm1,%xmm1
- DB 15,40,160,128,173,0,0 ; movaps 0xad80(%eax),%xmm4
+ DB 15,40,160,112,176,0,0 ; movaps 0xb070(%eax),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,176,224,173,0,0 ; movaps 0xade0(%eax),%xmm6
+ DB 15,40,176,208,176,0,0 ; movaps 0xb0d0(%eax),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,176,208,173,0,0 ; movaps 0xadd0(%eax),%xmm6
+ DB 15,40,176,192,176,0,0 ; movaps 0xb0c0(%eax),%xmm6
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,184,240,173,0,0 ; movaps 0xadf0(%eax),%xmm7
+ DB 15,40,184,224,176,0,0 ; movaps 0xb0e0(%eax),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,184,0,174,0,0 ; movaps 0xae00(%eax),%xmm7
+ DB 15,40,184,240,176,0,0 ; movaps 0xb0f0(%eax),%xmm7
DB 15,194,215,1 ; cmpltps %xmm7,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -47192,18 +47934,18 @@ _sk_from_srgb_dst_sse2 LABEL PROC
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,40,161,165,172,0,0 ; movaps 0xaca5(%ecx),%xmm4
+ DB 15,40,161,149,175,0,0 ; movaps 0xaf95(%ecx),%xmm4
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,177,5,173,0,0 ; movaps 0xad05(%ecx),%xmm6
+ DB 15,40,177,245,175,0,0 ; movaps 0xaff5(%ecx),%xmm6
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,169,245,172,0,0 ; movaps 0xacf5(%ecx),%xmm5
+ DB 15,40,169,229,175,0,0 ; movaps 0xafe5(%ecx),%xmm5
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,185,21,173,0,0 ; movaps 0xad15(%ecx),%xmm7
+ DB 15,40,185,5,176,0,0 ; movaps 0xb005(%ecx),%xmm7
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,153,37,173,0,0 ; movaps 0xad25(%ecx),%xmm3
+ DB 15,40,153,21,176,0,0 ; movaps 0xb015(%ecx),%xmm3
DB 15,194,203,1 ; cmpltps %xmm3,%xmm1
DB 15,84,209 ; andps %xmm1,%xmm2
DB 15,85,200 ; andnps %xmm0,%xmm1
@@ -47263,25 +48005,25 @@ _sk_to_srgb_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 2236 <_sk_to_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,82,218 ; rsqrtps %xmm2,%xmm3
- DB 15,40,160,90,172,0,0 ; movaps 0xac5a(%eax),%xmm4
+ DB 15,40,160,74,175,0,0 ; movaps 0xaf4a(%eax),%xmm4
DB 15,40,235 ; movaps %xmm3,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,40,128,106,172,0,0 ; movaps 0xac6a(%eax),%xmm0
+ DB 15,40,128,90,175,0,0 ; movaps 0xaf5a(%eax),%xmm0
DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,40,128,122,172,0,0 ; movaps 0xac7a(%eax),%xmm0
+ DB 15,40,128,106,175,0,0 ; movaps 0xaf6a(%eax),%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,128,138,172,0,0 ; movaps 0xac8a(%eax),%xmm0
+ DB 15,40,128,122,175,0,0 ; movaps 0xaf7a(%eax),%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 15,88,216 ; addps %xmm0,%xmm3
DB 15,83,195 ; rcpps %xmm3,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,168,74,172,0,0 ; movaps 0xac4a(%eax),%xmm5
+ DB 15,40,168,58,175,0,0 ; movaps 0xaf3a(%eax),%xmm5
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,152,154,172,0,0 ; movaps 0xac9a(%eax),%xmm3
+ DB 15,40,152,138,175,0,0 ; movaps 0xaf8a(%eax),%xmm3
DB 15,194,211,1 ; cmpltps %xmm3,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -47350,14 +48092,14 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
- DB 15,40,136,51,170,0,0 ; movaps 0xaa33(%eax),%xmm1
+ DB 15,40,136,35,173,0,0 ; movaps 0xad23(%eax),%xmm1
DB 15,94,200 ; divps %xmm0,%xmm1
DB 15,40,199 ; movaps %xmm7,%xmm0
DB 15,92,194 ; subps %xmm2,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
- DB 15,84,168,179,171,0,0 ; andps 0xabb3(%eax),%xmm5
+ DB 15,84,168,163,174,0,0 ; andps 0xaea3(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,196,0 ; cmpeqps %xmm4,%xmm0
@@ -47367,9 +48109,9 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,92,231 ; subps %xmm7,%xmm4
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,89,225 ; mulps %xmm1,%xmm4
- DB 15,40,136,195,171,0,0 ; movaps 0xabc3(%eax),%xmm1
+ DB 15,40,136,179,174,0,0 ; movaps 0xaeb3(%eax),%xmm1
DB 15,88,209 ; addps %xmm1,%xmm2
- DB 15,88,160,211,171,0,0 ; addps 0xabd3(%eax),%xmm4
+ DB 15,88,160,195,174,0,0 ; addps 0xaec3(%eax),%xmm4
DB 15,84,214 ; andps %xmm6,%xmm2
DB 15,85,244 ; andnps %xmm4,%xmm6
DB 15,86,242 ; orps %xmm2,%xmm6
@@ -47381,7 +48123,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,194,226,4 ; cmpneqps %xmm2,%xmm4
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 15,40,168,19,170,0,0 ; movaps 0xaa13(%eax),%xmm5
+ DB 15,40,168,3,173,0,0 ; movaps 0xad03(%eax),%xmm5
DB 15,92,202 ; subps %xmm2,%xmm1
DB 15,40,211 ; movaps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
@@ -47391,7 +48133,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,86,233 ; orps %xmm1,%xmm5
DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
DB 15,94,205 ; divps %xmm5,%xmm1
- DB 15,89,128,227,171,0,0 ; mulps 0xabe3(%eax),%xmm0
+ DB 15,89,128,211,174,0,0 ; mulps 0xaed3(%eax),%xmm0
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,84,204 ; andps %xmm4,%xmm1
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -47414,7 +48156,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
DB 232,0,0,0,0 ; call 2428 <_sk_hsl_to_rgb_sse2+0x19>
DB 88 ; pop %eax
- DB 15,40,160,24,169,0,0 ; movaps 0xa918(%eax),%xmm4
+ DB 15,40,160,8,172,0,0 ; movaps 0xac08(%eax),%xmm4
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
DB 15,194,218,2 ; cmpleps %xmm2,%xmm3
@@ -47427,13 +48169,13 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,84,243 ; andps %xmm3,%xmm6
DB 15,85,217 ; andnps %xmm1,%xmm3
DB 15,86,222 ; orps %xmm6,%xmm3
- DB 15,40,168,248,170,0,0 ; movaps 0xaaf8(%eax),%xmm5
+ DB 15,40,168,232,173,0,0 ; movaps 0xade8(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 243,15,91,205 ; cvttps2dq %xmm5,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,193,1 ; cmpltps %xmm1,%xmm0
- DB 15,40,176,56,169,0,0 ; movaps 0xa938(%eax),%xmm6
+ DB 15,40,176,40,172,0,0 ; movaps 0xac28(%eax),%xmm6
DB 15,41,117,136 ; movaps %xmm6,-0x78(%ebp)
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,200 ; subps %xmm0,%xmm1
@@ -47443,19 +48185,19 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,40,184,8,171,0,0 ; movaps 0xab08(%eax),%xmm7
+ DB 15,40,184,248,173,0,0 ; movaps 0xadf8(%eax),%xmm7
DB 15,41,189,88,255,255,255 ; movaps %xmm7,-0xa8(%ebp)
DB 15,194,253,2 ; cmpleps %xmm5,%xmm7
DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,204 ; movaps %xmm4,%xmm1
DB 15,194,205,2 ; cmpleps %xmm5,%xmm1
- DB 15,40,160,232,170,0,0 ; movaps 0xaae8(%eax),%xmm4
+ DB 15,40,160,216,173,0,0 ; movaps 0xadd8(%eax),%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,194,229,2 ; cmpleps %xmm5,%xmm4
- DB 15,40,176,184,170,0,0 ; movaps 0xaab8(%eax),%xmm6
+ DB 15,40,176,168,173,0,0 ; movaps 0xada8(%eax),%xmm6
DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,40,128,216,170,0,0 ; movaps 0xaad8(%eax),%xmm0
+ DB 15,40,128,200,173,0,0 ; movaps 0xadc8(%eax),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
@@ -47481,18 +48223,18 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,194,200,1 ; cmpltps %xmm0,%xmm1
- DB 15,84,136,56,169,0,0 ; andps 0xa938(%eax),%xmm1
+ DB 15,84,136,40,172,0,0 ; andps 0xac28(%eax),%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,40,128,8,171,0,0 ; movaps 0xab08(%eax),%xmm0
+ DB 15,40,128,248,173,0,0 ; movaps 0xadf8(%eax),%xmm0
DB 15,194,193,2 ; cmpleps %xmm1,%xmm0
- DB 15,40,152,24,169,0,0 ; movaps 0xa918(%eax),%xmm3
+ DB 15,40,152,8,172,0,0 ; movaps 0xac08(%eax),%xmm3
DB 15,194,217,2 ; cmpleps %xmm1,%xmm3
- DB 15,40,160,232,170,0,0 ; movaps 0xaae8(%eax),%xmm4
+ DB 15,40,160,216,173,0,0 ; movaps 0xadd8(%eax),%xmm4
DB 15,194,225,2 ; cmpleps %xmm1,%xmm4
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,168,216,170,0,0 ; movaps 0xaad8(%eax),%xmm5
+ DB 15,40,168,200,173,0,0 ; movaps 0xadc8(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,239 ; mulps %xmm7,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
@@ -47512,7 +48254,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
DB 15,85,252 ; andnps %xmm4,%xmm7
DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 15,88,152,24,171,0,0 ; addps 0xab18(%eax),%xmm3
+ DB 15,88,152,8,174,0,0 ; addps 0xae08(%eax),%xmm3
DB 243,15,91,195 ; cvttps2dq %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
@@ -47610,9 +48352,9 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,126,167,0,0 ; pand 0xa77e(%edx),%xmm4
+ DB 102,15,219,162,110,170,0,0 ; pand 0xaa6e(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,174,168,0,0 ; mulps 0xa8ae(%edx),%xmm4
+ DB 15,89,162,158,171,0,0 ; mulps 0xab9e(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,89,212 ; mulps %xmm4,%xmm2
@@ -47676,17 +48418,17 @@ _sk_scale_565_sse2 LABEL PROC
DB 15,133,157,0,0,0 ; jne 281a <_sk_scale_565_sse2+0xd8>
DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,162,4,168,0,0 ; movdqa 0xa804(%edx),%xmm4
+ DB 102,15,111,162,244,170,0,0 ; movdqa 0xaaf4(%edx),%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,212 ; cvtdq2ps %xmm4,%xmm2
- DB 15,89,146,20,168,0,0 ; mulps 0xa814(%edx),%xmm2
- DB 102,15,111,170,36,168,0,0 ; movdqa 0xa824(%edx),%xmm5
+ DB 15,89,146,4,171,0,0 ; mulps 0xab04(%edx),%xmm2
+ DB 102,15,111,170,20,171,0,0 ; movdqa 0xab14(%edx),%xmm5
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,52,168,0,0 ; mulps 0xa834(%edx),%xmm5
- DB 102,15,219,178,68,168,0,0 ; pand 0xa844(%edx),%xmm6
+ DB 15,89,170,36,171,0,0 ; mulps 0xab24(%edx),%xmm5
+ DB 102,15,219,178,52,171,0,0 ; pand 0xab34(%edx),%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,84,168,0,0 ; mulps 0xa854(%edx),%xmm6
+ DB 15,89,178,68,171,0,0 ; mulps 0xab44(%edx),%xmm6
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,93,254 ; minps %xmm6,%xmm7
DB 15,40,226 ; movaps %xmm2,%xmm4
@@ -47796,9 +48538,9 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,87,165,0,0 ; pand 0xa557(%edx),%xmm4
+ DB 102,15,219,162,71,168,0,0 ; pand 0xa847(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,135,166,0,0 ; mulps 0xa687(%edx),%xmm4
+ DB 15,89,162,119,169,0,0 ; mulps 0xa977(%edx),%xmm4
DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
DB 15,92,197 ; subps %xmm5,%xmm0
@@ -47874,17 +48616,17 @@ _sk_lerp_565_sse2 LABEL PROC
DB 15,133,211,0,0,0 ; jne 2aa7 <_sk_lerp_565_sse2+0x113>
DB 243,15,126,44,126 ; movq (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
- DB 102,15,111,162,173,165,0,0 ; movdqa 0xa5ad(%edx),%xmm4
+ DB 102,15,111,162,157,168,0,0 ; movdqa 0xa89d(%edx),%xmm4
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 15,91,204 ; cvtdq2ps %xmm4,%xmm1
- DB 15,89,138,189,165,0,0 ; mulps 0xa5bd(%edx),%xmm1
- DB 102,15,111,178,205,165,0,0 ; movdqa 0xa5cd(%edx),%xmm6
+ DB 15,89,138,173,168,0,0 ; mulps 0xa8ad(%edx),%xmm1
+ DB 102,15,111,178,189,168,0,0 ; movdqa 0xa8bd(%edx),%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,221,165,0,0 ; mulps 0xa5dd(%edx),%xmm6
- DB 102,15,219,170,237,165,0,0 ; pand 0xa5ed(%edx),%xmm5
+ DB 15,89,178,205,168,0,0 ; mulps 0xa8cd(%edx),%xmm6
+ DB 102,15,219,170,221,168,0,0 ; pand 0xa8dd(%edx),%xmm5
DB 15,91,213 ; cvtdq2ps %xmm5,%xmm2
- DB 15,89,146,253,165,0,0 ; mulps 0xa5fd(%edx),%xmm2
+ DB 15,89,146,237,168,0,0 ; mulps 0xa8ed(%edx),%xmm2
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,254 ; movaps %xmm6,%xmm7
@@ -47970,7 +48712,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 139,30 ; mov (%esi),%ebx
DB 15,133,19,1,0,0 ; jne 2c27 <_sk_load_tables_sse2+0x139>
DB 243,15,111,28,187 ; movdqu (%ebx,%edi,4),%xmm3
- DB 102,15,111,146,36,163,0,0 ; movdqa 0xa324(%edx),%xmm2
+ DB 102,15,111,146,20,166,0,0 ; movdqa 0xa614(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
@@ -48026,7 +48768,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,84,164,0,0 ; mulps 0xa454(%edx),%xmm3
+ DB 15,89,154,68,167,0,0 ; mulps 0xa744(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,194 ; mov %eax,%edx
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -48171,7 +48913,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 243,15,126,93,208 ; movq -0x30(%ebp),%xmm3
DB 102,15,97,223 ; punpcklwd %xmm7,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,86,163,0,0 ; mulps 0xa356(%edx),%xmm3
+ DB 15,89,154,70,166,0,0 ; mulps 0xa646(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,193 ; mov %eax,%ecx
DB 141,65,8 ; lea 0x8(%ecx),%eax
@@ -48308,7 +49050,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 141,65,8 ; lea 0x8(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 139,85,240 ; mov -0x10(%ebp),%edx
- DB 15,40,162,246,158,0,0 ; movaps 0x9ef6(%edx),%xmm4
+ DB 15,40,162,230,161,0,0 ; movaps 0xa1e6(%edx),%xmm4
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 80 ; push %eax
@@ -48351,7 +49093,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
- DB 15,40,162,183,157,0,0 ; movaps 0x9db7(%edx),%xmm4
+ DB 15,40,162,167,160,0,0 ; movaps 0xa0a7(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
@@ -48373,7 +49115,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,15,196,192,0 ; pinsrw $0x0,%eax,%xmm0
DB 139,65,4 ; mov 0x4(%ecx),%eax
DB 102,15,196,195,1 ; pinsrw $0x1,%ebx,%xmm0
- DB 15,40,170,215,158,0,0 ; movaps 0x9ed7(%edx),%xmm5
+ DB 15,40,170,199,161,0,0 ; movaps 0xa1c7(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -48501,7 +49243,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,15,196,199,0 ; pinsrw $0x0,%edi,%xmm0
DB 139,121,4 ; mov 0x4(%ecx),%edi
DB 102,15,196,198,1 ; pinsrw $0x1,%esi,%xmm0
- DB 15,40,170,215,156,0,0 ; movaps 0x9cd7(%edx),%xmm5
+ DB 15,40,170,199,159,0,0 ; movaps 0x9fc7(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -48747,15 +49489,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,136,154,0,0 ; mulps 0x9a88(%edx),%xmm5
- DB 15,84,178,152,154,0,0 ; andps 0x9a98(%edx),%xmm6
- DB 15,86,178,248,151,0,0 ; orps 0x97f8(%edx),%xmm6
- DB 15,88,170,168,154,0,0 ; addps 0x9aa8(%edx),%xmm5
- DB 15,40,186,184,154,0,0 ; movaps 0x9ab8(%edx),%xmm7
+ DB 15,89,170,120,157,0,0 ; mulps 0x9d78(%edx),%xmm5
+ DB 15,84,178,136,157,0,0 ; andps 0x9d88(%edx),%xmm6
+ DB 15,86,178,232,154,0,0 ; orps 0x9ae8(%edx),%xmm6
+ DB 15,88,170,152,157,0,0 ; addps 0x9d98(%edx),%xmm5
+ DB 15,40,186,168,157,0,0 ; movaps 0x9da8(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,200,154,0,0 ; addps 0x9ac8(%edx),%xmm6
- DB 15,40,186,216,154,0,0 ; movaps 0x9ad8(%edx),%xmm7
+ DB 15,88,178,184,157,0,0 ; addps 0x9db8(%edx),%xmm6
+ DB 15,40,186,200,157,0,0 ; movaps 0x9dc8(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48765,21 +49507,21 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,24,152,0,0 ; movaps 0x9818(%edx),%xmm6
+ DB 15,40,178,8,155,0,0 ; movaps 0x9b08(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,232,154,0,0 ; addps 0x9ae8(%edx),%xmm5
- DB 15,40,186,248,154,0,0 ; movaps 0x9af8(%edx),%xmm7
+ DB 15,88,170,216,157,0,0 ; addps 0x9dd8(%edx),%xmm5
+ DB 15,40,186,232,157,0,0 ; movaps 0x9de8(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,8,155,0,0 ; movaps 0x9b08(%edx),%xmm7
+ DB 15,40,186,248,157,0,0 ; movaps 0x9df8(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,24,155,0,0 ; movaps 0x9b18(%edx),%xmm0
+ DB 15,40,130,8,158,0,0 ; movaps 0x9e08(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,40,155,0,0 ; mulps 0x9b28(%edx),%xmm0
+ DB 15,89,130,24,158,0,0 ; mulps 0x9e18(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48831,15 +49573,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,81,153,0,0 ; mulps 0x9951(%edx),%xmm5
- DB 15,84,178,97,153,0,0 ; andps 0x9961(%edx),%xmm6
- DB 15,86,178,193,150,0,0 ; orps 0x96c1(%edx),%xmm6
- DB 15,88,170,113,153,0,0 ; addps 0x9971(%edx),%xmm5
- DB 15,40,186,129,153,0,0 ; movaps 0x9981(%edx),%xmm7
+ DB 15,89,170,65,156,0,0 ; mulps 0x9c41(%edx),%xmm5
+ DB 15,84,178,81,156,0,0 ; andps 0x9c51(%edx),%xmm6
+ DB 15,86,178,177,153,0,0 ; orps 0x99b1(%edx),%xmm6
+ DB 15,88,170,97,156,0,0 ; addps 0x9c61(%edx),%xmm5
+ DB 15,40,186,113,156,0,0 ; movaps 0x9c71(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,145,153,0,0 ; addps 0x9991(%edx),%xmm6
- DB 15,40,186,161,153,0,0 ; movaps 0x99a1(%edx),%xmm7
+ DB 15,88,178,129,156,0,0 ; addps 0x9c81(%edx),%xmm6
+ DB 15,40,186,145,156,0,0 ; movaps 0x9c91(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48849,21 +49591,21 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,225,150,0,0 ; movaps 0x96e1(%edx),%xmm6
+ DB 15,40,178,209,153,0,0 ; movaps 0x99d1(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,177,153,0,0 ; addps 0x99b1(%edx),%xmm5
- DB 15,40,186,193,153,0,0 ; movaps 0x99c1(%edx),%xmm7
+ DB 15,88,170,161,156,0,0 ; addps 0x9ca1(%edx),%xmm5
+ DB 15,40,186,177,156,0,0 ; movaps 0x9cb1(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,209,153,0,0 ; movaps 0x99d1(%edx),%xmm7
+ DB 15,40,186,193,156,0,0 ; movaps 0x9cc1(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,225,153,0,0 ; movaps 0x99e1(%edx),%xmm0
+ DB 15,40,130,209,156,0,0 ; movaps 0x9cd1(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,241,153,0,0 ; mulps 0x99f1(%edx),%xmm0
+ DB 15,89,130,225,156,0,0 ; mulps 0x9ce1(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48914,15 +49656,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,29,152,0,0 ; mulps 0x981d(%edx),%xmm5
- DB 15,84,178,45,152,0,0 ; andps 0x982d(%edx),%xmm6
- DB 15,86,178,141,149,0,0 ; orps 0x958d(%edx),%xmm6
- DB 15,88,170,61,152,0,0 ; addps 0x983d(%edx),%xmm5
- DB 15,40,186,77,152,0,0 ; movaps 0x984d(%edx),%xmm7
+ DB 15,89,170,13,155,0,0 ; mulps 0x9b0d(%edx),%xmm5
+ DB 15,84,178,29,155,0,0 ; andps 0x9b1d(%edx),%xmm6
+ DB 15,86,178,125,152,0,0 ; orps 0x987d(%edx),%xmm6
+ DB 15,88,170,45,155,0,0 ; addps 0x9b2d(%edx),%xmm5
+ DB 15,40,186,61,155,0,0 ; movaps 0x9b3d(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,93,152,0,0 ; addps 0x985d(%edx),%xmm6
- DB 15,40,186,109,152,0,0 ; movaps 0x986d(%edx),%xmm7
+ DB 15,88,178,77,155,0,0 ; addps 0x9b4d(%edx),%xmm6
+ DB 15,40,186,93,155,0,0 ; movaps 0x9b5d(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -48932,21 +49674,21 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,173,149,0,0 ; movaps 0x95ad(%edx),%xmm6
+ DB 15,40,178,157,152,0,0 ; movaps 0x989d(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,125,152,0,0 ; addps 0x987d(%edx),%xmm5
- DB 15,40,186,141,152,0,0 ; movaps 0x988d(%edx),%xmm7
+ DB 15,88,170,109,155,0,0 ; addps 0x9b6d(%edx),%xmm5
+ DB 15,40,186,125,155,0,0 ; movaps 0x9b7d(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,157,152,0,0 ; movaps 0x989d(%edx),%xmm7
+ DB 15,40,186,141,155,0,0 ; movaps 0x9b8d(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,173,152,0,0 ; movaps 0x98ad(%edx),%xmm0
+ DB 15,40,130,157,155,0,0 ; movaps 0x9b9d(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,189,152,0,0 ; mulps 0x98bd(%edx),%xmm0
+ DB 15,89,130,173,155,0,0 ; mulps 0x9bad(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -48997,15 +49739,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,233,150,0,0 ; mulps 0x96e9(%edx),%xmm5
- DB 15,84,178,249,150,0,0 ; andps 0x96f9(%edx),%xmm6
- DB 15,86,178,89,148,0,0 ; orps 0x9459(%edx),%xmm6
- DB 15,88,170,9,151,0,0 ; addps 0x9709(%edx),%xmm5
- DB 15,40,186,25,151,0,0 ; movaps 0x9719(%edx),%xmm7
+ DB 15,89,170,217,153,0,0 ; mulps 0x99d9(%edx),%xmm5
+ DB 15,84,178,233,153,0,0 ; andps 0x99e9(%edx),%xmm6
+ DB 15,86,178,73,151,0,0 ; orps 0x9749(%edx),%xmm6
+ DB 15,88,170,249,153,0,0 ; addps 0x99f9(%edx),%xmm5
+ DB 15,40,186,9,154,0,0 ; movaps 0x9a09(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,41,151,0,0 ; addps 0x9729(%edx),%xmm6
- DB 15,40,186,57,151,0,0 ; movaps 0x9739(%edx),%xmm7
+ DB 15,88,178,25,154,0,0 ; addps 0x9a19(%edx),%xmm6
+ DB 15,40,186,41,154,0,0 ; movaps 0x9a29(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -49015,21 +49757,21 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,121,148,0,0 ; movaps 0x9479(%edx),%xmm6
+ DB 15,40,178,105,151,0,0 ; movaps 0x9769(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,73,151,0,0 ; addps 0x9749(%edx),%xmm5
- DB 15,40,186,89,151,0,0 ; movaps 0x9759(%edx),%xmm7
+ DB 15,88,170,57,154,0,0 ; addps 0x9a39(%edx),%xmm5
+ DB 15,40,186,73,154,0,0 ; movaps 0x9a49(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,105,151,0,0 ; movaps 0x9769(%edx),%xmm7
+ DB 15,40,186,89,154,0,0 ; movaps 0x9a59(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,121,151,0,0 ; movaps 0x9779(%edx),%xmm0
+ DB 15,40,130,105,154,0,0 ; movaps 0x9a69(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,137,151,0,0 ; mulps 0x9789(%edx),%xmm0
+ DB 15,89,130,121,154,0,0 ; mulps 0x9a79(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -49062,15 +49804,15 @@ _sk_gamma_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 3a18 <_sk_gamma_sse2+0x12>
DB 88 ; pop %eax
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,128,184,149,0,0 ; mulps 0x95b8(%eax),%xmm0
- DB 15,84,152,200,149,0,0 ; andps 0x95c8(%eax),%xmm3
- DB 15,86,152,40,147,0,0 ; orps 0x9328(%eax),%xmm3
- DB 15,88,128,216,149,0,0 ; addps 0x95d8(%eax),%xmm0
+ DB 15,89,128,168,152,0,0 ; mulps 0x98a8(%eax),%xmm0
+ DB 15,84,152,184,152,0,0 ; andps 0x98b8(%eax),%xmm3
+ DB 15,86,152,24,150,0,0 ; orps 0x9618(%eax),%xmm3
+ DB 15,88,128,200,152,0,0 ; addps 0x98c8(%eax),%xmm0
DB 15,40,227 ; movaps %xmm3,%xmm4
- DB 15,89,160,232,149,0,0 ; mulps 0x95e8(%eax),%xmm4
+ DB 15,89,160,216,152,0,0 ; mulps 0x98d8(%eax),%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,88,152,248,149,0,0 ; addps 0x95f8(%eax),%xmm3
- DB 15,40,160,8,150,0,0 ; movaps 0x9608(%eax),%xmm4
+ DB 15,88,152,232,152,0,0 ; addps 0x98e8(%eax),%xmm3
+ DB 15,40,160,248,152,0,0 ; movaps 0x98f8(%eax),%xmm4
DB 15,94,227 ; divps %xmm3,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 139,77,12 ; mov 0xc(%ebp),%ecx
@@ -49083,30 +49825,30 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,227,1 ; cmpltps %xmm3,%xmm4
- DB 15,84,160,72,147,0,0 ; andps 0x9348(%eax),%xmm4
+ DB 15,84,160,56,150,0,0 ; andps 0x9638(%eax),%xmm4
DB 15,92,220 ; subps %xmm4,%xmm3
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
- DB 15,88,128,24,150,0,0 ; addps 0x9618(%eax),%xmm0
- DB 15,40,176,56,150,0,0 ; movaps 0x9638(%eax),%xmm6
+ DB 15,88,128,8,153,0,0 ; addps 0x9908(%eax),%xmm0
+ DB 15,40,176,40,153,0,0 ; movaps 0x9928(%eax),%xmm6
DB 15,92,244 ; subps %xmm4,%xmm6
- DB 15,40,168,40,150,0,0 ; movaps 0x9628(%eax),%xmm5
+ DB 15,40,168,24,153,0,0 ; movaps 0x9918(%eax),%xmm5
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,40,152,72,150,0,0 ; movaps 0x9648(%eax),%xmm3
+ DB 15,40,152,56,153,0,0 ; movaps 0x9938(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,94,230 ; divps %xmm6,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,128,184,149,0,0 ; mulps 0x95b8(%eax),%xmm0
- DB 15,84,136,200,149,0,0 ; andps 0x95c8(%eax),%xmm1
- DB 15,86,136,40,147,0,0 ; orps 0x9328(%eax),%xmm1
- DB 15,88,128,216,149,0,0 ; addps 0x95d8(%eax),%xmm0
+ DB 15,89,128,168,152,0,0 ; mulps 0x98a8(%eax),%xmm0
+ DB 15,84,136,184,152,0,0 ; andps 0x98b8(%eax),%xmm1
+ DB 15,86,136,24,150,0,0 ; orps 0x9618(%eax),%xmm1
+ DB 15,88,128,200,152,0,0 ; addps 0x98c8(%eax),%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
- DB 15,89,176,232,149,0,0 ; mulps 0x95e8(%eax),%xmm6
+ DB 15,89,176,216,152,0,0 ; mulps 0x98d8(%eax),%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,136,248,149,0,0 ; addps 0x95f8(%eax),%xmm1
- DB 15,40,176,8,150,0,0 ; movaps 0x9608(%eax),%xmm6
+ DB 15,88,136,232,152,0,0 ; addps 0x98e8(%eax),%xmm1
+ DB 15,40,176,248,152,0,0 ; movaps 0x98f8(%eax),%xmm6
DB 15,94,241 ; divps %xmm1,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -49114,12 +49856,12 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,241,1 ; cmpltps %xmm1,%xmm6
- DB 15,84,176,72,147,0,0 ; andps 0x9348(%eax),%xmm6
+ DB 15,84,176,56,150,0,0 ; andps 0x9638(%eax),%xmm6
DB 15,92,206 ; subps %xmm6,%xmm1
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,241 ; subps %xmm1,%xmm6
- DB 15,88,128,24,150,0,0 ; addps 0x9618(%eax),%xmm0
- DB 15,40,184,56,150,0,0 ; movaps 0x9638(%eax),%xmm7
+ DB 15,88,128,8,153,0,0 ; addps 0x9908(%eax),%xmm0
+ DB 15,40,184,40,153,0,0 ; movaps 0x9928(%eax),%xmm7
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
@@ -49127,15 +49869,15 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,207 ; divps %xmm7,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,128,184,149,0,0 ; mulps 0x95b8(%eax),%xmm0
- DB 15,84,144,200,149,0,0 ; andps 0x95c8(%eax),%xmm2
- DB 15,86,144,40,147,0,0 ; orps 0x9328(%eax),%xmm2
- DB 15,88,128,216,149,0,0 ; addps 0x95d8(%eax),%xmm0
- DB 15,40,176,232,149,0,0 ; movaps 0x95e8(%eax),%xmm6
+ DB 15,89,128,168,152,0,0 ; mulps 0x98a8(%eax),%xmm0
+ DB 15,84,144,184,152,0,0 ; andps 0x98b8(%eax),%xmm2
+ DB 15,86,144,24,150,0,0 ; orps 0x9618(%eax),%xmm2
+ DB 15,88,128,200,152,0,0 ; addps 0x98c8(%eax),%xmm0
+ DB 15,40,176,216,152,0,0 ; movaps 0x98d8(%eax),%xmm6
DB 15,89,242 ; mulps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
- DB 15,88,144,248,149,0,0 ; addps 0x95f8(%eax),%xmm2
- DB 15,40,176,8,150,0,0 ; movaps 0x9608(%eax),%xmm6
+ DB 15,88,144,232,152,0,0 ; addps 0x98e8(%eax),%xmm2
+ DB 15,40,176,248,152,0,0 ; movaps 0x98f8(%eax),%xmm6
DB 15,94,242 ; divps %xmm2,%xmm6
DB 15,92,198 ; subps %xmm6,%xmm0
DB 15,89,69,232 ; mulps -0x18(%ebp),%xmm0
@@ -49143,18 +49885,18 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,194,242,1 ; cmpltps %xmm2,%xmm6
- DB 15,84,176,72,147,0,0 ; andps 0x9348(%eax),%xmm6
+ DB 15,84,176,56,150,0,0 ; andps 0x9638(%eax),%xmm6
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
- DB 15,88,128,24,150,0,0 ; addps 0x9618(%eax),%xmm0
+ DB 15,88,128,8,153,0,0 ; addps 0x9908(%eax),%xmm0
DB 15,89,238 ; mulps %xmm6,%xmm5
DB 15,92,197 ; subps %xmm5,%xmm0
- DB 15,40,144,56,150,0,0 ; movaps 0x9638(%eax),%xmm2
+ DB 15,40,144,40,153,0,0 ; movaps 0x9928(%eax),%xmm2
DB 15,92,214 ; subps %xmm6,%xmm2
DB 15,94,218 ; divps %xmm2,%xmm3
DB 15,88,216 ; addps %xmm0,%xmm3
- DB 15,40,128,88,150,0,0 ; movaps 0x9658(%eax),%xmm0
+ DB 15,40,128,72,153,0,0 ; movaps 0x9948(%eax),%xmm0
DB 15,89,224 ; mulps %xmm0,%xmm4
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,89,216 ; mulps %xmm0,%xmm3
@@ -49181,29 +49923,29 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 232,0,0,0,0 ; call 3c00 <_sk_lab_to_xyz_sse2+0x15>
DB 88 ; pop %eax
- DB 15,89,144,128,148,0,0 ; mulps 0x9480(%eax),%xmm2
- DB 15,40,160,48,146,0,0 ; movaps 0x9230(%eax),%xmm4
+ DB 15,89,144,112,151,0,0 ; mulps 0x9770(%eax),%xmm2
+ DB 15,40,160,32,149,0,0 ; movaps 0x9520(%eax),%xmm4
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,168,144,148,0,0 ; movaps 0x9490(%eax),%xmm5
+ DB 15,40,168,128,151,0,0 ; movaps 0x9780(%eax),%xmm5
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,89,220 ; mulps %xmm4,%xmm3
DB 15,88,221 ; addps %xmm5,%xmm3
- DB 15,88,144,160,148,0,0 ; addps 0x94a0(%eax),%xmm2
- DB 15,89,144,176,148,0,0 ; mulps 0x94b0(%eax),%xmm2
- DB 15,89,136,192,148,0,0 ; mulps 0x94c0(%eax),%xmm1
+ DB 15,88,144,144,151,0,0 ; addps 0x9790(%eax),%xmm2
+ DB 15,89,144,160,151,0,0 ; mulps 0x97a0(%eax),%xmm2
+ DB 15,89,136,176,151,0,0 ; mulps 0x97b0(%eax),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,89,152,208,148,0,0 ; mulps 0x94d0(%eax),%xmm3
+ DB 15,89,152,192,151,0,0 ; mulps 0x97c0(%eax),%xmm3
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,152,224,148,0,0 ; movaps 0x94e0(%eax),%xmm3
+ DB 15,40,152,208,151,0,0 ; movaps 0x97d0(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,194,224,1 ; cmpltps %xmm0,%xmm4
- DB 15,40,176,240,148,0,0 ; movaps 0x94f0(%eax),%xmm6
+ DB 15,40,176,224,151,0,0 ; movaps 0x97e0(%eax),%xmm6
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,184,0,149,0,0 ; movaps 0x9500(%eax),%xmm7
+ DB 15,40,184,240,151,0,0 ; movaps 0x97f0(%eax),%xmm7
DB 15,89,207 ; mulps %xmm7,%xmm1
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,85,225 ; andnps %xmm1,%xmm4
@@ -49228,8 +49970,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,85,221 ; andnps %xmm5,%xmm3
DB 15,86,216 ; orps %xmm0,%xmm3
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,160,16,149,0,0 ; mulps 0x9510(%eax),%xmm4
- DB 15,89,152,32,149,0,0 ; mulps 0x9520(%eax),%xmm3
+ DB 15,89,160,0,152,0,0 ; mulps 0x9800(%eax),%xmm4
+ DB 15,89,152,16,152,0,0 ; mulps 0x9810(%eax),%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -49265,9 +50007,9 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,48,145,0,0 ; pand 0x9130(%edx),%xmm0
+ DB 102,15,219,130,32,148,0,0 ; pand 0x9420(%edx),%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,154,96,146,0,0 ; mulps 0x9260(%edx),%xmm3
+ DB 15,89,154,80,149,0,0 ; mulps 0x9550(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -49330,9 +50072,9 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,110,36,55 ; movd (%edi,%esi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,92,144,0,0 ; pand 0x905c(%edx),%xmm4
+ DB 102,15,219,162,76,147,0,0 ; pand 0x934c(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,140,145,0,0 ; mulps 0x918c(%edx),%xmm4
+ DB 15,89,162,124,148,0,0 ; mulps 0x947c(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -49408,7 +50150,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,153,142,144,0,0 ; mulps 0x908e(%ecx),%xmm3
+ DB 15,89,153,126,147,0,0 ; mulps 0x937e(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -49440,7 +50182,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 15,175,81,4 ; imul 0x4(%ecx),%edx
DB 3,23 ; add (%edi),%edx
DB 139,89,8 ; mov 0x8(%ecx),%ebx
- DB 15,40,166,42,143,0,0 ; movaps 0x8f2a(%esi),%xmm4
+ DB 15,40,166,26,146,0,0 ; movaps 0x921a(%esi),%xmm4
DB 15,89,227 ; mulps %xmm3,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
@@ -49476,7 +50218,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 138,93,208 ; mov -0x30(%ebp),%bl
DB 136,92,58,2 ; mov %bl,0x2(%edx,%edi,1)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
- DB 102,15,219,166,42,146,0,0 ; pand 0x922a(%esi),%xmm4
+ DB 102,15,219,166,26,149,0,0 ; pand 0x951a(%esi),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
@@ -49511,12 +50253,12 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,97,142,0,0 ; pand 0x8e61(%edx),%xmm0
+ DB 102,15,219,130,81,145,0,0 ; pand 0x9151(%edx),%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,145,143,0,0 ; mulps 0x8f91(%edx),%xmm0
+ DB 15,89,130,129,146,0,0 ; mulps 0x9281(%edx),%xmm0
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,161,141,0,0 ; movaps 0x8da1(%edx),%xmm3
+ DB 15,40,154,145,144,0,0 ; movaps 0x9091(%edx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 86 ; push %esi
@@ -49572,13 +50314,13 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,181,141,0,0 ; pand 0x8db5(%edx),%xmm4
+ DB 102,15,219,162,165,144,0,0 ; pand 0x90a5(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,229,142,0,0 ; mulps 0x8ee5(%edx),%xmm4
+ DB 15,89,162,213,145,0,0 ; mulps 0x91d5(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
DB 15,41,97,32 ; movaps %xmm4,0x20(%ecx)
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,162,245,140,0,0 ; movaps 0x8cf5(%edx),%xmm4
+ DB 15,40,162,229,143,0,0 ; movaps 0x8fe5(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -49655,10 +50397,10 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,189,141,0,0 ; mulps 0x8dbd(%ecx),%xmm0
+ DB 15,89,129,173,144,0,0 ; mulps 0x90ad(%ecx),%xmm0
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,205,139,0,0 ; movaps 0x8bcd(%ecx),%xmm3
+ DB 15,40,153,189,142,0,0 ; movaps 0x8ebd(%ecx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 82 ; push %edx
@@ -49693,20 +50435,20 @@ _sk_load_565_sse2 LABEL PROC
DB 117,97 ; jne 425c <_sk_load_565_sse2+0x8c>
DB 243,15,126,20,126 ; movq (%esi,%edi,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,130,141,0,0 ; movdqa 0x8d82(%edx),%xmm0
+ DB 102,15,111,130,114,144,0,0 ; movdqa 0x9072(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,146,141,0,0 ; mulps 0x8d92(%edx),%xmm0
- DB 102,15,111,138,162,141,0,0 ; movdqa 0x8da2(%edx),%xmm1
+ DB 15,89,130,130,144,0,0 ; mulps 0x9082(%edx),%xmm0
+ DB 102,15,111,138,146,144,0,0 ; movdqa 0x9092(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,178,141,0,0 ; mulps 0x8db2(%edx),%xmm1
- DB 102,15,219,146,194,141,0,0 ; pand 0x8dc2(%edx),%xmm2
+ DB 15,89,138,162,144,0,0 ; mulps 0x90a2(%edx),%xmm1
+ DB 102,15,219,146,178,144,0,0 ; pand 0x90b2(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,210,141,0,0 ; mulps 0x8dd2(%edx),%xmm2
+ DB 15,89,146,194,144,0,0 ; mulps 0x90c2(%edx),%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,130,139,0,0 ; movaps 0x8b82(%edx),%xmm3
+ DB 15,40,154,114,142,0,0 ; movaps 0x8e72(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -49758,21 +50500,21 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 117,113 ; jne 433b <_sk_load_565_dst_sse2+0x9c>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,179,140,0,0 ; movdqa 0x8cb3(%edx),%xmm5
+ DB 102,15,111,170,163,143,0,0 ; movdqa 0x8fa3(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,195,140,0,0 ; mulps 0x8cc3(%edx),%xmm5
+ DB 15,89,170,179,143,0,0 ; mulps 0x8fb3(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,211,140,0,0 ; movdqa 0x8cd3(%edx),%xmm5
+ DB 102,15,111,170,195,143,0,0 ; movdqa 0x8fc3(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,227,140,0,0 ; mulps 0x8ce3(%edx),%xmm5
+ DB 15,89,170,211,143,0,0 ; mulps 0x8fd3(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,219,162,243,140,0,0 ; pand 0x8cf3(%edx),%xmm4
+ DB 102,15,219,162,227,143,0,0 ; pand 0x8fe3(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,3,141,0,0 ; mulps 0x8d03(%edx),%xmm4
+ DB 15,89,162,243,143,0,0 ; mulps 0x8ff3(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
- DB 15,40,162,179,138,0,0 ; movaps 0x8ab3(%edx),%xmm4
+ DB 15,40,162,163,141,0,0 ; movaps 0x8da3(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -49840,20 +50582,20 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,209,3 ; pinsrw $0x3,%ecx,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,103,139,0,0 ; movdqa 0x8b67(%edx),%xmm0
+ DB 102,15,111,130,87,142,0,0 ; movdqa 0x8e57(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,119,139,0,0 ; mulps 0x8b77(%edx),%xmm0
- DB 102,15,111,138,135,139,0,0 ; movdqa 0x8b87(%edx),%xmm1
+ DB 15,89,130,103,142,0,0 ; mulps 0x8e67(%edx),%xmm0
+ DB 102,15,111,138,119,142,0,0 ; movdqa 0x8e77(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,151,139,0,0 ; mulps 0x8b97(%edx),%xmm1
- DB 102,15,219,146,167,139,0,0 ; pand 0x8ba7(%edx),%xmm2
+ DB 15,89,138,135,142,0,0 ; mulps 0x8e87(%edx),%xmm1
+ DB 102,15,219,146,151,142,0,0 ; pand 0x8e97(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,183,139,0,0 ; mulps 0x8bb7(%edx),%xmm2
+ DB 15,89,146,167,142,0,0 ; mulps 0x8ea7(%edx),%xmm2
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,103,137,0,0 ; movaps 0x8967(%edx),%xmm3
+ DB 15,40,154,87,140,0,0 ; movaps 0x8c57(%edx),%xmm3
DB 81 ; push %ecx
DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,80,4 ; call *0x4(%eax)
@@ -49879,8 +50621,8 @@ _sk_store_565_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,212,140,0,0 ; movaps 0x8cd4(%edi),%xmm4
- DB 15,40,175,228,140,0,0 ; movaps 0x8ce4(%edi),%xmm5
+ DB 15,40,167,196,143,0,0 ; movaps 0x8fc4(%edi),%xmm4
+ DB 15,40,175,212,143,0,0 ; movaps 0x8fd4(%edi),%xmm5
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,89,244 ; mulps %xmm4,%xmm6
@@ -49958,21 +50700,21 @@ _sk_load_4444_sse2 LABEL PROC
DB 117,112 ; jne 45db <_sk_load_4444_sse2+0x9b>
DB 243,15,126,28,126 ; movq (%esi,%edi,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,130,18,140,0,0 ; movdqa 0x8c12(%edx),%xmm0
+ DB 102,15,111,130,2,143,0,0 ; movdqa 0x8f02(%edx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,34,140,0,0 ; mulps 0x8c22(%edx),%xmm0
- DB 102,15,111,138,50,140,0,0 ; movdqa 0x8c32(%edx),%xmm1
+ DB 15,89,130,18,143,0,0 ; mulps 0x8f12(%edx),%xmm0
+ DB 102,15,111,138,34,143,0,0 ; movdqa 0x8f22(%edx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,66,140,0,0 ; mulps 0x8c42(%edx),%xmm1
- DB 102,15,111,146,82,140,0,0 ; movdqa 0x8c52(%edx),%xmm2
+ DB 15,89,138,50,143,0,0 ; mulps 0x8f32(%edx),%xmm1
+ DB 102,15,111,146,66,143,0,0 ; movdqa 0x8f42(%edx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,98,140,0,0 ; mulps 0x8c62(%edx),%xmm2
- DB 102,15,219,154,114,140,0,0 ; pand 0x8c72(%edx),%xmm3
+ DB 15,89,146,82,143,0,0 ; mulps 0x8f52(%edx),%xmm2
+ DB 102,15,219,154,98,143,0,0 ; pand 0x8f62(%edx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,130,140,0,0 ; mulps 0x8c82(%edx),%xmm3
+ DB 15,89,154,114,143,0,0 ; mulps 0x8f72(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 82 ; push %edx
@@ -50026,24 +50768,24 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 15,133,128,0,0,0 ; jne 46cd <_sk_load_4444_dst_sse2+0xaf>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,52,139,0,0 ; movdqa 0x8b34(%edx),%xmm5
+ DB 102,15,111,170,36,142,0,0 ; movdqa 0x8e24(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,68,139,0,0 ; mulps 0x8b44(%edx),%xmm5
+ DB 15,89,170,52,142,0,0 ; mulps 0x8e34(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,84,139,0,0 ; movdqa 0x8b54(%edx),%xmm5
+ DB 102,15,111,170,68,142,0,0 ; movdqa 0x8e44(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,100,139,0,0 ; mulps 0x8b64(%edx),%xmm5
+ DB 15,89,170,84,142,0,0 ; mulps 0x8e54(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,111,170,116,139,0,0 ; movdqa 0x8b74(%edx),%xmm5
+ DB 102,15,111,170,100,142,0,0 ; movdqa 0x8e64(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,132,139,0,0 ; mulps 0x8b84(%edx),%xmm5
+ DB 15,89,170,116,142,0,0 ; mulps 0x8e74(%edx),%xmm5
DB 15,41,105,48 ; movaps %xmm5,0x30(%ecx)
- DB 102,15,219,162,148,139,0,0 ; pand 0x8b94(%edx),%xmm4
+ DB 102,15,219,162,132,142,0,0 ; pand 0x8e84(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,164,139,0,0 ; mulps 0x8ba4(%edx),%xmm4
+ DB 15,89,162,148,142,0,0 ; mulps 0x8e94(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -50111,21 +50853,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,129,204,137,0,0 ; movdqa 0x89cc(%ecx),%xmm0
+ DB 102,15,111,129,188,140,0,0 ; movdqa 0x8cbc(%ecx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,220,137,0,0 ; mulps 0x89dc(%ecx),%xmm0
- DB 102,15,111,137,236,137,0,0 ; movdqa 0x89ec(%ecx),%xmm1
+ DB 15,89,129,204,140,0,0 ; mulps 0x8ccc(%ecx),%xmm0
+ DB 102,15,111,137,220,140,0,0 ; movdqa 0x8cdc(%ecx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,137,252,137,0,0 ; mulps 0x89fc(%ecx),%xmm1
- DB 102,15,111,145,12,138,0,0 ; movdqa 0x8a0c(%ecx),%xmm2
+ DB 15,89,137,236,140,0,0 ; mulps 0x8cec(%ecx),%xmm1
+ DB 102,15,111,145,252,140,0,0 ; movdqa 0x8cfc(%ecx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,145,28,138,0,0 ; mulps 0x8a1c(%ecx),%xmm2
- DB 102,15,219,153,44,138,0,0 ; pand 0x8a2c(%ecx),%xmm3
+ DB 15,89,145,12,141,0,0 ; mulps 0x8d0c(%ecx),%xmm2
+ DB 102,15,219,153,28,141,0,0 ; pand 0x8d1c(%ecx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,153,60,138,0,0 ; mulps 0x8a3c(%ecx),%xmm3
+ DB 15,89,153,44,141,0,0 ; mulps 0x8d2c(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 81 ; push %ecx
@@ -50153,7 +50895,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,207,137,0,0 ; movaps 0x89cf(%edi),%xmm4
+ DB 15,40,167,191,140,0,0 ; movaps 0x8cbf(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -50236,11 +50978,11 @@ _sk_load_8888_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 117,102 ; jne 4986 <_sk_load_8888_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,146,30,133,0,0 ; movdqa 0x851e(%edx),%xmm2
+ DB 102,15,111,146,14,136,0,0 ; movdqa 0x880e(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,78,134,0,0 ; movaps 0x864e(%edx),%xmm4
+ DB 15,40,162,62,137,0,0 ; movaps 0x893e(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -50303,11 +51045,11 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 117,118 ; jne 4a5d <_sk_load_8888_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,87,132,0,0 ; movdqa 0x8457(%edx),%xmm5
+ DB 102,15,111,170,71,135,0,0 ; movdqa 0x8747(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,135,133,0,0 ; movaps 0x8587(%edx),%xmm7
+ DB 15,40,186,119,136,0,0 ; movaps 0x8877(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,16 ; movaps %xmm6,0x10(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -50387,11 +51129,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,145,20,131,0,0 ; movdqa 0x8314(%ecx),%xmm2
+ DB 102,15,111,145,4,134,0,0 ; movdqa 0x8604(%ecx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,161,68,132,0,0 ; movaps 0x8444(%ecx),%xmm4
+ DB 15,40,161,52,135,0,0 ; movaps 0x8734(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -50433,7 +51175,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,169,130,0,0 ; movaps 0x82a9(%edi),%xmm4
+ DB 15,40,167,153,133,0,0 ; movaps 0x8599(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -50502,11 +51244,11 @@ _sk_load_bgra_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 117,102 ; jne 4cc1 <_sk_load_bgra_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,130,227,129,0,0 ; movdqa 0x81e3(%edx),%xmm0
+ DB 102,15,111,130,211,132,0,0 ; movdqa 0x84d3(%edx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,162,19,131,0,0 ; movaps 0x8313(%edx),%xmm4
+ DB 15,40,162,3,134,0,0 ; movaps 0x8603(%edx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -50569,11 +51311,11 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 139,57 ; mov (%ecx),%edi
DB 117,118 ; jne 4d98 <_sk_load_bgra_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,28,129,0,0 ; movdqa 0x811c(%edx),%xmm5
+ DB 102,15,111,170,12,132,0,0 ; movdqa 0x840c(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,76,130,0,0 ; movaps 0x824c(%edx),%xmm7
+ DB 15,40,186,60,133,0,0 ; movaps 0x853c(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,48 ; movaps %xmm6,0x30(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -50653,11 +51395,11 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,129,217,127,0,0 ; movdqa 0x7fd9(%ecx),%xmm0
+ DB 102,15,111,129,201,130,0,0 ; movdqa 0x82c9(%ecx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,161,9,129,0,0 ; movaps 0x8109(%ecx),%xmm4
+ DB 15,40,161,249,131,0,0 ; movaps 0x83f9(%ecx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -50699,7 +51441,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,110,127,0,0 ; movaps 0x7f6e(%edi),%xmm4
+ DB 15,40,167,94,130,0,0 ; movaps 0x825e(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -50794,7 +51536,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,154,120,130,0,0 ; movdqa 0x8278(%edx),%xmm3
+ DB 102,15,111,154,104,133,0,0 ; movdqa 0x8568(%edx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -50827,15 +51569,15 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,154,136,130,0,0 ; movdqa 0x8288(%edx),%xmm3
+ DB 102,15,111,154,120,133,0,0 ; movdqa 0x8578(%edx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,154,152,130,0,0 ; movdqa 0x8298(%edx),%xmm3
+ DB 102,15,111,154,136,133,0,0 ; movdqa 0x8588(%edx),%xmm3
DB 102,15,127,93,184 ; movdqa %xmm3,-0x48(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,154,168,130,0,0 ; movdqa 0x82a8(%edx),%xmm3
+ DB 102,15,111,154,152,133,0,0 ; movdqa 0x8598(%edx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -50926,7 +51668,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp)
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
- DB 102,15,111,154,98,128,0,0 ; movdqa 0x8062(%edx),%xmm3
+ DB 102,15,111,154,82,131,0,0 ; movdqa 0x8352(%edx),%xmm3
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 102,15,239,226 ; pxor %xmm2,%xmm4
@@ -50934,13 +51676,13 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,15,111,146,130,128,0,0 ; movdqa 0x8082(%edx),%xmm2
+ DB 102,15,111,146,114,131,0,0 ; movdqa 0x8372(%edx),%xmm2
DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
DB 102,15,239,226 ; pxor %xmm2,%xmm4
- DB 102,15,111,178,146,128,0,0 ; movdqa 0x8092(%edx),%xmm6
+ DB 102,15,111,178,130,131,0,0 ; movdqa 0x8382(%edx),%xmm6
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,15,102,252 ; pcmpgtd %xmm4,%xmm7
- DB 102,15,111,146,114,128,0,0 ; movdqa 0x8072(%edx),%xmm2
+ DB 102,15,111,146,98,131,0,0 ; movdqa 0x8362(%edx),%xmm2
DB 102,15,127,85,184 ; movdqa %xmm2,-0x48(%ebp)
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,223,249 ; pandn %xmm1,%xmm7
@@ -51082,7 +51824,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,69,248 ; movd %xmm0,-0x8(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,153,184,125,0,0 ; movdqa 0x7db8(%ecx),%xmm3
+ DB 102,15,111,153,168,128,0,0 ; movdqa 0x80a8(%ecx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -51115,15 +51857,15 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,153,200,125,0,0 ; movdqa 0x7dc8(%ecx),%xmm3
+ DB 102,15,111,153,184,128,0,0 ; movdqa 0x80b8(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,153,216,125,0,0 ; movdqa 0x7dd8(%ecx),%xmm3
+ DB 102,15,111,153,200,128,0,0 ; movdqa 0x80c8(%ecx),%xmm3
DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,153,232,125,0,0 ; movdqa 0x7de8(%ecx),%xmm3
+ DB 102,15,111,153,216,128,0,0 ; movdqa 0x80d8(%ecx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -51162,18 +51904,18 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 232,0,0,0,0 ; call 55fb <_sk_store_f16_sse2+0x15>
DB 88 ; pop %eax
- DB 102,15,111,176,21,124,0,0 ; movdqa 0x7c15(%eax),%xmm6
+ DB 102,15,111,176,5,127,0,0 ; movdqa 0x7f05(%eax),%xmm6
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,219,214 ; pand %xmm6,%xmm2
DB 102,15,127,69,200 ; movdqa %xmm0,-0x38(%ebp)
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 102,15,239,234 ; pxor %xmm2,%xmm5
- DB 102,15,111,160,53,124,0,0 ; movdqa 0x7c35(%eax),%xmm4
+ DB 102,15,111,160,37,127,0,0 ; movdqa 0x7f25(%eax),%xmm4
DB 102,15,114,210,16 ; psrld $0x10,%xmm2
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,15,102,197 ; pcmpgtd %xmm5,%xmm0
DB 102,15,114,213,13 ; psrld $0xd,%xmm5
- DB 102,15,111,184,69,124,0,0 ; movdqa 0x7c45(%eax),%xmm7
+ DB 102,15,111,184,53,127,0,0 ; movdqa 0x7f35(%eax),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,127,125,232 ; movdqa %xmm7,-0x18(%ebp)
DB 102,15,254,213 ; paddd %xmm5,%xmm2
@@ -51308,7 +52050,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,255,119,0,0 ; movaps 0x77ff(%edx),%xmm4
+ DB 15,40,162,239,122,0,0 ; movaps 0x7aef(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -51410,7 +52152,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,170,152,118,0,0 ; movaps 0x7698(%edx),%xmm5
+ DB 15,40,170,136,121,0,0 ; movaps 0x7988(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -51436,7 +52178,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,56,116,0,0 ; movaps 0x7438(%edx),%xmm3
+ DB 15,40,154,40,119,0,0 ; movaps 0x7728(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -51475,7 +52217,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 232,0,0,0,0 ; call 5a83 <_sk_store_u16_be_sse2+0x11>
DB 88 ; pop %eax
- DB 15,40,176,205,119,0,0 ; movaps 0x77cd(%eax),%xmm6
+ DB 15,40,176,189,122,0,0 ; movaps 0x7abd(%eax),%xmm6
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,89,230 ; mulps %xmm6,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
@@ -51806,7 +52548,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,57,111,0,0 ; andps 0x6f39(%ecx),%xmm6
+ DB 15,84,177,41,114,0,0 ; andps 0x7229(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51842,7 +52584,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,211,110,0,0 ; andps 0x6ed3(%ecx),%xmm6
+ DB 15,84,177,195,113,0,0 ; andps 0x71c3(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51876,13 +52618,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 243,15,89,177,109,117,0,0 ; mulss 0x756d(%ecx),%xmm6
+ DB 243,15,89,177,173,120,0,0 ; mulss 0x78ad(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,109,110,0,0 ; andps 0x6e6d(%ecx),%xmm6
+ DB 15,84,177,93,113,0,0 ; andps 0x715d(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51920,13 +52662,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,204 ; subps %xmm4,%xmm1
- DB 243,15,89,177,232,116,0,0 ; mulss 0x74e8(%ecx),%xmm6
+ DB 243,15,89,177,40,120,0,0 ; mulss 0x7828(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,232,109,0,0 ; andps 0x6de8(%ecx),%xmm6
+ DB 15,84,177,216,112,0,0 ; andps 0x70d8(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -51960,7 +52702,7 @@ _sk_clamp_x_1_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,95,224 ; maxps %xmm0,%xmm4
- DB 15,93,160,99,109,0,0 ; minps 0x6d63(%eax),%xmm4
+ DB 15,93,160,83,112,0,0 ; minps 0x7053(%eax),%xmm4
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -51983,7 +52725,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,84,168,51,109,0,0 ; andps 0x6d33(%eax),%xmm5
+ DB 15,84,168,35,112,0,0 ; andps 0x7023(%eax),%xmm5
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -52003,14 +52745,14 @@ _sk_mirror_x_1_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 6068 <_sk_mirror_x_1_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 15,40,161,104,109,0,0 ; movaps 0x6d68(%ecx),%xmm4
+ DB 15,40,161,88,112,0,0 ; movaps 0x7058(%ecx),%xmm4
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,169,216,108,0,0 ; movaps 0x6cd8(%ecx),%xmm5
+ DB 15,40,169,200,111,0,0 ; movaps 0x6fc8(%ecx),%xmm5
DB 15,89,232 ; mulps %xmm0,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,194,238,1 ; cmpltps %xmm6,%xmm5
- DB 15,84,169,248,108,0,0 ; andps 0x6cf8(%ecx),%xmm5
+ DB 15,84,169,232,111,0,0 ; andps 0x6fe8(%ecx),%xmm5
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,88,246 ; addps %xmm6,%xmm6
@@ -52036,10 +52778,10 @@ _sk_luminance_to_alpha_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 60c6 <_sk_luminance_to_alpha_sse2+0xe>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,128,154,113,0,0 ; mulps 0x719a(%eax),%xmm0
- DB 15,89,136,170,113,0,0 ; mulps 0x71aa(%eax),%xmm1
+ DB 15,89,128,138,116,0,0 ; mulps 0x748a(%eax),%xmm0
+ DB 15,89,136,154,116,0,0 ; mulps 0x749a(%eax),%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,152,186,113,0,0 ; mulps 0x71ba(%eax),%xmm3
+ DB 15,89,152,170,116,0,0 ; mulps 0x74aa(%eax),%xmm3
DB 15,88,217 ; addps %xmm1,%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -52424,12 +53166,12 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 78 ; dec %esi
DB 102,15,110,206 ; movd %esi,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
- DB 102,15,111,146,45,109,0,0 ; movdqa 0x6d2d(%edx),%xmm2
+ DB 102,15,111,146,29,112,0,0 ; movdqa 0x701d(%edx),%xmm2
DB 102,15,219,209 ; pand %xmm1,%xmm2
- DB 102,15,235,146,13,107,0,0 ; por 0x6b0d(%edx),%xmm2
+ DB 102,15,235,146,253,109,0,0 ; por 0x6dfd(%edx),%xmm2
DB 102,15,114,209,16 ; psrld $0x10,%xmm1
- DB 102,15,235,138,61,109,0,0 ; por 0x6d3d(%edx),%xmm1
- DB 15,88,138,77,109,0,0 ; addps 0x6d4d(%edx),%xmm1
+ DB 102,15,235,138,45,112,0,0 ; por 0x702d(%edx),%xmm1
+ DB 15,88,138,61,112,0,0 ; addps 0x703d(%edx),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
@@ -52537,15 +53279,15 @@ _sk_gauss_a_to_rgba_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 6719 <_sk_gauss_a_to_rgba_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,128,167,107,0,0 ; movaps 0x6ba7(%eax),%xmm0
+ DB 15,40,128,151,110,0,0 ; movaps 0x6e97(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,183,107,0,0 ; addps 0x6bb7(%eax),%xmm0
+ DB 15,88,128,167,110,0,0 ; addps 0x6ea7(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,199,107,0,0 ; addps 0x6bc7(%eax),%xmm0
+ DB 15,88,128,183,110,0,0 ; addps 0x6eb7(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,215,107,0,0 ; addps 0x6bd7(%eax),%xmm0
+ DB 15,88,128,199,110,0,0 ; addps 0x6ec7(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,231,107,0,0 ; addps 0x6be7(%eax),%xmm0
+ DB 15,88,128,215,110,0,0 ; addps 0x6ed7(%eax),%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,200 ; movaps %xmm0,%xmm1
@@ -52580,7 +53322,7 @@ _sk_gradient_sse2 LABEL PROC
DB 74 ; dec %edx
DB 131,198,4 ; add $0x4,%esi
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,151,12,102,0,0 ; movaps 0x660c(%edi),%xmm2
+ DB 15,40,151,252,104,0,0 ; movaps 0x68fc(%edi),%xmm2
DB 243,15,16,30 ; movss (%esi),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -52751,30 +53493,30 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,94,247 ; divps %xmm7,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,40,128,96,105,0,0 ; movaps 0x6960(%eax),%xmm0
+ DB 15,40,128,80,108,0,0 ; movaps 0x6c50(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,112,105,0,0 ; addps 0x6970(%eax),%xmm0
+ DB 15,88,128,96,108,0,0 ; addps 0x6c60(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,128,105,0,0 ; addps 0x6980(%eax),%xmm0
+ DB 15,88,128,112,108,0,0 ; addps 0x6c70(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,144,105,0,0 ; addps 0x6990(%eax),%xmm0
+ DB 15,88,128,128,108,0,0 ; addps 0x6c80(%eax),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,40,176,160,105,0,0 ; movaps 0x69a0(%eax),%xmm6
+ DB 15,40,176,144,108,0,0 ; movaps 0x6c90(%eax),%xmm6
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,84,245 ; andps %xmm5,%xmm6
DB 15,85,232 ; andnps %xmm0,%xmm5
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,86,238 ; orps %xmm6,%xmm5
DB 15,194,204,1 ; cmpltps %xmm4,%xmm1
- DB 15,40,128,144,99,0,0 ; movaps 0x6390(%eax),%xmm0
+ DB 15,40,128,128,102,0,0 ; movaps 0x6680(%eax),%xmm0
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,84,193 ; andps %xmm1,%xmm0
DB 15,85,205 ; andnps %xmm5,%xmm1
DB 15,86,200 ; orps %xmm0,%xmm1
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,194,196,1 ; cmpltps %xmm4,%xmm0
- DB 15,40,168,176,99,0,0 ; movaps 0x63b0(%eax),%xmm5
+ DB 15,40,168,160,102,0,0 ; movaps 0x66a0(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,193 ; andnps %xmm1,%xmm0
@@ -52838,8 +53580,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,147,104,0,0 ; mulps 0x6893(%edx),%xmm4
- DB 15,89,130,163,104,0,0 ; mulps 0x68a3(%edx),%xmm0
+ DB 15,89,162,131,107,0,0 ; mulps 0x6b83(%edx),%xmm4
+ DB 15,89,130,147,107,0,0 ; mulps 0x6b93(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -52847,11 +53589,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,67,103,0,0 ; xorps 0x6743(%edx),%xmm4
+ DB 15,87,162,51,106,0,0 ; xorps 0x6a33(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,115,98,0,0 ; mulps 0x6273(%edx),%xmm5
+ DB 15,89,170,99,101,0,0 ; mulps 0x6563(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,95,196 ; maxps %xmm4,%xmm0
@@ -52887,8 +53629,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,245,103,0,0 ; mulps 0x67f5(%edx),%xmm4
- DB 15,89,130,5,104,0,0 ; mulps 0x6805(%edx),%xmm0
+ DB 15,89,162,229,106,0,0 ; mulps 0x6ae5(%edx),%xmm4
+ DB 15,89,130,245,106,0,0 ; mulps 0x6af5(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -52896,11 +53638,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,165,102,0,0 ; xorps 0x66a5(%edx),%xmm4
+ DB 15,87,162,149,105,0,0 ; xorps 0x6995(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,213,97,0,0 ; mulps 0x61d5(%edx),%xmm5
+ DB 15,89,170,197,100,0,0 ; mulps 0x64c5(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
@@ -52927,7 +53669,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,89,169,125,103,0,0 ; mulps 0x677d(%ecx),%xmm5
+ DB 15,89,169,109,106,0,0 ; mulps 0x6a6d(%ecx),%xmm5
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
@@ -52935,7 +53677,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,228 ; mulss %xmm4,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,129,45,102,0,0 ; xorps 0x662d(%ecx),%xmm0
+ DB 15,87,129,29,105,0,0 ; xorps 0x691d(%ecx),%xmm0
DB 15,94,197 ; divps %xmm5,%xmm0
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
@@ -53005,14 +53747,14 @@ _sk_save_xy_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 232,0,0,0,0 ; call 6cc0 <_sk_save_xy_sse2+0x12>
DB 88 ; pop %eax
- DB 15,40,160,128,96,0,0 ; movaps 0x6080(%eax),%xmm4
+ DB 15,40,160,112,99,0,0 ; movaps 0x6370(%eax),%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,88,236 ; addps %xmm4,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,144,160,96,0,0 ; movaps 0x60a0(%eax),%xmm2
+ DB 15,40,144,144,99,0,0 ; movaps 0x6390(%eax),%xmm2
DB 15,84,250 ; andps %xmm2,%xmm7
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,92,238 ; subps %xmm6,%xmm5
@@ -53090,8 +53832,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,222,101,0,0 ; addps 0x65de(%eax),%xmm0
- DB 15,40,168,190,95,0,0 ; movaps 0x5fbe(%eax),%xmm5
+ DB 15,88,128,206,104,0,0 ; addps 0x68ce(%eax),%xmm0
+ DB 15,40,168,174,98,0,0 ; movaps 0x62ae(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -53117,7 +53859,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,91,95,0,0 ; addps 0x5f5b(%eax),%xmm0
+ DB 15,88,128,75,98,0,0 ; addps 0x624b(%eax),%xmm0
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53142,8 +53884,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,98,101,0,0 ; addps 0x6562(%eax),%xmm1
- DB 15,40,168,66,95,0,0 ; movaps 0x5f42(%eax),%xmm5
+ DB 15,88,136,82,104,0,0 ; addps 0x6852(%eax),%xmm1
+ DB 15,40,168,50,98,0,0 ; movaps 0x6232(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -53169,7 +53911,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,222,94,0,0 ; addps 0x5ede(%eax),%xmm1
+ DB 15,88,136,206,97,0,0 ; addps 0x61ce(%eax),%xmm1
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53194,13 +53936,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,244,100,0,0 ; addps 0x64f4(%eax),%xmm0
- DB 15,40,168,196,94,0,0 ; movaps 0x5ec4(%eax),%xmm5
+ DB 15,88,128,228,103,0,0 ; addps 0x67e4(%eax),%xmm0
+ DB 15,40,168,180,97,0,0 ; movaps 0x61b4(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,4,101,0,0 ; mulps 0x6504(%eax),%xmm5
- DB 15,88,168,164,96,0,0 ; addps 0x60a4(%eax),%xmm5
+ DB 15,89,168,244,103,0,0 ; mulps 0x67f4(%eax),%xmm5
+ DB 15,88,168,148,99,0,0 ; addps 0x6394(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -53226,16 +53968,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,138,100,0,0 ; addps 0x648a(%eax),%xmm0
- DB 15,40,168,106,94,0,0 ; movaps 0x5e6a(%eax),%xmm5
+ DB 15,88,128,122,103,0,0 ; addps 0x677a(%eax),%xmm0
+ DB 15,40,168,90,97,0,0 ; movaps 0x615a(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,186,100,0,0 ; movaps 0x64ba(%eax),%xmm4
+ DB 15,40,160,170,103,0,0 ; movaps 0x67aa(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,202,100,0,0 ; addps 0x64ca(%eax),%xmm4
+ DB 15,88,160,186,103,0,0 ; addps 0x67ba(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,74,94,0,0 ; addps 0x5e4a(%eax),%xmm4
+ DB 15,88,160,58,97,0,0 ; addps 0x613a(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,218,100,0,0 ; addps 0x64da(%eax),%xmm4
+ DB 15,88,160,202,103,0,0 ; addps 0x67ca(%eax),%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53258,17 +54000,17 @@ _sk_bicubic_p1x_sse2 LABEL PROC
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,226,93,0,0 ; movaps 0x5de2(%eax),%xmm4
+ DB 15,40,160,210,96,0,0 ; movaps 0x60d2(%eax),%xmm4
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,110,64 ; movups 0x40(%esi),%xmm5
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,176,82,100,0,0 ; movaps 0x6452(%eax),%xmm6
+ DB 15,40,176,66,103,0,0 ; movaps 0x6742(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,98,100,0,0 ; addps 0x6462(%eax),%xmm6
+ DB 15,88,176,82,103,0,0 ; addps 0x6752(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,114,100,0,0 ; addps 0x6472(%eax),%xmm6
+ DB 15,88,176,98,103,0,0 ; addps 0x6762(%eax),%xmm6
DB 15,17,182,128,0,0,0 ; movups %xmm6,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53293,11 +54035,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,5,100,0,0 ; addps 0x6405(%eax),%xmm0
+ DB 15,88,128,245,102,0,0 ; addps 0x66f5(%eax),%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,229,99,0,0 ; mulps 0x63e5(%eax),%xmm4
- DB 15,88,160,133,95,0,0 ; addps 0x5f85(%eax),%xmm4
+ DB 15,89,160,213,102,0,0 ; mulps 0x66d5(%eax),%xmm4
+ DB 15,88,160,117,98,0,0 ; addps 0x6275(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -53323,13 +54065,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,133,99,0,0 ; addps 0x6385(%eax),%xmm1
- DB 15,40,168,85,93,0,0 ; movaps 0x5d55(%eax),%xmm5
+ DB 15,88,136,117,102,0,0 ; addps 0x6675(%eax),%xmm1
+ DB 15,40,168,69,96,0,0 ; movaps 0x6045(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,149,99,0,0 ; mulps 0x6395(%eax),%xmm5
- DB 15,88,168,53,95,0,0 ; addps 0x5f35(%eax),%xmm5
+ DB 15,89,168,133,102,0,0 ; mulps 0x6685(%eax),%xmm5
+ DB 15,88,168,37,98,0,0 ; addps 0x6225(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -53355,16 +54097,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,26,99,0,0 ; addps 0x631a(%eax),%xmm1
- DB 15,40,168,250,92,0,0 ; movaps 0x5cfa(%eax),%xmm5
+ DB 15,88,136,10,102,0,0 ; addps 0x660a(%eax),%xmm1
+ DB 15,40,168,234,95,0,0 ; movaps 0x5fea(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,74,99,0,0 ; movaps 0x634a(%eax),%xmm4
+ DB 15,40,160,58,102,0,0 ; movaps 0x663a(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,90,99,0,0 ; addps 0x635a(%eax),%xmm4
+ DB 15,88,160,74,102,0,0 ; addps 0x664a(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,218,92,0,0 ; addps 0x5cda(%eax),%xmm4
+ DB 15,88,160,202,95,0,0 ; addps 0x5fca(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,106,99,0,0 ; addps 0x636a(%eax),%xmm4
+ DB 15,88,160,90,102,0,0 ; addps 0x665a(%eax),%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53387,17 +54129,17 @@ _sk_bicubic_p1y_sse2 LABEL PROC
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,113,92,0,0 ; movaps 0x5c71(%eax),%xmm4
+ DB 15,40,160,97,95,0,0 ; movaps 0x5f61(%eax),%xmm4
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,110,96 ; movups 0x60(%esi),%xmm5
DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,40,176,225,98,0,0 ; movaps 0x62e1(%eax),%xmm6
+ DB 15,40,176,209,101,0,0 ; movaps 0x65d1(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,241,98,0,0 ; addps 0x62f1(%eax),%xmm6
+ DB 15,88,176,225,101,0,0 ; addps 0x65e1(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,1,99,0,0 ; addps 0x6301(%eax),%xmm6
+ DB 15,88,176,241,101,0,0 ; addps 0x65f1(%eax),%xmm6
DB 15,17,182,160,0,0,0 ; movups %xmm6,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -53422,11 +54164,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,147,98,0,0 ; addps 0x6293(%eax),%xmm1
+ DB 15,88,136,131,101,0,0 ; addps 0x6583(%eax),%xmm1
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,115,98,0,0 ; mulps 0x6273(%eax),%xmm4
- DB 15,88,160,19,94,0,0 ; addps 0x5e13(%eax),%xmm4
+ DB 15,89,160,99,101,0,0 ; mulps 0x6563(%eax),%xmm4
+ DB 15,88,160,3,97,0,0 ; addps 0x6103(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -53576,7 +54318,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,254,202 ; paddd %xmm2,%xmm1
- DB 102,15,111,130,207,96,0,0 ; movdqa 0x60cf(%edx),%xmm0
+ DB 102,15,111,130,191,99,0,0 ; movdqa 0x63bf(%edx),%xmm0
DB 102,15,127,133,88,255,255,255 ; movdqa %xmm0,-0xa8(%ebp)
DB 102,15,112,225,245 ; pshufd $0xf5,%xmm1,%xmm4
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
@@ -53600,7 +54342,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,196 ; unpcklps %xmm4,%xmm0
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
- DB 102,15,111,130,95,90,0,0 ; movdqa 0x5a5f(%edx),%xmm0
+ DB 102,15,111,130,79,93,0,0 ; movdqa 0x5d4f(%edx),%xmm0
DB 102,15,127,133,72,255,255,255 ; movdqa %xmm0,-0xb8(%ebp)
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,254,224 ; paddd %xmm0,%xmm4
@@ -53618,7 +54360,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,15,16,36,185 ; movss (%ecx,%edi,4),%xmm4
DB 15,20,252 ; unpcklps %xmm4,%xmm7
DB 15,20,248 ; unpcklps %xmm0,%xmm7
- DB 102,15,111,130,127,90,0,0 ; movdqa 0x5a7f(%edx),%xmm0
+ DB 102,15,111,130,111,93,0,0 ; movdqa 0x5d6f(%edx),%xmm0
DB 102,15,127,69,216 ; movdqa %xmm0,-0x28(%ebp)
DB 102,15,254,200 ; paddd %xmm0,%xmm1
DB 102,15,112,193,229 ; pshufd $0xe5,%xmm1,%xmm0
@@ -53635,7 +54377,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,15,16,4,177 ; movss (%ecx,%esi,4),%xmm0
DB 15,20,232 ; unpcklps %xmm0,%xmm5
DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,40,130,191,96,0,0 ; movaps 0x60bf(%edx),%xmm0
+ DB 15,40,130,175,99,0,0 ; movaps 0x63af(%edx),%xmm0
DB 15,88,240 ; addps %xmm0,%xmm6
DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
DB 15,40,141,56,255,255,255 ; movaps -0xc8(%ebp),%xmm1
@@ -54259,7 +55001,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,245 ; paddd %xmm5,%xmm6
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,15,254,206 ; paddd %xmm6,%xmm1
- DB 102,15,111,153,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm3
+ DB 102,15,111,153,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm3
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
@@ -54282,7 +55024,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
- DB 102,15,111,153,233,78,0,0 ; movdqa 0x4ee9(%ecx),%xmm3
+ DB 102,15,111,153,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm3
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
@@ -54300,7 +55042,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 15,20,213 ; unpcklps %xmm5,%xmm2
DB 15,41,149,136,254,255,255 ; movaps %xmm2,-0x178(%ebp)
- DB 102,15,254,137,9,79,0,0 ; paddd 0x4f09(%ecx),%xmm1
+ DB 102,15,254,137,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm1
DB 102,15,112,233,229 ; pshufd $0xe5,%xmm1,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
@@ -54316,7 +55058,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,207 ; unpcklps %xmm7,%xmm1
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,41,141,152,254,255,255 ; movaps %xmm1,-0x168(%ebp)
- DB 15,40,185,73,85,0,0 ; movaps 0x5549(%ecx),%xmm7
+ DB 15,40,185,57,88,0,0 ; movaps 0x5839(%ecx),%xmm7
DB 15,88,231 ; addps %xmm7,%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,40,141,232,254,255,255 ; movaps -0x118(%ebp),%xmm1
@@ -54337,7 +55079,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,127,77,184 ; movdqa %xmm1,-0x48(%ebp)
DB 102,15,254,241 ; paddd %xmm1,%xmm6
DB 102,15,112,254,245 ; pshufd $0xf5,%xmm6,%xmm7
- DB 102,15,111,137,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm1
+ DB 102,15,111,137,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm1
DB 102,15,244,241 ; pmuludq %xmm1,%xmm6
DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
DB 102,15,244,249 ; pmuludq %xmm1,%xmm7
@@ -54374,7 +55116,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,44,178 ; movss (%edx,%esi,4),%xmm5
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,20,217 ; unpcklps %xmm1,%xmm3
- DB 102,15,111,177,9,79,0,0 ; movdqa 0x4f09(%ecx),%xmm6
+ DB 102,15,111,177,249,81,0,0 ; movdqa 0x51f9(%ecx),%xmm6
DB 102,15,254,198 ; paddd %xmm6,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
@@ -54422,7 +55164,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,254,77,168 ; paddd -0x58(%ebp),%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,129,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm0
+ DB 102,15,111,129,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm0
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
@@ -54444,7 +55186,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,195 ; unpcklps %xmm3,%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,129,233,78,0,0 ; movdqa 0x4ee9(%ecx),%xmm0
+ DB 102,15,111,129,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm0
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
@@ -54480,7 +55222,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,197 ; movdqa %xmm5,%xmm0
DB 102,15,254,69,184 ; paddd -0x48(%ebp),%xmm0
DB 102,15,112,216,245 ; pshufd $0xf5,%xmm0,%xmm3
- DB 102,15,111,137,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm1
+ DB 102,15,111,137,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm1
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,217 ; pmuludq %xmm1,%xmm3
@@ -54516,7 +55258,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,224 ; unpcklps %xmm0,%xmm4
DB 15,20,227 ; unpcklps %xmm3,%xmm4
- DB 102,15,111,153,9,79,0,0 ; movdqa 0x4f09(%ecx),%xmm3
+ DB 102,15,111,153,249,81,0,0 ; movdqa 0x51f9(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,194,229 ; pshufd $0xe5,%xmm2,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
@@ -54580,7 +55322,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,197 ; movdqa %xmm5,%xmm0
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,145,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm2
+ DB 102,15,111,145,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -54602,7 +55344,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,214 ; unpcklps %xmm6,%xmm2
DB 15,41,85,136 ; movaps %xmm2,-0x78(%ebp)
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,111,145,233,78,0,0 ; movdqa 0x4ee9(%ecx),%xmm2
+ DB 102,15,111,145,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm2
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
@@ -54635,7 +55377,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 102,15,254,109,184 ; paddd -0x48(%ebp),%xmm5
DB 102,15,112,245,245 ; pshufd $0xf5,%xmm5,%xmm6
- DB 102,15,111,129,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm0
+ DB 102,15,111,129,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm0
DB 102,15,244,232 ; pmuludq %xmm0,%xmm5
DB 102,15,112,253,232 ; pshufd $0xe8,%xmm5,%xmm7
DB 102,15,244,240 ; pmuludq %xmm0,%xmm6
@@ -54671,7 +55413,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,234 ; unpcklps %xmm2,%xmm5
DB 15,20,238 ; unpcklps %xmm6,%xmm5
- DB 102,15,111,153,9,79,0,0 ; movdqa 0x4f09(%ecx),%xmm3
+ DB 102,15,111,153,249,81,0,0 ; movdqa 0x51f9(%ecx),%xmm3
DB 102,15,254,251 ; paddd %xmm3,%xmm7
DB 102,15,112,215,229 ; pshufd $0xe5,%xmm7,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
@@ -54705,7 +55447,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,177,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm6
+ DB 102,15,111,177,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm6
DB 102,15,244,198 ; pmuludq %xmm6,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,206 ; pmuludq %xmm6,%xmm1
@@ -54727,7 +55469,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,15,254,137,233,78,0,0 ; paddd 0x4ee9(%ecx),%xmm1
+ DB 102,15,254,137,217,81,0,0 ; paddd 0x51d9(%ecx),%xmm1
DB 102,15,112,241,229 ; pshufd $0xe5,%xmm1,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -54761,7 +55503,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,254,85,184 ; paddd -0x48(%ebp),%xmm2
DB 102,15,112,194,245 ; pshufd $0xf5,%xmm2,%xmm0
- DB 102,15,111,137,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm1
+ DB 102,15,111,137,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm1
DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
DB 102,15,112,226,232 ; pshufd $0xe8,%xmm2,%xmm4
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
@@ -54782,7 +55524,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,200 ; unpcklps %xmm0,%xmm1
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
- DB 102,15,254,129,233,78,0,0 ; paddd 0x4ee9(%ecx),%xmm0
+ DB 102,15,254,129,217,81,0,0 ; paddd 0x51d9(%ecx),%xmm0
DB 102,15,112,240,229 ; pshufd $0xe5,%xmm0,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,240,78 ; pshufd $0x4e,%xmm0,%xmm6
@@ -54797,7 +55539,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,208 ; unpcklps %xmm0,%xmm2
DB 15,20,214 ; unpcklps %xmm6,%xmm2
- DB 102,15,254,161,9,79,0,0 ; paddd 0x4f09(%ecx),%xmm4
+ DB 102,15,254,161,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm4
DB 102,15,112,196,229 ; pshufd $0xe5,%xmm4,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,196,78 ; pshufd $0x4e,%xmm4,%xmm0
@@ -54865,7 +55607,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,69,168 ; movdqa -0x58(%ebp),%xmm0
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,112,224,245 ; pshufd $0xf5,%xmm0,%xmm4
- DB 102,15,111,145,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm2
+ DB 102,15,111,145,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,216,232 ; pshufd $0xe8,%xmm0,%xmm3
DB 102,15,244,226 ; pmuludq %xmm2,%xmm4
@@ -54888,7 +55630,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,196 ; unpcklps %xmm4,%xmm0
DB 15,41,133,120,255,255,255 ; movaps %xmm0,-0x88(%ebp)
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,111,145,233,78,0,0 ; movdqa 0x4ee9(%ecx),%xmm2
+ DB 102,15,111,145,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm2
DB 102,15,254,226 ; paddd %xmm2,%xmm4
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
@@ -54904,7 +55646,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
DB 15,20,236 ; unpcklps %xmm4,%xmm5
DB 15,20,238 ; unpcklps %xmm6,%xmm5
- DB 102,15,254,153,9,79,0,0 ; paddd 0x4f09(%ecx),%xmm3
+ DB 102,15,254,153,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm3
DB 102,15,112,227,229 ; pshufd $0xe5,%xmm3,%xmm4
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
@@ -54956,7 +55698,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,20,223 ; unpcklps %xmm7,%xmm3
- DB 102,15,254,161,9,79,0,0 ; paddd 0x4f09(%ecx),%xmm4
+ DB 102,15,254,161,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm4
DB 102,15,112,212,229 ; pshufd $0xe5,%xmm4,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,212,78 ; pshufd $0x4e,%xmm4,%xmm2
@@ -54989,7 +55731,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,127,133,56,255,255,255 ; movdqa %xmm0,-0xc8(%ebp)
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,208,245 ; pshufd $0xf5,%xmm0,%xmm2
- DB 102,15,111,137,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm1
+ DB 102,15,111,137,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm1
DB 102,15,244,193 ; pmuludq %xmm1,%xmm0
DB 102,15,112,240,232 ; pshufd $0xe8,%xmm0,%xmm6
DB 102,15,244,209 ; pmuludq %xmm1,%xmm2
@@ -55011,7 +55753,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,194 ; unpcklps %xmm2,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 102,15,111,214 ; movdqa %xmm6,%xmm2
- DB 102,15,111,153,233,78,0,0 ; movdqa 0x4ee9(%ecx),%xmm3
+ DB 102,15,111,153,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,229 ; pshufd $0xe5,%xmm2,%xmm5
DB 102,15,126,232 ; movd %xmm5,%eax
@@ -55027,7 +55769,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,20,178 ; movss (%edx,%esi,4),%xmm2
DB 15,20,234 ; unpcklps %xmm2,%xmm5
DB 15,20,239 ; unpcklps %xmm7,%xmm5
- DB 102,15,254,177,9,79,0,0 ; paddd 0x4f09(%ecx),%xmm6
+ DB 102,15,254,177,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm6
DB 102,15,112,214,229 ; pshufd $0xe5,%xmm6,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,214,78 ; pshufd $0x4e,%xmm6,%xmm2
@@ -55080,7 +55822,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,4,178 ; movss (%edx,%esi,4),%xmm0
DB 15,20,216 ; unpcklps %xmm0,%xmm3
DB 15,20,218 ; unpcklps %xmm2,%xmm3
- DB 102,15,254,185,9,79,0,0 ; paddd 0x4f09(%ecx),%xmm7
+ DB 102,15,254,185,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm7
DB 102,15,112,199,229 ; pshufd $0xe5,%xmm7,%xmm0
DB 102,15,126,192 ; movd %xmm0,%eax
DB 102,15,112,199,78 ; pshufd $0x4e,%xmm7,%xmm0
@@ -55130,7 +55872,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,254,69,168 ; paddd -0x58(%ebp),%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,153,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm3
+ DB 102,15,111,153,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm3
DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
@@ -55152,7 +55894,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,15,111,177,233,78,0,0 ; movdqa 0x4ee9(%ecx),%xmm6
+ DB 102,15,111,177,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm6
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,15,112,217,229 ; pshufd $0xe5,%xmm1,%xmm3
DB 102,15,126,216 ; movd %xmm3,%eax
@@ -55168,7 +55910,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,36,178 ; movss (%edx,%esi,4),%xmm4
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,203 ; unpcklps %xmm3,%xmm1
- DB 102,15,111,185,9,79,0,0 ; movdqa 0x4f09(%ecx),%xmm7
+ DB 102,15,111,185,249,81,0,0 ; movdqa 0x51f9(%ecx),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,112,218,229 ; pshufd $0xe5,%xmm2,%xmm3
DB 102,15,126,216 ; movd %xmm3,%eax
@@ -55187,7 +55929,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,221 ; movdqa %xmm5,%xmm3
DB 102,15,254,93,184 ; paddd -0x48(%ebp),%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,15,111,129,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm0
+ DB 102,15,111,129,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm0
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
@@ -55256,7 +55998,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,193 ; paddd %xmm1,%xmm0
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,145,89,85,0,0 ; movdqa 0x5559(%ecx),%xmm2
+ DB 102,15,111,145,73,88,0,0 ; movdqa 0x5849(%ecx),%xmm2
DB 102,15,244,194 ; pmuludq %xmm2,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -55279,7 +56021,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,41,93,168 ; movaps %xmm3,-0x58(%ebp)
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,137,233,78,0,0 ; paddd 0x4ee9(%ecx),%xmm1
+ DB 102,15,254,137,217,81,0,0 ; paddd 0x51d9(%ecx),%xmm1
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
DB 102,15,126,208 ; movd %xmm2,%eax
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
@@ -55295,7 +56037,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,217 ; unpcklps %xmm1,%xmm3
DB 15,20,218 ; unpcklps %xmm2,%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
- DB 102,15,254,129,9,79,0,0 ; paddd 0x4f09(%ecx),%xmm0
+ DB 102,15,254,129,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -55332,7 +56074,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,60,178 ; movss (%edx,%esi,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,177,233,78,0,0 ; movdqa 0x4ee9(%ecx),%xmm6
+ DB 102,15,111,177,217,81,0,0 ; movdqa 0x51d9(%ecx),%xmm6
DB 102,15,254,242 ; paddd %xmm2,%xmm6
DB 102,15,112,206,229 ; pshufd $0xe5,%xmm6,%xmm1
DB 102,15,126,200 ; movd %xmm1,%eax
@@ -55348,7 +56090,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,15,16,52,178 ; movss (%edx,%esi,4),%xmm6
DB 15,20,206 ; unpcklps %xmm6,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,145,9,79,0,0 ; paddd 0x4f09(%ecx),%xmm2
+ DB 102,15,254,145,249,81,0,0 ; paddd 0x51f9(%ecx),%xmm2
DB 102,15,112,242,229 ; pshufd $0xe5,%xmm2,%xmm6
DB 102,15,126,240 ; movd %xmm6,%eax
DB 102,15,112,242,78 ; pshufd $0x4e,%xmm2,%xmm6
@@ -55418,7 +56160,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 139,117,12 ; mov 0xc(%ebp),%esi
DB 141,86,8 ; lea 0x8(%esi),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,201,78,0,0 ; movaps 0x4ec9(%ecx),%xmm3
+ DB 15,40,153,185,81,0,0 ; movaps 0x51b9(%ecx),%xmm3
DB 82 ; push %edx
DB 80 ; push %eax
DB 255,86,4 ; call *0x4(%esi)
@@ -55524,11 +56266,11 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
- DB 243,15,16,161,178,64,0,0 ; movss 0x40b2(%ecx),%xmm4
+ DB 243,15,16,161,242,67,0,0 ; movss 0x43f2(%ecx),%xmm4
DB 243,15,16,50 ; movss (%edx),%xmm6
DB 243,15,89,244 ; mulss %xmm4,%xmm6
DB 243,15,44,246 ; cvttss2si %xmm6,%esi
- DB 243,15,16,169,182,64,0,0 ; movss 0x40b6(%ecx),%xmm5
+ DB 243,15,16,169,246,67,0,0 ; movss 0x43f6(%ecx),%xmm5
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 243,15,92,253 ; subss %xmm5,%xmm7
DB 243,15,44,255 ; cvttss2si %xmm7,%edi
@@ -55558,7 +56300,7 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 9,247 ; or %esi,%edi
DB 102,15,110,231 ; movd %edi,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,169,78,64,0,0 ; movdqa 0x404e(%ecx),%xmm5
+ DB 102,15,111,169,62,67,0,0 ; movdqa 0x433e(%ecx),%xmm5
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -55598,7 +56340,7 @@ _sk_premul_sse2_8bit LABEL PROC
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
DB 242,15,112,228,95 ; pshuflw $0x5f,%xmm4,%xmm4
DB 243,15,112,252,95 ; pshufhw $0x5f,%xmm4,%xmm7
- DB 102,15,111,160,118,63,0,0 ; movdqa 0x3f76(%eax),%xmm4
+ DB 102,15,111,160,102,66,0,0 ; movdqa 0x4266(%eax),%xmm4
DB 102,15,235,252 ; por %xmm4,%xmm7
DB 102,15,235,244 ; por %xmm4,%xmm6
DB 102,15,239,210 ; pxor %xmm2,%xmm2
@@ -56194,6 +56936,228 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 0,0 ; add %al,(%eax)
DB 0 ; .byte 0x0
+PUBLIC _sk_store_565_sse2_8bit
+_sk_store_565_sse2_8bit LABEL PROC
+ DB 85 ; push %ebp
+ DB 137,229 ; mov %esp,%ebp
+ DB 83 ; push %ebx
+ DB 87 ; push %edi
+ DB 86 ; push %esi
+ DB 131,236,12 ; sub $0xc,%esp
+ DB 232,0,0,0,0 ; call 9bc2 <_sk_store_565_sse2_8bit+0xe>
+ DB 88 ; pop %eax
+ DB 102,15,111,176,62,59,0,0 ; movdqa 0x3b3e(%eax),%xmm6
+ DB 102,15,111,249 ; movdqa %xmm1,%xmm7
+ DB 102,15,219,254 ; pand %xmm6,%xmm7
+ DB 102,15,219,240 ; pand %xmm0,%xmm6
+ DB 102,15,114,246,8 ; pslld $0x8,%xmm6
+ DB 102,15,114,247,8 ; pslld $0x8,%xmm7
+ DB 102,15,111,160,78,59,0,0 ; movdqa 0x3b4e(%eax),%xmm4
+ DB 102,15,111,233 ; movdqa %xmm1,%xmm5
+ DB 102,15,219,236 ; pand %xmm4,%xmm5
+ DB 102,15,219,224 ; pand %xmm0,%xmm4
+ DB 102,15,114,212,5 ; psrld $0x5,%xmm4
+ DB 102,15,114,213,5 ; psrld $0x5,%xmm5
+ DB 102,15,235,239 ; por %xmm7,%xmm5
+ DB 102,15,111,184,94,59,0,0 ; movdqa 0x3b5e(%eax),%xmm7
+ DB 102,15,235,230 ; por %xmm6,%xmm4
+ DB 102,15,111,240 ; movdqa %xmm0,%xmm6
+ DB 102,15,219,247 ; pand %xmm7,%xmm6
+ DB 102,15,114,214,19 ; psrld $0x13,%xmm6
+ DB 102,15,235,230 ; por %xmm6,%xmm4
+ DB 102,15,219,249 ; pand %xmm1,%xmm7
+ DB 102,15,114,215,19 ; psrld $0x13,%xmm7
+ DB 102,15,235,239 ; por %xmm7,%xmm5
+ DB 102,15,114,245,16 ; pslld $0x10,%xmm5
+ DB 102,15,114,229,16 ; psrad $0x10,%xmm5
+ DB 102,15,114,244,16 ; pslld $0x10,%xmm4
+ DB 102,15,114,228,16 ; psrad $0x10,%xmm4
+ DB 102,15,107,229 ; packssdw %xmm5,%xmm4
+ DB 139,85,20 ; mov 0x14(%ebp),%edx
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,49 ; mov (%ecx),%esi
+ DB 139,126,4 ; mov 0x4(%esi),%edi
+ DB 15,175,250 ; imul %edx,%edi
+ DB 1,255 ; add %edi,%edi
+ DB 3,62 ; add (%esi),%edi
+ DB 139,93,8 ; mov 0x8(%ebp),%ebx
+ DB 133,219 ; test %ebx,%ebx
+ DB 139,117,16 ; mov 0x10(%ebp),%esi
+ DB 117,23 ; jne 9c78 <_sk_store_565_sse2_8bit+0xc4>
+ DB 243,15,127,36,119 ; movdqu %xmm4,(%edi,%esi,2)
+ DB 141,65,8 ; lea 0x8(%ecx),%eax
+ DB 82 ; push %edx
+ DB 86 ; push %esi
+ DB 80 ; push %eax
+ DB 83 ; push %ebx
+ DB 255,81,4 ; call *0x4(%ecx)
+ DB 131,196,28 ; add $0x1c,%esp
+ DB 94 ; pop %esi
+ DB 95 ; pop %edi
+ DB 91 ; pop %ebx
+ DB 93 ; pop %ebp
+ DB 195 ; ret
+ DB 139,93,8 ; mov 0x8(%ebp),%ebx
+ DB 136,93,243 ; mov %bl,-0xd(%ebp)
+ DB 139,93,8 ; mov 0x8(%ebp),%ebx
+ DB 128,101,243,7 ; andb $0x7,-0xd(%ebp)
+ DB 254,77,243 ; decb -0xd(%ebp)
+ DB 128,125,243,6 ; cmpb $0x6,-0xd(%ebp)
+ DB 119,216 ; ja 9c66 <_sk_store_565_sse2_8bit+0xb2>
+ DB 15,182,85,243 ; movzbl -0xd(%ebp),%edx
+ DB 3,132,144,34,1,0,0 ; add 0x122(%eax,%edx,4),%eax
+ DB 255,224 ; jmp *%eax
+ DB 102,15,126,224 ; movd %xmm4,%eax
+ DB 102,137,4,119 ; mov %ax,(%edi,%esi,2)
+ DB 139,85,20 ; mov 0x14(%ebp),%edx
+ DB 235,190 ; jmp 9c66 <_sk_store_565_sse2_8bit+0xb2>
+ DB 102,15,197,196,2 ; pextrw $0x2,%xmm4,%eax
+ DB 102,137,68,119,4 ; mov %ax,0x4(%edi,%esi,2)
+ DB 102,15,126,36,119 ; movd %xmm4,(%edi,%esi,2)
+ DB 139,85,20 ; mov 0x14(%ebp),%edx
+ DB 235,170 ; jmp 9c66 <_sk_store_565_sse2_8bit+0xb2>
+ DB 102,15,197,196,6 ; pextrw $0x6,%xmm4,%eax
+ DB 102,137,68,119,12 ; mov %ax,0xc(%edi,%esi,2)
+ DB 102,15,197,196,5 ; pextrw $0x5,%xmm4,%eax
+ DB 102,137,68,119,10 ; mov %ax,0xa(%edi,%esi,2)
+ DB 102,15,197,196,4 ; pextrw $0x4,%xmm4,%eax
+ DB 102,137,68,119,8 ; mov %ax,0x8(%edi,%esi,2)
+ DB 102,15,214,36,119 ; movq %xmm4,(%edi,%esi,2)
+ DB 139,85,20 ; mov 0x14(%ebp),%edx
+ DB 235,130 ; jmp 9c66 <_sk_store_565_sse2_8bit+0xb2>
+ DB 217,0 ; flds (%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 240,0,0 ; lock add %al,(%eax)
+ DB 0,230 ; add %ah,%dh
+ DB 0,0 ; add %al,(%eax)
+ DB 0,24 ; add %bl,(%eax)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,14 ; add %cl,(%esi)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,4,1 ; add %al,(%ecx,%eax,1)
+ DB 0,0 ; add %al,(%eax)
+ DB 250 ; cli
+ DB 0,0 ; add %al,(%eax)
+ DB 0 ; .byte 0x0
+
+PUBLIC _sk_load_565_dst_sse2_8bit
+_sk_load_565_dst_sse2_8bit LABEL PROC
+ DB 85 ; push %ebp
+ DB 137,229 ; mov %esp,%ebp
+ DB 83 ; push %ebx
+ DB 87 ; push %edi
+ DB 86 ; push %esi
+ DB 131,236,28 ; sub $0x1c,%esp
+ DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
+ DB 232,0,0,0,0 ; call 9d12 <_sk_load_565_dst_sse2_8bit+0x12>
+ DB 94 ; pop %esi
+ DB 139,69,12 ; mov 0xc(%ebp),%eax
+ DB 139,16 ; mov (%eax),%edx
+ DB 139,90,4 ; mov 0x4(%edx),%ebx
+ DB 15,175,93,20 ; imul 0x14(%ebp),%ebx
+ DB 1,219 ; add %ebx,%ebx
+ DB 3,26 ; add (%edx),%ebx
+ DB 139,85,8 ; mov 0x8(%ebp),%edx
+ DB 133,210 ; test %edx,%edx
+ DB 139,125,16 ; mov 0x10(%ebp),%edi
+ DB 15,133,235,0,0,0 ; jne 9e1c <_sk_load_565_dst_sse2_8bit+0x11c>
+ DB 243,15,111,20,123 ; movdqu (%ebx,%edi,2),%xmm2
+ DB 102,15,239,228 ; pxor %xmm4,%xmm4
+ DB 102,15,111,218 ; movdqa %xmm2,%xmm3
+ DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
+ DB 102,15,97,212 ; punpcklwd %xmm4,%xmm2
+ DB 102,15,111,182,62,53,0,0 ; movdqa 0x353e(%esi),%xmm6
+ DB 102,15,111,250 ; movdqa %xmm2,%xmm7
+ DB 102,15,219,254 ; pand %xmm6,%xmm7
+ DB 102,15,219,243 ; pand %xmm3,%xmm6
+ DB 102,15,114,214,8 ; psrld $0x8,%xmm6
+ DB 102,15,114,215,8 ; psrld $0x8,%xmm7
+ DB 102,15,111,174,126,53,0,0 ; movdqa 0x357e(%esi),%xmm5
+ DB 102,15,111,226 ; movdqa %xmm2,%xmm4
+ DB 102,15,219,229 ; pand %xmm5,%xmm4
+ DB 102,15,219,235 ; pand %xmm3,%xmm5
+ DB 102,15,114,245,19 ; pslld $0x13,%xmm5
+ DB 102,15,114,244,19 ; pslld $0x13,%xmm4
+ DB 102,15,235,231 ; por %xmm7,%xmm4
+ DB 102,15,235,238 ; por %xmm6,%xmm5
+ DB 102,15,111,182,94,53,0,0 ; movdqa 0x355e(%esi),%xmm6
+ DB 102,15,111,251 ; movdqa %xmm3,%xmm7
+ DB 102,15,219,254 ; pand %xmm6,%xmm7
+ DB 102,15,219,242 ; pand %xmm2,%xmm6
+ DB 102,15,111,142,46,58,0,0 ; movdqa 0x3a2e(%esi),%xmm1
+ DB 102,15,219,217 ; pand %xmm1,%xmm3
+ DB 102,15,219,209 ; pand %xmm1,%xmm2
+ DB 102,15,114,247,5 ; pslld $0x5,%xmm7
+ DB 102,15,114,211,1 ; psrld $0x1,%xmm3
+ DB 102,15,235,223 ; por %xmm7,%xmm3
+ DB 102,15,235,221 ; por %xmm5,%xmm3
+ DB 102,15,114,213,5 ; psrld $0x5,%xmm5
+ DB 102,15,114,246,5 ; pslld $0x5,%xmm6
+ DB 102,15,114,210,1 ; psrld $0x1,%xmm2
+ DB 102,15,235,214 ; por %xmm6,%xmm2
+ DB 102,15,235,212 ; por %xmm4,%xmm2
+ DB 102,15,114,212,5 ; psrld $0x5,%xmm4
+ DB 102,15,111,142,30,58,0,0 ; movdqa 0x3a1e(%esi),%xmm1
+ DB 102,15,219,225 ; pand %xmm1,%xmm4
+ DB 102,15,219,233 ; pand %xmm1,%xmm5
+ DB 102,15,111,142,222,57,0,0 ; movdqa 0x39de(%esi),%xmm1
+ DB 102,15,235,209 ; por %xmm1,%xmm2
+ DB 102,15,235,212 ; por %xmm4,%xmm2
+ DB 102,15,235,217 ; por %xmm1,%xmm3
+ DB 102,15,235,221 ; por %xmm5,%xmm3
+ DB 141,72,8 ; lea 0x8(%eax),%ecx
+ DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
+ DB 255,117,20 ; pushl 0x14(%ebp)
+ DB 87 ; push %edi
+ DB 81 ; push %ecx
+ DB 82 ; push %edx
+ DB 255,80,4 ; call *0x4(%eax)
+ DB 131,196,44 ; add $0x2c,%esp
+ DB 94 ; pop %esi
+ DB 95 ; pop %edi
+ DB 91 ; pop %ebx
+ DB 93 ; pop %ebp
+ DB 195 ; ret
+ DB 137,209 ; mov %edx,%ecx
+ DB 128,225,7 ; and $0x7,%cl
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
+ DB 254,201 ; dec %cl
+ DB 128,249,6 ; cmp $0x6,%cl
+ DB 15,135,6,255,255,255 ; ja 9d36 <_sk_load_565_dst_sse2_8bit+0x36>
+ DB 15,182,201 ; movzbl %cl,%ecx
+ DB 139,140,142,118,1,0,0 ; mov 0x176(%esi,%ecx,4),%ecx
+ DB 1,241 ; add %esi,%ecx
+ DB 255,225 ; jmp *%ecx
+ DB 15,183,12,123 ; movzwl (%ebx,%edi,2),%ecx
+ DB 102,15,110,209 ; movd %ecx,%xmm2
+ DB 233,235,254,255,255 ; jmp 9d36 <_sk_load_565_dst_sse2_8bit+0x36>
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
+ DB 102,15,196,84,123,4,2 ; pinsrw $0x2,0x4(%ebx,%edi,2),%xmm2
+ DB 243,15,16,28,123 ; movss (%ebx,%edi,2),%xmm3
+ DB 243,15,16,211 ; movss %xmm3,%xmm2
+ DB 233,210,254,255,255 ; jmp 9d36 <_sk_load_565_dst_sse2_8bit+0x36>
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
+ DB 102,15,196,84,123,12,6 ; pinsrw $0x6,0xc(%ebx,%edi,2),%xmm2
+ DB 102,15,196,84,123,10,5 ; pinsrw $0x5,0xa(%ebx,%edi,2),%xmm2
+ DB 102,15,196,84,123,8,4 ; pinsrw $0x4,0x8(%ebx,%edi,2),%xmm2
+ DB 102,15,18,20,123 ; movlpd (%ebx,%edi,2),%xmm2
+ DB 233,175,254,255,255 ; jmp 9d36 <_sk_load_565_dst_sse2_8bit+0x36>
+ DB 144 ; nop
+ DB 44,1 ; sub $0x1,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 68 ; inc %esp
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,57 ; add %bh,(%ecx)
+ DB 1,0 ; add %eax,(%eax)
+ DB 0,107,1 ; add %ch,0x1(%ebx)
+ DB 0,0 ; add %al,(%eax)
+ DB 100,1,0 ; add %eax,%fs:(%eax)
+ DB 0,93,1 ; add %bl,0x1(%ebp)
+ DB 0,0 ; add %al,(%eax)
+ DB 82 ; push %edx
+ DB 1,0 ; add %eax,(%eax)
+ DB 0 ; .byte 0x0
+
PUBLIC _sk_load_a8_sse2_8bit
_sk_load_a8_sse2_8bit LABEL PROC
DB 85 ; push %ebp
@@ -56202,7 +57166,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 9bc2 <_sk_load_a8_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 9eb2 <_sk_load_a8_sse2_8bit+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56212,10 +57176,10 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,63 ; jne 9c1a <_sk_load_a8_sse2_8bit+0x66>
+ DB 117,63 ; jne 9f0a <_sk_load_a8_sse2_8bit+0x66>
DB 243,15,126,4,51 ; movq (%ebx,%esi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,219,135,78,56,0,0 ; pand 0x384e(%edi),%xmm0
+ DB 102,15,219,135,158,56,0,0 ; pand 0x389e(%edi),%xmm0
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -56239,14 +57203,14 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,186 ; ja 9be4 <_sk_load_a8_sse2_8bit+0x30>
+ DB 119,186 ; ja 9ed4 <_sk_load_a8_sse2_8bit+0x30>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,214,0,0,0 ; mov 0xd6(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,193 ; movd %ecx,%xmm0
- DB 235,162 ; jmp 9be4 <_sk_load_a8_sse2_8bit+0x30>
+ DB 235,162 ; jmp 9ed4 <_sk_load_a8_sse2_8bit+0x30>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,193,2 ; pinsrw $0x2,%ecx,%xmm0
@@ -56254,7 +57218,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,110,201 ; movd %ecx,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 235,130 ; jmp 9be4 <_sk_load_a8_sse2_8bit+0x30>
+ DB 235,130 ; jmp 9ed4 <_sk_load_a8_sse2_8bit+0x30>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,193,6 ; pinsrw $0x6,%ecx,%xmm0
@@ -56265,9 +57229,9 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,110,12,51 ; movd (%ebx,%esi,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,78,255,255,255 ; jmp 9be4 <_sk_load_a8_sse2_8bit+0x30>
+ DB 233,78,255,255,255 ; jmp 9ed4 <_sk_load_a8_sse2_8bit+0x30>
DB 102,144 ; xchg %ax,%ax
- DB 118,0 ; jbe 9c9a <_sk_load_a8_sse2_8bit+0xe6>
+ DB 118,0 ; jbe 9f8a <_sk_load_a8_sse2_8bit+0xe6>
DB 0,0 ; add %al,(%eax)
DB 142,0 ; mov (%eax),%es
DB 0,0 ; add %al,(%eax)
@@ -56289,7 +57253,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 9cc2 <_sk_load_a8_dst_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call 9fb2 <_sk_load_a8_dst_sse2_8bit+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56299,10 +57263,10 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 117,63 ; jne 9d1a <_sk_load_a8_dst_sse2_8bit+0x66>
+ DB 117,63 ; jne a00a <_sk_load_a8_dst_sse2_8bit+0x66>
DB 243,15,126,20,51 ; movq (%ebx,%esi,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,219,151,78,55,0,0 ; pand 0x374e(%edi),%xmm2
+ DB 102,15,219,151,158,55,0,0 ; pand 0x379e(%edi),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -56326,14 +57290,14 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,186 ; ja 9ce4 <_sk_load_a8_dst_sse2_8bit+0x30>
+ DB 119,186 ; ja 9fd4 <_sk_load_a8_dst_sse2_8bit+0x30>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,214,0,0,0 ; mov 0xd6(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,209 ; movd %ecx,%xmm2
- DB 235,162 ; jmp 9ce4 <_sk_load_a8_dst_sse2_8bit+0x30>
+ DB 235,162 ; jmp 9fd4 <_sk_load_a8_dst_sse2_8bit+0x30>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2
@@ -56341,7 +57305,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,110,217 ; movd %ecx,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 235,130 ; jmp 9ce4 <_sk_load_a8_dst_sse2_8bit+0x30>
+ DB 235,130 ; jmp 9fd4 <_sk_load_a8_dst_sse2_8bit+0x30>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,209,6 ; pinsrw $0x6,%ecx,%xmm2
@@ -56352,9 +57316,9 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,110,28,51 ; movd (%ebx,%esi,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,78,255,255,255 ; jmp 9ce4 <_sk_load_a8_dst_sse2_8bit+0x30>
+ DB 233,78,255,255,255 ; jmp 9fd4 <_sk_load_a8_dst_sse2_8bit+0x30>
DB 102,144 ; xchg %ax,%ax
- DB 118,0 ; jbe 9d9a <_sk_load_a8_dst_sse2_8bit+0xe6>
+ DB 118,0 ; jbe a08a <_sk_load_a8_dst_sse2_8bit+0xe6>
DB 0,0 ; add %al,(%eax)
DB 142,0 ; mov (%eax),%es
DB 0,0 ; add %al,(%eax)
@@ -56376,7 +57340,7 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,92 ; sub $0x5c,%esp
- DB 232,0,0,0,0 ; call 9dc2 <_sk_store_a8_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call a0b2 <_sk_store_a8_sse2_8bit+0xe>
DB 91 ; pop %ebx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56395,8 +57359,8 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,107,229 ; packssdw %xmm5,%xmm4
DB 133,210 ; test %edx,%edx
DB 139,125,16 ; mov 0x10(%ebp),%edi
- DB 117,37 ; jne 9e2a <_sk_store_a8_sse2_8bit+0x76>
- DB 102,15,219,163,78,54,0,0 ; pand 0x364e(%ebx),%xmm4
+ DB 117,37 ; jne a11a <_sk_store_a8_sse2_8bit+0x76>
+ DB 102,15,219,163,158,54,0,0 ; pand 0x369e(%ebx),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,214,36,62 ; movq %xmm4,(%esi,%edi,1)
DB 141,72,8 ; lea 0x8(%eax),%ecx
@@ -56415,7 +57379,7 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 128,225,7 ; and $0x7,%cl
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 119,224 ; ja 9e16 <_sk_store_a8_sse2_8bit+0x62>
+ DB 119,224 ; ja a106 <_sk_store_a8_sse2_8bit+0x62>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,139,238,0,0,0 ; mov 0xee(%ebx,%ecx,4),%ecx
DB 1,217 ; add %ebx,%ecx
@@ -56423,15 +57387,15 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,127,101,152 ; movdqa %xmm4,-0x68(%ebp)
DB 138,77,152 ; mov -0x68(%ebp),%cl
DB 136,12,62 ; mov %cl,(%esi,%edi,1)
- DB 235,197 ; jmp 9e16 <_sk_store_a8_sse2_8bit+0x62>
+ DB 235,197 ; jmp a106 <_sk_store_a8_sse2_8bit+0x62>
DB 102,15,127,101,168 ; movdqa %xmm4,-0x58(%ebp)
DB 138,77,172 ; mov -0x54(%ebp),%cl
DB 136,76,62,2 ; mov %cl,0x2(%esi,%edi,1)
- DB 102,15,219,163,78,54,0,0 ; pand 0x364e(%ebx),%xmm4
+ DB 102,15,219,163,158,54,0,0 ; pand 0x369e(%ebx),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,225 ; movd %xmm4,%ecx
DB 102,137,12,62 ; mov %cx,(%esi,%edi,1)
- DB 235,163 ; jmp 9e16 <_sk_store_a8_sse2_8bit+0x62>
+ DB 235,163 ; jmp a106 <_sk_store_a8_sse2_8bit+0x62>
DB 102,15,127,101,184 ; movdqa %xmm4,-0x48(%ebp)
DB 138,77,196 ; mov -0x3c(%ebp),%cl
DB 136,76,62,6 ; mov %cl,0x6(%esi,%edi,1)
@@ -56441,10 +57405,10 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,127,101,216 ; movdqa %xmm4,-0x28(%ebp)
DB 138,77,224 ; mov -0x20(%ebp),%cl
DB 136,76,62,4 ; mov %cl,0x4(%esi,%edi,1)
- DB 102,15,219,163,78,54,0,0 ; pand 0x364e(%ebx),%xmm4
+ DB 102,15,219,163,158,54,0,0 ; pand 0x369e(%ebx),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,36,62 ; movd %xmm4,(%esi,%edi,1)
- DB 233,105,255,255,255 ; jmp 9e16 <_sk_store_a8_sse2_8bit+0x62>
+ DB 233,105,255,255,255 ; jmp a106 <_sk_store_a8_sse2_8bit+0x62>
DB 15,31,0 ; nopl (%eax)
DB 130,0,0 ; addb $0x0,(%eax)
DB 0,155,0,0,0,143 ; add %bl,-0x71000000(%ebx)
@@ -56465,7 +57429,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 9eda <_sk_load_g8_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call a1ca <_sk_load_g8_sse2_8bit+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56475,15 +57439,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,131,0,0,0 ; jne 9f7a <_sk_load_g8_sse2_8bit+0xae>
+ DB 15,133,131,0,0,0 ; jne a26a <_sk_load_g8_sse2_8bit+0xae>
DB 243,15,126,4,51 ; movq (%ebx,%esi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,219,135,54,53,0,0 ; pand 0x3536(%edi),%xmm0
+ DB 102,15,219,135,134,53,0,0 ; pand 0x3586(%edi),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
- DB 102,15,111,175,70,53,0,0 ; movdqa 0x3546(%edi),%xmm5
+ DB 102,15,111,175,150,53,0,0 ; movdqa 0x3596(%edi),%xmm5
DB 102,15,112,240,245 ; pshufd $0xf5,%xmm0,%xmm6
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,200,232 ; pshufd $0xe8,%xmm0,%xmm1
@@ -56516,14 +57480,14 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 15,135,114,255,255,255 ; ja 9f00 <_sk_load_g8_sse2_8bit+0x34>
+ DB 15,135,114,255,255,255 ; ja a1f0 <_sk_load_g8_sse2_8bit+0x34>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,38,1,0,0 ; mov 0x126(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,193 ; movd %ecx,%xmm0
- DB 233,87,255,255,255 ; jmp 9f00 <_sk_load_g8_sse2_8bit+0x34>
+ DB 233,87,255,255,255 ; jmp a1f0 <_sk_load_g8_sse2_8bit+0x34>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,193,2 ; pinsrw $0x2,%ecx,%xmm0
@@ -56531,7 +57495,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,110,201 ; movd %ecx,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 233,52,255,255,255 ; jmp 9f00 <_sk_load_g8_sse2_8bit+0x34>
+ DB 233,52,255,255,255 ; jmp a1f0 <_sk_load_g8_sse2_8bit+0x34>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,193,6 ; pinsrw $0x6,%ecx,%xmm0
@@ -56542,7 +57506,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,110,12,51 ; movd (%ebx,%esi,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,0,255,255,255 ; jmp 9f00 <_sk_load_g8_sse2_8bit+0x34>
+ DB 233,0,255,255,255 ; jmp a1f0 <_sk_load_g8_sse2_8bit+0x34>
DB 194,0,0 ; ret $0x0
DB 0,221 ; add %bl,%ch
DB 0,0 ; add %al,(%eax)
@@ -56565,7 +57529,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call a02a <_sk_load_g8_dst_sse2_8bit+0xe>
+ DB 232,0,0,0,0 ; call a31a <_sk_load_g8_dst_sse2_8bit+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56575,15 +57539,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,131,0,0,0 ; jne a0ca <_sk_load_g8_dst_sse2_8bit+0xae>
+ DB 15,133,131,0,0,0 ; jne a3ba <_sk_load_g8_dst_sse2_8bit+0xae>
DB 243,15,126,20,51 ; movq (%ebx,%esi,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,219,151,230,51,0,0 ; pand 0x33e6(%edi),%xmm2
+ DB 102,15,219,151,54,52,0,0 ; pand 0x3436(%edi),%xmm2
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,15,97,227 ; punpcklwd %xmm3,%xmm4
DB 102,15,105,211 ; punpckhwd %xmm3,%xmm2
- DB 102,15,111,175,246,51,0,0 ; movdqa 0x33f6(%edi),%xmm5
+ DB 102,15,111,175,70,52,0,0 ; movdqa 0x3446(%edi),%xmm5
DB 102,15,112,242,245 ; pshufd $0xf5,%xmm2,%xmm6
DB 102,15,244,213 ; pmuludq %xmm5,%xmm2
DB 102,15,112,218,232 ; pshufd $0xe8,%xmm2,%xmm3
@@ -56616,14 +57580,14 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 15,135,114,255,255,255 ; ja a050 <_sk_load_g8_dst_sse2_8bit+0x34>
+ DB 15,135,114,255,255,255 ; ja a340 <_sk_load_g8_dst_sse2_8bit+0x34>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,38,1,0,0 ; mov 0x126(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,209 ; movd %ecx,%xmm2
- DB 233,87,255,255,255 ; jmp a050 <_sk_load_g8_dst_sse2_8bit+0x34>
+ DB 233,87,255,255,255 ; jmp a340 <_sk_load_g8_dst_sse2_8bit+0x34>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2
@@ -56631,7 +57595,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,110,217 ; movd %ecx,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 233,52,255,255,255 ; jmp a050 <_sk_load_g8_dst_sse2_8bit+0x34>
+ DB 233,52,255,255,255 ; jmp a340 <_sk_load_g8_dst_sse2_8bit+0x34>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,209,6 ; pinsrw $0x6,%ecx,%xmm2
@@ -56642,7 +57606,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,110,28,51 ; movd (%ebx,%esi,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,0,255,255,255 ; jmp a050 <_sk_load_g8_dst_sse2_8bit+0x34>
+ DB 233,0,255,255,255 ; jmp a340 <_sk_load_g8_dst_sse2_8bit+0x34>
DB 194,0,0 ; ret $0x0
DB 0,221 ; add %bl,%ch
DB 0,0 ; add %al,(%eax)
@@ -56667,7 +57631,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 131,236,124 ; sub $0x7c,%esp
DB 15,41,157,120,255,255,255 ; movaps %xmm3,-0x88(%ebp)
DB 102,15,127,85,136 ; movdqa %xmm2,-0x78(%ebp)
- DB 232,0,0,0,0 ; call a186 <_sk_srcover_rgba_8888_sse2_8bit+0x1a>
+ DB 232,0,0,0,0 ; call a476 <_sk_srcover_rgba_8888_sse2_8bit+0x1a>
DB 91 ; pop %ebx
DB 139,77,20 ; mov 0x14(%ebp),%ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -56679,7 +57643,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,51,1,0,0 ; jne a2db <_sk_srcover_rgba_8888_sse2_8bit+0x16f>
+ DB 15,133,51,1,0,0 ; jne a5cb <_sk_srcover_rgba_8888_sse2_8bit+0x16f>
DB 15,16,116,183,16 ; movups 0x10(%edi,%esi,4),%xmm6
DB 102,15,16,20,183 ; movupd (%edi,%esi,4),%xmm2
DB 102,15,41,85,200 ; movapd %xmm2,-0x38(%ebp)
@@ -56739,7 +57703,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 133,210 ; test %edx,%edx
DB 102,15,252,232 ; paddb %xmm0,%xmm5
DB 102,15,252,217 ; paddb %xmm1,%xmm3
- DB 117,98 ; jne a312 <_sk_srcover_rgba_8888_sse2_8bit+0x1a6>
+ DB 117,98 ; jne a602 <_sk_srcover_rgba_8888_sse2_8bit+0x1a6>
DB 243,15,127,44,183 ; movdqu %xmm5,(%edi,%esi,4)
DB 243,15,127,92,183,16 ; movdqu %xmm3,0x10(%edi,%esi,4)
DB 141,120,8 ; lea 0x8(%eax),%edi
@@ -56764,33 +57728,33 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 254,77,200 ; decb -0x38(%ebp)
DB 128,125,200,6 ; cmpb $0x6,-0x38(%ebp)
- DB 119,66 ; ja a33a <_sk_srcover_rgba_8888_sse2_8bit+0x1ce>
+ DB 119,66 ; ja a62a <_sk_srcover_rgba_8888_sse2_8bit+0x1ce>
DB 15,182,93,200 ; movzbl -0x38(%ebp),%ebx
DB 139,69,216 ; mov -0x28(%ebp),%eax
DB 139,156,152,70,2,0,0 ; mov 0x246(%eax,%ebx,4),%ebx
DB 3,93,216 ; add -0x28(%ebp),%ebx
DB 255,227 ; jmp *%ebx
DB 243,15,16,20,183 ; movss (%edi,%esi,4),%xmm2
- DB 235,109 ; jmp a37f <_sk_srcover_rgba_8888_sse2_8bit+0x213>
+ DB 235,109 ; jmp a66f <_sk_srcover_rgba_8888_sse2_8bit+0x213>
DB 137,93,216 ; mov %ebx,-0x28(%ebp)
DB 137,211 ; mov %edx,%ebx
DB 128,227,7 ; and $0x7,%bl
DB 254,203 ; dec %bl
DB 128,251,6 ; cmp $0x6,%bl
- DB 119,154 ; ja a2bb <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ DB 119,154 ; ja a5ab <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
DB 15,182,219 ; movzbl %bl,%ebx
DB 139,77,216 ; mov -0x28(%ebp),%ecx
DB 3,140,153,98,2,0,0 ; add 0x262(%ecx,%ebx,4),%ecx
DB 255,225 ; jmp *%ecx
DB 102,15,126,44,183 ; movd %xmm5,(%edi,%esi,4)
DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 235,129 ; jmp a2bb <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ DB 235,129 ; jmp a5ab <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
DB 139,93,216 ; mov -0x28(%ebp),%ebx
- DB 233,112,254,255,255 ; jmp a1b2 <_sk_srcover_rgba_8888_sse2_8bit+0x46>
+ DB 233,112,254,255,255 ; jmp a4a2 <_sk_srcover_rgba_8888_sse2_8bit+0x46>
DB 102,15,110,92,183,8 ; movd 0x8(%edi,%esi,4),%xmm3
DB 102,15,112,211,69 ; pshufd $0x45,%xmm3,%xmm2
DB 102,15,18,20,183 ; movlpd (%edi,%esi,4),%xmm2
- DB 235,43 ; jmp a37f <_sk_srcover_rgba_8888_sse2_8bit+0x213>
+ DB 235,43 ; jmp a66f <_sk_srcover_rgba_8888_sse2_8bit+0x213>
DB 102,15,110,84,183,24 ; movd 0x18(%edi,%esi,4),%xmm2
DB 102,15,112,242,69 ; pshufd $0x45,%xmm2,%xmm6
DB 243,15,16,92,183,20 ; movss 0x14(%edi,%esi,4),%xmm3
@@ -56802,12 +57766,12 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,15,16,20,183 ; movupd (%edi,%esi,4),%xmm2
DB 139,93,216 ; mov -0x28(%ebp),%ebx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 233,40,254,255,255 ; jmp a1b2 <_sk_srcover_rgba_8888_sse2_8bit+0x46>
+ DB 233,40,254,255,255 ; jmp a4a2 <_sk_srcover_rgba_8888_sse2_8bit+0x46>
DB 102,15,112,213,78 ; pshufd $0x4e,%xmm5,%xmm2
DB 102,15,126,84,183,8 ; movd %xmm2,0x8(%edi,%esi,4)
DB 102,15,214,44,183 ; movq %xmm5,(%edi,%esi,4)
DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 233,25,255,255,255 ; jmp a2bb <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ DB 233,25,255,255,255 ; jmp a5ab <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
DB 102,15,112,211,78 ; pshufd $0x4e,%xmm3,%xmm2
DB 102,15,126,84,183,24 ; movd %xmm2,0x18(%edi,%esi,4)
DB 102,15,112,211,229 ; pshufd $0xe5,%xmm3,%xmm2
@@ -56815,7 +57779,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,15,126,92,183,16 ; movd %xmm3,0x10(%edi,%esi,4)
DB 243,15,127,44,183 ; movdqu %xmm5,(%edi,%esi,4)
DB 139,77,20 ; mov 0x14(%ebp),%ecx
- DB 233,240,254,255,255 ; jmp a2bb <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
+ DB 233,240,254,255,255 ; jmp a5ab <_sk_srcover_rgba_8888_sse2_8bit+0x14f>
DB 144 ; nop
DB 133,1 ; test %eax,(%ecx)
DB 0,0 ; add %al,(%eax)
@@ -56851,12 +57815,12 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 232,0,0,0,0 ; call a41f <_sk_scale_1_float_sse2_8bit+0x1b>
+ DB 232,0,0,0,0 ; call a70f <_sk_scale_1_float_sse2_8bit+0x1b>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
DB 243,15,16,2 ; movss (%edx),%xmm0
- DB 243,15,89,129,69,48,0,0 ; mulss 0x3045(%ecx),%xmm0
+ DB 243,15,89,129,149,48,0,0 ; mulss 0x3095(%ecx),%xmm0
DB 243,15,44,208 ; cvttss2si %xmm0,%edx
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,111,213 ; movdqa %xmm5,%xmm2
@@ -56868,7 +57832,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,15,96,246 ; punpcklbw %xmm6,%xmm6
DB 242,15,112,246,0 ; pshuflw $0x0,%xmm6,%xmm6
DB 102,15,112,246,80 ; pshufd $0x50,%xmm6,%xmm6
- DB 102,15,219,177,241,47,0,0 ; pand 0x2ff1(%ecx),%xmm6
+ DB 102,15,219,177,65,48,0,0 ; pand 0x3041(%ecx),%xmm6
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,15,111,222 ; movdqa %xmm6,%xmm3
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
@@ -56909,7 +57873,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 131,236,60 ; sub $0x3c,%esp
DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
DB 102,15,127,85,200 ; movdqa %xmm2,-0x38(%ebp)
- DB 232,0,0,0,0 ; call a4e7 <_sk_scale_u8_sse2_8bit+0x17>
+ DB 232,0,0,0,0 ; call a7d7 <_sk_scale_u8_sse2_8bit+0x17>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -56919,10 +57883,10 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,11,1,0,0 ; jne a60f <_sk_scale_u8_sse2_8bit+0x13f>
+ DB 15,133,11,1,0,0 ; jne a8ff <_sk_scale_u8_sse2_8bit+0x13f>
DB 243,15,126,36,51 ; movq (%ebx,%esi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
- DB 102,15,219,167,41,47,0,0 ; pand 0x2f29(%edi),%xmm4
+ DB 102,15,219,167,121,47,0,0 ; pand 0x2f79(%edi),%xmm4
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
DB 102,15,105,234 ; punpckhwd %xmm2,%xmm5
@@ -56993,14 +57957,14 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 15,135,234,254,255,255 ; ja a50d <_sk_scale_u8_sse2_8bit+0x3d>
+ DB 15,135,234,254,255,255 ; ja a7fd <_sk_scale_u8_sse2_8bit+0x3d>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,177,1,0,0 ; mov 0x1b1(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,225 ; movd %ecx,%xmm4
- DB 233,207,254,255,255 ; jmp a50d <_sk_scale_u8_sse2_8bit+0x3d>
+ DB 233,207,254,255,255 ; jmp a7fd <_sk_scale_u8_sse2_8bit+0x3d>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,225,2 ; pinsrw $0x2,%ecx,%xmm4
@@ -57008,7 +57972,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,110,217 ; movd %ecx,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,227 ; movss %xmm3,%xmm4
- DB 233,172,254,255,255 ; jmp a50d <_sk_scale_u8_sse2_8bit+0x3d>
+ DB 233,172,254,255,255 ; jmp a7fd <_sk_scale_u8_sse2_8bit+0x3d>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,225,6 ; pinsrw $0x6,%ecx,%xmm4
@@ -57019,7 +57983,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,110,28,51 ; movd (%ebx,%esi,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,227 ; movsd %xmm3,%xmm4
- DB 233,120,254,255,255 ; jmp a50d <_sk_scale_u8_sse2_8bit+0x3d>
+ DB 233,120,254,255,255 ; jmp a7fd <_sk_scale_u8_sse2_8bit+0x3d>
DB 15,31,0 ; nopl (%eax)
DB 74 ; dec %edx
DB 1,0 ; add %eax,(%eax)
@@ -57031,7 +57995,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 0,0 ; add %al,(%eax)
DB 136,1 ; mov %al,(%ecx)
DB 0,0 ; add %al,(%eax)
- DB 122,1 ; jp a6b3 <_sk_scale_u8_sse2_8bit+0x1e3>
+ DB 122,1 ; jp a9a3 <_sk_scale_u8_sse2_8bit+0x1e3>
DB 0,0 ; add %al,(%eax)
PUBLIC _sk_lerp_1_float_sse2_8bit
@@ -57043,12 +58007,12 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 15,41,85,232 ; movaps %xmm2,-0x18(%ebp)
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 232,0,0,0,0 ; call a6cf <_sk_lerp_1_float_sse2_8bit+0x1b>
+ DB 232,0,0,0,0 ; call a9bf <_sk_lerp_1_float_sse2_8bit+0x1b>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
DB 243,15,16,34 ; movss (%edx),%xmm4
- DB 243,15,89,161,149,45,0,0 ; mulss 0x2d95(%ecx),%xmm4
+ DB 243,15,89,161,229,45,0,0 ; mulss 0x2de5(%ecx),%xmm4
DB 243,15,44,212 ; cvttss2si %xmm4,%edx
DB 102,15,110,226 ; movd %edx,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -57057,7 +58021,7 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 102,15,127,85,200 ; movdqa %xmm2,-0x38(%ebp)
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,96,197 ; punpcklbw %xmm5,%xmm0
- DB 102,15,111,153,65,45,0,0 ; movdqa 0x2d41(%ecx),%xmm3
+ DB 102,15,111,153,145,45,0,0 ; movdqa 0x2d91(%ecx),%xmm3
DB 102,15,219,218 ; pand %xmm2,%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
@@ -57138,7 +58102,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 131,236,92 ; sub $0x5c,%esp
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 102,15,127,85,216 ; movdqa %xmm2,-0x28(%ebp)
- DB 232,0,0,0,0 ; call a835 <_sk_lerp_u8_sse2_8bit+0x17>
+ DB 232,0,0,0,0 ; call ab25 <_sk_lerp_u8_sse2_8bit+0x17>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -57148,10 +58112,10 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 133,210 ; test %edx,%edx
DB 139,117,16 ; mov 0x10(%ebp),%esi
- DB 15,133,181,1,0,0 ; jne aa07 <_sk_lerp_u8_sse2_8bit+0x1e9>
+ DB 15,133,181,1,0,0 ; jne acf7 <_sk_lerp_u8_sse2_8bit+0x1e9>
DB 243,15,126,44,51 ; movq (%ebx,%esi,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
- DB 102,15,219,175,219,43,0,0 ; pand 0x2bdb(%edi),%xmm5
+ DB 102,15,219,175,43,44,0,0 ; pand 0x2c2b(%edi),%xmm5
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,111,221 ; movdqa %xmm5,%xmm3
DB 102,15,105,218 ; punpckhwd %xmm2,%xmm3
@@ -57262,14 +58226,14 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 254,201 ; dec %cl
DB 128,249,6 ; cmp $0x6,%cl
- DB 15,135,64,254,255,255 ; ja a85b <_sk_lerp_u8_sse2_8bit+0x3d>
+ DB 15,135,64,254,255,255 ; ja ab4b <_sk_lerp_u8_sse2_8bit+0x3d>
DB 15,182,201 ; movzbl %cl,%ecx
DB 139,140,143,91,2,0,0 ; mov 0x25b(%edi,%ecx,4),%ecx
DB 1,249 ; add %edi,%ecx
DB 255,225 ; jmp *%ecx
DB 15,182,12,51 ; movzbl (%ebx,%esi,1),%ecx
DB 102,15,110,233 ; movd %ecx,%xmm5
- DB 233,37,254,255,255 ; jmp a85b <_sk_lerp_u8_sse2_8bit+0x3d>
+ DB 233,37,254,255,255 ; jmp ab4b <_sk_lerp_u8_sse2_8bit+0x3d>
DB 15,182,76,51,2 ; movzbl 0x2(%ebx,%esi,1),%ecx
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,233,2 ; pinsrw $0x2,%ecx,%xmm5
@@ -57277,7 +58241,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,110,217 ; movd %ecx,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,235 ; movss %xmm3,%xmm5
- DB 233,2,254,255,255 ; jmp a85b <_sk_lerp_u8_sse2_8bit+0x3d>
+ DB 233,2,254,255,255 ; jmp ab4b <_sk_lerp_u8_sse2_8bit+0x3d>
DB 15,182,76,51,6 ; movzbl 0x6(%ebx,%esi,1),%ecx
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,233,6 ; pinsrw $0x6,%ecx,%xmm5
@@ -57288,7 +58252,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,110,28,51 ; movd (%ebx,%esi,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,235 ; movsd %xmm3,%xmm5
- DB 233,206,253,255,255 ; jmp a85b <_sk_lerp_u8_sse2_8bit+0x3d>
+ DB 233,206,253,255,255 ; jmp ab4b <_sk_lerp_u8_sse2_8bit+0x3d>
DB 15,31,0 ; nopl (%eax)
DB 244 ; hlt
DB 1,0 ; add %eax,(%eax)
@@ -57346,7 +58310,7 @@ _sk_black_color_sse2_8bit LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call aafd <_sk_black_color_sse2_8bit+0xb>
+ DB 232,0,0,0,0 ; call aded <_sk_black_color_sse2_8bit+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
@@ -58555,12 +59519,12 @@ _sk_darken_sse2_8bit LABEL PROC
DB 102,15,252,218 ; paddb %xmm2,%xmm3
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,15,248,238 ; psubb %xmm6,%xmm5
- DB 232,0,0,0,0 ; call bd20 <_sk_darken_sse2_8bit+0x1f7>
+ DB 232,0,0,0,0 ; call c010 <_sk_darken_sse2_8bit+0x1f7>
DB 88 ; pop %eax
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,248,216 ; psubb %xmm0,%xmm3
- DB 102,15,111,128,16,23,0,0 ; movdqa 0x1710(%eax),%xmm0
+ DB 102,15,111,128,96,23,0,0 ; movdqa 0x1760(%eax),%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,223,203 ; pandn %xmm3,%xmm1
DB 102,15,219,232 ; pand %xmm0,%xmm5
@@ -58699,12 +59663,12 @@ _sk_lighten_sse2_8bit LABEL PROC
DB 102,15,252,218 ; paddb %xmm2,%xmm3
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,15,248,238 ; psubb %xmm6,%xmm5
- DB 232,0,0,0,0 ; call bf6e <_sk_lighten_sse2_8bit+0x1f7>
+ DB 232,0,0,0,0 ; call c25e <_sk_lighten_sse2_8bit+0x1f7>
DB 88 ; pop %eax
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,248,216 ; psubb %xmm0,%xmm3
- DB 102,15,111,128,194,20,0,0 ; movdqa 0x14c2(%eax),%xmm0
+ DB 102,15,111,128,18,21,0,0 ; movdqa 0x1512(%eax),%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,223,203 ; pandn %xmm3,%xmm1
DB 102,15,219,232 ; pand %xmm0,%xmm5
@@ -58770,12 +59734,12 @@ _sk_exclusion_sse2_8bit LABEL PROC
DB 102,15,113,209,8 ; psrlw $0x8,%xmm1
DB 102,15,113,212,8 ; psrlw $0x8,%xmm4
DB 102,15,103,225 ; packuswb %xmm1,%xmm4
- DB 232,0,0,0,0 ; call c077 <_sk_exclusion_sse2_8bit+0xb2>
+ DB 232,0,0,0,0 ; call c367 <_sk_exclusion_sse2_8bit+0xb2>
DB 88 ; pop %eax
DB 102,15,113,208,8 ; psrlw $0x8,%xmm0
DB 102,15,113,213,8 ; psrlw $0x8,%xmm5
DB 102,15,103,232 ; packuswb %xmm0,%xmm5
- DB 102,15,111,128,185,19,0,0 ; movdqa 0x13b9(%eax),%xmm0
+ DB 102,15,111,128,9,20,0,0 ; movdqa 0x1409(%eax),%xmm0
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
DB 102,15,252,254 ; paddb %xmm6,%xmm7
DB 102,15,248,253 ; psubb %xmm5,%xmm7
@@ -58902,10 +59866,10 @@ _sk_difference_sse2_8bit LABEL PROC
DB 102,15,113,208,8 ; psrlw $0x8,%xmm0
DB 102,15,103,194 ; packuswb %xmm2,%xmm0
DB 102,15,218,125,152 ; pminub -0x68(%ebp),%xmm7
- DB 232,0,0,0,0 ; call c292 <_sk_difference_sse2_8bit+0x1b8>
+ DB 232,0,0,0,0 ; call c582 <_sk_difference_sse2_8bit+0x1b8>
DB 88 ; pop %eax
DB 102,15,218,198 ; pminub %xmm6,%xmm0
- DB 102,15,111,136,158,17,0,0 ; movdqa 0x119e(%eax),%xmm1
+ DB 102,15,111,136,238,17,0,0 ; movdqa 0x11ee(%eax),%xmm1
DB 102,15,111,101,136 ; movdqa -0x78(%ebp),%xmm4
DB 102,15,111,93,232 ; movdqa -0x18(%ebp),%xmm3
DB 102,15,252,227 ; paddb %xmm3,%xmm4
@@ -59025,9 +59989,9 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,15,217,229 ; psubusw %xmm5,%xmm4
DB 102,15,117,231 ; pcmpeqw %xmm7,%xmm4
DB 102,15,127,165,72,255,255,255 ; movdqa %xmm4,-0xb8(%ebp)
- DB 232,0,0,0,0 ; call c4c3 <_sk_hardlight_sse2_8bit+0x1ce>
+ DB 232,0,0,0,0 ; call c7b3 <_sk_hardlight_sse2_8bit+0x1ce>
DB 88 ; pop %eax
- DB 102,15,111,176,77,15,0,0 ; movdqa 0xf4d(%eax),%xmm6
+ DB 102,15,111,176,157,15,0,0 ; movdqa 0xf9d(%eax),%xmm6
DB 102,15,111,157,88,255,255,255 ; movdqa -0xa8(%ebp),%xmm3
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,239,206 ; pxor %xmm6,%xmm1
@@ -59162,7 +60126,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,15,111,69,216 ; movdqa -0x28(%ebp),%xmm0
DB 102,15,253,133,104,255,255,255 ; paddw -0x98(%ebp),%xmm0
DB 102,15,253,117,136 ; paddw -0x78(%ebp),%xmm6
- DB 102,15,111,152,125,15,0,0 ; movdqa 0xf7d(%eax),%xmm3
+ DB 102,15,111,152,205,15,0,0 ; movdqa 0xfcd(%eax),%xmm3
DB 102,15,253,227 ; paddw %xmm3,%xmm4
DB 102,15,111,149,72,255,255,255 ; movdqa -0xb8(%ebp),%xmm2
DB 102,15,253,212 ; paddw %xmm4,%xmm2
@@ -59172,7 +60136,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,15,253,200 ; paddw %xmm0,%xmm1
DB 102,15,253,243 ; paddw %xmm3,%xmm6
DB 102,15,253,245 ; paddw %xmm5,%xmm6
- DB 102,15,111,152,141,15,0,0 ; movdqa 0xf8d(%eax),%xmm3
+ DB 102,15,111,152,221,15,0,0 ; movdqa 0xfdd(%eax),%xmm3
DB 102,15,228,243 ; pmulhuw %xmm3,%xmm6
DB 102,15,228,203 ; pmulhuw %xmm3,%xmm1
DB 102,15,228,251 ; pmulhuw %xmm3,%xmm7
@@ -59290,9 +60254,9 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,217,236 ; psubusw %xmm4,%xmm5
DB 102,15,117,238 ; pcmpeqw %xmm6,%xmm5
DB 102,15,127,173,72,255,255,255 ; movdqa %xmm5,-0xb8(%ebp)
- DB 232,0,0,0,0 ; call c9e9 <_sk_overlay_sse2_8bit+0x1c5>
+ DB 232,0,0,0,0 ; call ccd9 <_sk_overlay_sse2_8bit+0x1c5>
DB 88 ; pop %eax
- DB 102,15,111,152,39,10,0,0 ; movdqa 0xa27(%eax),%xmm3
+ DB 102,15,111,152,119,10,0,0 ; movdqa 0xa77(%eax),%xmm3
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,15,239,195 ; pxor %xmm3,%xmm0
DB 102,15,111,181,120,255,255,255 ; movdqa -0x88(%ebp),%xmm6
@@ -59425,7 +60389,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,253,189,120,255,255,255 ; paddw -0x88(%ebp),%xmm7
DB 102,15,253,173,104,255,255,255 ; paddw -0x98(%ebp),%xmm5
DB 102,15,253,157,216,254,255,255 ; paddw -0x128(%ebp),%xmm3
- DB 102,15,111,144,87,10,0,0 ; movdqa 0xa57(%eax),%xmm2
+ DB 102,15,111,144,167,10,0,0 ; movdqa 0xaa7(%eax),%xmm2
DB 102,15,253,194 ; paddw %xmm2,%xmm0
DB 102,15,253,133,72,255,255,255 ; paddw -0xb8(%ebp),%xmm0
DB 102,15,253,250 ; paddw %xmm2,%xmm7
@@ -59434,7 +60398,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,253,233 ; paddw %xmm1,%xmm5
DB 102,15,253,218 ; paddw %xmm2,%xmm3
DB 102,15,253,220 ; paddw %xmm4,%xmm3
- DB 102,15,111,144,103,10,0,0 ; movdqa 0xa67(%eax),%xmm2
+ DB 102,15,111,144,183,10,0,0 ; movdqa 0xab7(%eax),%xmm2
DB 102,15,228,218 ; pmulhuw %xmm2,%xmm3
DB 102,15,228,234 ; pmulhuw %xmm2,%xmm5
DB 102,15,228,250 ; pmulhuw %xmm2,%xmm7
@@ -59529,11 +60493,11 @@ ALIGN 16
DB 0,128,191,0,0,128 ; add %al,-0x7fffff41(%eax)
DB 191,0,0,224,64 ; mov $0x40e00000,%edi
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne ce28 <.literal16+0xe8>
+ DB 224,64 ; loopne d118 <.literal16+0xe8>
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne ce2c <.literal16+0xec>
+ DB 224,64 ; loopne d11c <.literal16+0xec>
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne ce30 <.literal16+0xf0>
+ DB 224,64 ; loopne d120 <.literal16+0xf0>
DB 154,153,153,62,154,153,153 ; lcall $0x9999,$0x9a3e9999
DB 62,154,153,153,62,154,153,153 ; ds lcall $0x9999,$0x9a3e9999
DB 62,61,10,23,63,61 ; ds cmp $0x3d3f170a,%eax
@@ -59544,16 +60508,16 @@ ALIGN 16
DB 63 ; aas
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope ce51 <.literal16+0x111>
+ DB 225,61 ; loope d141 <.literal16+0x111>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope ce55 <.literal16+0x115>
+ DB 225,61 ; loope d145 <.literal16+0x115>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope ce59 <.literal16+0x119>
+ DB 225,61 ; loope d149 <.literal16+0x119>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope ce5d <.literal16+0x11d>
+ DB 225,61 ; loope d14d <.literal16+0x11d>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -59563,13 +60527,13 @@ ALIGN 16
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg ce77 <.literal16+0x137>
+ DB 127,67 ; jg d167 <.literal16+0x137>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg ce7b <.literal16+0x13b>
+ DB 127,67 ; jg d16b <.literal16+0x13b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg ce7f <.literal16+0x13f>
+ DB 127,67 ; jg d16f <.literal16+0x13f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg ce83 <.literal16+0x143>
+ DB 127,67 ; jg d173 <.literal16+0x143>
DB 145 ; xchg %eax,%ecx
DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%esi)
DB 145 ; xchg %eax,%ecx
@@ -59720,13 +60684,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne cf89 <.literal16+0x249>
+ DB 224,7 ; loopne d279 <.literal16+0x249>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne cf8d <.literal16+0x24d>
+ DB 224,7 ; loopne d27d <.literal16+0x24d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne cf91 <.literal16+0x251>
+ DB 224,7 ; loopne d281 <.literal16+0x251>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne cf95 <.literal16+0x255>
+ DB 224,7 ; loopne d285 <.literal16+0x255>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -59767,17 +60731,17 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg cfe4 <.literal16+0x2a4>
+ DB 127,0 ; jg d2d4 <.literal16+0x2a4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg cfe8 <.literal16+0x2a8>
+ DB 127,0 ; jg d2d8 <.literal16+0x2a8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg cfec <.literal16+0x2ac>
+ DB 127,0 ; jg d2dc <.literal16+0x2ac>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg cff0 <.literal16+0x2b0>
- DB 119,115 ; ja d065 <.literal16+0x325>
+ DB 127,0 ; jg d2e0 <.literal16+0x2b0>
+ DB 119,115 ; ja d355 <.literal16+0x325>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -59788,7 +60752,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne cfc9 <.literal16+0x289>
+ DB 117,191 ; jne d2b9 <.literal16+0x289>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -59804,7 +60768,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a41006 <_sk_overlay_sse2_8bit+0xe9a347e2>
+ DB 233,220,63,163,233 ; jmp e9a412f6 <_sk_overlay_sse2_8bit+0xe9a347e2>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,81 ; mov %eax,0x513fdce9
DB 140,242 ; mov %?,%edx
@@ -59900,16 +60864,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%ebx)
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe d153 <.literal16+0x413>
+ DB 118,63 ; jbe d443 <.literal16+0x413>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe d157 <.literal16+0x417>
+ DB 118,63 ; jbe d447 <.literal16+0x417>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe d15b <.literal16+0x41b>
+ DB 118,63 ; jbe d44b <.literal16+0x41b>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe d15f <.literal16+0x41f>
+ DB 118,63 ; jbe d44f <.literal16+0x41f>
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
@@ -59935,13 +60899,13 @@ ALIGN 16
DB 248 ; clc
DB 65 ; inc %ecx
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl d196 <.literal16+0x456>
+ DB 124,66 ; jl d486 <.literal16+0x456>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl d19a <.literal16+0x45a>
+ DB 124,66 ; jl d48a <.literal16+0x45a>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl d19e <.literal16+0x45e>
+ DB 124,66 ; jl d48e <.literal16+0x45e>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl d1a2 <.literal16+0x462>
+ DB 124,66 ; jl d492 <.literal16+0x462>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%eax)
DB 0,240 ; add %dh,%al
@@ -59987,13 +60951,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%eax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo d225 <.literal16+0x4e5>
+ DB 112,65 ; jo d515 <.literal16+0x4e5>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo d229 <.literal16+0x4e9>
+ DB 112,65 ; jo d519 <.literal16+0x4e9>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo d22d <.literal16+0x4ed>
+ DB 112,65 ; jo d51d <.literal16+0x4ed>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo d231 <.literal16+0x4f1>
+ DB 112,65 ; jo d521 <.literal16+0x4f1>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
DB 0,0 ; add %al,(%eax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
@@ -60030,13 +60994,13 @@ ALIGN 16
DB 254 ; (bad)
DB 255,0 ; incl (%eax)
DB 255 ; (bad)
- DB 127,71 ; jg d29b <.literal16+0x55b>
+ DB 127,71 ; jg d58b <.literal16+0x55b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg d29f <.literal16+0x55f>
+ DB 127,71 ; jg d58f <.literal16+0x55f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg d2a3 <.literal16+0x563>
+ DB 127,71 ; jg d593 <.literal16+0x563>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg d2a7 <.literal16+0x567>
+ DB 127,71 ; jg d597 <.literal16+0x567>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,208 ; ds (bad)
@@ -60089,7 +61053,7 @@ ALIGN 16
DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js d30c <.literal16+0x5cc>
+ DB 120,57 ; js d5fc <.literal16+0x5cc>
DB 64 ; inc %eax
DB 18,120,57 ; adc 0x39(%eax),%bh
DB 64 ; inc %eax
@@ -60160,13 +61124,13 @@ ALIGN 16
DB 192,191,0,0,192,191,0 ; sarb $0x0,-0x40400000(%edi)
DB 0,192 ; add %al,%al
DB 191,0,0,192,191 ; mov $0xbfc00000,%edi
- DB 114,28 ; jb d3be <.literal16+0x67e>
+ DB 114,28 ; jb d6ae <.literal16+0x67e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt d3c2 <.literal16+0x682>
+ DB 62,114,28 ; jb,pt d6b2 <.literal16+0x682>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt d3c6 <.literal16+0x686>
+ DB 62,114,28 ; jb,pt d6b6 <.literal16+0x686>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt d3ca <.literal16+0x68a>
+ DB 62,114,28 ; jb,pt d6ba <.literal16+0x68a>
DB 199 ; (bad)
DB 62,85 ; ds push %ebp
DB 85 ; push %ebp
@@ -60187,13 +61151,13 @@ ALIGN 16
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%esi)
DB 99,61,57,142,99,61 ; arpl %di,0x3d638e39
DB 57,142,99,61,114,249 ; cmp %ecx,-0x68dc29d(%esi)
- DB 127,63 ; jg d423 <.literal16+0x6e3>
- DB 114,249 ; jb d3df <.literal16+0x69f>
- DB 127,63 ; jg d427 <.literal16+0x6e7>
- DB 114,249 ; jb d3e3 <.literal16+0x6a3>
- DB 127,63 ; jg d42b <.literal16+0x6eb>
- DB 114,249 ; jb d3e7 <.literal16+0x6a7>
- DB 127,63 ; jg d42f <.literal16+0x6ef>
+ DB 127,63 ; jg d713 <.literal16+0x6e3>
+ DB 114,249 ; jb d6cf <.literal16+0x69f>
+ DB 127,63 ; jg d717 <.literal16+0x6e7>
+ DB 114,249 ; jb d6d3 <.literal16+0x6a3>
+ DB 127,63 ; jg d71b <.literal16+0x6eb>
+ DB 114,249 ; jb d6d7 <.literal16+0x6a7>
+ DB 127,63 ; jg d71f <.literal16+0x6ef>
DB 3,0 ; add (%eax),%eax
DB 0,0 ; add %al,(%eax)
DB 3,0 ; add (%eax),%eax
@@ -60210,23 +61174,64 @@ ALIGN 16
DB 0,255 ; add %bh,%bh
DB 0,0 ; add %al,(%eax)
DB 0,255 ; add %bh,%bh
- DB 255,0 ; incl (%eax)
- DB 255,0 ; incl (%eax)
- DB 255,0 ; incl (%eax)
- DB 255,0 ; incl (%eax)
- DB 255,0 ; incl (%eax)
- DB 255,0 ; incl (%eax)
- DB 255,0 ; incl (%eax)
- DB 255,0 ; incl (%eax)
+ DB 248 ; clc
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 252 ; cld
+ DB 0,0 ; add %al,(%eax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%eax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%eax)
+ DB 0,252 ; add %bh,%ah
+ DB 0,0 ; add %al,(%eax)
+ DB 0,0 ; add %al,(%eax)
+ DB 248 ; clc
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 0,248 ; add %bh,%al
+ DB 0,7 ; add %al,(%edi)
+ DB 0,7 ; add %al,(%edi)
+ DB 0,7 ; add %al,(%edi)
+ DB 0,7 ; add %al,(%edi)
+ DB 0,7 ; add %al,(%edi)
+ DB 0,7 ; add %al,(%edi)
+ DB 0,7 ; add %al,(%edi)
+ DB 0,7 ; add %al,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 12,0 ; or $0x0,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 12,0 ; or $0x0,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 12,0 ; or $0x0,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 12,0 ; or $0x0,%al
+ DB 0,255 ; add %bh,%bh
+ DB 0,255 ; add %bh,%bh
+ DB 0,255 ; add %bh,%bh
+ DB 0,255 ; add %bh,%bh
+ DB 0,255 ; add %bh,%bh
+ DB 0,255 ; add %bh,%bh
+ DB 0,255 ; add %bh,%bh
+ DB 0,255 ; add %bh,%bh
+ DB 0,1 ; add %al,(%ecx)
DB 1,1 ; add %eax,(%ecx)
- DB 1,0 ; add %eax,(%eax)
+ DB 0,1 ; add %al,(%ecx)
DB 1,1 ; add %eax,(%ecx)
- DB 1,0 ; add %eax,(%eax)
+ DB 0,1 ; add %al,(%ecx)
DB 1,1 ; add %eax,(%ecx)
- DB 1,0 ; add %eax,(%eax)
+ DB 0,1 ; add %al,(%ecx)
DB 1,1 ; add %eax,(%ecx)
- DB 1,0 ; add %eax,(%eax)
- DB 255 ; (bad)
+ DB 0,255 ; add %bh,%bh
DB 255 ; (bad)
DB 255,0 ; incl (%eax)
DB 255 ; (bad)
@@ -60238,14 +61243,14 @@ ALIGN 16
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,0 ; incl (%eax)
- DB 127,0 ; jg d442 <.literal16+0x702>
- DB 127,0 ; jg d444 <.literal16+0x704>
- DB 127,0 ; jg d446 <.literal16+0x706>
- DB 127,0 ; jg d448 <.literal16+0x708>
- DB 127,0 ; jg d44a <.literal16+0x70a>
- DB 127,0 ; jg d44c <.literal16+0x70c>
- DB 127,0 ; jg d44e <.literal16+0x70e>
- DB 127,0 ; jg d450 <.literal16+0x710>
+ DB 127,0 ; jg d782 <.literal16+0x752>
+ DB 127,0 ; jg d784 <.literal16+0x754>
+ DB 127,0 ; jg d786 <.literal16+0x756>
+ DB 127,0 ; jg d788 <.literal16+0x758>
+ DB 127,0 ; jg d78a <.literal16+0x75a>
+ DB 127,0 ; jg d78c <.literal16+0x75c>
+ DB 127,0 ; jg d78e <.literal16+0x75e>
+ DB 127,0 ; jg d790 <.literal16+0x760>
DB 129,128,129,128,129,128,129,128,129,128; addl $0x80818081,-0x7f7e7f7f(%eax)
DB 129 ; .byte 0x81
DB 128 ; .byte 0x80
@@ -60258,7 +61263,7 @@ ALIGN 4
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg d4ab <_sk_overlay_sse2_8bit+0xc87>
+ DB 127,67 ; jg d7eb <_sk_overlay_sse2_8bit+0xcd7>
DB 0,0 ; add %al,(%eax)
DB 0 ; .byte 0x0
DB 79 ; dec %edi
diff --git a/src/jumper/SkJumper_stages_8bit.cpp b/src/jumper/SkJumper_stages_8bit.cpp
index 11b4426848..c556bdd4f8 100644
--- a/src/jumper/SkJumper_stages_8bit.cpp
+++ b/src/jumper/SkJumper_stages_8bit.cpp
@@ -33,12 +33,14 @@ SI T* ptr_at_xy(const SkJumper_MemoryCtx* ctx, int x, int y) {
#if defined(__AVX2__)
using U8 = uint8_t __attribute__((ext_vector_type(16)));
+ using U16 = uint16_t __attribute__((ext_vector_type(16)));
using U32 = uint32_t __attribute__((ext_vector_type(16)));
using U8x4 = uint8_t __attribute__((ext_vector_type(64)));
using U16x4 = uint16_t __attribute__((ext_vector_type(64)));
using R = uint8_t __attribute__((ext_vector_type(32)));
#else
using U8 = uint8_t __attribute__((ext_vector_type( 8)));
+ using U16 = uint16_t __attribute__((ext_vector_type( 8)));
using U32 = uint32_t __attribute__((ext_vector_type( 8)));
using U8x4 = uint8_t __attribute__((ext_vector_type(32)));
using U16x4 = uint16_t __attribute__((ext_vector_type(32)));
@@ -323,6 +325,26 @@ SI T* ptr_at_xy(const SkJumper_MemoryCtx* ctx, int x, int y) {
store(ptr, swap_rb(src).u32, tail);
}
+ STAGE(store_565) {
+ auto ptr = ptr_at_xy<uint16_t>(ctx, x,y);
+
+ U32 r = (src.u32 & 0x0000F8) << 8;
+ U32 g = (src.u32 & 0x00FC00) >> 5;
+ U32 b = (src.u32 & 0xF80000) >> 19;
+
+ store(ptr, __builtin_convertvector(r | g | b, U16), tail);
+ }
+ STAGE(load_565_dst) {
+ auto ptr = ptr_at_xy<const uint16_t>(ctx, x,y);
+ U32 p = __builtin_convertvector(load<U16>(ptr, tail), U32);
+
+ U32 rb = ((p & 0xF800) >> 8) | ((p & 0x001F) << 19);
+ rb = rb | ((rb >> 5) & 0x70007);
+ U32 g = ((p & 0x07E0) << 5) | ((p & 0x0C00) >> 1);
+
+ dst = (0xFF << 24) | rb | g;
+ }
+
STAGE(load_a8) {
auto ptr = ptr_at_xy<const uint8_t>(ctx, x,y);
src = __builtin_convertvector(load<U8>(ptr, tail), U32) << 24;
@@ -619,6 +641,35 @@ SI T* ptr_at_xy(const SkJumper_MemoryCtx* ctx, int x, int y) {
}
}
+ SI U16 load_u16(const uint16_t* ptr, size_t tail) {
+ __builtin_assume(tail < kStride);
+ U16 v = 0;
+ switch (tail) {
+ case 0: memcpy(&v, ptr, 8*sizeof(uint16_t)); break;
+ case 7: v[6] = ptr[6];
+ case 6: v[5] = ptr[5];
+ case 5: v[4] = ptr[4];
+ case 4: memcpy(&v, ptr, 4*sizeof(uint16_t)); break;
+ case 3: v[2] = ptr[2];
+ case 2: memcpy(&v, ptr, 2*sizeof(uint16_t)); break;
+ case 1: v[0] = ptr[0];
+ }
+ return v;
+ }
+ SI void store_u16(uint16_t* ptr, size_t tail, U16 v) {
+ __builtin_assume(tail < kStride);
+ switch (tail) {
+ case 0: memcpy(ptr, &v, 8*sizeof(uint16_t)); break;
+ case 7: ptr[6] = v[6];
+ case 6: ptr[5] = v[5];
+ case 5: ptr[4] = v[4];
+ case 4: memcpy(ptr, &v, 4*sizeof(uint16_t)); break;
+ case 3: ptr[2] = v[2];
+ case 2: memcpy(ptr, &v, 2*sizeof(uint16_t)); break;
+ case 1: ptr[0] = v[0];
+ }
+ }
+
SI U8 load_u8(const uint8_t* ptr, size_t tail) {
__builtin_assume(tail < kStride);
U8 v = 0;
@@ -698,6 +749,25 @@ SI T* ptr_at_xy(const SkJumper_MemoryCtx* ctx, int x, int y) {
store_u32(ptr, tail, rgba);
}
+ STAGE(store_565) {
+ auto ptr = ptr_at_xy<uint16_t>(ctx, x,y);
+
+ U16 rr = __builtin_convertvector(r.vec >> 3, U16);
+ U16 gg = __builtin_convertvector(g.vec >> 2, U16);
+ U16 bb = __builtin_convertvector(b.vec >> 3, U16);
+ store_u16(ptr, tail, (rr << 11) | (gg << 5) | bb);
+ }
+
+ STAGE(load_565_dst) {
+ auto ptr = ptr_at_xy<const uint16_t>(ctx, x,y);
+
+ auto p = load_u16(ptr, tail);
+ dr = __builtin_convertvector(((p & 0xF800) >> 8) | ( p >> 13), U8);
+ dg = __builtin_convertvector(((p & 0x07E0) >> 3) | ((p & 0x60) >> 5), U8);
+ db = __builtin_convertvector(( p << 3) | ((p & 0x1C) >> 3), U8);
+ da = 0xFF;
+ }
+
STAGE(load_a8) {
auto ptr = ptr_at_xy<const uint8_t>(ctx, x,y);