aboutsummaryrefslogtreecommitdiffhomepage
path: root/src/jumper
diff options
context:
space:
mode:
authorGravatar Mike Klein <mtklein@chromium.org>2017-08-09 13:51:35 -0400
committerGravatar Skia Commit-Bot <skia-commit-bot@chromium.org>2017-08-09 18:51:44 +0000
commita07e4302cfefc282d8d235edfbc20a54c75afa88 (patch)
tree213da9d00c56d3cf3f8056410a81da60388dc933 /src/jumper
parentb681a0f1b0acebe36130fd463d14016d48295b97 (diff)
add gamma stage
Until now we've been using 3 separate parametric stages to apply gamma to r,g,b. That works fine, but is kind of unnecessarily slow, and again less clear in a stack trace than seeing "gamma". The new bench runs in about 60% of the time the old one does on my Trashcan. BUG=skia:6939 Change-Id: I079698d3009b081f1c23a2e27fc26e373b439610 Reviewed-on: https://skia-review.googlesource.com/32721 Reviewed-by: Mike Reed <reed@google.com> Commit-Queue: Mike Klein <mtklein@chromium.org>
Diffstat (limited to 'src/jumper')
-rw-r--r--src/jumper/SkJumper_generated.S7653
-rw-r--r--src/jumper/SkJumper_generated_win.S6835
-rw-r--r--src/jumper/SkJumper_stages.cpp7
3 files changed, 8248 insertions, 6247 deletions
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index e0f31bdfaa..05483651db 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -2813,6 +2813,97 @@ _sk_parametric_a_aarch64:
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
+HIDDEN _sk_gamma_aarch64
+.globl _sk_gamma_aarch64
+FUNCTION(_sk_gamma_aarch64)
+_sk_gamma_aarch64:
+ .long 0x52b85f08 // mov w8, #0xc2f80000
+ .long 0x728e6ee8 // movk w8, #0x7377
+ .long 0x4e040d10 // dup v16.4s, w8
+ .long 0x52a7d688 // mov w8, #0x3eb40000
+ .long 0x72889f28 // movk w8, #0x44f9
+ .long 0x4e040d12 // dup v18.4s, w8
+ .long 0x52a85e48 // mov w8, #0x42f20000
+ .long 0x72918a28 // movk w8, #0x8c51
+ .long 0x4e040d13 // dup v19.4s, w8
+ .long 0x52a81348 // mov w8, #0x409a0000
+ .long 0x729ebf08 // movk w8, #0xf5f8
+ .long 0x4e040d15 // dup v21.4s, w8
+ .long 0xa8c11428 // ldp x8, x5, [x1], #16
+ .long 0x52a7f7e9 // mov w9, #0x3fbf0000
+ .long 0x4f01669a // movi v26.4s, #0x34, lsl #24
+ .long 0x4e21d85b // scvtf v27.4s, v2.4s
+ .long 0x7297eea9 // movk w9, #0xbf75
+ .long 0x4eb01e1c // mov v28.16b, v16.16b
+ .long 0x4eb01e1d // mov v29.16b, v16.16b
+ .long 0x4e3bcf50 // fmla v16.4s, v26.4s, v27.4s
+ .long 0x4f03d7fb // movi v27.4s, #0x7f, msl #16
+ .long 0x4e040d31 // dup v17.4s, w9
+ .long 0x52a7fb89 // mov w9, #0x3fdc0000
+ .long 0x4e21d819 // scvtf v25.4s, v0.4s
+ .long 0x4e3b1c00 // and v0.16b, v0.16b, v27.16b
+ .long 0x4e3b1c42 // and v2.16b, v2.16b, v27.16b
+ .long 0x4e3b1c3b // and v27.16b, v1.16b, v27.16b
+ .long 0x729d3469 // movk w9, #0xe9a3
+ .long 0xbd400118 // ldr s24, [x8]
+ .long 0x4e21d821 // scvtf v1.4s, v1.4s
+ .long 0x4f0177e0 // orr v0.4s, #0x3f, lsl #24
+ .long 0x4f0177fb // orr v27.4s, #0x3f, lsl #24
+ .long 0x4f0177e2 // orr v2.4s, #0x3f, lsl #24
+ .long 0x4e040d37 // dup v23.4s, w9
+ .long 0x4e39cf5c // fmla v28.4s, v26.4s, v25.4s
+ .long 0x4e21cf5d // fmla v29.4s, v26.4s, v1.4s
+ .long 0x4e32d401 // fadd v1.4s, v0.4s, v18.4s
+ .long 0x4e32d77a // fadd v26.4s, v27.4s, v18.4s
+ .long 0x4eb1cc50 // fmls v16.4s, v2.4s, v17.4s
+ .long 0x4e32d442 // fadd v2.4s, v2.4s, v18.4s
+ .long 0x4eb1cc1c // fmls v28.4s, v0.4s, v17.4s
+ .long 0x6e21fee0 // fdiv v0.4s, v23.4s, v1.4s
+ .long 0x4eb1cf7d // fmls v29.4s, v27.4s, v17.4s
+ .long 0x6e3afee1 // fdiv v1.4s, v23.4s, v26.4s
+ .long 0x6e22fee2 // fdiv v2.4s, v23.4s, v2.4s
+ .long 0x52a7f7c9 // mov w9, #0x3fbe0000
+ .long 0x4ea0d780 // fsub v0.4s, v28.4s, v0.4s
+ .long 0x4ea1d7a1 // fsub v1.4s, v29.4s, v1.4s
+ .long 0x4ea2d602 // fsub v2.4s, v16.4s, v2.4s
+ .long 0x729791a9 // movk w9, #0xbc8d
+ .long 0x4f989000 // fmul v0.4s, v0.4s, v24.s[0]
+ .long 0x4f989021 // fmul v1.4s, v1.4s, v24.s[0]
+ .long 0x4f989042 // fmul v2.4s, v2.4s, v24.s[0]
+ .long 0x4e040d34 // dup v20.4s, w9
+ .long 0x52a83ba9 // mov w9, #0x41dd0000
+ .long 0x4e219810 // frintm v16.4s, v0.4s
+ .long 0x4e219832 // frintm v18.4s, v1.4s
+ .long 0x4e219858 // frintm v24.4s, v2.4s
+ .long 0x729a5fc9 // movk w9, #0xd2fe
+ .long 0x4e33d411 // fadd v17.4s, v0.4s, v19.4s
+ .long 0x4e33d437 // fadd v23.4s, v1.4s, v19.4s
+ .long 0x4e33d453 // fadd v19.4s, v2.4s, v19.4s
+ .long 0x4eb0d400 // fsub v0.4s, v0.4s, v16.4s
+ .long 0x4eb2d421 // fsub v1.4s, v1.4s, v18.4s
+ .long 0x4eb8d442 // fsub v2.4s, v2.4s, v24.4s
+ .long 0x4e040d36 // dup v22.4s, w9
+ .long 0x4eb4cc11 // fmls v17.4s, v0.4s, v20.4s
+ .long 0x4ea0d6a0 // fsub v0.4s, v21.4s, v0.4s
+ .long 0x4eb4cc37 // fmls v23.4s, v1.4s, v20.4s
+ .long 0x4ea1d6a1 // fsub v1.4s, v21.4s, v1.4s
+ .long 0x4eb4cc53 // fmls v19.4s, v2.4s, v20.4s
+ .long 0x4ea2d6a2 // fsub v2.4s, v21.4s, v2.4s
+ .long 0x6e20fec0 // fdiv v0.4s, v22.4s, v0.4s
+ .long 0x6e21fec1 // fdiv v1.4s, v22.4s, v1.4s
+ .long 0x6e22fec2 // fdiv v2.4s, v22.4s, v2.4s
+ .long 0x4f026579 // movi v25.4s, #0x4b, lsl #24
+ .long 0x4e20d620 // fadd v0.4s, v17.4s, v0.4s
+ .long 0x4e21d6e1 // fadd v1.4s, v23.4s, v1.4s
+ .long 0x4e22d662 // fadd v2.4s, v19.4s, v2.4s
+ .long 0x6e39dc00 // fmul v0.4s, v0.4s, v25.4s
+ .long 0x6e39dc21 // fmul v1.4s, v1.4s, v25.4s
+ .long 0x6e39dc42 // fmul v2.4s, v2.4s, v25.4s
+ .long 0x6e21a800 // fcvtnu v0.4s, v0.4s
+ .long 0x6e21a821 // fcvtnu v1.4s, v1.4s
+ .long 0x6e21a842 // fcvtnu v2.4s, v2.4s
+ .long 0xd61f00a0 // br x5
+
HIDDEN _sk_lab_to_xyz_aarch64
.globl _sk_lab_to_xyz_aarch64
FUNCTION(_sk_lab_to_xyz_aarch64)
@@ -2889,7 +2980,7 @@ _sk_load_a8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2754 <_sk_load_a8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 28ac <_sk_load_a8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -2914,12 +3005,12 @@ _sk_load_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 27a0 <_sk_load_a8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 28f8 <_sk_load_a8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e402 // movi d2, #0x0
- .long 0x540000c0 // b.eq 2780 <_sk_load_a8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 28d8 <_sk_load_a8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 271c <_sk_load_a8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2874 <_sk_load_a8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e0a1d22 // mov v2.h[2], w9
@@ -2930,11 +3021,11 @@ _sk_load_a8_aarch64:
.long 0x0e401800 // uzp1 v0.4h, v0.4h, v0.4h
.long 0x2e002040 // ext v0.8b, v2.8b, v0.8b, #4
.long 0x2e002002 // ext v2.8b, v0.8b, v0.8b, #4
- .long 0x17ffffe0 // b 271c <_sk_load_a8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2874 <_sk_load_a8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e021d02 // mov v2.h[0], w8
- .long 0x17ffffdc // b 271c <_sk_load_a8_aarch64+0x3c>
+ .long 0x17ffffdc // b 2874 <_sk_load_a8_aarch64+0x3c>
HIDDEN _sk_load_a8_dst_aarch64
.globl _sk_load_a8_dst_aarch64
@@ -2946,7 +3037,7 @@ _sk_load_a8_dst_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2824 <_sk_load_a8_dst_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 297c <_sk_load_a8_dst_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -2971,12 +3062,12 @@ _sk_load_a8_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2870 <_sk_load_a8_dst_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 29c8 <_sk_load_a8_dst_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e406 // movi d6, #0x0
- .long 0x540000c0 // b.eq 2850 <_sk_load_a8_dst_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 29a8 <_sk_load_a8_dst_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 27ec <_sk_load_a8_dst_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2944 <_sk_load_a8_dst_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe6 // dup v6.4h, wzr
.long 0x4e0a1d26 // mov v6.h[2], w9
@@ -2987,11 +3078,11 @@ _sk_load_a8_dst_aarch64:
.long 0x0e401884 // uzp1 v4.4h, v4.4h, v0.4h
.long 0x2e0420c4 // ext v4.8b, v6.8b, v4.8b, #4
.long 0x2e042086 // ext v6.8b, v4.8b, v4.8b, #4
- .long 0x17ffffe0 // b 27ec <_sk_load_a8_dst_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2944 <_sk_load_a8_dst_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe6 // dup v6.4h, wzr
.long 0x4e021d06 // mov v6.h[0], w8
- .long 0x17ffffdc // b 27ec <_sk_load_a8_dst_aarch64+0x3c>
+ .long 0x17ffffdc // b 2944 <_sk_load_a8_dst_aarch64+0x3c>
HIDDEN _sk_gather_a8_aarch64
.globl _sk_gather_a8_aarch64
@@ -3043,7 +3134,7 @@ _sk_store_a8_aarch64:
.long 0x0e612a10 // xtn v16.4h, v16.4s
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb5000184 // cbnz x4, 2954 <_sk_store_a8_aarch64+0x5c>
+ .long 0xb5000184 // cbnz x4, 2aac <_sk_store_a8_aarch64+0x5c>
.long 0x0e0e3e09 // umov w9, v16.h[3]
.long 0x0e0a3e0a // umov w10, v16.h[2]
.long 0x0e063e0b // umov w11, v16.h[1]
@@ -3057,21 +3148,21 @@ _sk_store_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000180 // b.eq 298c <_sk_store_a8_aarch64+0x94> // b.none
+ .long 0x54000180 // b.eq 2ae4 <_sk_store_a8_aarch64+0x94> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2978 <_sk_store_a8_aarch64+0x80> // b.none
+ .long 0x540000a0 // b.eq 2ad0 <_sk_store_a8_aarch64+0x80> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 2948 <_sk_store_a8_aarch64+0x50> // b.any
+ .long 0x54fffee1 // b.ne 2aa0 <_sk_store_a8_aarch64+0x50> // b.any
.long 0x0e0a3e09 // umov w9, v16.h[2]
.long 0x39000909 // strb w9, [x8, #2]
.long 0x0e023e09 // umov w9, v16.h[0]
.long 0x0e063e0a // umov w10, v16.h[1]
.long 0x3900050a // strb w10, [x8, #1]
.long 0x39000109 // strb w9, [x8]
- .long 0x17fffff0 // b 2948 <_sk_store_a8_aarch64+0x50>
+ .long 0x17fffff0 // b 2aa0 <_sk_store_a8_aarch64+0x50>
.long 0x0e023e09 // umov w9, v16.h[0]
.long 0x39000109 // strb w9, [x8]
- .long 0x17ffffed // b 2948 <_sk_store_a8_aarch64+0x50>
+ .long 0x17ffffed // b 2aa0 <_sk_store_a8_aarch64+0x50>
HIDDEN _sk_load_g8_aarch64
.globl _sk_load_g8_aarch64
@@ -3083,7 +3174,7 @@ _sk_load_g8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2a0c <_sk_load_g8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2b64 <_sk_load_g8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3108,12 +3199,12 @@ _sk_load_g8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2a58 <_sk_load_g8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2bb0 <_sk_load_g8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2a38 <_sk_load_g8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2b90 <_sk_load_g8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 29d4 <_sk_load_g8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2b2c <_sk_load_g8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e0a1d20 // mov v0.h[2], w9
@@ -3124,11 +3215,11 @@ _sk_load_g8_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffe0 // b 29d4 <_sk_load_g8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2b2c <_sk_load_g8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e021d00 // mov v0.h[0], w8
- .long 0x17ffffdc // b 29d4 <_sk_load_g8_aarch64+0x3c>
+ .long 0x17ffffdc // b 2b2c <_sk_load_g8_aarch64+0x3c>
HIDDEN _sk_load_g8_dst_aarch64
.globl _sk_load_g8_dst_aarch64
@@ -3140,7 +3231,7 @@ _sk_load_g8_dst_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2adc <_sk_load_g8_dst_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2c34 <_sk_load_g8_dst_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3165,12 +3256,12 @@ _sk_load_g8_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2b28 <_sk_load_g8_dst_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2c80 <_sk_load_g8_dst_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 2b08 <_sk_load_g8_dst_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2c60 <_sk_load_g8_dst_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 2aa4 <_sk_load_g8_dst_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2bfc <_sk_load_g8_dst_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x4e0a1d24 // mov v4.h[2], w9
@@ -3181,11 +3272,11 @@ _sk_load_g8_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffe0 // b 2aa4 <_sk_load_g8_dst_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2bfc <_sk_load_g8_dst_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x4e021d04 // mov v4.h[0], w8
- .long 0x17ffffdc // b 2aa4 <_sk_load_g8_dst_aarch64+0x3c>
+ .long 0x17ffffdc // b 2bfc <_sk_load_g8_dst_aarch64+0x3c>
HIDDEN _sk_gather_g8_aarch64
.globl _sk_gather_g8_aarch64
@@ -3233,7 +3324,7 @@ _sk_load_565_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50003c4 // cbnz x4, 2c44 <_sk_load_565_aarch64+0x94>
+ .long 0xb50003c4 // cbnz x4, 2d9c <_sk_load_565_aarch64+0x94>
.long 0xfd400100 // ldr d0, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d02 // dup v2.4s, w8
@@ -3265,12 +3356,12 @@ _sk_load_565_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2c90 <_sk_load_565_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 2de8 <_sk_load_565_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2c70 <_sk_load_565_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 2dc8 <_sk_load_565_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffba1 // b.ne 2bd4 <_sk_load_565_aarch64+0x24> // b.any
+ .long 0x54fffba1 // b.ne 2d2c <_sk_load_565_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
@@ -3281,10 +3372,10 @@ _sk_load_565_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffd2 // b 2bd4 <_sk_load_565_aarch64+0x24>
+ .long 0x17ffffd2 // b 2d2c <_sk_load_565_aarch64+0x24>
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffcf // b 2bd4 <_sk_load_565_aarch64+0x24>
+ .long 0x17ffffcf // b 2d2c <_sk_load_565_aarch64+0x24>
HIDDEN _sk_load_565_dst_aarch64
.globl _sk_load_565_dst_aarch64
@@ -3297,7 +3388,7 @@ _sk_load_565_dst_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50003c4 // cbnz x4, 2d30 <_sk_load_565_dst_aarch64+0x94>
+ .long 0xb50003c4 // cbnz x4, 2e88 <_sk_load_565_dst_aarch64+0x94>
.long 0xfd400104 // ldr d4, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d06 // dup v6.4s, w8
@@ -3329,12 +3420,12 @@ _sk_load_565_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2d7c <_sk_load_565_dst_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 2ed4 <_sk_load_565_dst_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 2d5c <_sk_load_565_dst_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 2eb4 <_sk_load_565_dst_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffba1 // b.ne 2cc0 <_sk_load_565_dst_aarch64+0x24> // b.any
+ .long 0x54fffba1 // b.ne 2e18 <_sk_load_565_dst_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d405124 // ld1 {v4.h}[2], [x9]
@@ -3345,10 +3436,10 @@ _sk_load_565_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffd2 // b 2cc0 <_sk_load_565_dst_aarch64+0x24>
+ .long 0x17ffffd2 // b 2e18 <_sk_load_565_dst_aarch64+0x24>
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d404104 // ld1 {v4.h}[0], [x8]
- .long 0x17ffffcf // b 2cc0 <_sk_load_565_dst_aarch64+0x24>
+ .long 0x17ffffcf // b 2e18 <_sk_load_565_dst_aarch64+0x24>
HIDDEN _sk_gather_565_aarch64
.globl _sk_gather_565_aarch64
@@ -3424,24 +3515,24 @@ _sk_store_565_aarch64:
.long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b
.long 0x8b897d08 // add x8, x8, x9, asr #31
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 2ea0 <_sk_store_565_aarch64+0x68>
+ .long 0xb50000a4 // cbnz x4, 2ff8 <_sk_store_565_aarch64+0x68>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 2ecc <_sk_store_565_aarch64+0x94> // b.none
+ .long 0x54000120 // b.eq 3024 <_sk_store_565_aarch64+0x94> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2ec4 <_sk_store_565_aarch64+0x8c> // b.none
+ .long 0x540000a0 // b.eq 301c <_sk_store_565_aarch64+0x8c> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 2e94 <_sk_store_565_aarch64+0x5c> // b.any
+ .long 0x54fffee1 // b.ne 2fec <_sk_store_565_aarch64+0x5c> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 2e94 <_sk_store_565_aarch64+0x5c>
+ .long 0x17fffff1 // b 2fec <_sk_store_565_aarch64+0x5c>
HIDDEN _sk_load_4444_aarch64
.globl _sk_load_4444_aarch64
@@ -3454,7 +3545,7 @@ _sk_load_4444_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000444 // cbnz x4, 2f78 <_sk_load_4444_aarch64+0xa4>
+ .long 0xb5000444 // cbnz x4, 30d0 <_sk_load_4444_aarch64+0xa4>
.long 0xfd400100 // ldr d0, [x8]
.long 0x52a6f108 // mov w8, #0x37880000
.long 0x2f10a400 // uxtl v0.4s, v0.4h
@@ -3490,12 +3581,12 @@ _sk_load_4444_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2fc4 <_sk_load_4444_aarch64+0xf0> // b.none
+ .long 0x54000220 // b.eq 311c <_sk_load_4444_aarch64+0xf0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2fa4 <_sk_load_4444_aarch64+0xd0> // b.none
+ .long 0x540000c0 // b.eq 30fc <_sk_load_4444_aarch64+0xd0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffb21 // b.ne 2ef8 <_sk_load_4444_aarch64+0x24> // b.any
+ .long 0x54fffb21 // b.ne 3050 <_sk_load_4444_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
@@ -3506,10 +3597,10 @@ _sk_load_4444_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffce // b 2ef8 <_sk_load_4444_aarch64+0x24>
+ .long 0x17ffffce // b 3050 <_sk_load_4444_aarch64+0x24>
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffcb // b 2ef8 <_sk_load_4444_aarch64+0x24>
+ .long 0x17ffffcb // b 3050 <_sk_load_4444_aarch64+0x24>
HIDDEN _sk_load_4444_dst_aarch64
.globl _sk_load_4444_dst_aarch64
@@ -3522,7 +3613,7 @@ _sk_load_4444_dst_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000444 // cbnz x4, 3074 <_sk_load_4444_dst_aarch64+0xa4>
+ .long 0xb5000444 // cbnz x4, 31cc <_sk_load_4444_dst_aarch64+0xa4>
.long 0xfd400104 // ldr d4, [x8]
.long 0x52a6f108 // mov w8, #0x37880000
.long 0x2f10a484 // uxtl v4.4s, v4.4h
@@ -3558,12 +3649,12 @@ _sk_load_4444_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 30c0 <_sk_load_4444_dst_aarch64+0xf0> // b.none
+ .long 0x54000220 // b.eq 3218 <_sk_load_4444_dst_aarch64+0xf0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 30a0 <_sk_load_4444_dst_aarch64+0xd0> // b.none
+ .long 0x540000c0 // b.eq 31f8 <_sk_load_4444_dst_aarch64+0xd0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffb21 // b.ne 2ff4 <_sk_load_4444_dst_aarch64+0x24> // b.any
+ .long 0x54fffb21 // b.ne 314c <_sk_load_4444_dst_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d405124 // ld1 {v4.h}[2], [x9]
@@ -3574,10 +3665,10 @@ _sk_load_4444_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffce // b 2ff4 <_sk_load_4444_dst_aarch64+0x24>
+ .long 0x17ffffce // b 314c <_sk_load_4444_dst_aarch64+0x24>
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d404104 // ld1 {v4.h}[0], [x8]
- .long 0x17ffffcb // b 2ff4 <_sk_load_4444_dst_aarch64+0x24>
+ .long 0x17ffffcb // b 314c <_sk_load_4444_dst_aarch64+0x24>
HIDDEN _sk_gather_4444_aarch64
.globl _sk_gather_4444_aarch64
@@ -3660,24 +3751,24 @@ _sk_store_4444_aarch64:
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
.long 0x8b897d08 // add x8, x8, x9, asr #31
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 3200 <_sk_store_4444_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 3358 <_sk_store_4444_aarch64+0x70>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 322c <_sk_store_4444_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 3384 <_sk_store_4444_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 3224 <_sk_store_4444_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 337c <_sk_store_4444_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 31f4 <_sk_store_4444_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 334c <_sk_store_4444_aarch64+0x64> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 31f4 <_sk_store_4444_aarch64+0x64>
+ .long 0x17fffff1 // b 334c <_sk_store_4444_aarch64+0x64>
HIDDEN _sk_load_8888_aarch64
.globl _sk_load_8888_aarch64
@@ -3690,7 +3781,7 @@ _sk_load_8888_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 32ac <_sk_load_8888_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 3404 <_sk_load_8888_aarch64+0x78>
.long 0x3dc00100 // ldr q0, [x8]
.long 0x6f00e621 // movi v1.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3715,22 +3806,22 @@ _sk_load_8888_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 32e8 <_sk_load_8888_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 3440 <_sk_load_8888_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e400 // movi v0.2d, #0x0
- .long 0x540000c0 // b.eq 32d8 <_sk_load_8888_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 3430 <_sk_load_8888_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 3258 <_sk_load_8888_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 33b0 <_sk_load_8888_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x4d408120 // ld1 {v0.s}[2], [x9]
.long 0xfd400101 // ldr d1, [x8]
.long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8
.long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8
- .long 0x17ffffdd // b 3258 <_sk_load_8888_aarch64+0x24>
+ .long 0x17ffffdd // b 33b0 <_sk_load_8888_aarch64+0x24>
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x0d408100 // ld1 {v0.s}[0], [x8]
- .long 0x17ffffda // b 3258 <_sk_load_8888_aarch64+0x24>
+ .long 0x17ffffda // b 33b0 <_sk_load_8888_aarch64+0x24>
HIDDEN _sk_load_8888_dst_aarch64
.globl _sk_load_8888_dst_aarch64
@@ -3743,7 +3834,7 @@ _sk_load_8888_dst_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 336c <_sk_load_8888_dst_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 34c4 <_sk_load_8888_dst_aarch64+0x78>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3768,22 +3859,22 @@ _sk_load_8888_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 33a8 <_sk_load_8888_dst_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 3500 <_sk_load_8888_dst_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 3398 <_sk_load_8888_dst_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 34f0 <_sk_load_8888_dst_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 3318 <_sk_load_8888_dst_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 3470 <_sk_load_8888_dst_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffdd // b 3318 <_sk_load_8888_dst_aarch64+0x24>
+ .long 0x17ffffdd // b 3470 <_sk_load_8888_dst_aarch64+0x24>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffda // b 3318 <_sk_load_8888_dst_aarch64+0x24>
+ .long 0x17ffffda // b 3470 <_sk_load_8888_dst_aarch64+0x24>
HIDDEN _sk_gather_8888_aarch64
.globl _sk_gather_8888_aarch64
@@ -3855,24 +3946,24 @@ _sk_store_8888_aarch64:
.long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b
.long 0x8b897908 // add x8, x8, x9, asr #30
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
- .long 0xb50000a4 // cbnz x4, 34bc <_sk_store_8888_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 3614 <_sk_store_8888_aarch64+0x70>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 34e8 <_sk_store_8888_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 3640 <_sk_store_8888_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 34e0 <_sk_store_8888_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 3638 <_sk_store_8888_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 34b0 <_sk_store_8888_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 3608 <_sk_store_8888_aarch64+0x64> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17fffff3 // b 34b0 <_sk_store_8888_aarch64+0x64>
+ .long 0x17fffff3 // b 3608 <_sk_store_8888_aarch64+0x64>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17fffff1 // b 34b0 <_sk_store_8888_aarch64+0x64>
+ .long 0x17fffff1 // b 3608 <_sk_store_8888_aarch64+0x64>
HIDDEN _sk_load_bgra_aarch64
.globl _sk_load_bgra_aarch64
@@ -3885,7 +3976,7 @@ _sk_load_bgra_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 3568 <_sk_load_bgra_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 36c0 <_sk_load_bgra_aarch64+0x78>
.long 0x3dc00100 // ldr q0, [x8]
.long 0x6f00e621 // movi v1.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3910,22 +4001,22 @@ _sk_load_bgra_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 35a4 <_sk_load_bgra_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 36fc <_sk_load_bgra_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e400 // movi v0.2d, #0x0
- .long 0x540000c0 // b.eq 3594 <_sk_load_bgra_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 36ec <_sk_load_bgra_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 3514 <_sk_load_bgra_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 366c <_sk_load_bgra_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x4d408120 // ld1 {v0.s}[2], [x9]
.long 0xfd400101 // ldr d1, [x8]
.long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8
.long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8
- .long 0x17ffffdd // b 3514 <_sk_load_bgra_aarch64+0x24>
+ .long 0x17ffffdd // b 366c <_sk_load_bgra_aarch64+0x24>
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x0d408100 // ld1 {v0.s}[0], [x8]
- .long 0x17ffffda // b 3514 <_sk_load_bgra_aarch64+0x24>
+ .long 0x17ffffda // b 366c <_sk_load_bgra_aarch64+0x24>
HIDDEN _sk_load_bgra_dst_aarch64
.globl _sk_load_bgra_dst_aarch64
@@ -3938,7 +4029,7 @@ _sk_load_bgra_dst_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 3628 <_sk_load_bgra_dst_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 3780 <_sk_load_bgra_dst_aarch64+0x78>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3963,22 +4054,22 @@ _sk_load_bgra_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 3664 <_sk_load_bgra_dst_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 37bc <_sk_load_bgra_dst_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 3654 <_sk_load_bgra_dst_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 37ac <_sk_load_bgra_dst_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 35d4 <_sk_load_bgra_dst_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 372c <_sk_load_bgra_dst_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffdd // b 35d4 <_sk_load_bgra_dst_aarch64+0x24>
+ .long 0x17ffffdd // b 372c <_sk_load_bgra_dst_aarch64+0x24>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffda // b 35d4 <_sk_load_bgra_dst_aarch64+0x24>
+ .long 0x17ffffda // b 372c <_sk_load_bgra_dst_aarch64+0x24>
HIDDEN _sk_gather_bgra_aarch64
.globl _sk_gather_bgra_aarch64
@@ -4050,24 +4141,24 @@ _sk_store_bgra_aarch64:
.long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b
.long 0x8b897908 // add x8, x8, x9, asr #30
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
- .long 0xb50000a4 // cbnz x4, 3778 <_sk_store_bgra_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 38d0 <_sk_store_bgra_aarch64+0x70>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 37a4 <_sk_store_bgra_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 38fc <_sk_store_bgra_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 379c <_sk_store_bgra_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 38f4 <_sk_store_bgra_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 376c <_sk_store_bgra_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 38c4 <_sk_store_bgra_aarch64+0x64> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17fffff3 // b 376c <_sk_store_bgra_aarch64+0x64>
+ .long 0x17fffff3 // b 38c4 <_sk_store_bgra_aarch64+0x64>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17fffff1 // b 376c <_sk_store_bgra_aarch64+0x64>
+ .long 0x17fffff1 // b 38c4 <_sk_store_bgra_aarch64+0x64>
HIDDEN _sk_load_f16_aarch64
.globl _sk_load_f16_aarch64
@@ -4080,7 +4171,7 @@ _sk_load_f16_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb5000124 // cbnz x4, 37ec <_sk_load_f16_aarch64+0x40>
+ .long 0xb5000124 // cbnz x4, 3944 <_sk_load_f16_aarch64+0x40>
.long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x0e217a00 // fcvtl v0.4s, v16.4h
@@ -4091,14 +4182,14 @@ _sk_load_f16_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffee0 // b.eq 37d0 <_sk_load_f16_aarch64+0x24> // b.none
+ .long 0x54fffee0 // b.eq 3928 <_sk_load_f16_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffe63 // b.cc 37d0 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffe63 // b.cc 3928 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff0 // b 37d0 <_sk_load_f16_aarch64+0x24>
+ .long 0x17fffff0 // b 3928 <_sk_load_f16_aarch64+0x24>
HIDDEN _sk_load_f16_dst_aarch64
.globl _sk_load_f16_dst_aarch64
@@ -4111,7 +4202,7 @@ _sk_load_f16_dst_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb5000124 // cbnz x4, 3854 <_sk_load_f16_dst_aarch64+0x40>
+ .long 0xb5000124 // cbnz x4, 39ac <_sk_load_f16_dst_aarch64+0x40>
.long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x0e217a04 // fcvtl v4.4s, v16.4h
@@ -4122,14 +4213,14 @@ _sk_load_f16_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffee0 // b.eq 3838 <_sk_load_f16_dst_aarch64+0x24> // b.none
+ .long 0x54fffee0 // b.eq 3990 <_sk_load_f16_dst_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffe63 // b.cc 3838 <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffe63 // b.cc 3990 <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff0 // b 3838 <_sk_load_f16_dst_aarch64+0x24>
+ .long 0x17fffff0 // b 3990 <_sk_load_f16_dst_aarch64+0x24>
HIDDEN _sk_gather_f16_aarch64
.globl _sk_gather_f16_aarch64
@@ -4187,21 +4278,21 @@ _sk_store_f16_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb50000a4 // cbnz x4, 394c <_sk_store_f16_aarch64+0x40>
+ .long 0xb50000a4 // cbnz x4, 3aa4 <_sk_store_f16_aarch64+0x40>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3940 <_sk_store_f16_aarch64+0x34> // b.none
+ .long 0x54ffff60 // b.eq 3a98 <_sk_store_f16_aarch64+0x34> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3940 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3a98 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3940 <_sk_store_f16_aarch64+0x34>
+ .long 0x17fffff4 // b 3a98 <_sk_store_f16_aarch64+0x34>
HIDDEN _sk_load_u16_be_aarch64
.globl _sk_load_u16_be_aarch64
@@ -4214,7 +4305,7 @@ _sk_load_u16_be_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0x8b2ac508 // add x8, x8, w10, sxtw #1
- .long 0xb5000404 // cbnz x4, 3a10 <_sk_load_u16_be_aarch64+0x9c>
+ .long 0xb5000404 // cbnz x4, 3b68 <_sk_load_u16_be_aarch64+0x9c>
.long 0x0c400500 // ld4 {v0.4h-v3.4h}, [x8]
.long 0x0f185410 // shl v16.4h, v0.4h, #8
.long 0x2f180411 // ushr v17.4h, v0.4h, #8
@@ -4248,14 +4339,14 @@ _sk_load_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606100 // ld4 {v0.h-v3.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc00 // b.eq 3998 <_sk_load_u16_be_aarch64+0x24> // b.none
+ .long 0x54fffc00 // b.eq 3af0 <_sk_load_u16_be_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606920 // ld4 {v0.h-v3.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffb83 // b.cc 3998 <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffb83 // b.cc 3af0 <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607100 // ld4 {v0.h-v3.h}[2], [x8]
- .long 0x17ffffd9 // b 3998 <_sk_load_u16_be_aarch64+0x24>
+ .long 0x17ffffd9 // b 3af0 <_sk_load_u16_be_aarch64+0x24>
HIDDEN _sk_load_rgb_u16_be_aarch64
.globl _sk_load_rgb_u16_be_aarch64
@@ -4269,7 +4360,7 @@ _sk_load_rgb_u16_be_aarch64:
.long 0x0b020449 // add w9, w2, w2, lsl #1
.long 0xd3607d29 // lsl x9, x9, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000384 // cbnz x4, 3ac8 <_sk_load_rgb_u16_be_aarch64+0x90>
+ .long 0xb5000384 // cbnz x4, 3c20 <_sk_load_rgb_u16_be_aarch64+0x90>
.long 0x0c404500 // ld3 {v0.4h-v2.4h}, [x8]
.long 0x0f185403 // shl v3.4h, v0.4h, #8
.long 0x2f180410 // ushr v16.4h, v0.4h, #8
@@ -4299,14 +4390,14 @@ _sk_load_rgb_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d406100 // ld3 {v0.h-v2.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc80 // b.eq 3a60 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none
+ .long 0x54fffc80 // b.eq 3bb8 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none
.long 0x91001909 // add x9, x8, #0x6
.long 0x0d406920 // ld3 {v0.h-v2.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffc03 // b.cc 3a60 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last
+ .long 0x54fffc03 // b.cc 3bb8 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last
.long 0x91003108 // add x8, x8, #0xc
.long 0x0d407100 // ld3 {v0.h-v2.h}[2], [x8]
- .long 0x17ffffdd // b 3a60 <_sk_load_rgb_u16_be_aarch64+0x28>
+ .long 0x17ffffdd // b 3bb8 <_sk_load_rgb_u16_be_aarch64+0x28>
HIDDEN _sk_store_u16_be_aarch64
.globl _sk_store_u16_be_aarch64
@@ -4346,21 +4437,21 @@ _sk_store_u16_be_aarch64:
.long 0x8b28c548 // add x8, x10, w8, sxtw #1
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0x0eb41eb3 // orr v19.8b, v21.8b, v20.8b
- .long 0xb50000a4 // cbnz x4, 3b8c <_sk_store_u16_be_aarch64+0x9c>
+ .long 0xb50000a4 // cbnz x4, 3ce4 <_sk_store_u16_be_aarch64+0x9c>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3b80 <_sk_store_u16_be_aarch64+0x90> // b.none
+ .long 0x54ffff60 // b.eq 3cd8 <_sk_store_u16_be_aarch64+0x90> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3b80 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3cd8 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3b80 <_sk_store_u16_be_aarch64+0x90>
+ .long 0x17fffff4 // b 3cd8 <_sk_store_u16_be_aarch64+0x90>
HIDDEN _sk_load_f32_aarch64
.globl _sk_load_f32_aarch64
@@ -4373,21 +4464,21 @@ _sk_load_f32_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3be4 <_sk_load_f32_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3d3c <_sk_load_f32_aarch64+0x30>
.long 0x4c400900 // ld4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x0d60a100 // ld4 {v0.s-v3.s}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54ffff60 // b.eq 3bd8 <_sk_load_f32_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3d30 <_sk_load_f32_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0x0d60b120 // ld4 {v0.s-v3.s}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffee3 // b.cc 3bd8 <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3d30 <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d60a100 // ld4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 3bd8 <_sk_load_f32_aarch64+0x24>
+ .long 0x17fffff4 // b 3d30 <_sk_load_f32_aarch64+0x24>
HIDDEN _sk_load_f32_dst_aarch64
.globl _sk_load_f32_dst_aarch64
@@ -4400,21 +4491,21 @@ _sk_load_f32_dst_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3c3c <_sk_load_f32_dst_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3d94 <_sk_load_f32_dst_aarch64+0x30>
.long 0x4c400904 // ld4 {v4.4s-v7.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x0d60a104 // ld4 {v4.s-v7.s}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54ffff60 // b.eq 3c30 <_sk_load_f32_dst_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3d88 <_sk_load_f32_dst_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0x0d60b124 // ld4 {v4.s-v7.s}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffee3 // b.cc 3c30 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3d88 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d60a104 // ld4 {v4.s-v7.s}[2], [x8]
- .long 0x17fffff4 // b 3c30 <_sk_load_f32_dst_aarch64+0x24>
+ .long 0x17fffff4 // b 3d88 <_sk_load_f32_dst_aarch64+0x24>
HIDDEN _sk_store_f32_aarch64
.globl _sk_store_f32_aarch64
@@ -4427,21 +4518,21 @@ _sk_store_f32_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3c94 <_sk_store_f32_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3dec <_sk_store_f32_aarch64+0x30>
.long 0x4c000900 // st4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d20a100 // st4 {v0.s-v3.s}[0], [x8]
- .long 0x54ffff60 // b.eq 3c88 <_sk_store_f32_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3de0 <_sk_store_f32_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d20b120 // st4 {v0.s-v3.s}[1], [x9]
- .long 0x54fffee3 // b.cc 3c88 <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3de0 <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d20a100 // st4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 3c88 <_sk_store_f32_aarch64+0x24>
+ .long 0x17fffff4 // b 3de0 <_sk_store_f32_aarch64+0x24>
HIDDEN _sk_clamp_x_aarch64
.globl _sk_clamp_x_aarch64
@@ -4934,7 +5025,7 @@ _sk_gradient_aarch64:
.long 0x6f00e411 // movi v17.2d, #0x0
.long 0xf9400109 // ldr x9, [x8]
.long 0xf100093f // cmp x9, #0x2
- .long 0x540001c3 // b.cc 4314 <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
+ .long 0x540001c3 // b.cc 446c <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
.long 0xf940250a // ldr x10, [x8, #72]
.long 0xd1000529 // sub x9, x9, #0x1
.long 0x6f00e401 // movi v1.2d, #0x0
@@ -4945,7 +5036,7 @@ _sk_gradient_aarch64:
.long 0x6e23e403 // fcmge v3.4s, v0.4s, v3.4s
.long 0x4e221c63 // and v3.16b, v3.16b, v2.16b
.long 0x4ea18461 // add v1.4s, v3.4s, v1.4s
- .long 0xb5ffff69 // cbnz x9, 42f4 <_sk_gradient_aarch64+0x38>
+ .long 0xb5ffff69 // cbnz x9, 444c <_sk_gradient_aarch64+0x38>
.long 0x6f20a431 // uxtl2 v17.2d, v1.4s
.long 0x2f20a421 // uxtl v1.2d, v1.2s
.long 0xa940b10a // ldp x10, x12, [x8, #8]
@@ -9472,6 +9563,187 @@ _sk_parametric_a_vfp4:
.long 0x3fdce9a3 // .word 0x3fdce9a3
.long 0x41ddd2fe // .word 0x41ddd2fe
+HIDDEN _sk_gamma_vfp4
+.globl _sk_gamma_vfp4
+FUNCTION(_sk_gamma_vfp4)
+_sk_gamma_vfp4:
+ .long 0xe92d0030 // push {r4, r5}
+ .long 0xed2d8b10 // vpush {d8-d15}
+ .long 0xe24dd038 // sub sp, sp, #56
+ .long 0xf2c70d5f // vmov.i32 q8, #8388607
+ .long 0xe28d4020 // add r4, sp, #32
+ .long 0xed9fcaa7 // vldr s24, [pc, #668]
+ .long 0xf3fb2644 // vcvt.f32.s32 q9, q2
+ .long 0xec846b04 // vstmia r4, {d6-d7}
+ .long 0xe28f2e22 // add r2, pc, #544
+ .long 0xf2440170 // vand q8, q2, q8
+ .long 0xe28d4010 // add r4, sp, #16
+ .long 0xf2c3075f // vorr.i32 q8, #1056964608
+ .long 0xf422aacf // vld1.64 {d10-d11}, [r2]
+ .long 0xf2c34654 // vmov.i32 q10, #872415232
+ .long 0xe28f2f86 // add r2, pc, #536
+ .long 0xf2006dca // vadd.f32 q3, q8, q5
+ .long 0xf462cacf // vld1.64 {d28-d29}, [r2]
+ .long 0xe28f2f87 // add r2, pc, #540
+ .long 0xf3422df4 // vmul.f32 q9, q9, q10
+ .long 0xf462aacf // vld1.64 {d26-d27}, [r2]
+ .long 0xf3400dfc // vmul.f32 q8, q8, q14
+ .long 0xe5913000 // ldr r3, [r1]
+ .long 0xf2c76d5f // vmov.i32 q11, #8388607
+ .long 0xe5912004 // ldr r2, [r1, #4]
+ .long 0xf280e050 // vmov.i32 q7, #0
+ .long 0xeecc5a27 // vdiv.f32 s11, s24, s15
+ .long 0xe2811008 // add r1, r1, #8
+ .long 0xf4e3ecbf // vld1.32 {d30[]-d31[]}, [r3 :32]
+ .long 0xe28f3c02 // add r3, pc, #512
+ .long 0xf2422dea // vadd.f32 q9, q9, q13
+ .long 0xee8c5a07 // vdiv.f32 s10, s24, s14
+ .long 0xeecc4a26 // vdiv.f32 s9, s24, s13
+ .long 0xee8c4a06 // vdiv.f32 s8, s24, s12
+ .long 0xf2620de0 // vsub.f32 q8, q9, q8
+ .long 0xf4638acf // vld1.64 {d24-d25}, [r3]
+ .long 0xed9f6a8a // vldr s12, [pc, #552]
+ .long 0xeeb07a4c // vmov.f32 s14, s24
+ .long 0xf2600dc4 // vsub.f32 q8, q8, q2
+ .long 0xf2804050 // vmov.i32 q2, #0
+ .long 0xf3402dfe // vmul.f32 q9, q8, q15
+ .long 0xf3fb0762 // vcvt.s32.f32 q8, q9
+ .long 0xf3fb0660 // vcvt.f32.s32 q8, q8
+ .long 0xf3604ee2 // vcgt.f32 q10, q8, q9
+ .long 0xf35841d4 // vbsl q10, q12, q2
+ .long 0xf2600de4 // vsub.f32 q8, q8, q10
+ .long 0xf2620de0 // vsub.f32 q8, q9, q8
+ .long 0xecc40b04 // vstmia r4, {d16-d17}
+ .long 0xe28f3f71 // add r3, pc, #452
+ .long 0xf4634acf // vld1.64 {d20-d21}, [r3]
+ .long 0xf2248de0 // vsub.f32 q4, q10, q8
+ .long 0xf2420176 // vand q8, q1, q11
+ .long 0xf2c3075f // vorr.i32 q8, #1056964608
+ .long 0xf3fb6642 // vcvt.f32.s32 q11, q1
+ .long 0xeec65a29 // vdiv.f32 s11, s12, s19
+ .long 0xee865a09 // vdiv.f32 s10, s12, s18
+ .long 0xec8d8b04 // vstmia sp, {d8-d9}
+ .long 0xf2832654 // vmov.i32 q1, #872415232
+ .long 0xe28f3f6b // add r3, pc, #428
+ .long 0xeec64a28 // vdiv.f32 s9, s12, s17
+ .long 0xf2008dca // vadd.f32 q4, q8, q5
+ .long 0xf3466dd2 // vmul.f32 q11, q11, q1
+ .long 0xf3400dfc // vmul.f32 q8, q8, q14
+ .long 0xeec7da29 // vdiv.f32 s27, s14, s19
+ .long 0xee87da09 // vdiv.f32 s26, s14, s18
+ .long 0xeec7ca28 // vdiv.f32 s25, s14, s17
+ .long 0xee87ca08 // vdiv.f32 s24, s14, s16
+ .long 0xf2466dea // vadd.f32 q11, q11, q13
+ .long 0xf2660de0 // vsub.f32 q8, q11, q8
+ .long 0xf2600dcc // vsub.f32 q8, q8, q6
+ .long 0xf3406dfe // vmul.f32 q11, q8, q15
+ .long 0xf3fb0766 // vcvt.s32.f32 q8, q11
+ .long 0xf3fb0660 // vcvt.f32.s32 q8, q8
+ .long 0xf3202ee6 // vcgt.f32 q1, q8, q11
+ .long 0xf31821de // vbsl q1, q12, q7
+ .long 0xf220e150 // vorr q7, q0, q0
+ .long 0xf2600dc2 // vsub.f32 q8, q8, q1
+ .long 0xf2870d5f // vmov.i32 q0, #8388607
+ .long 0xf20e0150 // vand q0, q7, q0
+ .long 0xf226cde0 // vsub.f32 q6, q11, q8
+ .long 0xf4630acf // vld1.64 {d16-d17}, [r3]
+ .long 0xe28f3e16 // add r3, pc, #352
+ .long 0xf283075f // vorr.i32 q0, #1056964608
+ .long 0xf200ad4a // vadd.f32 q5, q0, q5
+ .long 0xf2248dcc // vsub.f32 q4, q10, q6
+ .long 0xf30ccd70 // vmul.f32 q6, q6, q8
+ .long 0xf340cd7c // vmul.f32 q14, q0, q14
+ .long 0xf3bb064e // vcvt.f32.s32 q0, q7
+ .long 0xeec63a29 // vdiv.f32 s7, s12, s19
+ .long 0xee863a09 // vdiv.f32 s6, s12, s18
+ .long 0xeec62a28 // vdiv.f32 s5, s12, s17
+ .long 0xee862a08 // vdiv.f32 s4, s12, s16
+ .long 0xf4238acf // vld1.64 {d8-d9}, [r3]
+ .long 0xe28d3010 // add r3, sp, #16
+ .long 0xf2466dc8 // vadd.f32 q11, q11, q4
+ .long 0xf2422dc8 // vadd.f32 q9, q9, q4
+ .long 0xf2666dcc // vsub.f32 q11, q11, q6
+ .long 0xeec7da2b // vdiv.f32 s27, s14, s23
+ .long 0xee87da0b // vdiv.f32 s26, s14, s22
+ .long 0xeec7ca2a // vdiv.f32 s25, s14, s21
+ .long 0xee87ca0a // vdiv.f32 s24, s14, s20
+ .long 0xf283a654 // vmov.i32 q5, #872415232
+ .long 0xf3000d5a // vmul.f32 q0, q0, q5
+ .long 0xf240ad6a // vadd.f32 q13, q0, q13
+ .long 0xf2800050 // vmov.i32 q0, #0
+ .long 0xf26aadec // vsub.f32 q13, q13, q14
+ .long 0xf26aadcc // vsub.f32 q13, q13, q6
+ .long 0xf34aadfe // vmul.f32 q13, q13, q15
+ .long 0xf3fbc76a // vcvt.s32.f32 q14, q13
+ .long 0xf3fbc66c // vcvt.f32.s32 q14, q14
+ .long 0xf36ceeea // vcgt.f32 q15, q14, q13
+ .long 0xf358e1d0 // vbsl q15, q12, q0
+ .long 0xf26c8dee // vsub.f32 q12, q14, q15
+ .long 0xf26a8de8 // vsub.f32 q12, q13, q12
+ .long 0xf2240de8 // vsub.f32 q0, q10, q12
+ .long 0xf3484df0 // vmul.f32 q10, q12, q8
+ .long 0xf24a8dc8 // vadd.f32 q12, q13, q4
+ .long 0xf2c3a65f // vmov.i32 q13, #1056964608
+ .long 0xeec6da21 // vdiv.f32 s27, s12, s3
+ .long 0xee86da01 // vdiv.f32 s26, s12, s2
+ .long 0xeec6ca20 // vdiv.f32 s25, s12, s1
+ .long 0xee86ca00 // vdiv.f32 s24, s12, s0
+ .long 0xec9d0b04 // vldmia sp, {d0-d1}
+ .long 0xf2684de4 // vsub.f32 q10, q12, q10
+ .long 0xee864a00 // vdiv.f32 s8, s12, s0
+ .long 0xecd38b04 // vldmia r3, {d24-d25}
+ .long 0xe28d3020 // add r3, sp, #32
+ .long 0xf3480df0 // vmul.f32 q8, q12, q8
+ .long 0xec936b04 // vldmia r3, {d6-d7}
+ .long 0xf2c3865f // vmov.i32 q12, #1056964608
+ .long 0xf2620de0 // vsub.f32 q8, q9, q8
+ .long 0xf2442dcc // vadd.f32 q9, q10, q6
+ .long 0xf2464dc2 // vadd.f32 q10, q11, q1
+ .long 0xf2400dc4 // vadd.f32 q8, q8, q2
+ .long 0xf2c4665b // vmov.i32 q11, #1258291200
+ .long 0xf242acf6 // vfma.f32 q13, q9, q11
+ .long 0xf2c3265f // vmov.i32 q9, #1056964608
+ .long 0xf2442cf6 // vfma.f32 q9, q10, q11
+ .long 0xf2408cf6 // vfma.f32 q12, q8, q11
+ .long 0xf3bb07ea // vcvt.u32.f32 q0, q13
+ .long 0xf3bb27e2 // vcvt.u32.f32 q1, q9
+ .long 0xf3bb47e8 // vcvt.u32.f32 q2, q12
+ .long 0xe28dd038 // add sp, sp, #56
+ .long 0xecbd8b10 // vpop {d8-d15}
+ .long 0xe8bd0030 // pop {r4, r5}
+ .long 0xe12fff12 // bx r2
+ .long 0xe320f000 // nop {0}
+ .long 0x3eb444f9 // .word 0x3eb444f9
+ .long 0x3eb444f9 // .word 0x3eb444f9
+ .long 0x3eb444f9 // .word 0x3eb444f9
+ .long 0x3eb444f9 // .word 0x3eb444f9
+ .long 0x3fbfbf75 // .word 0x3fbfbf75
+ .long 0x3fbfbf75 // .word 0x3fbfbf75
+ .long 0x3fbfbf75 // .word 0x3fbfbf75
+ .long 0x3fbfbf75 // .word 0x3fbfbf75
+ .long 0xc2f87377 // .word 0xc2f87377
+ .long 0xc2f87377 // .word 0xc2f87377
+ .long 0xc2f87377 // .word 0xc2f87377
+ .long 0xc2f87377 // .word 0xc2f87377
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x409af5f8 // .word 0x409af5f8
+ .long 0x409af5f8 // .word 0x409af5f8
+ .long 0x409af5f8 // .word 0x409af5f8
+ .long 0x409af5f8 // .word 0x409af5f8
+ .long 0x3fbebc8d // .word 0x3fbebc8d
+ .long 0x3fbebc8d // .word 0x3fbebc8d
+ .long 0x3fbebc8d // .word 0x3fbebc8d
+ .long 0x3fbebc8d // .word 0x3fbebc8d
+ .long 0x42f28c51 // .word 0x42f28c51
+ .long 0x42f28c51 // .word 0x42f28c51
+ .long 0x42f28c51 // .word 0x42f28c51
+ .long 0x42f28c51 // .word 0x42f28c51
+ .long 0x3fdce9a3 // .word 0x3fdce9a3
+ .long 0x41ddd2fe // .word 0x41ddd2fe
+
HIDDEN _sk_lab_to_xyz_vfp4
.globl _sk_lab_to_xyz_vfp4
FUNCTION(_sk_lab_to_xyz_vfp4)
@@ -9589,7 +9861,7 @@ _sk_load_a8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000012 // bne 3968 <sk_load_a8_vfp4+0x78>
+ .long 0x1a000012 // bne 3c28 <sk_load_a8_vfp4+0x78>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -9611,12 +9883,12 @@ _sk_load_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 39c0 <sk_load_a8_vfp4+0xd0>
+ .long 0x0a000012 // beq 3c80 <sk_load_a8_vfp4+0xd0>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3998 <sk_load_a8_vfp4+0xa8>
+ .long 0x0a000005 // beq 3c58 <sk_load_a8_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe9 // bne 3930 <sk_load_a8_vfp4+0x40>
+ .long 0x1affffe9 // bne 3bf0 <sk_load_a8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -9630,12 +9902,12 @@ _sk_load_a8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdb // b 3930 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffdb // b 3bf0 <sk_load_a8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd6 // b 3930 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffd6 // b 3bf0 <sk_load_a8_vfp4+0x40>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -9664,7 +9936,7 @@ _sk_load_a8_dst_vfp4:
.long 0xf4430aef // vst1.64 {d16-d17}, [r3 :128]
.long 0xe082300c // add r3, r2, ip
.long 0xe280c040 // add ip, r0, #64
- .long 0x1a000011 // bne 3a7c <sk_load_a8_dst_vfp4+0x94>
+ .long 0x1a000011 // bne 3d3c <sk_load_a8_dst_vfp4+0x94>
.long 0xe5932000 // ldr r2, [r3]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -9685,12 +9957,12 @@ _sk_load_a8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe20e2003 // and r2, lr, #3
.long 0xe3520001 // cmp r2, #1
- .long 0x0a000012 // beq 3ad4 <sk_load_a8_dst_vfp4+0xec>
+ .long 0x0a000012 // beq 3d94 <sk_load_a8_dst_vfp4+0xec>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3520002 // cmp r2, #2
- .long 0x0a000005 // beq 3aac <sk_load_a8_dst_vfp4+0xc4>
+ .long 0x0a000005 // beq 3d6c <sk_load_a8_dst_vfp4+0xc4>
.long 0xe3520003 // cmp r2, #3
- .long 0x1affffea // bne 3a48 <sk_load_a8_dst_vfp4+0x60>
+ .long 0x1affffea // bne 3d08 <sk_load_a8_dst_vfp4+0x60>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d32002 // ldrb r2, [r3, #2]
.long 0xee805bb0 // vdup.16 d16, r5
@@ -9704,12 +9976,12 @@ _sk_load_a8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdc // b 3a48 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffdc // b 3d08 <sk_load_a8_dst_vfp4+0x60>
.long 0xe5d32000 // ldrb r2, [r3]
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd7 // b 3a48 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffd7 // b 3d08 <sk_load_a8_dst_vfp4+0x60>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -9775,7 +10047,7 @@ _sk_store_a8_vfp4:
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000005 // bne 3be0 <sk_store_a8_vfp4+0x58>
+ .long 0x1a000005 // bne 3ea0 <sk_store_a8_vfp4+0x58>
.long 0xf3f20121 // vuzp.8 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -9784,21 +10056,21 @@ _sk_store_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000a // beq 3c18 <sk_store_a8_vfp4+0x90>
+ .long 0x0a00000a // beq 3ed8 <sk_store_a8_vfp4+0x90>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 3c04 <sk_store_a8_vfp4+0x7c>
+ .long 0x0a000003 // beq 3ec4 <sk_store_a8_vfp4+0x7c>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 3bd0 <sk_store_a8_vfp4+0x48>
+ .long 0x1afffff4 // bne 3e90 <sk_store_a8_vfp4+0x48>
.long 0xeeb03bb0 // vmov.u16 r3, d16[2]
.long 0xe5c23002 // strb r3, [r2, #2]
.long 0xee903bf0 // vmov.u16 r3, d16[1]
.long 0xee904bb0 // vmov.u16 r4, d16[0]
.long 0xe5c23001 // strb r3, [r2, #1]
.long 0xe5c24000 // strb r4, [r2]
- .long 0xeaffffed // b 3bd0 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffed // b 3e90 <sk_store_a8_vfp4+0x48>
.long 0xee903bb0 // vmov.u16 r3, d16[0]
.long 0xe5c23000 // strb r3, [r2]
- .long 0xeaffffea // b 3bd0 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffea // b 3e90 <sk_store_a8_vfp4+0x48>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -9819,7 +10091,7 @@ _sk_load_g8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000013 // bne 3cb4 <sk_load_g8_vfp4+0x7c>
+ .long 0x1a000013 // bne 3f74 <sk_load_g8_vfp4+0x7c>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -9842,12 +10114,12 @@ _sk_load_g8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 3d0c <sk_load_g8_vfp4+0xd4>
+ .long 0x0a000012 // beq 3fcc <sk_load_g8_vfp4+0xd4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3ce4 <sk_load_g8_vfp4+0xac>
+ .long 0x0a000005 // beq 3fa4 <sk_load_g8_vfp4+0xac>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe8 // bne 3c78 <sk_load_g8_vfp4+0x40>
+ .long 0x1affffe8 // bne 3f38 <sk_load_g8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -9861,12 +10133,12 @@ _sk_load_g8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffda // b 3c78 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffda // b 3f38 <sk_load_g8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd5 // b 3c78 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffd5 // b 3f38 <sk_load_g8_vfp4+0x40>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -9893,7 +10165,7 @@ _sk_load_g8_dst_vfp4:
.long 0xe0824003 // add r4, r2, r3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000015 // bne 3dd0 <sk_load_g8_dst_vfp4+0x90>
+ .long 0x1a000015 // bne 4090 <sk_load_g8_dst_vfp4+0x90>
.long 0xe5944000 // ldr r4, [r4]
.long 0xe58d4000 // str r4, [sp]
.long 0xe1a0400d // mov r4, sp
@@ -9918,12 +10190,12 @@ _sk_load_g8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000012 // beq 3e28 <sk_load_g8_dst_vfp4+0xe8>
+ .long 0x0a000012 // beq 40e8 <sk_load_g8_dst_vfp4+0xe8>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 3e00 <sk_load_g8_dst_vfp4+0xc0>
+ .long 0x0a000005 // beq 40c0 <sk_load_g8_dst_vfp4+0xc0>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffe6 // bne 3d8c <sk_load_g8_dst_vfp4+0x4c>
+ .long 0x1affffe6 // bne 404c <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a06000 // mov r6, #0
.long 0xe5d45002 // ldrb r5, [r4, #2]
.long 0xee806bb0 // vdup.16 d16, r6
@@ -9937,12 +10209,12 @@ _sk_load_g8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffd8 // b 3d8c <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd8 // b 404c <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d44000 // ldrb r4, [r4]
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xee004bb0 // vmov.16 d16[0], r4
- .long 0xeaffffd3 // b 3d8c <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd3 // b 404c <sk_load_g8_dst_vfp4+0x4c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10009,7 +10281,7 @@ _sk_load_565_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001b // bne 3f90 <sk_load_565_vfp4+0xa0>
+ .long 0x1a00001b // bne 4250 <sk_load_565_vfp4+0xa0>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a02e7e // mov r2, #2016
@@ -10040,12 +10312,12 @@ _sk_load_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 3fe4 <sk_load_565_vfp4+0xf4>
+ .long 0x0a000011 // beq 42a4 <sk_load_565_vfp4+0xf4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3fc0 <sk_load_565_vfp4+0xd0>
+ .long 0x0a000005 // beq 4280 <sk_load_565_vfp4+0xd0>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffdc // bne 3f24 <sk_load_565_vfp4+0x34>
+ .long 0x1affffdc // bne 41e4 <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -10058,11 +10330,11 @@ _sk_load_565_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcf // b 3f24 <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcf // b 41e4 <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffcb // b 3f24 <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcb // b 41e4 <sk_load_565_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -10099,7 +10371,7 @@ _sk_load_565_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001f // bne 40f4 <sk_load_565_dst_vfp4+0xbc>
+ .long 0x1a00001f // bne 43b4 <sk_load_565_dst_vfp4+0xbc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a04e7e // mov r4, #2016
@@ -10134,12 +10406,12 @@ _sk_load_565_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 4148 <sk_load_565_dst_vfp4+0x110>
+ .long 0x0a000011 // beq 4408 <sk_load_565_dst_vfp4+0x110>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4124 <sk_load_565_dst_vfp4+0xec>
+ .long 0x0a000005 // beq 43e4 <sk_load_565_dst_vfp4+0xec>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd8 // bne 4078 <sk_load_565_dst_vfp4+0x40>
+ .long 0x1affffd8 // bne 4338 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -10152,11 +10424,11 @@ _sk_load_565_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcb // b 4078 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffcb // b 4338 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc7 // b 4078 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 4338 <sk_load_565_dst_vfp4+0x40>
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -10268,7 +10540,7 @@ _sk_store_565_vfp4:
.long 0xf26401f0 // vorr q8, q10, q8
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 4304 <sk_store_565_vfp4+0x84>
+ .long 0x1a000004 // bne 45c4 <sk_store_565_vfp4+0x84>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -10276,11 +10548,11 @@ _sk_store_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4344 <sk_store_565_vfp4+0xc4>
+ .long 0x0a00000c // beq 4604 <sk_store_565_vfp4+0xc4>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4328 <sk_store_565_vfp4+0xa8>
+ .long 0x0a000003 // beq 45e8 <sk_store_565_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 42f4 <sk_store_565_vfp4+0x74>
+ .long 0x1afffff4 // bne 45b4 <sk_store_565_vfp4+0x74>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -10289,9 +10561,9 @@ _sk_store_565_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 42f4 <sk_store_565_vfp4+0x74>
+ .long 0xeaffffeb // b 45b4 <sk_store_565_vfp4+0x74>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 42f4 <sk_store_565_vfp4+0x74>
+ .long 0xeaffffe9 // b 45b4 <sk_store_565_vfp4+0x74>
.long 0xe320f000 // nop {0}
.long 0x427c0000 // .word 0x427c0000
.long 0x427c0000 // .word 0x427c0000
@@ -10313,7 +10585,7 @@ _sk_load_4444_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001e // bne 440c <sk_load_4444_vfp4+0xac>
+ .long 0x1a00001e // bne 46cc <sk_load_4444_vfp4+0xac>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f20d0 // add r2, pc, #208
@@ -10347,12 +10619,12 @@ _sk_load_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 4460 <sk_load_4444_vfp4+0x100>
+ .long 0x0a000011 // beq 4720 <sk_load_4444_vfp4+0x100>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 443c <sk_load_4444_vfp4+0xdc>
+ .long 0x0a000005 // beq 46fc <sk_load_4444_vfp4+0xdc>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffd9 // bne 4394 <sk_load_4444_vfp4+0x34>
+ .long 0x1affffd9 // bne 4654 <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -10365,11 +10637,11 @@ _sk_load_4444_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcc // b 4394 <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffcc // b 4654 <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffc8 // b 4394 <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffc8 // b 4654 <sk_load_4444_vfp4+0x34>
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
@@ -10405,7 +10677,7 @@ _sk_load_4444_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000023 // bne 457c <sk_load_4444_dst_vfp4+0xcc>
+ .long 0x1a000023 // bne 483c <sk_load_4444_dst_vfp4+0xcc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f40e4 // add r4, pc, #228
@@ -10444,12 +10716,12 @@ _sk_load_4444_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 45d0 <sk_load_4444_dst_vfp4+0x120>
+ .long 0x0a000011 // beq 4890 <sk_load_4444_dst_vfp4+0x120>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 45ac <sk_load_4444_dst_vfp4+0xfc>
+ .long 0x0a000005 // beq 486c <sk_load_4444_dst_vfp4+0xfc>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd4 // bne 44f0 <sk_load_4444_dst_vfp4+0x40>
+ .long 0x1affffd4 // bne 47b0 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -10462,11 +10734,11 @@ _sk_load_4444_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffc7 // b 44f0 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 47b0 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc3 // b 44f0 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc3 // b 47b0 <sk_load_4444_dst_vfp4+0x40>
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
@@ -10589,7 +10861,7 @@ _sk_store_4444_vfp4:
.long 0xf26001f6 // vorr q8, q8, q11
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 47b8 <sk_store_4444_vfp4+0x90>
+ .long 0x1a000004 // bne 4a78 <sk_store_4444_vfp4+0x90>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -10597,11 +10869,11 @@ _sk_store_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 47f8 <sk_store_4444_vfp4+0xd0>
+ .long 0x0a00000c // beq 4ab8 <sk_store_4444_vfp4+0xd0>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 47dc <sk_store_4444_vfp4+0xb4>
+ .long 0x0a000003 // beq 4a9c <sk_store_4444_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 47a8 <sk_store_4444_vfp4+0x80>
+ .long 0x1afffff4 // bne 4a68 <sk_store_4444_vfp4+0x80>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -10610,9 +10882,9 @@ _sk_store_4444_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 47a8 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffeb // b 4a68 <sk_store_4444_vfp4+0x80>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 47a8 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffe9 // b 4a68 <sk_store_4444_vfp4+0x80>
HIDDEN _sk_load_8888_vfp4
.globl _sk_load_8888_vfp4
@@ -10628,7 +10900,7 @@ _sk_load_8888_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 4884 <sk_load_8888_vfp4+0x84>
+ .long 0x1a000015 // bne 4b44 <sk_load_8888_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -10653,12 +10925,12 @@ _sk_load_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 48c4 <sk_load_8888_vfp4+0xc4>
+ .long 0x0a00000c // beq 4b84 <sk_load_8888_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 48b4 <sk_load_8888_vfp4+0xb4>
+ .long 0x0a000005 // beq 4b74 <sk_load_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4830 <sk_load_8888_vfp4+0x30>
+ .long 0x1affffe2 // bne 4af0 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -10666,11 +10938,11 @@ _sk_load_8888_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4830 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffda // b 4af0 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4830 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffd6 // b 4af0 <sk_load_8888_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10694,7 +10966,7 @@ _sk_load_8888_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 498c <sk_load_8888_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 4c4c <sk_load_8888_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -10724,12 +10996,12 @@ _sk_load_8888_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 49cc <sk_load_8888_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 4c8c <sk_load_8888_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 49bc <sk_load_8888_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 4c7c <sk_load_8888_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 4924 <sk_load_8888_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 4be4 <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -10737,11 +11009,11 @@ _sk_load_8888_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 4924 <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 4be4 <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 4924 <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 4be4 <sk_load_8888_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10831,7 +11103,7 @@ _sk_store_8888_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 4b30 <sk_store_8888_vfp4+0x90>
+ .long 0x1a000004 // bne 4df0 <sk_store_8888_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -10839,17 +11111,17 @@ _sk_store_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 4b5c <sk_store_8888_vfp4+0xbc>
+ .long 0x0a000007 // beq 4e1c <sk_store_8888_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4b54 <sk_store_8888_vfp4+0xb4>
+ .long 0x0a000003 // beq 4e14 <sk_store_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4b20 <sk_store_8888_vfp4+0x80>
+ .long 0x1afffff4 // bne 4de0 <sk_store_8888_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 4b20 <sk_store_8888_vfp4+0x80>
+ .long 0xeafffff0 // b 4de0 <sk_store_8888_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 4b20 <sk_store_8888_vfp4+0x80>
+ .long 0xeaffffee // b 4de0 <sk_store_8888_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -10870,7 +11142,7 @@ _sk_load_bgra_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 4bfc <sk_load_bgra_vfp4+0x84>
+ .long 0x1a000015 // bne 4ebc <sk_load_bgra_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -10895,12 +11167,12 @@ _sk_load_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4c3c <sk_load_bgra_vfp4+0xc4>
+ .long 0x0a00000c // beq 4efc <sk_load_bgra_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4c2c <sk_load_bgra_vfp4+0xb4>
+ .long 0x0a000005 // beq 4eec <sk_load_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4ba8 <sk_load_bgra_vfp4+0x30>
+ .long 0x1affffe2 // bne 4e68 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -10908,11 +11180,11 @@ _sk_load_bgra_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4ba8 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffda // b 4e68 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4ba8 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffd6 // b 4e68 <sk_load_bgra_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10936,7 +11208,7 @@ _sk_load_bgra_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 4d04 <sk_load_bgra_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 4fc4 <sk_load_bgra_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -10966,12 +11238,12 @@ _sk_load_bgra_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 4d44 <sk_load_bgra_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 5004 <sk_load_bgra_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4d34 <sk_load_bgra_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 4ff4 <sk_load_bgra_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 4c9c <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 4f5c <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -10979,11 +11251,11 @@ _sk_load_bgra_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 4c9c <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 4f5c <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 4c9c <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 4f5c <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -11073,7 +11345,7 @@ _sk_store_bgra_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 4ea8 <sk_store_bgra_vfp4+0x90>
+ .long 0x1a000004 // bne 5168 <sk_store_bgra_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -11081,17 +11353,17 @@ _sk_store_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 4ed4 <sk_store_bgra_vfp4+0xbc>
+ .long 0x0a000007 // beq 5194 <sk_store_bgra_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4ecc <sk_store_bgra_vfp4+0xb4>
+ .long 0x0a000003 // beq 518c <sk_store_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4e98 <sk_store_bgra_vfp4+0x80>
+ .long 0x1afffff4 // bne 5158 <sk_store_bgra_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 4e98 <sk_store_bgra_vfp4+0x80>
+ .long 0xeafffff0 // b 5158 <sk_store_bgra_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 4e98 <sk_store_bgra_vfp4+0x80>
+ .long 0xeaffffee // b 5158 <sk_store_bgra_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -11112,7 +11384,7 @@ _sk_load_f16_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a000008 // bne 4f40 <sk_load_f16_vfp4+0x50>
+ .long 0x1a000008 // bne 5200 <sk_load_f16_vfp4+0x50>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xf3b60720 // vcvt.f32.f16 q0, d16
@@ -11124,14 +11396,14 @@ _sk_load_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff4 // beq 4f20 <sk_load_f16_vfp4+0x30>
+ .long 0x0afffff4 // beq 51e0 <sk_load_f16_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff0 // bcc 4f20 <sk_load_f16_vfp4+0x30>
+ .long 0x3afffff0 // bcc 51e0 <sk_load_f16_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffed // b 4f20 <sk_load_f16_vfp4+0x30>
+ .long 0xeaffffed // b 51e0 <sk_load_f16_vfp4+0x30>
HIDDEN _sk_load_f16_dst_vfp4
.globl _sk_load_f16_dst_vfp4
@@ -11150,7 +11422,7 @@ _sk_load_f16_dst_vfp4:
.long 0xe0825183 // add r5, r2, r3, lsl #3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000d // bne 4fd8 <sk_load_f16_dst_vfp4+0x70>
+ .long 0x1a00000d // bne 5298 <sk_load_f16_dst_vfp4+0x70>
.long 0xf465004f // vld4.16 {d16-d19}, [r5]
.long 0xf3f64720 // vcvt.f32.f16 q10, d16
.long 0xf3f66721 // vcvt.f32.f16 q11, d17
@@ -11167,14 +11439,14 @@ _sk_load_f16_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e5070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r5]
.long 0xe3560001 // cmp r6, #1
- .long 0x0affffef // beq 4fa4 <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x0affffef // beq 5264 <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854008 // add r4, r5, #8
.long 0xe3560003 // cmp r6, #3
.long 0xf4e4074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r4]
- .long 0x3affffeb // bcc 4fa4 <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x3affffeb // bcc 5264 <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854010 // add r4, r5, #16
.long 0xf4e4078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r4]
- .long 0xeaffffe8 // b 4fa4 <sk_load_f16_dst_vfp4+0x3c>
+ .long 0xeaffffe8 // b 5264 <sk_load_f16_dst_vfp4+0x3c>
HIDDEN _sk_gather_f16_vfp4
.globl _sk_gather_f16_vfp4
@@ -11235,7 +11507,7 @@ _sk_store_f16_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082218e // add r2, r2, lr, lsl #3
- .long 0x1a000004 // bne 50e0 <sk_store_f16_vfp4+0x50>
+ .long 0x1a000004 // bne 53a0 <sk_store_f16_vfp4+0x50>
.long 0xf442004f // vst4.16 {d16-d19}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -11243,14 +11515,14 @@ _sk_store_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c2070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r2]
- .long 0x0afffff8 // beq 50d0 <sk_store_f16_vfp4+0x40>
+ .long 0x0afffff8 // beq 5390 <sk_store_f16_vfp4+0x40>
.long 0xe2823008 // add r3, r2, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c3074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r3]
- .long 0x3afffff4 // bcc 50d0 <sk_store_f16_vfp4+0x40>
+ .long 0x3afffff4 // bcc 5390 <sk_store_f16_vfp4+0x40>
.long 0xe2822010 // add r2, r2, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 50d0 <sk_store_f16_vfp4+0x40>
+ .long 0xeafffff1 // b 5390 <sk_store_f16_vfp4+0x40>
HIDDEN _sk_load_u16_be_vfp4
.globl _sk_load_u16_be_vfp4
@@ -11266,7 +11538,7 @@ _sk_load_u16_be_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a00001e // bne 51b0 <sk_load_u16_be_vfp4+0xa8>
+ .long 0x1a00001e // bne 5470 <sk_load_u16_be_vfp4+0xa8>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2094 // add r2, pc, #148
@@ -11300,14 +11572,14 @@ _sk_load_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffde // beq 5138 <sk_load_u16_be_vfp4+0x30>
+ .long 0x0affffde // beq 53f8 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3affffda // bcc 5138 <sk_load_u16_be_vfp4+0x30>
+ .long 0x3affffda // bcc 53f8 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffd7 // b 5138 <sk_load_u16_be_vfp4+0x30>
+ .long 0xeaffffd7 // b 53f8 <sk_load_u16_be_vfp4+0x30>
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -11328,7 +11600,7 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe08e308e // add r3, lr, lr, lsl #1
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe0823083 // add r3, r2, r3, lsl #1
- .long 0x1a00001a // bne 5284 <sk_load_rgb_u16_be_vfp4+0x9c>
+ .long 0x1a00001a // bne 5544 <sk_load_rgb_u16_be_vfp4+0x9c>
.long 0xf463044f // vld3.16 {d16-d18}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2088 // add r2, pc, #136
@@ -11358,14 +11630,14 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3060f // vld3.16 {d16[0],d17[0],d18[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffe2 // beq 521c <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x0affffe2 // beq 54dc <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe2832006 // add r2, r3, #6
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2]
- .long 0x3affffde // bcc 521c <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x3affffde // bcc 54dc <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe283200c // add r2, r3, #12
.long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2]
- .long 0xeaffffdb // b 521c <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0xeaffffdb // b 54dc <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -11420,7 +11692,7 @@ _sk_store_u16_be_vfp4:
.long 0xf2d84534 // vshl.s16 d20, d20, #8
.long 0xf26811b7 // vorr d17, d24, d23
.long 0xf26401b9 // vorr d16, d20, d25
- .long 0x1a000004 // bne 5388 <sk_store_u16_be_vfp4+0xb8>
+ .long 0x1a000004 // bne 5648 <sk_store_u16_be_vfp4+0xb8>
.long 0xf443004f // vst4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -11428,14 +11700,14 @@ _sk_store_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c3070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
- .long 0x0afffff8 // beq 5378 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x0afffff8 // beq 5638 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c2074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff4 // bcc 5378 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x3afffff4 // bcc 5638 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 5378 <sk_store_u16_be_vfp4+0xa8>
+ .long 0xeafffff1 // b 5638 <sk_store_u16_be_vfp4+0xa8>
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
@@ -11455,7 +11727,7 @@ _sk_load_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000009 // bne 5414 <sk_load_f32_vfp4+0x54>
+ .long 0x1a000009 // bne 56d4 <sk_load_f32_vfp4+0x54>
.long 0xf462018d // vld4.32 {d16,d18,d20,d22}, [r2]!
.long 0xf462118f // vld4.32 {d17,d19,d21,d23}, [r2]
.long 0xf22001f0 // vorr q0, q8, q8
@@ -11468,14 +11740,14 @@ _sk_load_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4a20b4f // vld4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff8 // beq 5404 <sk_load_f32_vfp4+0x44>
+ .long 0x0afffff8 // beq 56c4 <sk_load_f32_vfp4+0x44>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4a30bcf // vld4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 5404 <sk_load_f32_vfp4+0x44>
+ .long 0x3afffff4 // bcc 56c4 <sk_load_f32_vfp4+0x44>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4a21b4f // vld4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 5404 <sk_load_f32_vfp4+0x44>
+ .long 0xeafffff1 // b 56c4 <sk_load_f32_vfp4+0x44>
HIDDEN _sk_load_f32_dst_vfp4
.globl _sk_load_f32_dst_vfp4
@@ -11494,7 +11766,7 @@ _sk_load_f32_dst_vfp4:
.long 0xe0824203 // add r4, r2, r3, lsl #4
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000e // bne 54b0 <sk_load_f32_dst_vfp4+0x74>
+ .long 0x1a00000e // bne 5770 <sk_load_f32_dst_vfp4+0x74>
.long 0xf464818d // vld4.32 {d24,d26,d28,d30}, [r4]!
.long 0xf464918f // vld4.32 {d25,d27,d29,d31}, [r4]
.long 0xf26801f8 // vorr q8, q12, q12
@@ -11512,14 +11784,14 @@ _sk_load_f32_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e40b4f // vld4.32 {d16[0],d18[0],d20[0],d22[0]}, [r4]
.long 0xe3560001 // cmp r6, #1
- .long 0x0afffff3 // beq 548c <sk_load_f32_dst_vfp4+0x50>
+ .long 0x0afffff3 // beq 574c <sk_load_f32_dst_vfp4+0x50>
.long 0xe2845010 // add r5, r4, #16
.long 0xe3560003 // cmp r6, #3
.long 0xf4e50bcf // vld4.32 {d16[1],d18[1],d20[1],d22[1]}, [r5]
- .long 0x3affffef // bcc 548c <sk_load_f32_dst_vfp4+0x50>
+ .long 0x3affffef // bcc 574c <sk_load_f32_dst_vfp4+0x50>
.long 0xe2844020 // add r4, r4, #32
.long 0xf4e41b4f // vld4.32 {d17[0],d19[0],d21[0],d23[0]}, [r4]
- .long 0xeaffffec // b 548c <sk_load_f32_dst_vfp4+0x50>
+ .long 0xeaffffec // b 574c <sk_load_f32_dst_vfp4+0x50>
HIDDEN _sk_store_f32_vfp4
.globl _sk_store_f32_vfp4
@@ -11535,7 +11807,7 @@ _sk_store_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000005 // bne 551c <sk_store_f32_vfp4+0x44>
+ .long 0x1a000005 // bne 57dc <sk_store_f32_vfp4+0x44>
.long 0xf402018d // vst4.32 {d0,d2,d4,d6}, [r2]!
.long 0xf402118f // vst4.32 {d1,d3,d5,d7}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -11544,14 +11816,14 @@ _sk_store_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4820b4f // vst4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
- .long 0x0afffff8 // beq 550c <sk_store_f32_vfp4+0x34>
+ .long 0x0afffff8 // beq 57cc <sk_store_f32_vfp4+0x34>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4830bcf // vst4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 550c <sk_store_f32_vfp4+0x34>
+ .long 0x3afffff4 // bcc 57cc <sk_store_f32_vfp4+0x34>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4821b4f // vst4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 550c <sk_store_f32_vfp4+0x34>
+ .long 0xeafffff1 // b 57cc <sk_store_f32_vfp4+0x34>
HIDDEN _sk_clamp_x_vfp4
.globl _sk_clamp_x_vfp4
@@ -12232,7 +12504,7 @@ _sk_gradient_vfp4:
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe5931000 // ldr r1, [r3]
.long 0xe3510002 // cmp r1, #2
- .long 0x3a00000a // bcc 5e84 <sk_gradient_vfp4+0x5c>
+ .long 0x3a00000a // bcc 6144 <sk_gradient_vfp4+0x5c>
.long 0xe5932024 // ldr r2, [r3, #36]
.long 0xf2c04051 // vmov.i32 q10, #1
.long 0xf2c00050 // vmov.i32 q8, #0
@@ -12243,7 +12515,7 @@ _sk_gradient_vfp4:
.long 0xf3468ee8 // vcge.f32 q12, q11, q12
.long 0xf35481f2 // vbsl q12, q10, q9
.long 0xf26808e0 // vadd.i32 q8, q12, q8
- .long 0x1afffff9 // bne 5e6c <sk_gradient_vfp4+0x44>
+ .long 0x1afffff9 // bne 612c <sk_gradient_vfp4+0x44>
.long 0xee315b90 // vmov.32 r5, d17[1]
.long 0xe5937010 // ldr r7, [r3, #16]
.long 0xee112b90 // vmov.32 r2, d17[0]
@@ -13147,7 +13419,7 @@ _sk_seed_shader_hsw:
.byte 197,249,110,194 // vmovd %edx,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,154,88,0,0 // vbroadcastss 0x589a(%rip),%ymm1 # 5964 <_sk_callback_hsw+0x142>
+ .byte 196,226,125,24,13,82,90,0,0 // vbroadcastss 0x5a52(%rip),%ymm1 # 5b1c <_sk_callback_hsw+0x142>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -13155,7 +13427,7 @@ _sk_seed_shader_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,122,88,0,0 // vbroadcastss 0x587a(%rip),%ymm2 # 5968 <_sk_callback_hsw+0x146>
+ .byte 196,226,125,24,21,50,90,0,0 // vbroadcastss 0x5a32(%rip),%ymm2 # 5b20 <_sk_callback_hsw+0x146>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -13174,13 +13446,13 @@ _sk_dither_hsw:
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9
.byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9
- .byte 196,98,125,88,21,65,88,0,0 // vpbroadcastd 0x5841(%rip),%ymm10 # 596c <_sk_callback_hsw+0x14a>
+ .byte 196,98,125,88,21,249,89,0,0 // vpbroadcastd 0x59f9(%rip),%ymm10 # 5b24 <_sk_callback_hsw+0x14a>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,38,88,0,0 // vpbroadcastd 0x5826(%rip),%ymm12 # 5970 <_sk_callback_hsw+0x14e>
- .byte 196,98,125,88,45,33,88,0,0 // vpbroadcastd 0x5821(%rip),%ymm13 # 5974 <_sk_callback_hsw+0x152>
+ .byte 196,98,125,88,37,222,89,0,0 // vpbroadcastd 0x59de(%rip),%ymm12 # 5b28 <_sk_callback_hsw+0x14e>
+ .byte 196,98,125,88,45,217,89,0,0 // vpbroadcastd 0x59d9(%rip),%ymm13 # 5b2c <_sk_callback_hsw+0x152>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -13195,8 +13467,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,211,87,0,0 // vbroadcastss 0x57d3(%rip),%ymm9 # 5978 <_sk_callback_hsw+0x156>
- .byte 196,98,125,24,21,206,87,0,0 // vbroadcastss 0x57ce(%rip),%ymm10 # 597c <_sk_callback_hsw+0x15a>
+ .byte 196,98,125,24,13,139,89,0,0 // vbroadcastss 0x598b(%rip),%ymm9 # 5b30 <_sk_callback_hsw+0x156>
+ .byte 196,98,125,24,21,134,89,0,0 // vbroadcastss 0x5986(%rip),%ymm10 # 5b34 <_sk_callback_hsw+0x15a>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
@@ -13230,7 +13502,7 @@ HIDDEN _sk_black_color_hsw
FUNCTION(_sk_black_color_hsw)
_sk_black_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,110,87,0,0 // vbroadcastss 0x576e(%rip),%ymm3 # 5980 <_sk_callback_hsw+0x15e>
+ .byte 196,226,125,24,29,38,89,0,0 // vbroadcastss 0x5926(%rip),%ymm3 # 5b38 <_sk_callback_hsw+0x15e>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -13241,7 +13513,7 @@ HIDDEN _sk_white_color_hsw
FUNCTION(_sk_white_color_hsw)
_sk_white_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,89,87,0,0 // vbroadcastss 0x5759(%rip),%ymm0 # 5984 <_sk_callback_hsw+0x162>
+ .byte 196,226,125,24,5,17,89,0,0 // vbroadcastss 0x5911(%rip),%ymm0 # 5b3c <_sk_callback_hsw+0x162>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -13287,7 +13559,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,252,86,0,0 // vbroadcastss 0x56fc(%rip),%ymm8 # 5988 <_sk_callback_hsw+0x166>
+ .byte 196,98,125,24,5,180,88,0,0 // vbroadcastss 0x58b4(%rip),%ymm8 # 5b40 <_sk_callback_hsw+0x166>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -13303,7 +13575,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,207,86,0,0 // vbroadcastss 0x56cf(%rip),%ymm8 # 598c <_sk_callback_hsw+0x16a>
+ .byte 196,98,125,24,5,135,88,0,0 // vbroadcastss 0x5887(%rip),%ymm8 # 5b44 <_sk_callback_hsw+0x16a>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -13342,7 +13614,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,118,86,0,0 // vbroadcastss 0x5676(%rip),%ymm8 # 5990 <_sk_callback_hsw+0x16e>
+ .byte 196,98,125,24,5,46,88,0,0 // vbroadcastss 0x582e(%rip),%ymm8 # 5b48 <_sk_callback_hsw+0x16e>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -13355,7 +13627,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,89,86,0,0 // vbroadcastss 0x5659(%rip),%ymm0 # 5994 <_sk_callback_hsw+0x172>
+ .byte 196,226,125,24,5,17,88,0,0 // vbroadcastss 0x5811(%rip),%ymm0 # 5b4c <_sk_callback_hsw+0x172>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -13368,7 +13640,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,60,86,0,0 // vbroadcastss 0x563c(%rip),%ymm8 # 5998 <_sk_callback_hsw+0x176>
+ .byte 196,98,125,24,5,244,87,0,0 // vbroadcastss 0x57f4(%rip),%ymm8 # 5b50 <_sk_callback_hsw+0x176>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -13381,7 +13653,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,27,86,0,0 // vbroadcastss 0x561b(%rip),%ymm8 # 599c <_sk_callback_hsw+0x17a>
+ .byte 196,98,125,24,5,211,87,0,0 // vbroadcastss 0x57d3(%rip),%ymm8 # 5b54 <_sk_callback_hsw+0x17a>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -13405,7 +13677,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,230,85,0,0 // vbroadcastss 0x55e6(%rip),%ymm8 # 59a0 <_sk_callback_hsw+0x17e>
+ .byte 196,98,125,24,5,158,87,0,0 // vbroadcastss 0x579e(%rip),%ymm8 # 5b58 <_sk_callback_hsw+0x17e>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13453,7 +13725,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,97,85,0,0 // vbroadcastss 0x5561(%rip),%ymm8 # 59a4 <_sk_callback_hsw+0x182>
+ .byte 196,98,125,24,5,25,87,0,0 // vbroadcastss 0x5719(%rip),%ymm8 # 5b5c <_sk_callback_hsw+0x182>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13487,7 +13759,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,233,84,0,0 // vbroadcastss 0x54e9(%rip),%ymm8 # 59a8 <_sk_callback_hsw+0x186>
+ .byte 196,98,125,24,5,161,86,0,0 // vbroadcastss 0x56a1(%rip),%ymm8 # 5b60 <_sk_callback_hsw+0x186>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13512,7 +13784,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,152,84,0,0 // vbroadcastss 0x5498(%rip),%ymm8 # 59ac <_sk_callback_hsw+0x18a>
+ .byte 196,98,125,24,5,80,86,0,0 // vbroadcastss 0x5650(%rip),%ymm8 # 5b64 <_sk_callback_hsw+0x18a>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13540,7 +13812,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,59,84,0,0 // vbroadcastss 0x543b(%rip),%ymm8 # 59b0 <_sk_callback_hsw+0x18e>
+ .byte 196,98,125,24,5,243,85,0,0 // vbroadcastss 0x55f3(%rip),%ymm8 # 5b68 <_sk_callback_hsw+0x18e>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13562,7 +13834,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,249,83,0,0 // vbroadcastss 0x53f9(%rip),%ymm8 # 59b4 <_sk_callback_hsw+0x192>
+ .byte 196,98,125,24,5,177,85,0,0 // vbroadcastss 0x55b1(%rip),%ymm8 # 5b6c <_sk_callback_hsw+0x192>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13572,7 +13844,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,231,83,0,0 // vbroadcastss 0x53e7(%rip),%ymm8 # 59b8 <_sk_callback_hsw+0x196>
+ .byte 196,98,125,24,5,159,85,0,0 // vbroadcastss 0x559f(%rip),%ymm8 # 5b70 <_sk_callback_hsw+0x196>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -13630,7 +13902,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,242,82,0,0 // vbroadcastss 0x52f2(%rip),%ymm9 # 59bc <_sk_callback_hsw+0x19a>
+ .byte 196,98,125,24,13,170,84,0,0 // vbroadcastss 0x54aa(%rip),%ymm9 # 5b74 <_sk_callback_hsw+0x19a>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -13683,7 +13955,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,19,82,0,0 // vbroadcastss 0x5213(%rip),%ymm8 # 59c0 <_sk_callback_hsw+0x19e>
+ .byte 196,98,125,24,5,203,83,0,0 // vbroadcastss 0x53cb(%rip),%ymm8 # 5b78 <_sk_callback_hsw+0x19e>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13734,7 +14006,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,75,81,0,0 // vbroadcastss 0x514b(%rip),%ymm8 # 59c4 <_sk_callback_hsw+0x1a2>
+ .byte 196,98,125,24,5,3,83,0,0 // vbroadcastss 0x5303(%rip),%ymm8 # 5b7c <_sk_callback_hsw+0x1a2>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13795,10 +14067,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,86,80,0,0 // vbroadcastss 0x5056(%rip),%ymm11 # 59cc <_sk_callback_hsw+0x1aa>
+ .byte 196,98,125,24,29,14,82,0,0 // vbroadcastss 0x520e(%rip),%ymm11 # 5b84 <_sk_callback_hsw+0x1aa>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,71,80,0,0 // vbroadcastss 0x5047(%rip),%ymm12 # 59d0 <_sk_callback_hsw+0x1ae>
+ .byte 196,98,125,24,37,255,81,0,0 // vbroadcastss 0x51ff(%rip),%ymm12 # 5b88 <_sk_callback_hsw+0x1ae>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -13808,7 +14080,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,10,80,0,0 // vbroadcastss 0x500a(%rip),%ymm8 # 59c8 <_sk_callback_hsw+0x1a6>
+ .byte 196,98,125,24,5,194,81,0,0 // vbroadcastss 0x51c2(%rip),%ymm8 # 5b80 <_sk_callback_hsw+0x1a6>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -13921,11 +14193,11 @@ _sk_hue_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,14,78,0,0 // vbroadcastss 0x4e0e(%rip),%ymm14 # 59d4 <_sk_callback_hsw+0x1b2>
- .byte 196,98,125,24,61,9,78,0,0 // vbroadcastss 0x4e09(%rip),%ymm15 # 59d8 <_sk_callback_hsw+0x1b6>
+ .byte 196,98,125,24,53,198,79,0,0 // vbroadcastss 0x4fc6(%rip),%ymm14 # 5b8c <_sk_callback_hsw+0x1b2>
+ .byte 196,98,125,24,61,193,79,0,0 // vbroadcastss 0x4fc1(%rip),%ymm15 # 5b90 <_sk_callback_hsw+0x1b6>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,250,77,0,0 // vbroadcastss 0x4dfa(%rip),%ymm0 # 59dc <_sk_callback_hsw+0x1ba>
+ .byte 196,226,125,24,5,178,79,0,0 // vbroadcastss 0x4fb2(%rip),%ymm0 # 5b94 <_sk_callback_hsw+0x1ba>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -13980,7 +14252,7 @@ _sk_hue_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,231,76,0,0 // vbroadcastss 0x4ce7(%rip),%ymm1 # 59e0 <_sk_callback_hsw+0x1be>
+ .byte 196,226,125,24,13,159,78,0,0 // vbroadcastss 0x4e9f(%rip),%ymm1 # 5b98 <_sk_callback_hsw+0x1be>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -14034,11 +14306,11 @@ _sk_saturation_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,254,75,0,0 // vbroadcastss 0x4bfe(%rip),%ymm14 # 59e4 <_sk_callback_hsw+0x1c2>
- .byte 196,98,125,24,61,249,75,0,0 // vbroadcastss 0x4bf9(%rip),%ymm15 # 59e8 <_sk_callback_hsw+0x1c6>
+ .byte 196,98,125,24,53,182,77,0,0 // vbroadcastss 0x4db6(%rip),%ymm14 # 5b9c <_sk_callback_hsw+0x1c2>
+ .byte 196,98,125,24,61,177,77,0,0 // vbroadcastss 0x4db1(%rip),%ymm15 # 5ba0 <_sk_callback_hsw+0x1c6>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,234,75,0,0 // vbroadcastss 0x4bea(%rip),%ymm0 # 59ec <_sk_callback_hsw+0x1ca>
+ .byte 196,226,125,24,5,162,77,0,0 // vbroadcastss 0x4da2(%rip),%ymm0 # 5ba4 <_sk_callback_hsw+0x1ca>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -14093,7 +14365,7 @@ _sk_saturation_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,215,74,0,0 // vbroadcastss 0x4ad7(%rip),%ymm1 # 59f0 <_sk_callback_hsw+0x1ce>
+ .byte 196,226,125,24,13,143,76,0,0 // vbroadcastss 0x4c8f(%rip),%ymm1 # 5ba8 <_sk_callback_hsw+0x1ce>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -14121,11 +14393,11 @@ _sk_color_hsw:
.byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
.byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
.byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
- .byte 196,98,125,24,45,112,74,0,0 // vbroadcastss 0x4a70(%rip),%ymm13 # 59f4 <_sk_callback_hsw+0x1d2>
- .byte 196,98,125,24,53,107,74,0,0 // vbroadcastss 0x4a6b(%rip),%ymm14 # 59f8 <_sk_callback_hsw+0x1d6>
+ .byte 196,98,125,24,45,40,76,0,0 // vbroadcastss 0x4c28(%rip),%ymm13 # 5bac <_sk_callback_hsw+0x1d2>
+ .byte 196,98,125,24,53,35,76,0,0 // vbroadcastss 0x4c23(%rip),%ymm14 # 5bb0 <_sk_callback_hsw+0x1d6>
.byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
.byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
- .byte 196,98,125,24,61,92,74,0,0 // vbroadcastss 0x4a5c(%rip),%ymm15 # 59fc <_sk_callback_hsw+0x1da>
+ .byte 196,98,125,24,61,20,76,0,0 // vbroadcastss 0x4c14(%rip),%ymm15 # 5bb4 <_sk_callback_hsw+0x1da>
.byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -14181,7 +14453,7 @@ _sk_color_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,62,73,0,0 // vbroadcastss 0x493e(%rip),%ymm0 # 5a00 <_sk_callback_hsw+0x1de>
+ .byte 196,226,125,24,5,246,74,0,0 // vbroadcastss 0x4af6(%rip),%ymm0 # 5bb8 <_sk_callback_hsw+0x1de>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -14209,11 +14481,11 @@ _sk_luminosity_hsw:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
.byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
- .byte 196,98,125,24,45,215,72,0,0 // vbroadcastss 0x48d7(%rip),%ymm13 # 5a04 <_sk_callback_hsw+0x1e2>
- .byte 196,98,125,24,53,210,72,0,0 // vbroadcastss 0x48d2(%rip),%ymm14 # 5a08 <_sk_callback_hsw+0x1e6>
+ .byte 196,98,125,24,45,143,74,0,0 // vbroadcastss 0x4a8f(%rip),%ymm13 # 5bbc <_sk_callback_hsw+0x1e2>
+ .byte 196,98,125,24,53,138,74,0,0 // vbroadcastss 0x4a8a(%rip),%ymm14 # 5bc0 <_sk_callback_hsw+0x1e6>
.byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
.byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
- .byte 196,98,125,24,61,195,72,0,0 // vbroadcastss 0x48c3(%rip),%ymm15 # 5a0c <_sk_callback_hsw+0x1ea>
+ .byte 196,98,125,24,61,123,74,0,0 // vbroadcastss 0x4a7b(%rip),%ymm15 # 5bc4 <_sk_callback_hsw+0x1ea>
.byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -14269,7 +14541,7 @@ _sk_luminosity_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,165,71,0,0 // vbroadcastss 0x47a5(%rip),%ymm0 # 5a10 <_sk_callback_hsw+0x1ee>
+ .byte 196,226,125,24,5,93,73,0,0 // vbroadcastss 0x495d(%rip),%ymm0 # 5bc8 <_sk_callback_hsw+0x1ee>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -14302,17 +14574,17 @@ _sk_srcover_rgba_8888_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,178,0,0,0 // jne 1386 <_sk_srcover_rgba_8888_hsw+0xd9>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,196,84,37,64,75,0,0 // vandps 0x4b40(%rip),%ymm7,%ymm4 # 5e20 <_sk_callback_hsw+0x5fe>
+ .byte 197,196,84,37,32,77,0,0 // vandps 0x4d20(%rip),%ymm7,%ymm4 # 6000 <_sk_callback_hsw+0x626>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,69,0,45,83,75,0,0 // vpshufb 0x4b53(%rip),%ymm7,%ymm5 # 5e40 <_sk_callback_hsw+0x61e>
+ .byte 196,226,69,0,45,51,77,0,0 // vpshufb 0x4d33(%rip),%ymm7,%ymm5 # 6020 <_sk_callback_hsw+0x646>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,69,0,53,102,75,0,0 // vpshufb 0x4b66(%rip),%ymm7,%ymm6 # 5e60 <_sk_callback_hsw+0x63e>
+ .byte 196,226,69,0,53,70,77,0,0 // vpshufb 0x4d46(%rip),%ymm7,%ymm6 # 6040 <_sk_callback_hsw+0x666>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,4,71,0,0 // vbroadcastss 0x4704(%rip),%ymm8 # 5a14 <_sk_callback_hsw+0x1f2>
+ .byte 196,98,125,24,5,188,72,0,0 // vbroadcastss 0x48bc(%rip),%ymm8 # 5bcc <_sk_callback_hsw+0x1f2>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,251,70,0,0 // vbroadcastss 0x46fb(%rip),%ymm9 # 5a18 <_sk_callback_hsw+0x1f6>
+ .byte 196,98,125,24,13,179,72,0,0 // vbroadcastss 0x48b3(%rip),%ymm9 # 5bd0 <_sk_callback_hsw+0x1f6>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -14372,7 +14644,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,33,70,0,0 // vbroadcastss 0x4621(%rip),%ymm8 # 5a1c <_sk_callback_hsw+0x1fa>
+ .byte 196,98,125,24,5,217,71,0,0 // vbroadcastss 0x47d9(%rip),%ymm8 # 5bd4 <_sk_callback_hsw+0x1fa>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -14384,7 +14656,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,4,70,0,0 // vbroadcastss 0x4604(%rip),%ymm8 # 5a20 <_sk_callback_hsw+0x1fe>
+ .byte 196,98,125,24,5,188,71,0,0 // vbroadcastss 0x47bc(%rip),%ymm8 # 5bd8 <_sk_callback_hsw+0x1fe>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -14396,7 +14668,7 @@ HIDDEN _sk_clamp_a_dst_hsw
.globl _sk_clamp_a_dst_hsw
FUNCTION(_sk_clamp_a_dst_hsw)
_sk_clamp_a_dst_hsw:
- .byte 196,98,125,24,5,234,69,0,0 // vbroadcastss 0x45ea(%rip),%ymm8 # 5a24 <_sk_callback_hsw+0x202>
+ .byte 196,98,125,24,5,162,71,0,0 // vbroadcastss 0x47a2(%rip),%ymm8 # 5bdc <_sk_callback_hsw+0x202>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -14429,7 +14701,7 @@ HIDDEN _sk_invert_hsw
.globl _sk_invert_hsw
FUNCTION(_sk_invert_hsw)
_sk_invert_hsw:
- .byte 196,98,125,24,5,169,69,0,0 // vbroadcastss 0x45a9(%rip),%ymm8 # 5a28 <_sk_callback_hsw+0x206>
+ .byte 196,98,125,24,5,97,71,0,0 // vbroadcastss 0x4761(%rip),%ymm8 # 5be0 <_sk_callback_hsw+0x206>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -14485,7 +14757,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,61,69,0,0 // vbroadcastss 0x453d(%rip),%ymm10 # 5a2c <_sk_callback_hsw+0x20a>
+ .byte 196,98,125,24,21,245,70,0,0 // vbroadcastss 0x46f5(%rip),%ymm10 # 5be4 <_sk_callback_hsw+0x20a>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -14498,16 +14770,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,30,69,0,0 // vbroadcastss 0x451e(%rip),%ymm8 # 5a30 <_sk_callback_hsw+0x20e>
+ .byte 196,98,125,24,5,214,70,0,0 // vbroadcastss 0x46d6(%rip),%ymm8 # 5be8 <_sk_callback_hsw+0x20e>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,16,69,0,0 // vbroadcastss 0x4510(%rip),%ymm11 # 5a34 <_sk_callback_hsw+0x212>
- .byte 196,98,125,24,37,11,69,0,0 // vbroadcastss 0x450b(%rip),%ymm12 # 5a38 <_sk_callback_hsw+0x216>
+ .byte 196,98,125,24,29,200,70,0,0 // vbroadcastss 0x46c8(%rip),%ymm11 # 5bec <_sk_callback_hsw+0x212>
+ .byte 196,98,125,24,37,195,70,0,0 // vbroadcastss 0x46c3(%rip),%ymm12 # 5bf0 <_sk_callback_hsw+0x216>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,252,68,0,0 // vbroadcastss 0x44fc(%rip),%ymm14 # 5a3c <_sk_callback_hsw+0x21a>
+ .byte 196,98,125,24,53,180,70,0,0 // vbroadcastss 0x46b4(%rip),%ymm14 # 5bf4 <_sk_callback_hsw+0x21a>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,242,68,0,0 // vbroadcastss 0x44f2(%rip),%ymm10 # 5a40 <_sk_callback_hsw+0x21e>
+ .byte 196,98,125,24,21,170,70,0,0 // vbroadcastss 0x46aa(%rip),%ymm10 # 5bf8 <_sk_callback_hsw+0x21e>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -14530,16 +14802,16 @@ HIDDEN _sk_from_srgb_dst_hsw
.globl _sk_from_srgb_dst_hsw
FUNCTION(_sk_from_srgb_dst_hsw)
_sk_from_srgb_dst_hsw:
- .byte 196,98,125,24,5,154,68,0,0 // vbroadcastss 0x449a(%rip),%ymm8 # 5a44 <_sk_callback_hsw+0x222>
+ .byte 196,98,125,24,5,82,70,0,0 // vbroadcastss 0x4652(%rip),%ymm8 # 5bfc <_sk_callback_hsw+0x222>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,140,68,0,0 // vbroadcastss 0x448c(%rip),%ymm11 # 5a48 <_sk_callback_hsw+0x226>
- .byte 196,98,125,24,37,135,68,0,0 // vbroadcastss 0x4487(%rip),%ymm12 # 5a4c <_sk_callback_hsw+0x22a>
+ .byte 196,98,125,24,29,68,70,0,0 // vbroadcastss 0x4644(%rip),%ymm11 # 5c00 <_sk_callback_hsw+0x226>
+ .byte 196,98,125,24,37,63,70,0,0 // vbroadcastss 0x463f(%rip),%ymm12 # 5c04 <_sk_callback_hsw+0x22a>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13
- .byte 196,98,125,24,53,120,68,0,0 // vbroadcastss 0x4478(%rip),%ymm14 # 5a50 <_sk_callback_hsw+0x22e>
+ .byte 196,98,125,24,53,48,70,0,0 // vbroadcastss 0x4630(%rip),%ymm14 # 5c08 <_sk_callback_hsw+0x22e>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,110,68,0,0 // vbroadcastss 0x446e(%rip),%ymm10 # 5a54 <_sk_callback_hsw+0x232>
+ .byte 196,98,125,24,21,38,70,0,0 // vbroadcastss 0x4626(%rip),%ymm10 # 5c0c <_sk_callback_hsw+0x232>
.byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4
.byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -14563,19 +14835,19 @@ HIDDEN _sk_to_srgb_hsw
FUNCTION(_sk_to_srgb_hsw)
_sk_to_srgb_hsw:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,18,68,0,0 // vbroadcastss 0x4412(%rip),%ymm8 # 5a58 <_sk_callback_hsw+0x236>
+ .byte 196,98,125,24,5,202,69,0,0 // vbroadcastss 0x45ca(%rip),%ymm8 # 5c10 <_sk_callback_hsw+0x236>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,8,68,0,0 // vbroadcastss 0x4408(%rip),%ymm11 # 5a5c <_sk_callback_hsw+0x23a>
- .byte 196,98,125,24,37,3,68,0,0 // vbroadcastss 0x4403(%rip),%ymm12 # 5a60 <_sk_callback_hsw+0x23e>
+ .byte 196,98,125,24,29,192,69,0,0 // vbroadcastss 0x45c0(%rip),%ymm11 # 5c14 <_sk_callback_hsw+0x23a>
+ .byte 196,98,125,24,37,187,69,0,0 // vbroadcastss 0x45bb(%rip),%ymm12 # 5c18 <_sk_callback_hsw+0x23e>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13
- .byte 196,98,125,24,53,244,67,0,0 // vbroadcastss 0x43f4(%rip),%ymm14 # 5a64 <_sk_callback_hsw+0x242>
+ .byte 196,98,125,24,53,172,69,0,0 // vbroadcastss 0x45ac(%rip),%ymm14 # 5c1c <_sk_callback_hsw+0x242>
.byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13
- .byte 196,98,125,24,61,234,67,0,0 // vbroadcastss 0x43ea(%rip),%ymm15 # 5a68 <_sk_callback_hsw+0x246>
+ .byte 196,98,125,24,61,162,69,0,0 // vbroadcastss 0x45a2(%rip),%ymm15 # 5c20 <_sk_callback_hsw+0x246>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9
- .byte 196,98,125,24,45,214,67,0,0 // vbroadcastss 0x43d6(%rip),%ymm13 # 5a6c <_sk_callback_hsw+0x24a>
+ .byte 196,98,125,24,45,142,69,0,0 // vbroadcastss 0x458e(%rip),%ymm13 # 5c24 <_sk_callback_hsw+0x24a>
.byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -14609,26 +14881,26 @@ _sk_rgb_to_hsl_hsw:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,75,67,0,0 // vbroadcastss 0x434b(%rip),%ymm11 # 5a70 <_sk_callback_hsw+0x24e>
+ .byte 196,98,125,24,29,3,69,0,0 // vbroadcastss 0x4503(%rip),%ymm11 # 5c28 <_sk_callback_hsw+0x24e>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,56,67,0,0 // vbroadcastss 0x4338(%rip),%ymm14 # 5a74 <_sk_callback_hsw+0x252>
+ .byte 196,98,125,24,53,240,68,0,0 // vbroadcastss 0x44f0(%rip),%ymm14 # 5c2c <_sk_callback_hsw+0x252>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,31,67,0,0 // vbroadcastss 0x431f(%rip),%ymm14 # 5a7c <_sk_callback_hsw+0x25a>
+ .byte 196,98,125,24,53,215,68,0,0 // vbroadcastss 0x44d7(%rip),%ymm14 # 5c34 <_sk_callback_hsw+0x25a>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,13,67,0,0 // vbroadcastss 0x430d(%rip),%ymm14 # 5a78 <_sk_callback_hsw+0x256>
+ .byte 196,98,125,24,53,197,68,0,0 // vbroadcastss 0x44c5(%rip),%ymm14 # 5c30 <_sk_callback_hsw+0x256>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,240,66,0,0 // vbroadcastss 0x42f0(%rip),%ymm11 # 5a84 <_sk_callback_hsw+0x262>
+ .byte 196,98,125,24,29,168,68,0,0 // vbroadcastss 0x44a8(%rip),%ymm11 # 5c3c <_sk_callback_hsw+0x262>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -14638,7 +14910,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,179,66,0,0 // vbroadcastss 0x42b3(%rip),%ymm8 # 5a80 <_sk_callback_hsw+0x25e>
+ .byte 196,98,125,24,5,107,68,0,0 // vbroadcastss 0x446b(%rip),%ymm8 # 5c38 <_sk_callback_hsw+0x25e>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14655,30 +14927,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,128,66,0,0 // vbroadcastss 0x4280(%rip),%ymm8 # 5a88 <_sk_callback_hsw+0x266>
+ .byte 196,98,125,24,5,56,68,0,0 // vbroadcastss 0x4438(%rip),%ymm8 # 5c40 <_sk_callback_hsw+0x266>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,99,66,0,0 // vbroadcastss 0x4263(%rip),%ymm9 # 5a8c <_sk_callback_hsw+0x26a>
+ .byte 196,98,125,24,13,27,68,0,0 // vbroadcastss 0x441b(%rip),%ymm9 # 5c44 <_sk_callback_hsw+0x26a>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,89,66,0,0 // vbroadcastss 0x4259(%rip),%ymm11 # 5a90 <_sk_callback_hsw+0x26e>
+ .byte 196,98,125,24,29,17,68,0,0 // vbroadcastss 0x4411(%rip),%ymm11 # 5c48 <_sk_callback_hsw+0x26e>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,67,66,0,0 // vbroadcastss 0x4243(%rip),%ymm13 # 5a98 <_sk_callback_hsw+0x276>
+ .byte 196,98,125,24,45,251,67,0,0 // vbroadcastss 0x43fb(%rip),%ymm13 # 5c50 <_sk_callback_hsw+0x276>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,57,66,0,0 // vbroadcastss 0x4239(%rip),%ymm14 # 5a9c <_sk_callback_hsw+0x27a>
+ .byte 196,98,125,24,53,241,67,0,0 // vbroadcastss 0x43f1(%rip),%ymm14 # 5c54 <_sk_callback_hsw+0x27a>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,31,66,0,0 // vbroadcastss 0x421f(%rip),%ymm3 # 5a94 <_sk_callback_hsw+0x272>
+ .byte 196,226,125,24,29,215,67,0,0 // vbroadcastss 0x43d7(%rip),%ymm3 # 5c4c <_sk_callback_hsw+0x272>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,10,66,0,0 // vbroadcastss 0x420a(%rip),%ymm12 # 5aa0 <_sk_callback_hsw+0x27e>
+ .byte 196,98,125,24,37,194,67,0,0 // vbroadcastss 0x43c2(%rip),%ymm12 # 5c58 <_sk_callback_hsw+0x27e>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -14694,7 +14966,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,182,65,0,0 // vbroadcastss 0x41b6(%rip),%ymm0 # 5aa4 <_sk_callback_hsw+0x282>
+ .byte 196,226,125,24,5,110,67,0,0 // vbroadcastss 0x436e(%rip),%ymm0 # 5c5c <_sk_callback_hsw+0x282>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -14749,10 +15021,10 @@ _sk_scale_u8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,59 // jne 19df <_sk_scale_u8_hsw+0x54>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,110,71,0,0 // vpand 0x476e(%rip),%xmm8,%xmm8 # 6120 <_sk_callback_hsw+0x8fe>
+ .byte 197,57,219,5,78,73,0,0 // vpand 0x494e(%rip),%xmm8,%xmm8 # 6300 <_sk_callback_hsw+0x926>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,227,64,0,0 // vbroadcastss 0x40e3(%rip),%ymm9 # 5aa8 <_sk_callback_hsw+0x286>
+ .byte 196,98,125,24,13,155,66,0,0 // vbroadcastss 0x429b(%rip),%ymm9 # 5c60 <_sk_callback_hsw+0x286>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -14846,10 +15118,10 @@ _sk_lerp_u8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,79 // jne 1b2b <_sk_lerp_u8_hsw+0x68>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,70,70,0,0 // vpand 0x4646(%rip),%xmm8,%xmm8 # 6130 <_sk_callback_hsw+0x90e>
+ .byte 197,57,219,5,38,72,0,0 // vpand 0x4826(%rip),%xmm8,%xmm8 # 6310 <_sk_callback_hsw+0x936>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,175,63,0,0 // vbroadcastss 0x3faf(%rip),%ymm9 # 5aac <_sk_callback_hsw+0x28a>
+ .byte 196,98,125,24,13,103,65,0,0 // vbroadcastss 0x4167(%rip),%ymm9 # 5c64 <_sk_callback_hsw+0x28a>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -14932,20 +15204,20 @@ _sk_lerp_565_hsw:
.byte 15,133,170,0,0,0 // jne 1caa <_sk_lerp_565_hsw+0xca>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,156,62,0,0 // vpbroadcastd 0x3e9c(%rip),%ymm9 # 5ab0 <_sk_callback_hsw+0x28e>
+ .byte 196,98,125,88,13,84,64,0,0 // vpbroadcastd 0x4054(%rip),%ymm9 # 5c68 <_sk_callback_hsw+0x28e>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,141,62,0,0 // vbroadcastss 0x3e8d(%rip),%ymm10 # 5ab4 <_sk_callback_hsw+0x292>
+ .byte 196,98,125,24,21,69,64,0,0 // vbroadcastss 0x4045(%rip),%ymm10 # 5c6c <_sk_callback_hsw+0x292>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,131,62,0,0 // vpbroadcastd 0x3e83(%rip),%ymm10 # 5ab8 <_sk_callback_hsw+0x296>
+ .byte 196,98,125,88,21,59,64,0,0 // vpbroadcastd 0x403b(%rip),%ymm10 # 5c70 <_sk_callback_hsw+0x296>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,116,62,0,0 // vbroadcastss 0x3e74(%rip),%ymm11 # 5abc <_sk_callback_hsw+0x29a>
+ .byte 196,98,125,24,29,44,64,0,0 // vbroadcastss 0x402c(%rip),%ymm11 # 5c74 <_sk_callback_hsw+0x29a>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,106,62,0,0 // vpbroadcastd 0x3e6a(%rip),%ymm11 # 5ac0 <_sk_callback_hsw+0x29e>
+ .byte 196,98,125,88,29,34,64,0,0 // vpbroadcastd 0x4022(%rip),%ymm11 # 5c78 <_sk_callback_hsw+0x29e>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,91,62,0,0 // vbroadcastss 0x3e5b(%rip),%ymm11 # 5ac4 <_sk_callback_hsw+0x2a2>
+ .byte 196,98,125,24,29,19,64,0,0 // vbroadcastss 0x4013(%rip),%ymm11 # 5c7c <_sk_callback_hsw+0x2a2>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0
@@ -15018,21 +15290,21 @@ _sk_load_tables_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,105 // jne 1dce <_sk_load_tables_hsw+0x7e>
.byte 196,193,124,16,26 // vmovups (%r10),%ymm3
- .byte 197,228,84,13,14,65,0,0 // vandps 0x410e(%rip),%ymm3,%ymm1 # 5e80 <_sk_callback_hsw+0x65e>
+ .byte 197,228,84,13,238,66,0,0 // vandps 0x42ee(%rip),%ymm3,%ymm1 # 6060 <_sk_callback_hsw+0x686>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 72,139,72,8 // mov 0x8(%rax),%rcx
.byte 76,139,80,16 // mov 0x10(%rax),%r10
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,226,109,146,4,137 // vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,14,65,0,0 // vpshufb 0x410e(%rip),%ymm3,%ymm2 # 5ea0 <_sk_callback_hsw+0x67e>
+ .byte 196,226,101,0,21,238,66,0,0 // vpshufb 0x42ee(%rip),%ymm3,%ymm2 # 6080 <_sk_callback_hsw+0x6a6>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,22,65,0,0 // vpshufb 0x4116(%rip),%ymm3,%ymm9 # 5ec0 <_sk_callback_hsw+0x69e>
+ .byte 196,98,101,0,13,246,66,0,0 // vpshufb 0x42f6(%rip),%ymm3,%ymm9 # 60a0 <_sk_callback_hsw+0x6c6>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,6,61,0,0 // vbroadcastss 0x3d06(%rip),%ymm8 # 5ac8 <_sk_callback_hsw+0x2a6>
+ .byte 196,98,125,24,5,190,62,0,0 // vbroadcastss 0x3ebe(%rip),%ymm8 # 5c80 <_sk_callback_hsw+0x2a6>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -15071,7 +15343,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,226,66,0,0 // vmovdqa 0x42e2(%rip),%xmm10 # 6140 <_sk_callback_hsw+0x91e>
+ .byte 197,121,111,21,194,68,0,0 // vmovdqa 0x44c2(%rip),%xmm10 # 6320 <_sk_callback_hsw+0x946>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -15093,7 +15365,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,255,59,0,0 // vbroadcastss 0x3bff(%rip),%ymm8 # 5acc <_sk_callback_hsw+0x2aa>
+ .byte 196,98,125,24,5,183,61,0,0 // vbroadcastss 0x3db7(%rip),%ymm8 # 5c84 <_sk_callback_hsw+0x2aa>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15153,7 +15425,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,130,65,0,0 // vmovdqa 0x4182(%rip),%xmm9 # 6150 <_sk_callback_hsw+0x92e>
+ .byte 197,121,111,13,98,67,0,0 // vmovdqa 0x4362(%rip),%xmm9 # 6330 <_sk_callback_hsw+0x956>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -15170,7 +15442,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8
.byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,173,58,0,0 // vbroadcastss 0x3aad(%rip),%ymm3 # 5ad0 <_sk_callback_hsw+0x2ae>
+ .byte 196,226,125,24,29,101,60,0,0 // vbroadcastss 0x3c65(%rip),%ymm3 # 5c88 <_sk_callback_hsw+0x2ae>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
.byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
@@ -15211,7 +15483,7 @@ HIDDEN _sk_byte_tables_hsw
FUNCTION(_sk_byte_tables_hsw)
_sk_byte_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,245,57,0,0 // vbroadcastss 0x39f5(%rip),%ymm8 # 5ad4 <_sk_callback_hsw+0x2b2>
+ .byte 196,98,125,24,5,173,59,0,0 // vbroadcastss 0x3bad(%rip),%ymm8 # 5c8c <_sk_callback_hsw+0x2b2>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -15333,7 +15605,7 @@ _sk_byte_tables_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,154,55,0,0 // vbroadcastss 0x379a(%rip),%ymm8 # 5ad8 <_sk_callback_hsw+0x2b6>
+ .byte 196,98,125,24,5,82,57,0,0 // vbroadcastss 0x3952(%rip),%ymm8 # 5c90 <_sk_callback_hsw+0x2b6>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -15449,7 +15721,7 @@ _sk_byte_tables_rgb_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,134,53,0,0 // vbroadcastss 0x3586(%rip),%ymm8 # 5adc <_sk_callback_hsw+0x2ba>
+ .byte 196,98,125,24,5,62,55,0,0 // vbroadcastss 0x373e(%rip),%ymm8 # 5c94 <_sk_callback_hsw+0x2ba>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -15548,33 +15820,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,96,52,0,0 // vbroadcastss 0x3460(%rip),%ymm12 # 5ae0 <_sk_callback_hsw+0x2be>
- .byte 196,98,125,24,45,91,52,0,0 // vbroadcastss 0x345b(%rip),%ymm13 # 5ae4 <_sk_callback_hsw+0x2c2>
+ .byte 196,98,125,24,37,24,54,0,0 // vbroadcastss 0x3618(%rip),%ymm12 # 5c98 <_sk_callback_hsw+0x2be>
+ .byte 196,98,125,24,45,19,54,0,0 // vbroadcastss 0x3613(%rip),%ymm13 # 5c9c <_sk_callback_hsw+0x2c2>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,81,52,0,0 // vbroadcastss 0x3451(%rip),%ymm13 # 5ae8 <_sk_callback_hsw+0x2c6>
+ .byte 196,98,125,24,45,9,54,0,0 // vbroadcastss 0x3609(%rip),%ymm13 # 5ca0 <_sk_callback_hsw+0x2c6>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,71,52,0,0 // vbroadcastss 0x3447(%rip),%ymm13 # 5aec <_sk_callback_hsw+0x2ca>
+ .byte 196,98,125,24,45,255,53,0,0 // vbroadcastss 0x35ff(%rip),%ymm13 # 5ca4 <_sk_callback_hsw+0x2ca>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,61,52,0,0 // vbroadcastss 0x343d(%rip),%ymm11 # 5af0 <_sk_callback_hsw+0x2ce>
+ .byte 196,98,125,24,29,245,53,0,0 // vbroadcastss 0x35f5(%rip),%ymm11 # 5ca8 <_sk_callback_hsw+0x2ce>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,51,52,0,0 // vbroadcastss 0x3433(%rip),%ymm12 # 5af4 <_sk_callback_hsw+0x2d2>
+ .byte 196,98,125,24,37,235,53,0,0 // vbroadcastss 0x35eb(%rip),%ymm12 # 5cac <_sk_callback_hsw+0x2d2>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,41,52,0,0 // vbroadcastss 0x3429(%rip),%ymm12 # 5af8 <_sk_callback_hsw+0x2d6>
+ .byte 196,98,125,24,37,225,53,0,0 // vbroadcastss 0x35e1(%rip),%ymm12 # 5cb0 <_sk_callback_hsw+0x2d6>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,10,52,0,0 // vbroadcastss 0x340a(%rip),%ymm11 # 5afc <_sk_callback_hsw+0x2da>
+ .byte 196,98,125,24,29,194,53,0,0 // vbroadcastss 0x35c2(%rip),%ymm11 # 5cb4 <_sk_callback_hsw+0x2da>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,0,52,0,0 // vbroadcastss 0x3400(%rip),%ymm11 # 5b00 <_sk_callback_hsw+0x2de>
+ .byte 196,98,125,24,29,184,53,0,0 // vbroadcastss 0x35b8(%rip),%ymm11 # 5cb8 <_sk_callback_hsw+0x2de>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,246,51,0,0 // vbroadcastss 0x33f6(%rip),%ymm0 # 5b04 <_sk_callback_hsw+0x2e2>
+ .byte 196,226,125,24,5,174,53,0,0 // vbroadcastss 0x35ae(%rip),%ymm0 # 5cbc <_sk_callback_hsw+0x2e2>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,236,51,0,0 // vbroadcastss 0x33ec(%rip),%ymm10 # 5b08 <_sk_callback_hsw+0x2e6>
+ .byte 196,98,125,24,21,164,53,0,0 // vbroadcastss 0x35a4(%rip),%ymm10 # 5cc0 <_sk_callback_hsw+0x2e6>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,223,51,0,0 // vbroadcastss 0x33df(%rip),%ymm10 # 5b0c <_sk_callback_hsw+0x2ea>
+ .byte 196,98,125,24,21,151,53,0,0 // vbroadcastss 0x3597(%rip),%ymm10 # 5cc4 <_sk_callback_hsw+0x2ea>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15582,7 +15854,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,182,51,0,0 // vbroadcastss 0x33b6(%rip),%ymm8 # 5b10 <_sk_callback_hsw+0x2ee>
+ .byte 196,98,125,24,5,110,53,0,0 // vbroadcastss 0x356e(%rip),%ymm8 # 5cc8 <_sk_callback_hsw+0x2ee>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15602,33 +15874,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,110,51,0,0 // vbroadcastss 0x336e(%rip),%ymm12 # 5b14 <_sk_callback_hsw+0x2f2>
- .byte 196,98,125,24,45,105,51,0,0 // vbroadcastss 0x3369(%rip),%ymm13 # 5b18 <_sk_callback_hsw+0x2f6>
+ .byte 196,98,125,24,37,38,53,0,0 // vbroadcastss 0x3526(%rip),%ymm12 # 5ccc <_sk_callback_hsw+0x2f2>
+ .byte 196,98,125,24,45,33,53,0,0 // vbroadcastss 0x3521(%rip),%ymm13 # 5cd0 <_sk_callback_hsw+0x2f6>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,95,51,0,0 // vbroadcastss 0x335f(%rip),%ymm13 # 5b1c <_sk_callback_hsw+0x2fa>
+ .byte 196,98,125,24,45,23,53,0,0 // vbroadcastss 0x3517(%rip),%ymm13 # 5cd4 <_sk_callback_hsw+0x2fa>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,85,51,0,0 // vbroadcastss 0x3355(%rip),%ymm13 # 5b20 <_sk_callback_hsw+0x2fe>
+ .byte 196,98,125,24,45,13,53,0,0 // vbroadcastss 0x350d(%rip),%ymm13 # 5cd8 <_sk_callback_hsw+0x2fe>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,75,51,0,0 // vbroadcastss 0x334b(%rip),%ymm11 # 5b24 <_sk_callback_hsw+0x302>
+ .byte 196,98,125,24,29,3,53,0,0 // vbroadcastss 0x3503(%rip),%ymm11 # 5cdc <_sk_callback_hsw+0x302>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,65,51,0,0 // vbroadcastss 0x3341(%rip),%ymm12 # 5b28 <_sk_callback_hsw+0x306>
+ .byte 196,98,125,24,37,249,52,0,0 // vbroadcastss 0x34f9(%rip),%ymm12 # 5ce0 <_sk_callback_hsw+0x306>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,55,51,0,0 // vbroadcastss 0x3337(%rip),%ymm12 # 5b2c <_sk_callback_hsw+0x30a>
+ .byte 196,98,125,24,37,239,52,0,0 // vbroadcastss 0x34ef(%rip),%ymm12 # 5ce4 <_sk_callback_hsw+0x30a>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,24,51,0,0 // vbroadcastss 0x3318(%rip),%ymm11 # 5b30 <_sk_callback_hsw+0x30e>
+ .byte 196,98,125,24,29,208,52,0,0 // vbroadcastss 0x34d0(%rip),%ymm11 # 5ce8 <_sk_callback_hsw+0x30e>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,14,51,0,0 // vbroadcastss 0x330e(%rip),%ymm11 # 5b34 <_sk_callback_hsw+0x312>
+ .byte 196,98,125,24,29,198,52,0,0 // vbroadcastss 0x34c6(%rip),%ymm11 # 5cec <_sk_callback_hsw+0x312>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,4,51,0,0 // vbroadcastss 0x3304(%rip),%ymm1 # 5b38 <_sk_callback_hsw+0x316>
+ .byte 196,226,125,24,13,188,52,0,0 // vbroadcastss 0x34bc(%rip),%ymm1 # 5cf0 <_sk_callback_hsw+0x316>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,250,50,0,0 // vbroadcastss 0x32fa(%rip),%ymm10 # 5b3c <_sk_callback_hsw+0x31a>
+ .byte 196,98,125,24,21,178,52,0,0 // vbroadcastss 0x34b2(%rip),%ymm10 # 5cf4 <_sk_callback_hsw+0x31a>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,237,50,0,0 // vbroadcastss 0x32ed(%rip),%ymm10 # 5b40 <_sk_callback_hsw+0x31e>
+ .byte 196,98,125,24,21,165,52,0,0 // vbroadcastss 0x34a5(%rip),%ymm10 # 5cf8 <_sk_callback_hsw+0x31e>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15636,7 +15908,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,196,50,0,0 // vbroadcastss 0x32c4(%rip),%ymm8 # 5b44 <_sk_callback_hsw+0x322>
+ .byte 196,98,125,24,5,124,52,0,0 // vbroadcastss 0x347c(%rip),%ymm8 # 5cfc <_sk_callback_hsw+0x322>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15656,33 +15928,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,124,50,0,0 // vbroadcastss 0x327c(%rip),%ymm12 # 5b48 <_sk_callback_hsw+0x326>
- .byte 196,98,125,24,45,119,50,0,0 // vbroadcastss 0x3277(%rip),%ymm13 # 5b4c <_sk_callback_hsw+0x32a>
+ .byte 196,98,125,24,37,52,52,0,0 // vbroadcastss 0x3434(%rip),%ymm12 # 5d00 <_sk_callback_hsw+0x326>
+ .byte 196,98,125,24,45,47,52,0,0 // vbroadcastss 0x342f(%rip),%ymm13 # 5d04 <_sk_callback_hsw+0x32a>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,109,50,0,0 // vbroadcastss 0x326d(%rip),%ymm13 # 5b50 <_sk_callback_hsw+0x32e>
+ .byte 196,98,125,24,45,37,52,0,0 // vbroadcastss 0x3425(%rip),%ymm13 # 5d08 <_sk_callback_hsw+0x32e>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,99,50,0,0 // vbroadcastss 0x3263(%rip),%ymm13 # 5b54 <_sk_callback_hsw+0x332>
+ .byte 196,98,125,24,45,27,52,0,0 // vbroadcastss 0x341b(%rip),%ymm13 # 5d0c <_sk_callback_hsw+0x332>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,89,50,0,0 // vbroadcastss 0x3259(%rip),%ymm11 # 5b58 <_sk_callback_hsw+0x336>
+ .byte 196,98,125,24,29,17,52,0,0 // vbroadcastss 0x3411(%rip),%ymm11 # 5d10 <_sk_callback_hsw+0x336>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,79,50,0,0 // vbroadcastss 0x324f(%rip),%ymm12 # 5b5c <_sk_callback_hsw+0x33a>
+ .byte 196,98,125,24,37,7,52,0,0 // vbroadcastss 0x3407(%rip),%ymm12 # 5d14 <_sk_callback_hsw+0x33a>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,69,50,0,0 // vbroadcastss 0x3245(%rip),%ymm12 # 5b60 <_sk_callback_hsw+0x33e>
+ .byte 196,98,125,24,37,253,51,0,0 // vbroadcastss 0x33fd(%rip),%ymm12 # 5d18 <_sk_callback_hsw+0x33e>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,38,50,0,0 // vbroadcastss 0x3226(%rip),%ymm11 # 5b64 <_sk_callback_hsw+0x342>
+ .byte 196,98,125,24,29,222,51,0,0 // vbroadcastss 0x33de(%rip),%ymm11 # 5d1c <_sk_callback_hsw+0x342>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,28,50,0,0 // vbroadcastss 0x321c(%rip),%ymm11 # 5b68 <_sk_callback_hsw+0x346>
+ .byte 196,98,125,24,29,212,51,0,0 // vbroadcastss 0x33d4(%rip),%ymm11 # 5d20 <_sk_callback_hsw+0x346>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,18,50,0,0 // vbroadcastss 0x3212(%rip),%ymm2 # 5b6c <_sk_callback_hsw+0x34a>
+ .byte 196,226,125,24,21,202,51,0,0 // vbroadcastss 0x33ca(%rip),%ymm2 # 5d24 <_sk_callback_hsw+0x34a>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,8,50,0,0 // vbroadcastss 0x3208(%rip),%ymm10 # 5b70 <_sk_callback_hsw+0x34e>
+ .byte 196,98,125,24,21,192,51,0,0 // vbroadcastss 0x33c0(%rip),%ymm10 # 5d28 <_sk_callback_hsw+0x34e>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,251,49,0,0 // vbroadcastss 0x31fb(%rip),%ymm10 # 5b74 <_sk_callback_hsw+0x352>
+ .byte 196,98,125,24,21,179,51,0,0 // vbroadcastss 0x33b3(%rip),%ymm10 # 5d2c <_sk_callback_hsw+0x352>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15690,7 +15962,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,210,49,0,0 // vbroadcastss 0x31d2(%rip),%ymm8 # 5b78 <_sk_callback_hsw+0x356>
+ .byte 196,98,125,24,5,138,51,0,0 // vbroadcastss 0x338a(%rip),%ymm8 # 5d30 <_sk_callback_hsw+0x356>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15710,33 +15982,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,138,49,0,0 // vbroadcastss 0x318a(%rip),%ymm12 # 5b7c <_sk_callback_hsw+0x35a>
- .byte 196,98,125,24,45,133,49,0,0 // vbroadcastss 0x3185(%rip),%ymm13 # 5b80 <_sk_callback_hsw+0x35e>
+ .byte 196,98,125,24,37,66,51,0,0 // vbroadcastss 0x3342(%rip),%ymm12 # 5d34 <_sk_callback_hsw+0x35a>
+ .byte 196,98,125,24,45,61,51,0,0 // vbroadcastss 0x333d(%rip),%ymm13 # 5d38 <_sk_callback_hsw+0x35e>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,123,49,0,0 // vbroadcastss 0x317b(%rip),%ymm13 # 5b84 <_sk_callback_hsw+0x362>
+ .byte 196,98,125,24,45,51,51,0,0 // vbroadcastss 0x3333(%rip),%ymm13 # 5d3c <_sk_callback_hsw+0x362>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,113,49,0,0 // vbroadcastss 0x3171(%rip),%ymm13 # 5b88 <_sk_callback_hsw+0x366>
+ .byte 196,98,125,24,45,41,51,0,0 // vbroadcastss 0x3329(%rip),%ymm13 # 5d40 <_sk_callback_hsw+0x366>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,103,49,0,0 // vbroadcastss 0x3167(%rip),%ymm11 # 5b8c <_sk_callback_hsw+0x36a>
+ .byte 196,98,125,24,29,31,51,0,0 // vbroadcastss 0x331f(%rip),%ymm11 # 5d44 <_sk_callback_hsw+0x36a>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,93,49,0,0 // vbroadcastss 0x315d(%rip),%ymm12 # 5b90 <_sk_callback_hsw+0x36e>
+ .byte 196,98,125,24,37,21,51,0,0 // vbroadcastss 0x3315(%rip),%ymm12 # 5d48 <_sk_callback_hsw+0x36e>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,83,49,0,0 // vbroadcastss 0x3153(%rip),%ymm12 # 5b94 <_sk_callback_hsw+0x372>
+ .byte 196,98,125,24,37,11,51,0,0 // vbroadcastss 0x330b(%rip),%ymm12 # 5d4c <_sk_callback_hsw+0x372>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,52,49,0,0 // vbroadcastss 0x3134(%rip),%ymm11 # 5b98 <_sk_callback_hsw+0x376>
+ .byte 196,98,125,24,29,236,50,0,0 // vbroadcastss 0x32ec(%rip),%ymm11 # 5d50 <_sk_callback_hsw+0x376>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,42,49,0,0 // vbroadcastss 0x312a(%rip),%ymm11 # 5b9c <_sk_callback_hsw+0x37a>
+ .byte 196,98,125,24,29,226,50,0,0 // vbroadcastss 0x32e2(%rip),%ymm11 # 5d54 <_sk_callback_hsw+0x37a>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,32,49,0,0 // vbroadcastss 0x3120(%rip),%ymm3 # 5ba0 <_sk_callback_hsw+0x37e>
+ .byte 196,226,125,24,29,216,50,0,0 // vbroadcastss 0x32d8(%rip),%ymm3 # 5d58 <_sk_callback_hsw+0x37e>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,22,49,0,0 // vbroadcastss 0x3116(%rip),%ymm10 # 5ba4 <_sk_callback_hsw+0x382>
+ .byte 196,98,125,24,21,206,50,0,0 // vbroadcastss 0x32ce(%rip),%ymm10 # 5d5c <_sk_callback_hsw+0x382>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,9,49,0,0 // vbroadcastss 0x3109(%rip),%ymm10 # 5ba8 <_sk_callback_hsw+0x386>
+ .byte 196,98,125,24,21,193,50,0,0 // vbroadcastss 0x32c1(%rip),%ymm10 # 5d60 <_sk_callback_hsw+0x386>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15744,35 +16016,124 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,224,48,0,0 // vbroadcastss 0x30e0(%rip),%ymm8 # 5bac <_sk_callback_hsw+0x38a>
+ .byte 196,98,125,24,5,152,50,0,0 // vbroadcastss 0x3298(%rip),%ymm8 # 5d64 <_sk_callback_hsw+0x38a>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_gamma_hsw
+.globl _sk_gamma_hsw
+FUNCTION(_sk_gamma_hsw)
+_sk_gamma_hsw:
+ .byte 72,131,236,56 // sub $0x38,%rsp
+ .byte 197,252,17,60,36 // vmovups %ymm7,(%rsp)
+ .byte 197,252,17,116,36,224 // vmovups %ymm6,-0x20(%rsp)
+ .byte 197,252,17,108,36,192 // vmovups %ymm5,-0x40(%rsp)
+ .byte 197,252,17,100,36,160 // vmovups %ymm4,-0x60(%rsp)
+ .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
+ .byte 197,252,40,250 // vmovaps %ymm2,%ymm7
+ .byte 197,252,40,241 // vmovaps %ymm1,%ymm6
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,124,91,208 // vcvtdq2ps %ymm0,%ymm10
+ .byte 196,98,125,24,29,91,50,0,0 // vbroadcastss 0x325b(%rip),%ymm11 # 5d68 <_sk_callback_hsw+0x38e>
+ .byte 196,226,125,24,45,86,50,0,0 // vbroadcastss 0x3256(%rip),%ymm5 # 5d6c <_sk_callback_hsw+0x392>
+ .byte 197,124,84,205 // vandps %ymm5,%ymm0,%ymm9
+ .byte 196,226,125,24,37,77,50,0,0 // vbroadcastss 0x324d(%rip),%ymm4 # 5d70 <_sk_callback_hsw+0x396>
+ .byte 197,52,86,228 // vorps %ymm4,%ymm9,%ymm12
+ .byte 196,98,125,24,45,68,50,0,0 // vbroadcastss 0x3244(%rip),%ymm13 # 5d74 <_sk_callback_hsw+0x39a>
+ .byte 196,66,37,168,213 // vfmadd213ps %ymm13,%ymm11,%ymm10
+ .byte 196,98,125,24,13,58,50,0,0 // vbroadcastss 0x323a(%rip),%ymm9 # 5d78 <_sk_callback_hsw+0x39e>
+ .byte 196,66,29,188,209 // vfnmadd231ps %ymm9,%ymm12,%ymm10
+ .byte 197,124,91,246 // vcvtdq2ps %ymm6,%ymm14
+ .byte 196,66,37,168,245 // vfmadd213ps %ymm13,%ymm11,%ymm14
+ .byte 197,124,91,255 // vcvtdq2ps %ymm7,%ymm15
+ .byte 196,66,37,168,253 // vfmadd213ps %ymm13,%ymm11,%ymm15
+ .byte 196,98,125,24,29,30,50,0,0 // vbroadcastss 0x321e(%rip),%ymm11 # 5d7c <_sk_callback_hsw+0x3a2>
+ .byte 196,65,28,88,227 // vaddps %ymm11,%ymm12,%ymm12
+ .byte 196,98,125,24,45,20,50,0,0 // vbroadcastss 0x3214(%rip),%ymm13 # 5d80 <_sk_callback_hsw+0x3a6>
+ .byte 196,65,20,94,228 // vdivps %ymm12,%ymm13,%ymm12
+ .byte 196,65,44,92,212 // vsubps %ymm12,%ymm10,%ymm10
+ .byte 196,98,125,24,32 // vbroadcastss (%rax),%ymm12
+ .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
+ .byte 196,67,125,8,194,1 // vroundps $0x1,%ymm10,%ymm8
+ .byte 196,65,44,92,192 // vsubps %ymm8,%ymm10,%ymm8
+ .byte 196,226,125,24,21,240,49,0,0 // vbroadcastss 0x31f0(%rip),%ymm2 # 5d84 <_sk_callback_hsw+0x3aa>
+ .byte 197,44,88,210 // vaddps %ymm2,%ymm10,%ymm10
+ .byte 196,226,125,24,29,231,49,0,0 // vbroadcastss 0x31e7(%rip),%ymm3 # 5d88 <_sk_callback_hsw+0x3ae>
+ .byte 196,98,61,188,211 // vfnmadd231ps %ymm3,%ymm8,%ymm10
+ .byte 196,226,125,24,13,221,49,0,0 // vbroadcastss 0x31dd(%rip),%ymm1 # 5d8c <_sk_callback_hsw+0x3b2>
+ .byte 196,65,116,92,192 // vsubps %ymm8,%ymm1,%ymm8
+ .byte 196,226,125,24,5,211,49,0,0 // vbroadcastss 0x31d3(%rip),%ymm0 # 5d90 <_sk_callback_hsw+0x3b6>
+ .byte 196,65,124,94,192 // vdivps %ymm8,%ymm0,%ymm8
+ .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
+ .byte 197,204,84,245 // vandps %ymm5,%ymm6,%ymm6
+ .byte 197,204,86,244 // vorps %ymm4,%ymm6,%ymm6
+ .byte 196,66,77,188,241 // vfnmadd231ps %ymm9,%ymm6,%ymm14
+ .byte 196,193,76,88,243 // vaddps %ymm11,%ymm6,%ymm6
+ .byte 197,148,94,246 // vdivps %ymm6,%ymm13,%ymm6
+ .byte 197,140,92,246 // vsubps %ymm6,%ymm14,%ymm6
+ .byte 196,193,76,89,244 // vmulps %ymm12,%ymm6,%ymm6
+ .byte 196,99,125,8,214,1 // vroundps $0x1,%ymm6,%ymm10
+ .byte 196,65,76,92,210 // vsubps %ymm10,%ymm6,%ymm10
+ .byte 197,204,88,242 // vaddps %ymm2,%ymm6,%ymm6
+ .byte 196,226,45,188,243 // vfnmadd231ps %ymm3,%ymm10,%ymm6
+ .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
+ .byte 196,65,124,94,210 // vdivps %ymm10,%ymm0,%ymm10
+ .byte 196,193,76,88,242 // vaddps %ymm10,%ymm6,%ymm6
+ .byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
+ .byte 197,212,86,228 // vorps %ymm4,%ymm5,%ymm4
+ .byte 196,66,93,188,249 // vfnmadd231ps %ymm9,%ymm4,%ymm15
+ .byte 196,193,92,88,227 // vaddps %ymm11,%ymm4,%ymm4
+ .byte 197,148,94,228 // vdivps %ymm4,%ymm13,%ymm4
+ .byte 197,132,92,228 // vsubps %ymm4,%ymm15,%ymm4
+ .byte 196,193,92,89,228 // vmulps %ymm12,%ymm4,%ymm4
+ .byte 196,227,125,8,236,1 // vroundps $0x1,%ymm4,%ymm5
+ .byte 197,220,92,237 // vsubps %ymm5,%ymm4,%ymm5
+ .byte 197,220,88,210 // vaddps %ymm2,%ymm4,%ymm2
+ .byte 196,226,85,188,211 // vfnmadd231ps %ymm3,%ymm5,%ymm2
+ .byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
+ .byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
+ .byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
+ .byte 196,226,125,24,13,68,49,0,0 // vbroadcastss 0x3144(%rip),%ymm1 # 5d94 <_sk_callback_hsw+0x3ba>
+ .byte 197,188,89,209 // vmulps %ymm1,%ymm8,%ymm2
+ .byte 197,204,89,217 // vmulps %ymm1,%ymm6,%ymm3
+ .byte 197,252,89,225 // vmulps %ymm1,%ymm0,%ymm4
+ .byte 197,253,91,194 // vcvtps2dq %ymm2,%ymm0
+ .byte 197,253,91,203 // vcvtps2dq %ymm3,%ymm1
+ .byte 197,253,91,212 // vcvtps2dq %ymm4,%ymm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,252,16,92,36,128 // vmovups -0x80(%rsp),%ymm3
+ .byte 197,252,16,100,36,160 // vmovups -0x60(%rsp),%ymm4
+ .byte 197,252,16,108,36,192 // vmovups -0x40(%rsp),%ymm5
+ .byte 197,252,16,116,36,224 // vmovups -0x20(%rsp),%ymm6
+ .byte 197,252,16,60,36 // vmovups (%rsp),%ymm7
+ .byte 72,131,196,56 // add $0x38,%rsp
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,210,48,0,0 // vbroadcastss 0x30d2(%rip),%ymm8 # 5bb0 <_sk_callback_hsw+0x38e>
- .byte 196,98,125,24,13,205,48,0,0 // vbroadcastss 0x30cd(%rip),%ymm9 # 5bb4 <_sk_callback_hsw+0x392>
- .byte 196,98,125,24,21,200,48,0,0 // vbroadcastss 0x30c8(%rip),%ymm10 # 5bb8 <_sk_callback_hsw+0x396>
+ .byte 196,98,125,24,5,2,49,0,0 // vbroadcastss 0x3102(%rip),%ymm8 # 5d98 <_sk_callback_hsw+0x3be>
+ .byte 196,98,125,24,13,253,48,0,0 // vbroadcastss 0x30fd(%rip),%ymm9 # 5d9c <_sk_callback_hsw+0x3c2>
+ .byte 196,98,125,24,21,248,48,0,0 // vbroadcastss 0x30f8(%rip),%ymm10 # 5da0 <_sk_callback_hsw+0x3c6>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,185,48,0,0 // vbroadcastss 0x30b9(%rip),%ymm9 # 5bbc <_sk_callback_hsw+0x39a>
+ .byte 196,98,125,24,13,233,48,0,0 // vbroadcastss 0x30e9(%rip),%ymm9 # 5da4 <_sk_callback_hsw+0x3ca>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,175,48,0,0 // vbroadcastss 0x30af(%rip),%ymm0 # 5bc0 <_sk_callback_hsw+0x39e>
+ .byte 196,226,125,24,5,223,48,0,0 // vbroadcastss 0x30df(%rip),%ymm0 # 5da8 <_sk_callback_hsw+0x3ce>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,166,48,0,0 // vbroadcastss 0x30a6(%rip),%ymm8 # 5bc4 <_sk_callback_hsw+0x3a2>
+ .byte 196,98,125,24,5,214,48,0,0 // vbroadcastss 0x30d6(%rip),%ymm8 # 5dac <_sk_callback_hsw+0x3d2>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,156,48,0,0 // vbroadcastss 0x309c(%rip),%ymm9 # 5bc8 <_sk_callback_hsw+0x3a6>
+ .byte 196,98,125,24,13,204,48,0,0 // vbroadcastss 0x30cc(%rip),%ymm9 # 5db0 <_sk_callback_hsw+0x3d6>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,137,48,0,0 // vbroadcastss 0x3089(%rip),%ymm2 # 5bcc <_sk_callback_hsw+0x3aa>
+ .byte 196,226,125,24,21,185,48,0,0 // vbroadcastss 0x30b9(%rip),%ymm2 # 5db4 <_sk_callback_hsw+0x3da>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,127,48,0,0 // vbroadcastss 0x307f(%rip),%ymm11 # 5bd0 <_sk_callback_hsw+0x3ae>
+ .byte 196,98,125,24,29,175,48,0,0 // vbroadcastss 0x30af(%rip),%ymm11 # 5db8 <_sk_callback_hsw+0x3de>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,117,48,0,0 // vbroadcastss 0x3075(%rip),%ymm12 # 5bd4 <_sk_callback_hsw+0x3b2>
+ .byte 196,98,125,24,37,165,48,0,0 // vbroadcastss 0x30a5(%rip),%ymm12 # 5dbc <_sk_callback_hsw+0x3e2>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -15787,9 +16148,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,42,48,0,0 // vbroadcastss 0x302a(%rip),%ymm0 # 5bd8 <_sk_callback_hsw+0x3b6>
+ .byte 196,226,125,24,5,90,48,0,0 // vbroadcastss 0x305a(%rip),%ymm0 # 5dc0 <_sk_callback_hsw+0x3e6>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,33,48,0,0 // vbroadcastss 0x3021(%rip),%ymm8 # 5bdc <_sk_callback_hsw+0x3ba>
+ .byte 196,98,125,24,5,81,48,0,0 // vbroadcastss 0x3051(%rip),%ymm8 # 5dc4 <_sk_callback_hsw+0x3ea>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15806,12 +16167,12 @@ _sk_load_a8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 2c12 <_sk_load_a8_hsw+0x4e>
+ .byte 117,53 // jne 2dca <_sk_load_a8_hsw+0x4e>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,117,53,0,0 // vpand 0x3575(%rip),%xmm0,%xmm0 # 6160 <_sk_callback_hsw+0x93e>
+ .byte 197,249,219,5,157,53,0,0 // vpand 0x359d(%rip),%xmm0,%xmm0 # 6340 <_sk_callback_hsw+0x966>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,227,47,0,0 // vbroadcastss 0x2fe3(%rip),%ymm1 # 5be0 <_sk_callback_hsw+0x3be>
+ .byte 196,226,125,24,13,19,48,0,0 // vbroadcastss 0x3013(%rip),%ymm1 # 5dc8 <_sk_callback_hsw+0x3ee>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -15824,15 +16185,15 @@ _sk_load_a8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 2be3 <_sk_load_a8_hsw+0x1f>
+ .byte 119,189 // ja 2d9b <_sk_load_a8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 2ca8 <_sk_load_a8_hsw+0xe4>
+ .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 2e60 <_sk_load_a8_hsw+0xe4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,158 // jmp 2be3 <_sk_load_a8_hsw+0x1f>
+ .byte 235,158 // jmp 2d9b <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -15840,7 +16201,7 @@ _sk_load_a8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,118,255,255,255 // jmpq 2be3 <_sk_load_a8_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 2d9b <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -15851,7 +16212,7 @@ _sk_load_a8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,59,255,255,255 // jmpq 2be3 <_sk_load_a8_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 2d9b <_sk_load_a8_hsw+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -15884,12 +16245,12 @@ _sk_load_a8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 2d12 <_sk_load_a8_dst_hsw+0x4e>
+ .byte 117,53 // jne 2eca <_sk_load_a8_dst_hsw+0x4e>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,133,52,0,0 // vpand 0x3485(%rip),%xmm4,%xmm4 # 6170 <_sk_callback_hsw+0x94e>
+ .byte 197,217,219,37,173,52,0,0 // vpand 0x34ad(%rip),%xmm4,%xmm4 # 6350 <_sk_callback_hsw+0x976>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,231,46,0,0 // vbroadcastss 0x2ee7(%rip),%ymm5 # 5be4 <_sk_callback_hsw+0x3c2>
+ .byte 196,226,125,24,45,23,47,0,0 // vbroadcastss 0x2f17(%rip),%ymm5 # 5dcc <_sk_callback_hsw+0x3f2>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -15902,15 +16263,15 @@ _sk_load_a8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 2ce3 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 119,189 // ja 2e9b <_sk_load_a8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 2da8 <_sk_load_a8_dst_hsw+0xe4>
+ .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 2f60 <_sk_load_a8_dst_hsw+0xe4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,158 // jmp 2ce3 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 235,158 // jmp 2e9b <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -15918,7 +16279,7 @@ _sk_load_a8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,118,255,255,255 // jmpq 2ce3 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 2e9b <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -15929,7 +16290,7 @@ _sk_load_a8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,59,255,255,255 // jmpq 2ce3 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 2e9b <_sk_load_a8_dst_hsw+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -15990,7 +16351,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,110,45,0,0 // vbroadcastss 0x2d6e(%rip),%ymm1 # 5be8 <_sk_callback_hsw+0x3c6>
+ .byte 196,226,125,24,13,158,45,0,0 // vbroadcastss 0x2d9e(%rip),%ymm1 # 5dd0 <_sk_callback_hsw+0x3f6>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -16009,14 +16370,14 @@ _sk_store_a8_hsw:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,65,45,0,0 // vbroadcastss 0x2d41(%rip),%ymm8 # 5bec <_sk_callback_hsw+0x3ca>
+ .byte 196,98,125,24,5,113,45,0,0 // vbroadcastss 0x2d71(%rip),%ymm8 # 5dd4 <_sk_callback_hsw+0x3fa>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 2ed5 <_sk_store_a8_hsw+0x47>
+ .byte 117,11 // jne 308d <_sk_store_a8_hsw+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16025,25 +16386,25 @@ _sk_store_a8_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 2ed0 <_sk_store_a8_hsw+0x42>
+ .byte 119,235 // ja 3088 <_sk_store_a8_hsw+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 2f4c <_sk_store_a8_hsw+0xbe>
+ .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 3104 <_sk_store_a8_hsw+0xbe>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp 2ed0 <_sk_store_a8_hsw+0x42>
+ .byte 235,201 // jmp 3088 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,104,50,0,0 // vpshufb 0x3268(%rip),%xmm8,%xmm8 # 6180 <_sk_callback_hsw+0x95e>
+ .byte 196,98,57,0,5,144,50,0,0 // vpshufb 0x3290(%rip),%xmm8,%xmm8 # 6360 <_sk_callback_hsw+0x986>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp 2ed0 <_sk_store_a8_hsw+0x42>
+ .byte 235,175 // jmp 3088 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,78,50,0,0 // vpshufb 0x324e(%rip),%xmm8,%xmm8 # 6190 <_sk_callback_hsw+0x96e>
+ .byte 196,98,57,0,5,118,50,0,0 // vpshufb 0x3276(%rip),%xmm8,%xmm8 # 6370 <_sk_callback_hsw+0x996>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp 2ed0 <_sk_store_a8_hsw+0x42>
+ .byte 235,134 // jmp 3088 <_sk_store_a8_hsw+0x42>
.byte 102,144 // xchg %ax,%ax
.byte 178,255 // mov $0xff,%dl
.byte 255 // (bad)
@@ -16077,15 +16438,15 @@ _sk_load_g8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 2fbb <_sk_load_g8_hsw+0x53>
+ .byte 117,58 // jne 3173 <_sk_load_g8_hsw+0x53>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,17,50,0,0 // vpand 0x3211(%rip),%xmm0,%xmm0 # 61a0 <_sk_callback_hsw+0x97e>
+ .byte 197,249,219,5,57,50,0,0 // vpand 0x3239(%rip),%xmm0,%xmm0 # 6380 <_sk_callback_hsw+0x9a6>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,79,44,0,0 // vbroadcastss 0x2c4f(%rip),%ymm1 # 5bf0 <_sk_callback_hsw+0x3ce>
+ .byte 196,226,125,24,13,127,44,0,0 // vbroadcastss 0x2c7f(%rip),%ymm1 # 5dd8 <_sk_callback_hsw+0x3fe>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,68,44,0,0 // vbroadcastss 0x2c44(%rip),%ymm3 # 5bf4 <_sk_callback_hsw+0x3d2>
+ .byte 196,226,125,24,29,116,44,0,0 // vbroadcastss 0x2c74(%rip),%ymm3 # 5ddc <_sk_callback_hsw+0x402>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -16095,15 +16456,15 @@ _sk_load_g8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 2f87 <_sk_load_g8_hsw+0x1f>
+ .byte 119,184 // ja 313f <_sk_load_g8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3054 <_sk_load_g8_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 320c <_sk_load_g8_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,153 // jmp 2f87 <_sk_load_g8_hsw+0x1f>
+ .byte 235,153 // jmp 313f <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -16111,7 +16472,7 @@ _sk_load_g8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,113,255,255,255 // jmpq 2f87 <_sk_load_g8_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 313f <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -16122,7 +16483,7 @@ _sk_load_g8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,54,255,255,255 // jmpq 2f87 <_sk_load_g8_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 313f <_sk_load_g8_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -16156,15 +16517,15 @@ _sk_load_g8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 30c3 <_sk_load_g8_dst_hsw+0x53>
+ .byte 117,58 // jne 327b <_sk_load_g8_dst_hsw+0x53>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,25,49,0,0 // vpand 0x3119(%rip),%xmm4,%xmm4 # 61b0 <_sk_callback_hsw+0x98e>
+ .byte 197,217,219,37,65,49,0,0 // vpand 0x3141(%rip),%xmm4,%xmm4 # 6390 <_sk_callback_hsw+0x9b6>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,79,43,0,0 // vbroadcastss 0x2b4f(%rip),%ymm5 # 5bf8 <_sk_callback_hsw+0x3d6>
+ .byte 196,226,125,24,45,127,43,0,0 // vbroadcastss 0x2b7f(%rip),%ymm5 # 5de0 <_sk_callback_hsw+0x406>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,68,43,0,0 // vbroadcastss 0x2b44(%rip),%ymm7 # 5bfc <_sk_callback_hsw+0x3da>
+ .byte 196,226,125,24,61,116,43,0,0 // vbroadcastss 0x2b74(%rip),%ymm7 # 5de4 <_sk_callback_hsw+0x40a>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -16174,15 +16535,15 @@ _sk_load_g8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 308f <_sk_load_g8_dst_hsw+0x1f>
+ .byte 119,184 // ja 3247 <_sk_load_g8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 315c <_sk_load_g8_dst_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3314 <_sk_load_g8_dst_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,153 // jmp 308f <_sk_load_g8_dst_hsw+0x1f>
+ .byte 235,153 // jmp 3247 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -16190,7 +16551,7 @@ _sk_load_g8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,113,255,255,255 // jmpq 308f <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 3247 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -16201,7 +16562,7 @@ _sk_load_g8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,54,255,255,255 // jmpq 308f <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 3247 <_sk_load_g8_dst_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -16263,10 +16624,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,210,41,0,0 // vbroadcastss 0x29d2(%rip),%ymm1 # 5c00 <_sk_callback_hsw+0x3de>
+ .byte 196,226,125,24,13,2,42,0,0 // vbroadcastss 0x2a02(%rip),%ymm1 # 5de8 <_sk_callback_hsw+0x40e>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,199,41,0,0 // vbroadcastss 0x29c7(%rip),%ymm3 # 5c04 <_sk_callback_hsw+0x3e2>
+ .byte 196,226,125,24,29,247,41,0,0 // vbroadcastss 0x29f7(%rip),%ymm3 # 5dec <_sk_callback_hsw+0x412>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -16284,26 +16645,26 @@ _sk_load_565_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 32d6 <_sk_load_565_hsw+0x8f>
+ .byte 117,115 // jne 348e <_sk_load_565_hsw+0x8f>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,145,41,0,0 // vpbroadcastd 0x2991(%rip),%ymm0 # 5c08 <_sk_callback_hsw+0x3e6>
+ .byte 196,226,125,88,5,193,41,0,0 // vpbroadcastd 0x29c1(%rip),%ymm0 # 5df0 <_sk_callback_hsw+0x416>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,132,41,0,0 // vbroadcastss 0x2984(%rip),%ymm1 # 5c0c <_sk_callback_hsw+0x3ea>
+ .byte 196,226,125,24,13,180,41,0,0 // vbroadcastss 0x29b4(%rip),%ymm1 # 5df4 <_sk_callback_hsw+0x41a>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,123,41,0,0 // vpbroadcastd 0x297b(%rip),%ymm1 # 5c10 <_sk_callback_hsw+0x3ee>
+ .byte 196,226,125,88,13,171,41,0,0 // vpbroadcastd 0x29ab(%rip),%ymm1 # 5df8 <_sk_callback_hsw+0x41e>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,110,41,0,0 // vbroadcastss 0x296e(%rip),%ymm3 # 5c14 <_sk_callback_hsw+0x3f2>
+ .byte 196,226,125,24,29,158,41,0,0 // vbroadcastss 0x299e(%rip),%ymm3 # 5dfc <_sk_callback_hsw+0x422>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,101,41,0,0 // vpbroadcastd 0x2965(%rip),%ymm3 # 5c18 <_sk_callback_hsw+0x3f6>
+ .byte 196,226,125,88,29,149,41,0,0 // vpbroadcastd 0x2995(%rip),%ymm3 # 5e00 <_sk_callback_hsw+0x426>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,88,41,0,0 // vbroadcastss 0x2958(%rip),%ymm3 # 5c1c <_sk_callback_hsw+0x3fa>
+ .byte 196,226,125,24,29,136,41,0,0 // vbroadcastss 0x2988(%rip),%ymm3 # 5e04 <_sk_callback_hsw+0x42a>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,77,41,0,0 // vbroadcastss 0x294d(%rip),%ymm3 # 5c20 <_sk_callback_hsw+0x3fe>
+ .byte 196,226,125,24,29,125,41,0,0 // vbroadcastss 0x297d(%rip),%ymm3 # 5e08 <_sk_callback_hsw+0x42e>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -16311,27 +16672,27 @@ _sk_load_565_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 3269 <_sk_load_565_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 3421 <_sk_load_565_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 335c <_sk_load_565_hsw+0x115>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 3514 <_sk_load_565_hsw+0x115>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,89,255,255,255 // jmpq 3269 <_sk_load_565_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 3421 <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,60,255,255,255 // jmpq 3269 <_sk_load_565_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 3421 <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,15,255,255,255 // jmpq 3269 <_sk_load_565_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 3421 <_sk_load_565_hsw+0x22>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -16365,26 +16726,26 @@ _sk_load_565_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 3407 <_sk_load_565_dst_hsw+0x8f>
+ .byte 117,115 // jne 35bf <_sk_load_565_dst_hsw+0x8f>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6
- .byte 196,226,125,88,37,124,40,0,0 // vpbroadcastd 0x287c(%rip),%ymm4 # 5c24 <_sk_callback_hsw+0x402>
+ .byte 196,226,125,88,37,172,40,0,0 // vpbroadcastd 0x28ac(%rip),%ymm4 # 5e0c <_sk_callback_hsw+0x432>
.byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,111,40,0,0 // vbroadcastss 0x286f(%rip),%ymm5 # 5c28 <_sk_callback_hsw+0x406>
+ .byte 196,226,125,24,45,159,40,0,0 // vbroadcastss 0x289f(%rip),%ymm5 # 5e10 <_sk_callback_hsw+0x436>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,102,40,0,0 // vpbroadcastd 0x2866(%rip),%ymm5 # 5c2c <_sk_callback_hsw+0x40a>
+ .byte 196,226,125,88,45,150,40,0,0 // vpbroadcastd 0x2896(%rip),%ymm5 # 5e14 <_sk_callback_hsw+0x43a>
.byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,89,40,0,0 // vbroadcastss 0x2859(%rip),%ymm7 # 5c30 <_sk_callback_hsw+0x40e>
+ .byte 196,226,125,24,61,137,40,0,0 // vbroadcastss 0x2889(%rip),%ymm7 # 5e18 <_sk_callback_hsw+0x43e>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,88,61,80,40,0,0 // vpbroadcastd 0x2850(%rip),%ymm7 # 5c34 <_sk_callback_hsw+0x412>
+ .byte 196,226,125,88,61,128,40,0,0 // vpbroadcastd 0x2880(%rip),%ymm7 # 5e1c <_sk_callback_hsw+0x442>
.byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,67,40,0,0 // vbroadcastss 0x2843(%rip),%ymm7 # 5c38 <_sk_callback_hsw+0x416>
+ .byte 196,226,125,24,61,115,40,0,0 // vbroadcastss 0x2873(%rip),%ymm7 # 5e20 <_sk_callback_hsw+0x446>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,56,40,0,0 // vbroadcastss 0x2838(%rip),%ymm7 # 5c3c <_sk_callback_hsw+0x41a>
+ .byte 196,226,125,24,61,104,40,0,0 // vbroadcastss 0x2868(%rip),%ymm7 # 5e24 <_sk_callback_hsw+0x44a>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -16392,27 +16753,27 @@ _sk_load_565_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 339a <_sk_load_565_dst_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 3552 <_sk_load_565_dst_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 348c <_sk_load_565_dst_hsw+0x114>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3644 <_sk_load_565_dst_hsw+0x114>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,89,255,255,255 // jmpq 339a <_sk_load_565_dst_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 3552 <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,60,255,255,255 // jmpq 339a <_sk_load_565_dst_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 3552 <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,15,255,255,255 // jmpq 339a <_sk_load_565_dst_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 3552 <_sk_load_565_dst_hsw+0x22>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -16475,23 +16836,23 @@ _sk_gather_565_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,231,38,0,0 // vpbroadcastd 0x26e7(%rip),%ymm0 # 5c40 <_sk_callback_hsw+0x41e>
+ .byte 196,226,125,88,5,23,39,0,0 // vpbroadcastd 0x2717(%rip),%ymm0 # 5e28 <_sk_callback_hsw+0x44e>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,218,38,0,0 // vbroadcastss 0x26da(%rip),%ymm1 # 5c44 <_sk_callback_hsw+0x422>
+ .byte 196,226,125,24,13,10,39,0,0 // vbroadcastss 0x270a(%rip),%ymm1 # 5e2c <_sk_callback_hsw+0x452>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,209,38,0,0 // vpbroadcastd 0x26d1(%rip),%ymm1 # 5c48 <_sk_callback_hsw+0x426>
+ .byte 196,226,125,88,13,1,39,0,0 // vpbroadcastd 0x2701(%rip),%ymm1 # 5e30 <_sk_callback_hsw+0x456>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,196,38,0,0 // vbroadcastss 0x26c4(%rip),%ymm3 # 5c4c <_sk_callback_hsw+0x42a>
+ .byte 196,226,125,24,29,244,38,0,0 // vbroadcastss 0x26f4(%rip),%ymm3 # 5e34 <_sk_callback_hsw+0x45a>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,187,38,0,0 // vpbroadcastd 0x26bb(%rip),%ymm3 # 5c50 <_sk_callback_hsw+0x42e>
+ .byte 196,226,125,88,29,235,38,0,0 // vpbroadcastd 0x26eb(%rip),%ymm3 # 5e38 <_sk_callback_hsw+0x45e>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,174,38,0,0 // vbroadcastss 0x26ae(%rip),%ymm3 # 5c54 <_sk_callback_hsw+0x432>
+ .byte 196,226,125,24,29,222,38,0,0 // vbroadcastss 0x26de(%rip),%ymm3 # 5e3c <_sk_callback_hsw+0x462>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,163,38,0,0 // vbroadcastss 0x26a3(%rip),%ymm3 # 5c58 <_sk_callback_hsw+0x436>
+ .byte 196,226,125,24,29,211,38,0,0 // vbroadcastss 0x26d3(%rip),%ymm3 # 5e40 <_sk_callback_hsw+0x466>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_hsw
@@ -16506,11 +16867,11 @@ _sk_store_565_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,133,38,0,0 // vbroadcastss 0x2685(%rip),%ymm8 # 5c5c <_sk_callback_hsw+0x43a>
+ .byte 196,98,125,24,5,181,38,0,0 // vbroadcastss 0x26b5(%rip),%ymm8 # 5e44 <_sk_callback_hsw+0x46a>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,112,38,0,0 // vbroadcastss 0x2670(%rip),%ymm10 # 5c60 <_sk_callback_hsw+0x43e>
+ .byte 196,98,125,24,21,160,38,0,0 // vbroadcastss 0x26a0(%rip),%ymm10 # 5e48 <_sk_callback_hsw+0x46e>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -16521,7 +16882,7 @@ _sk_store_565_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 362f <_sk_store_565_hsw+0x78>
+ .byte 117,11 // jne 37e7 <_sk_store_565_hsw+0x78>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16530,22 +16891,22 @@ _sk_store_565_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 362a <_sk_store_565_hsw+0x73>
+ .byte 119,235 // ja 37e2 <_sk_store_565_hsw+0x73>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 368c <_sk_store_565_hsw+0xd5>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3844 <_sk_store_565_hsw+0xd5>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 362a <_sk_store_565_hsw+0x73>
+ .byte 235,206 // jmp 37e2 <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 362a <_sk_store_565_hsw+0x73>
+ .byte 235,190 // jmp 37e2 <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 362a <_sk_store_565_hsw+0x73>
+ .byte 235,158 // jmp 37e2 <_sk_store_565_hsw+0x73>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -16563,7 +16924,7 @@ _sk_store_565_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe10036a4 <_sk_callback_hsw+0xffffffffe0ffde82>
+ .byte 232,255,255,255,224 // callq ffffffffe100385c <_sk_callback_hsw+0xffffffffe0ffde82>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -16581,28 +16942,28 @@ _sk_load_4444_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 3753 <_sk_load_4444_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 390b <_sk_load_4444_hsw+0xab>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,136,37,0,0 // vpbroadcastd 0x2588(%rip),%ymm0 # 5c64 <_sk_callback_hsw+0x442>
+ .byte 196,226,125,88,5,184,37,0,0 // vpbroadcastd 0x25b8(%rip),%ymm0 # 5e4c <_sk_callback_hsw+0x472>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,123,37,0,0 // vbroadcastss 0x257b(%rip),%ymm1 # 5c68 <_sk_callback_hsw+0x446>
+ .byte 196,226,125,24,13,171,37,0,0 // vbroadcastss 0x25ab(%rip),%ymm1 # 5e50 <_sk_callback_hsw+0x476>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,114,37,0,0 // vpbroadcastd 0x2572(%rip),%ymm1 # 5c6c <_sk_callback_hsw+0x44a>
+ .byte 196,226,125,88,13,162,37,0,0 // vpbroadcastd 0x25a2(%rip),%ymm1 # 5e54 <_sk_callback_hsw+0x47a>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,101,37,0,0 // vbroadcastss 0x2565(%rip),%ymm2 # 5c70 <_sk_callback_hsw+0x44e>
+ .byte 196,226,125,24,21,149,37,0,0 // vbroadcastss 0x2595(%rip),%ymm2 # 5e58 <_sk_callback_hsw+0x47e>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,92,37,0,0 // vpbroadcastd 0x255c(%rip),%ymm2 # 5c74 <_sk_callback_hsw+0x452>
+ .byte 196,226,125,88,21,140,37,0,0 // vpbroadcastd 0x258c(%rip),%ymm2 # 5e5c <_sk_callback_hsw+0x482>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,79,37,0,0 // vbroadcastss 0x254f(%rip),%ymm8 # 5c78 <_sk_callback_hsw+0x456>
+ .byte 196,98,125,24,5,127,37,0,0 // vbroadcastss 0x257f(%rip),%ymm8 # 5e60 <_sk_callback_hsw+0x486>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,69,37,0,0 // vpbroadcastd 0x2545(%rip),%ymm8 # 5c7c <_sk_callback_hsw+0x45a>
+ .byte 196,98,125,88,5,117,37,0,0 // vpbroadcastd 0x2575(%rip),%ymm8 # 5e64 <_sk_callback_hsw+0x48a>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,55,37,0,0 // vbroadcastss 0x2537(%rip),%ymm8 # 5c80 <_sk_callback_hsw+0x45e>
+ .byte 196,98,125,24,5,103,37,0,0 // vbroadcastss 0x2567(%rip),%ymm8 # 5e68 <_sk_callback_hsw+0x48e>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16612,27 +16973,27 @@ _sk_load_4444_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 36ce <_sk_load_4444_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 3886 <_sk_load_4444_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 37d8 <_sk_load_4444_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3990 <_sk_load_4444_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,65,255,255,255 // jmpq 36ce <_sk_load_4444_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 3886 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,36,255,255,255 // jmpq 36ce <_sk_load_4444_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 3886 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,247,254,255,255 // jmpq 36ce <_sk_load_4444_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 3886 <_sk_load_4444_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -16667,28 +17028,28 @@ _sk_load_4444_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 389f <_sk_load_4444_dst_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 3a57 <_sk_load_4444_dst_hsw+0xab>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7
- .byte 196,226,125,88,37,92,36,0,0 // vpbroadcastd 0x245c(%rip),%ymm4 # 5c84 <_sk_callback_hsw+0x462>
+ .byte 196,226,125,88,37,140,36,0,0 // vpbroadcastd 0x248c(%rip),%ymm4 # 5e6c <_sk_callback_hsw+0x492>
.byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,79,36,0,0 // vbroadcastss 0x244f(%rip),%ymm5 # 5c88 <_sk_callback_hsw+0x466>
+ .byte 196,226,125,24,45,127,36,0,0 // vbroadcastss 0x247f(%rip),%ymm5 # 5e70 <_sk_callback_hsw+0x496>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,70,36,0,0 // vpbroadcastd 0x2446(%rip),%ymm5 # 5c8c <_sk_callback_hsw+0x46a>
+ .byte 196,226,125,88,45,118,36,0,0 // vpbroadcastd 0x2476(%rip),%ymm5 # 5e74 <_sk_callback_hsw+0x49a>
.byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,57,36,0,0 // vbroadcastss 0x2439(%rip),%ymm6 # 5c90 <_sk_callback_hsw+0x46e>
+ .byte 196,226,125,24,53,105,36,0,0 // vbroadcastss 0x2469(%rip),%ymm6 # 5e78 <_sk_callback_hsw+0x49e>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,88,53,48,36,0,0 // vpbroadcastd 0x2430(%rip),%ymm6 # 5c94 <_sk_callback_hsw+0x472>
+ .byte 196,226,125,88,53,96,36,0,0 // vpbroadcastd 0x2460(%rip),%ymm6 # 5e7c <_sk_callback_hsw+0x4a2>
.byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,35,36,0,0 // vbroadcastss 0x2423(%rip),%ymm8 # 5c98 <_sk_callback_hsw+0x476>
+ .byte 196,98,125,24,5,83,36,0,0 // vbroadcastss 0x2453(%rip),%ymm8 # 5e80 <_sk_callback_hsw+0x4a6>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,88,5,25,36,0,0 // vpbroadcastd 0x2419(%rip),%ymm8 # 5c9c <_sk_callback_hsw+0x47a>
+ .byte 196,98,125,88,5,73,36,0,0 // vpbroadcastd 0x2449(%rip),%ymm8 # 5e84 <_sk_callback_hsw+0x4aa>
.byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,11,36,0,0 // vbroadcastss 0x240b(%rip),%ymm8 # 5ca0 <_sk_callback_hsw+0x47e>
+ .byte 196,98,125,24,5,59,36,0,0 // vbroadcastss 0x243b(%rip),%ymm8 # 5e88 <_sk_callback_hsw+0x4ae>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16698,27 +17059,27 @@ _sk_load_4444_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 381a <_sk_load_4444_dst_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 39d2 <_sk_load_4444_dst_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3924 <_sk_load_4444_dst_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3adc <_sk_load_4444_dst_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,65,255,255,255 // jmpq 381a <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 39d2 <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,36,255,255,255 // jmpq 381a <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 39d2 <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,247,254,255,255 // jmpq 381a <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 39d2 <_sk_load_4444_dst_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -16781,25 +17142,25 @@ _sk_gather_4444_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,179,34,0,0 // vpbroadcastd 0x22b3(%rip),%ymm0 # 5ca4 <_sk_callback_hsw+0x482>
+ .byte 196,226,125,88,5,227,34,0,0 // vpbroadcastd 0x22e3(%rip),%ymm0 # 5e8c <_sk_callback_hsw+0x4b2>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,166,34,0,0 // vbroadcastss 0x22a6(%rip),%ymm1 # 5ca8 <_sk_callback_hsw+0x486>
+ .byte 196,226,125,24,13,214,34,0,0 // vbroadcastss 0x22d6(%rip),%ymm1 # 5e90 <_sk_callback_hsw+0x4b6>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,157,34,0,0 // vpbroadcastd 0x229d(%rip),%ymm1 # 5cac <_sk_callback_hsw+0x48a>
+ .byte 196,226,125,88,13,205,34,0,0 // vpbroadcastd 0x22cd(%rip),%ymm1 # 5e94 <_sk_callback_hsw+0x4ba>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,144,34,0,0 // vbroadcastss 0x2290(%rip),%ymm2 # 5cb0 <_sk_callback_hsw+0x48e>
+ .byte 196,226,125,24,21,192,34,0,0 // vbroadcastss 0x22c0(%rip),%ymm2 # 5e98 <_sk_callback_hsw+0x4be>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,135,34,0,0 // vpbroadcastd 0x2287(%rip),%ymm2 # 5cb4 <_sk_callback_hsw+0x492>
+ .byte 196,226,125,88,21,183,34,0,0 // vpbroadcastd 0x22b7(%rip),%ymm2 # 5e9c <_sk_callback_hsw+0x4c2>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,122,34,0,0 // vbroadcastss 0x227a(%rip),%ymm8 # 5cb8 <_sk_callback_hsw+0x496>
+ .byte 196,98,125,24,5,170,34,0,0 // vbroadcastss 0x22aa(%rip),%ymm8 # 5ea0 <_sk_callback_hsw+0x4c6>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,112,34,0,0 // vpbroadcastd 0x2270(%rip),%ymm8 # 5cbc <_sk_callback_hsw+0x49a>
+ .byte 196,98,125,88,5,160,34,0,0 // vpbroadcastd 0x22a0(%rip),%ymm8 # 5ea4 <_sk_callback_hsw+0x4ca>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,98,34,0,0 // vbroadcastss 0x2262(%rip),%ymm8 # 5cc0 <_sk_callback_hsw+0x49e>
+ .byte 196,98,125,24,5,146,34,0,0 // vbroadcastss 0x2292(%rip),%ymm8 # 5ea8 <_sk_callback_hsw+0x4ce>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16816,7 +17177,7 @@ _sk_store_4444_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,61,34,0,0 // vbroadcastss 0x223d(%rip),%ymm8 # 5cc4 <_sk_callback_hsw+0x4a2>
+ .byte 196,98,125,24,5,109,34,0,0 // vbroadcastss 0x226d(%rip),%ymm8 # 5eac <_sk_callback_hsw+0x4d2>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -16834,7 +17195,7 @@ _sk_store_4444_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3aeb <_sk_store_4444_hsw+0x84>
+ .byte 117,11 // jne 3ca3 <_sk_store_4444_hsw+0x84>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16843,22 +17204,22 @@ _sk_store_4444_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3ae6 <_sk_store_4444_hsw+0x7f>
+ .byte 119,235 // ja 3c9e <_sk_store_4444_hsw+0x7f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3b48 <_sk_store_4444_hsw+0xe1>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3d00 <_sk_store_4444_hsw+0xe1>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 3ae6 <_sk_store_4444_hsw+0x7f>
+ .byte 235,206 // jmp 3c9e <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 3ae6 <_sk_store_4444_hsw+0x7f>
+ .byte 235,190 // jmp 3c9e <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 3ae6 <_sk_store_4444_hsw+0x7f>
+ .byte 235,158 // jmp 3c9e <_sk_store_4444_hsw+0x7f>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -16876,7 +17237,7 @@ _sk_store_4444_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe1003b60 <_sk_callback_hsw+0xffffffffe0ffe33e>
+ .byte 232,255,255,255,224 // callq ffffffffe1003d18 <_sk_callback_hsw+0xffffffffe0ffe33e>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -16895,16 +17256,16 @@ _sk_load_8888_hsw:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3bde <_sk_load_8888_hsw+0x7a>
+ .byte 117,87 // jne 3d96 <_sk_load_8888_hsw+0x7a>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,228,84,5,77,35,0,0 // vandps 0x234d(%rip),%ymm3,%ymm0 # 5ee0 <_sk_callback_hsw+0x6be>
+ .byte 197,228,84,5,117,35,0,0 // vandps 0x2375(%rip),%ymm3,%ymm0 # 60c0 <_sk_callback_hsw+0x6e6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,40,33,0,0 // vbroadcastss 0x2128(%rip),%ymm8 # 5cc8 <_sk_callback_hsw+0x4a6>
+ .byte 196,98,125,24,5,88,33,0,0 // vbroadcastss 0x2158(%rip),%ymm8 # 5eb0 <_sk_callback_hsw+0x4d6>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,82,35,0,0 // vpshufb 0x2352(%rip),%ymm3,%ymm1 # 5f00 <_sk_callback_hsw+0x6de>
+ .byte 196,226,101,0,13,122,35,0,0 // vpshufb 0x237a(%rip),%ymm3,%ymm1 # 60e0 <_sk_callback_hsw+0x706>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,96,35,0,0 // vpshufb 0x2360(%rip),%ymm3,%ymm2 # 5f20 <_sk_callback_hsw+0x6fe>
+ .byte 196,226,101,0,21,136,35,0,0 // vpshufb 0x2388(%rip),%ymm3,%ymm2 # 6100 <_sk_callback_hsw+0x726>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -16921,7 +17282,7 @@ _sk_load_8888_hsw:
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
- .byte 235,135 // jmp 3b8b <_sk_load_8888_hsw+0x27>
+ .byte 235,135 // jmp 3d43 <_sk_load_8888_hsw+0x27>
HIDDEN _sk_load_8888_dst_hsw
.globl _sk_load_8888_dst_hsw
@@ -16937,16 +17298,16 @@ _sk_load_8888_dst_hsw:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3c7e <_sk_load_8888_dst_hsw+0x7a>
+ .byte 117,87 // jne 3e36 <_sk_load_8888_dst_hsw+0x7a>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,196,84,37,13,35,0,0 // vandps 0x230d(%rip),%ymm7,%ymm4 # 5f40 <_sk_callback_hsw+0x71e>
+ .byte 197,196,84,37,53,35,0,0 // vandps 0x2335(%rip),%ymm7,%ymm4 # 6120 <_sk_callback_hsw+0x746>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,140,32,0,0 // vbroadcastss 0x208c(%rip),%ymm8 # 5ccc <_sk_callback_hsw+0x4aa>
+ .byte 196,98,125,24,5,188,32,0,0 // vbroadcastss 0x20bc(%rip),%ymm8 # 5eb4 <_sk_callback_hsw+0x4da>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
- .byte 196,226,69,0,45,18,35,0,0 // vpshufb 0x2312(%rip),%ymm7,%ymm5 # 5f60 <_sk_callback_hsw+0x73e>
+ .byte 196,226,69,0,45,58,35,0,0 // vpshufb 0x233a(%rip),%ymm7,%ymm5 # 6140 <_sk_callback_hsw+0x766>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
.byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5
- .byte 196,226,69,0,53,32,35,0,0 // vpshufb 0x2320(%rip),%ymm7,%ymm6 # 5f80 <_sk_callback_hsw+0x75e>
+ .byte 196,226,69,0,53,72,35,0,0 // vpshufb 0x2348(%rip),%ymm7,%ymm6 # 6160 <_sk_callback_hsw+0x786>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -16963,7 +17324,7 @@ _sk_load_8888_dst_hsw:
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,125,33,228 // vpmovsxbd %xmm4,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
- .byte 235,135 // jmp 3c2b <_sk_load_8888_dst_hsw+0x27>
+ .byte 235,135 // jmp 3de3 <_sk_load_8888_dst_hsw+0x27>
HIDDEN _sk_gather_8888_hsw
.globl _sk_gather_8888_hsw
@@ -16978,14 +17339,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,206,34,0,0 // vpand 0x22ce(%rip),%ymm3,%ymm0 # 5fa0 <_sk_callback_hsw+0x77e>
+ .byte 197,229,219,5,246,34,0,0 // vpand 0x22f6(%rip),%ymm3,%ymm0 # 6180 <_sk_callback_hsw+0x7a6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,241,31,0,0 // vbroadcastss 0x1ff1(%rip),%ymm8 # 5cd0 <_sk_callback_hsw+0x4ae>
+ .byte 196,98,125,24,5,33,32,0,0 // vbroadcastss 0x2021(%rip),%ymm8 # 5eb8 <_sk_callback_hsw+0x4de>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,211,34,0,0 // vpshufb 0x22d3(%rip),%ymm3,%ymm1 # 5fc0 <_sk_callback_hsw+0x79e>
+ .byte 196,226,101,0,13,251,34,0,0 // vpshufb 0x22fb(%rip),%ymm3,%ymm1 # 61a0 <_sk_callback_hsw+0x7c6>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,225,34,0,0 // vpshufb 0x22e1(%rip),%ymm3,%ymm2 # 5fe0 <_sk_callback_hsw+0x7be>
+ .byte 196,226,101,0,21,9,35,0,0 // vpshufb 0x2309(%rip),%ymm3,%ymm2 # 61c0 <_sk_callback_hsw+0x7e6>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17007,7 +17368,7 @@ _sk_store_8888_hsw:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,147,31,0,0 // vbroadcastss 0x1f93(%rip),%ymm8 # 5cd4 <_sk_callback_hsw+0x4b2>
+ .byte 196,98,125,24,5,195,31,0,0 // vbroadcastss 0x1fc3(%rip),%ymm8 # 5ebc <_sk_callback_hsw+0x4e2>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -17023,7 +17384,7 @@ _sk_store_8888_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3d9a <_sk_store_8888_hsw+0x80>
+ .byte 117,11 // jne 3f52 <_sk_store_8888_hsw+0x80>
.byte 197,124,17,0 // vmovups %ymm8,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -17036,7 +17397,7 @@ _sk_store_8888_hsw:
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
- .byte 235,211 // jmp 3d93 <_sk_store_8888_hsw+0x79>
+ .byte 235,211 // jmp 3f4b <_sk_store_8888_hsw+0x79>
HIDDEN _sk_load_bgra_hsw
.globl _sk_load_bgra_hsw
@@ -17052,16 +17413,16 @@ _sk_load_bgra_hsw:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3e3a <_sk_load_bgra_hsw+0x7a>
+ .byte 117,87 // jne 3ff2 <_sk_load_bgra_hsw+0x7a>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,228,84,5,17,34,0,0 // vandps 0x2211(%rip),%ymm3,%ymm0 # 6000 <_sk_callback_hsw+0x7de>
+ .byte 197,228,84,5,57,34,0,0 // vandps 0x2239(%rip),%ymm3,%ymm0 # 61e0 <_sk_callback_hsw+0x806>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,220,30,0,0 // vbroadcastss 0x1edc(%rip),%ymm8 # 5cd8 <_sk_callback_hsw+0x4b6>
+ .byte 196,98,125,24,5,12,31,0,0 // vbroadcastss 0x1f0c(%rip),%ymm8 # 5ec0 <_sk_callback_hsw+0x4e6>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,22,34,0,0 // vpshufb 0x2216(%rip),%ymm3,%ymm0 # 6020 <_sk_callback_hsw+0x7fe>
+ .byte 196,226,101,0,5,62,34,0,0 // vpshufb 0x223e(%rip),%ymm3,%ymm0 # 6200 <_sk_callback_hsw+0x826>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,36,34,0,0 // vpshufb 0x2224(%rip),%ymm3,%ymm0 # 6040 <_sk_callback_hsw+0x81e>
+ .byte 196,226,101,0,5,76,34,0,0 // vpshufb 0x224c(%rip),%ymm3,%ymm0 # 6220 <_sk_callback_hsw+0x846>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17078,7 +17439,7 @@ _sk_load_bgra_hsw:
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
- .byte 235,135 // jmp 3de7 <_sk_load_bgra_hsw+0x27>
+ .byte 235,135 // jmp 3f9f <_sk_load_bgra_hsw+0x27>
HIDDEN _sk_load_bgra_dst_hsw
.globl _sk_load_bgra_dst_hsw
@@ -17094,16 +17455,16 @@ _sk_load_bgra_dst_hsw:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3eda <_sk_load_bgra_dst_hsw+0x7a>
+ .byte 117,87 // jne 4092 <_sk_load_bgra_dst_hsw+0x7a>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,196,84,37,209,33,0,0 // vandps 0x21d1(%rip),%ymm7,%ymm4 # 6060 <_sk_callback_hsw+0x83e>
+ .byte 197,196,84,37,249,33,0,0 // vandps 0x21f9(%rip),%ymm7,%ymm4 # 6240 <_sk_callback_hsw+0x866>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,64,30,0,0 // vbroadcastss 0x1e40(%rip),%ymm8 # 5cdc <_sk_callback_hsw+0x4ba>
+ .byte 196,98,125,24,5,112,30,0,0 // vbroadcastss 0x1e70(%rip),%ymm8 # 5ec4 <_sk_callback_hsw+0x4ea>
.byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6
- .byte 196,226,69,0,37,214,33,0,0 // vpshufb 0x21d6(%rip),%ymm7,%ymm4 # 6080 <_sk_callback_hsw+0x85e>
+ .byte 196,226,69,0,37,254,33,0,0 // vpshufb 0x21fe(%rip),%ymm7,%ymm4 # 6260 <_sk_callback_hsw+0x886>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5
- .byte 196,226,69,0,37,228,33,0,0 // vpshufb 0x21e4(%rip),%ymm7,%ymm4 # 60a0 <_sk_callback_hsw+0x87e>
+ .byte 196,226,69,0,37,12,34,0,0 // vpshufb 0x220c(%rip),%ymm7,%ymm4 # 6280 <_sk_callback_hsw+0x8a6>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -17120,7 +17481,7 @@ _sk_load_bgra_dst_hsw:
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,125,33,228 // vpmovsxbd %xmm4,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
- .byte 235,135 // jmp 3e87 <_sk_load_bgra_dst_hsw+0x27>
+ .byte 235,135 // jmp 403f <_sk_load_bgra_dst_hsw+0x27>
HIDDEN _sk_gather_bgra_hsw
.globl _sk_gather_bgra_hsw
@@ -17135,14 +17496,14 @@ _sk_gather_bgra_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,146,33,0,0 // vpand 0x2192(%rip),%ymm3,%ymm0 # 60c0 <_sk_callback_hsw+0x89e>
+ .byte 197,229,219,5,186,33,0,0 // vpand 0x21ba(%rip),%ymm3,%ymm0 # 62a0 <_sk_callback_hsw+0x8c6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,165,29,0,0 // vbroadcastss 0x1da5(%rip),%ymm8 # 5ce0 <_sk_callback_hsw+0x4be>
+ .byte 196,98,125,24,5,213,29,0,0 // vbroadcastss 0x1dd5(%rip),%ymm8 # 5ec8 <_sk_callback_hsw+0x4ee>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,151,33,0,0 // vpshufb 0x2197(%rip),%ymm3,%ymm0 # 60e0 <_sk_callback_hsw+0x8be>
+ .byte 196,226,101,0,5,191,33,0,0 // vpshufb 0x21bf(%rip),%ymm3,%ymm0 # 62c0 <_sk_callback_hsw+0x8e6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,165,33,0,0 // vpshufb 0x21a5(%rip),%ymm3,%ymm0 # 6100 <_sk_callback_hsw+0x8de>
+ .byte 196,226,101,0,5,205,33,0,0 // vpshufb 0x21cd(%rip),%ymm3,%ymm0 # 62e0 <_sk_callback_hsw+0x906>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17164,7 +17525,7 @@ _sk_store_bgra_hsw:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,71,29,0,0 // vbroadcastss 0x1d47(%rip),%ymm8 # 5ce4 <_sk_callback_hsw+0x4c2>
+ .byte 196,98,125,24,5,119,29,0,0 // vbroadcastss 0x1d77(%rip),%ymm8 # 5ecc <_sk_callback_hsw+0x4f2>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -17180,7 +17541,7 @@ _sk_store_bgra_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3ff6 <_sk_store_bgra_hsw+0x80>
+ .byte 117,11 // jne 41ae <_sk_store_bgra_hsw+0x80>
.byte 197,124,17,0 // vmovups %ymm8,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -17193,7 +17554,7 @@ _sk_store_bgra_hsw:
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
- .byte 235,211 // jmp 3fef <_sk_store_bgra_hsw+0x79>
+ .byte 235,211 // jmp 41a7 <_sk_store_bgra_hsw+0x79>
HIDDEN _sk_load_f16_hsw
.globl _sk_load_f16_hsw
@@ -17207,7 +17568,7 @@ _sk_load_f16_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 409d <_sk_load_f16_hsw+0x81>
+ .byte 117,101 // jne 4255 <_sk_load_f16_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,92,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm3
@@ -17233,29 +17594,29 @@ _sk_load_f16_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4103 <_sk_load_f16_hsw+0xe7>
+ .byte 116,85 // je 42bb <_sk_load_f16_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4103 <_sk_load_f16_hsw+0xe7>
+ .byte 114,72 // jb 42bb <_sk_load_f16_hsw+0xe7>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4110 <_sk_load_f16_hsw+0xf4>
+ .byte 116,72 // je 42c8 <_sk_load_f16_hsw+0xf4>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4110 <_sk_load_f16_hsw+0xf4>
+ .byte 114,59 // jb 42c8 <_sk_load_f16_hsw+0xf4>
.byte 196,193,123,16,92,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 4053 <_sk_load_f16_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 420b <_sk_load_f16_hsw+0x37>
.byte 196,193,97,22,92,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 4053 <_sk_load_f16_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 420b <_sk_load_f16_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 4053 <_sk_load_f16_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 420b <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,67,255,255,255 // jmpq 4053 <_sk_load_f16_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 420b <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,58,255,255,255 // jmpq 4053 <_sk_load_f16_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 420b <_sk_load_f16_hsw+0x37>
HIDDEN _sk_load_f16_dst_hsw
.globl _sk_load_f16_dst_hsw
@@ -17269,7 +17630,7 @@ _sk_load_f16_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 419a <_sk_load_f16_dst_hsw+0x81>
+ .byte 117,101 // jne 4352 <_sk_load_f16_dst_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,124,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm7
@@ -17295,29 +17656,29 @@ _sk_load_f16_dst_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4200 <_sk_load_f16_dst_hsw+0xe7>
+ .byte 116,85 // je 43b8 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4200 <_sk_load_f16_dst_hsw+0xe7>
+ .byte 114,72 // jb 43b8 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 420d <_sk_load_f16_dst_hsw+0xf4>
+ .byte 116,72 // je 43c5 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 420d <_sk_load_f16_dst_hsw+0xf4>
+ .byte 114,59 // jb 43c5 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,123,16,124,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm7
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 4308 <_sk_load_f16_dst_hsw+0x37>
.byte 196,193,65,22,124,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 4308 <_sk_load_f16_dst_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 4308 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,67,255,255,255 // jmpq 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 4308 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
- .byte 233,58,255,255,255 // jmpq 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 4308 <_sk_load_f16_dst_hsw+0x37>
HIDDEN _sk_gather_f16_hsw
.globl _sk_gather_f16_hsw
@@ -17380,7 +17741,7 @@ _sk_store_f16_hsw:
.byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9
.byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 431b <_sk_store_f16_hsw+0x7b>
+ .byte 117,31 // jne 44d3 <_sk_store_f16_hsw+0x7b>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -17389,22 +17750,22 @@ _sk_store_f16_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4317 <_sk_store_f16_hsw+0x77>
+ .byte 116,240 // je 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4317 <_sk_store_f16_hsw+0x77>
+ .byte 114,227 // jb 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,218 // je 4317 <_sk_store_f16_hsw+0x77>
+ .byte 116,218 // je 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4317 <_sk_store_f16_hsw+0x77>
+ .byte 114,205 // jb 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,196 // je 4317 <_sk_store_f16_hsw+0x77>
+ .byte 116,196 // je 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4317 <_sk_store_f16_hsw+0x77>
+ .byte 114,183 // jb 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,174 // jmp 4317 <_sk_store_f16_hsw+0x77>
+ .byte 235,174 // jmp 44cf <_sk_store_f16_hsw+0x77>
HIDDEN _sk_load_u16_be_hsw
.globl _sk_load_u16_be_hsw
@@ -17419,7 +17780,7 @@ _sk_load_u16_be_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 445c <_sk_load_u16_be_hsw+0xf3>
+ .byte 15,133,204,0,0,0 // jne 4614 <_sk_load_u16_be_hsw+0xf3>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -17438,7 +17799,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,247,24,0,0 // vbroadcastss 0x18f7(%rip),%ymm10 # 5ce8 <_sk_callback_hsw+0x4c6>
+ .byte 196,98,125,24,21,39,25,0,0 // vbroadcastss 0x1927(%rip),%ymm10 # 5ed0 <_sk_callback_hsw+0x4f6>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -17466,29 +17827,29 @@ _sk_load_u16_be_hsw:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 44c2 <_sk_load_u16_be_hsw+0x159>
+ .byte 116,85 // je 467a <_sk_load_u16_be_hsw+0x159>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 44c2 <_sk_load_u16_be_hsw+0x159>
+ .byte 114,72 // jb 467a <_sk_load_u16_be_hsw+0x159>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 44cf <_sk_load_u16_be_hsw+0x166>
+ .byte 116,72 // je 4687 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 44cf <_sk_load_u16_be_hsw+0x166>
+ .byte 114,59 // jb 4687 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,6,255,255,255 // je 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 15,132,6,255,255,255 // je 4563 <_sk_load_u16_be_hsw+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,245,254,255,255 // jb 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 15,130,245,254,255,255 // jb 4563 <_sk_load_u16_be_hsw+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,233,254,255,255 // jmpq 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 233,233,254,255,255 // jmpq 4563 <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,220,254,255,255 // jmpq 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 233,220,254,255,255 // jmpq 4563 <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,211,254,255,255 // jmpq 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 233,211,254,255,255 // jmpq 4563 <_sk_load_u16_be_hsw+0x42>
HIDDEN _sk_load_rgb_u16_be_hsw
.globl _sk_load_rgb_u16_be_hsw
@@ -17505,7 +17866,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 45cf <_sk_load_rgb_u16_be_hsw+0xf7>
+ .byte 15,133,204,0,0,0 // jne 4787 <_sk_load_rgb_u16_be_hsw+0xf7>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -17529,7 +17890,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,111,23,0,0 // vbroadcastss 0x176f(%rip),%ymm10 # 5cec <_sk_callback_hsw+0x4ca>
+ .byte 196,98,125,24,21,159,23,0,0 // vbroadcastss 0x179f(%rip),%ymm10 # 5ed4 <_sk_callback_hsw+0x4fa>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -17546,41 +17907,41 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,35,23,0,0 // vbroadcastss 0x1723(%rip),%ymm3 # 5cf0 <_sk_callback_hsw+0x4ce>
+ .byte 196,226,125,24,29,83,23,0,0 // vbroadcastss 0x1753(%rip),%ymm3 # 5ed8 <_sk_callback_hsw+0x4fe>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 45e8 <_sk_load_rgb_u16_be_hsw+0x110>
- .byte 233,79,255,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,5 // jne 47a0 <_sk_load_rgb_u16_be_hsw+0x110>
+ .byte 233,79,255,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 4617 <_sk_load_rgb_u16_be_hsw+0x13f>
+ .byte 114,26 // jb 47cf <_sk_load_rgb_u16_be_hsw+0x13f>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 461c <_sk_load_rgb_u16_be_hsw+0x144>
- .byte 233,32,255,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,27,255,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,10 // jne 47d4 <_sk_load_rgb_u16_be_hsw+0x144>
+ .byte 233,32,255,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,27,255,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 464b <_sk_load_rgb_u16_be_hsw+0x173>
+ .byte 114,26 // jb 4803 <_sk_load_rgb_u16_be_hsw+0x173>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 4650 <_sk_load_rgb_u16_be_hsw+0x178>
- .byte 233,236,254,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,231,254,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,10 // jne 4808 <_sk_load_rgb_u16_be_hsw+0x178>
+ .byte 233,236,254,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,231,254,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 4679 <_sk_load_rgb_u16_be_hsw+0x1a1>
+ .byte 114,20 // jb 4831 <_sk_load_rgb_u16_be_hsw+0x1a1>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,190,254,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,185,254,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,190,254,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,185,254,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
HIDDEN _sk_store_u16_be_hsw
.globl _sk_store_u16_be_hsw
@@ -17594,7 +17955,7 @@ _sk_store_u16_be_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,79,22,0,0 // vbroadcastss 0x164f(%rip),%ymm8 # 5cf4 <_sk_callback_hsw+0x4d2>
+ .byte 196,98,125,24,5,127,22,0,0 // vbroadcastss 0x167f(%rip),%ymm8 # 5edc <_sk_callback_hsw+0x502>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -17632,7 +17993,7 @@ _sk_store_u16_be_hsw:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 4789 <_sk_store_u16_be_hsw+0x10b>
+ .byte 117,31 // jne 4941 <_sk_store_u16_be_hsw+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -17641,22 +18002,22 @@ _sk_store_u16_be_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,240 // je 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,227 // jb 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,218 // je 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,205 // jb 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,196 // je 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,183 // jb 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 235,174 // jmp 493d <_sk_store_u16_be_hsw+0x107>
HIDDEN _sk_load_f32_hsw
.globl _sk_load_f32_hsw
@@ -17664,7 +18025,7 @@ FUNCTION(_sk_load_f32_hsw)
_sk_load_f32_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 4863 <_sk_load_f32_hsw+0x8c>
+ .byte 15,135,128,0,0,0 // ja 4a1b <_sk_load_f32_hsw+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -17672,7 +18033,7 @@ _sk_load_f32_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 488c <_sk_load_f32_hsw+0xb5>
+ .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 4a44 <_sk_load_f32_hsw+0xb5>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -17720,7 +18081,7 @@ FUNCTION(_sk_load_f32_dst_hsw)
_sk_load_f32_dst_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 4938 <_sk_load_f32_dst_hsw+0x8c>
+ .byte 15,135,128,0,0,0 // ja 4af0 <_sk_load_f32_dst_hsw+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -17728,7 +18089,7 @@ _sk_load_f32_dst_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 4960 <_sk_load_f32_dst_hsw+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 4b18 <_sk_load_f32_dst_hsw+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -17792,7 +18153,7 @@ _sk_store_f32_hsw:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne 49ff <_sk_store_f32_hsw+0x7f>
+ .byte 117,55 // jne 4bb7 <_sk_store_f32_hsw+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -17805,22 +18166,22 @@ _sk_store_f32_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 116,240 // je 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 114,227 // jb 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 116,218 // je 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 114,205 // jb 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 116,195 // je 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 114,181 // jb 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 235,171 // jmp 4bb3 <_sk_store_f32_hsw+0x7b>
HIDDEN _sk_clamp_x_hsw
.globl _sk_clamp_x_hsw
@@ -17897,7 +18258,7 @@ _sk_mirror_x_hsw:
.byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8
- .byte 197,178,89,5,203,17,0,0 // vmulss 0x11cb(%rip),%xmm9,%xmm0 # 5cf8 <_sk_callback_hsw+0x4d6>
+ .byte 197,178,89,5,251,17,0,0 // vmulss 0x11fb(%rip),%xmm9,%xmm0 # 5ee0 <_sk_callback_hsw+0x506>
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
.byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0
@@ -17924,7 +18285,7 @@ _sk_mirror_y_hsw:
.byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8
- .byte 197,178,89,13,107,17,0,0 // vmulss 0x116b(%rip),%xmm9,%xmm1 # 5cfc <_sk_callback_hsw+0x4da>
+ .byte 197,178,89,13,155,17,0,0 // vmulss 0x119b(%rip),%xmm9,%xmm1 # 5ee4 <_sk_callback_hsw+0x50a>
.byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
.byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1
@@ -17946,7 +18307,7 @@ FUNCTION(_sk_clamp_x_1_hsw)
_sk_clamp_x_1_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,32,17,0,0 // vbroadcastss 0x1120(%rip),%ymm8 # 5d00 <_sk_callback_hsw+0x4de>
+ .byte 196,98,125,24,5,80,17,0,0 // vbroadcastss 0x1150(%rip),%ymm8 # 5ee8 <_sk_callback_hsw+0x50e>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -17964,9 +18325,9 @@ HIDDEN _sk_mirror_x_1_hsw
.globl _sk_mirror_x_1_hsw
FUNCTION(_sk_mirror_x_1_hsw)
_sk_mirror_x_1_hsw:
- .byte 196,98,125,24,5,3,17,0,0 // vbroadcastss 0x1103(%rip),%ymm8 # 5d04 <_sk_callback_hsw+0x4e2>
+ .byte 196,98,125,24,5,51,17,0,0 // vbroadcastss 0x1133(%rip),%ymm8 # 5eec <_sk_callback_hsw+0x512>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,249,16,0,0 // vbroadcastss 0x10f9(%rip),%ymm9 # 5d08 <_sk_callback_hsw+0x4e6>
+ .byte 196,98,125,24,13,41,17,0,0 // vbroadcastss 0x1129(%rip),%ymm9 # 5ef0 <_sk_callback_hsw+0x516>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -17982,11 +18343,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,201,16,0,0 // vbroadcastss 0x10c9(%rip),%ymm3 # 5d0c <_sk_callback_hsw+0x4ea>
- .byte 196,98,125,24,5,196,16,0,0 // vbroadcastss 0x10c4(%rip),%ymm8 # 5d10 <_sk_callback_hsw+0x4ee>
+ .byte 196,226,125,24,29,249,16,0,0 // vbroadcastss 0x10f9(%rip),%ymm3 # 5ef4 <_sk_callback_hsw+0x51a>
+ .byte 196,98,125,24,5,244,16,0,0 // vbroadcastss 0x10f4(%rip),%ymm8 # 5ef8 <_sk_callback_hsw+0x51e>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,181,16,0,0 // vbroadcastss 0x10b5(%rip),%ymm3 # 5d14 <_sk_callback_hsw+0x4f2>
+ .byte 196,226,125,24,29,229,16,0,0 // vbroadcastss 0x10e5(%rip),%ymm3 # 5efc <_sk_callback_hsw+0x522>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -18186,9 +18547,9 @@ _sk_evenly_spaced_gradient_hsw:
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 77,137,211 // mov %r10,%r11
.byte 73,255,203 // dec %r11
- .byte 120,7 // js 4f58 <_sk_evenly_spaced_gradient_hsw+0x19>
+ .byte 120,7 // js 5110 <_sk_evenly_spaced_gradient_hsw+0x19>
.byte 196,193,242,42,203 // vcvtsi2ss %r11,%xmm1,%xmm1
- .byte 235,22 // jmp 4f6e <_sk_evenly_spaced_gradient_hsw+0x2f>
+ .byte 235,22 // jmp 5126 <_sk_evenly_spaced_gradient_hsw+0x2f>
.byte 76,137,219 // mov %r11,%rbx
.byte 72,209,235 // shr %rbx
.byte 65,131,227,1 // and $0x1,%r11d
@@ -18199,7 +18560,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1
.byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11
.byte 73,131,250,8 // cmp $0x8,%r10
- .byte 119,70 // ja 4fc7 <_sk_evenly_spaced_gradient_hsw+0x88>
+ .byte 119,70 // ja 517f <_sk_evenly_spaced_gradient_hsw+0x88>
.byte 196,66,37,22,1 // vpermps (%r9),%ymm11,%ymm8
.byte 72,139,88,40 // mov 0x28(%rax),%rbx
.byte 196,98,37,22,11 // vpermps (%rbx),%ymm11,%ymm9
@@ -18215,7 +18576,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 196,226,37,22,27 // vpermps (%rbx),%ymm11,%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13
- .byte 235,110 // jmp 5035 <_sk_evenly_spaced_gradient_hsw+0xf6>
+ .byte 235,110 // jmp 51ed <_sk_evenly_spaced_gradient_hsw+0xf6>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,153 // vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -18252,14 +18613,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw
.globl _sk_gauss_a_to_rgba_hsw
FUNCTION(_sk_gauss_a_to_rgba_hsw)
_sk_gauss_a_to_rgba_hsw:
- .byte 196,226,125,24,5,189,12,0,0 // vbroadcastss 0xcbd(%rip),%ymm0 # 5d18 <_sk_callback_hsw+0x4f6>
- .byte 196,226,125,24,13,184,12,0,0 // vbroadcastss 0xcb8(%rip),%ymm1 # 5d1c <_sk_callback_hsw+0x4fa>
+ .byte 196,226,125,24,5,237,12,0,0 // vbroadcastss 0xced(%rip),%ymm0 # 5f00 <_sk_callback_hsw+0x526>
+ .byte 196,226,125,24,13,232,12,0,0 // vbroadcastss 0xce8(%rip),%ymm1 # 5f04 <_sk_callback_hsw+0x52a>
.byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,174,12,0,0 // vbroadcastss 0xcae(%rip),%ymm0 # 5d20 <_sk_callback_hsw+0x4fe>
+ .byte 196,226,125,24,5,222,12,0,0 // vbroadcastss 0xcde(%rip),%ymm0 # 5f08 <_sk_callback_hsw+0x52e>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
- .byte 196,226,125,24,13,164,12,0,0 // vbroadcastss 0xca4(%rip),%ymm1 # 5d24 <_sk_callback_hsw+0x502>
+ .byte 196,226,125,24,13,212,12,0,0 // vbroadcastss 0xcd4(%rip),%ymm1 # 5f0c <_sk_callback_hsw+0x532>
.byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,154,12,0,0 // vbroadcastss 0xc9a(%rip),%ymm0 # 5d28 <_sk_callback_hsw+0x506>
+ .byte 196,226,125,24,5,202,12,0,0 // vbroadcastss 0xcca(%rip),%ymm0 # 5f10 <_sk_callback_hsw+0x536>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -18274,11 +18635,11 @@ _sk_gradient_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 73,131,249,1 // cmp $0x1,%r9
- .byte 15,134,180,0,0,0 // jbe 5166 <_sk_gradient_hsw+0xc3>
+ .byte 15,134,180,0,0,0 // jbe 531e <_sk_gradient_hsw+0xc3>
.byte 76,139,80,72 // mov 0x48(%rax),%r10
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 65,187,1,0,0,0 // mov $0x1,%r11d
- .byte 196,226,125,24,21,99,12,0,0 // vbroadcastss 0xc63(%rip),%ymm2 # 5d2c <_sk_callback_hsw+0x50a>
+ .byte 196,226,125,24,21,147,12,0,0 // vbroadcastss 0xc93(%rip),%ymm2 # 5f14 <_sk_callback_hsw+0x53a>
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
.byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3
.byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3
@@ -18286,10 +18647,10 @@ _sk_gradient_hsw:
.byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9
.byte 73,255,195 // inc %r11
.byte 77,57,217 // cmp %r11,%r9
- .byte 117,226 // jne 50ce <_sk_gradient_hsw+0x2b>
+ .byte 117,226 // jne 5286 <_sk_gradient_hsw+0x2b>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 73,131,249,8 // cmp $0x8,%r9
- .byte 118,121 // jbe 516f <_sk_gradient_hsw+0xcc>
+ .byte 118,121 // jbe 5327 <_sk_gradient_hsw+0xcc>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,138 // vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -18313,7 +18674,7 @@ _sk_gradient_hsw:
.byte 196,130,21,146,28,137 // vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- .byte 235,77 // jmp 51b3 <_sk_gradient_hsw+0x110>
+ .byte 235,77 // jmp 536b <_sk_gradient_hsw+0x110>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 196,66,53,22,2 // vpermps (%r10),%ymm9,%ymm8
@@ -18373,24 +18734,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,226,10,0,0 // vbroadcastss 0xae2(%rip),%ymm13 # 5d30 <_sk_callback_hsw+0x50e>
- .byte 196,98,125,24,53,221,10,0,0 // vbroadcastss 0xadd(%rip),%ymm14 # 5d34 <_sk_callback_hsw+0x512>
+ .byte 196,98,125,24,45,18,11,0,0 // vbroadcastss 0xb12(%rip),%ymm13 # 5f18 <_sk_callback_hsw+0x53e>
+ .byte 196,98,125,24,53,13,11,0,0 // vbroadcastss 0xb0d(%rip),%ymm14 # 5f1c <_sk_callback_hsw+0x542>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,211,10,0,0 // vbroadcastss 0xad3(%rip),%ymm13 # 5d38 <_sk_callback_hsw+0x516>
+ .byte 196,98,125,24,45,3,11,0,0 // vbroadcastss 0xb03(%rip),%ymm13 # 5f20 <_sk_callback_hsw+0x546>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,201,10,0,0 // vbroadcastss 0xac9(%rip),%ymm14 # 5d3c <_sk_callback_hsw+0x51a>
+ .byte 196,98,125,24,53,249,10,0,0 // vbroadcastss 0xaf9(%rip),%ymm14 # 5f24 <_sk_callback_hsw+0x54a>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,180,10,0,0 // vbroadcastss 0xab4(%rip),%ymm10 # 5d40 <_sk_callback_hsw+0x51e>
+ .byte 196,98,125,24,21,228,10,0,0 // vbroadcastss 0xae4(%rip),%ymm10 # 5f28 <_sk_callback_hsw+0x54e>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,158,10,0,0 // vbroadcastss 0xa9e(%rip),%ymm10 # 5d44 <_sk_callback_hsw+0x522>
+ .byte 196,98,125,24,21,206,10,0,0 // vbroadcastss 0xace(%rip),%ymm10 # 5f2c <_sk_callback_hsw+0x552>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,136,10,0,0 // vbroadcastss 0xa88(%rip),%ymm10 # 5d48 <_sk_callback_hsw+0x526>
+ .byte 196,98,125,24,21,184,10,0,0 // vbroadcastss 0xab8(%rip),%ymm10 # 5f30 <_sk_callback_hsw+0x556>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -18418,23 +18779,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,60,10,0,0 // vbroadcastss 0xa3c(%rip),%ymm11 # 5d4c <_sk_callback_hsw+0x52a>
+ .byte 196,98,125,24,29,108,10,0,0 // vbroadcastss 0xa6c(%rip),%ymm11 # 5f34 <_sk_callback_hsw+0x55a>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,27,10,0,0 // vbroadcastss 0xa1b(%rip),%ymm9 # 5d50 <_sk_callback_hsw+0x52e>
+ .byte 196,98,125,24,13,75,10,0,0 // vbroadcastss 0xa4b(%rip),%ymm9 # 5f38 <_sk_callback_hsw+0x55e>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,254,9,0,0 // vbroadcastss 0x9fe(%rip),%ymm9 # 5d54 <_sk_callback_hsw+0x532>
+ .byte 196,98,125,24,13,46,10,0,0 // vbroadcastss 0xa2e(%rip),%ymm9 # 5f3c <_sk_callback_hsw+0x562>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,239,9,0,0 // vbroadcastss 0x9ef(%rip),%ymm11 # 5d58 <_sk_callback_hsw+0x536>
+ .byte 196,98,125,24,29,31,10,0,0 // vbroadcastss 0xa1f(%rip),%ymm11 # 5f40 <_sk_callback_hsw+0x566>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -18453,23 +18814,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,180,9,0,0 // vbroadcastss 0x9b4(%rip),%ymm11 # 5d5c <_sk_callback_hsw+0x53a>
+ .byte 196,98,125,24,29,228,9,0,0 // vbroadcastss 0x9e4(%rip),%ymm11 # 5f44 <_sk_callback_hsw+0x56a>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,147,9,0,0 // vbroadcastss 0x993(%rip),%ymm9 # 5d60 <_sk_callback_hsw+0x53e>
+ .byte 196,98,125,24,13,195,9,0,0 // vbroadcastss 0x9c3(%rip),%ymm9 # 5f48 <_sk_callback_hsw+0x56e>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,118,9,0,0 // vbroadcastss 0x976(%rip),%ymm9 # 5d64 <_sk_callback_hsw+0x542>
+ .byte 196,98,125,24,13,166,9,0,0 // vbroadcastss 0x9a6(%rip),%ymm9 # 5f4c <_sk_callback_hsw+0x572>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,103,9,0,0 // vbroadcastss 0x967(%rip),%ymm11 # 5d68 <_sk_callback_hsw+0x546>
+ .byte 196,98,125,24,29,151,9,0,0 // vbroadcastss 0x997(%rip),%ymm11 # 5f50 <_sk_callback_hsw+0x576>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -18487,14 +18848,14 @@ _sk_xy_to_2pt_conical_linear_hsw:
.byte 197,58,89,72,44 // vmulss 0x2c(%rax),%xmm8,%xmm9
.byte 196,66,125,24,201 // vbroadcastss %xmm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,50,9,0,0 // vbroadcastss 0x932(%rip),%ymm10 # 5d6c <_sk_callback_hsw+0x54a>
+ .byte 196,98,125,24,21,98,9,0,0 // vbroadcastss 0x962(%rip),%ymm10 # 5f54 <_sk_callback_hsw+0x57a>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
.byte 196,98,125,184,208 // vfmadd231ps %ymm0,%ymm0,%ymm10
.byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,17,9,0,0 // vbroadcastss 0x911(%rip),%ymm8 # 5d70 <_sk_callback_hsw+0x54e>
+ .byte 196,98,125,24,5,65,9,0,0 // vbroadcastss 0x941(%rip),%ymm8 # 5f58 <_sk_callback_hsw+0x57e>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18534,7 +18895,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,177,8,0,0 // vbroadcastss 0x8b1(%rip),%ymm8 # 5d74 <_sk_callback_hsw+0x552>
+ .byte 196,98,125,24,5,225,8,0,0 // vbroadcastss 0x8e1(%rip),%ymm8 # 5f5c <_sk_callback_hsw+0x582>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -18568,9 +18929,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,69,8,0,0 // vbroadcastss 0x845(%rip),%ymm0 # 5d78 <_sk_callback_hsw+0x556>
+ .byte 196,226,125,24,5,117,8,0,0 // vbroadcastss 0x875(%rip),%ymm0 # 5f60 <_sk_callback_hsw+0x586>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,60,8,0,0 // vbroadcastss 0x83c(%rip),%ymm8 # 5d7c <_sk_callback_hsw+0x55a>
+ .byte 196,98,125,24,5,108,8,0,0 // vbroadcastss 0x86c(%rip),%ymm8 # 5f64 <_sk_callback_hsw+0x58a>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18581,7 +18942,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,36,8,0,0 // vbroadcastss 0x824(%rip),%ymm0 # 5d80 <_sk_callback_hsw+0x55e>
+ .byte 196,226,125,24,5,84,8,0,0 // vbroadcastss 0x854(%rip),%ymm0 # 5f68 <_sk_callback_hsw+0x58e>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18593,9 +18954,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,8,8,0,0 // vbroadcastss 0x808(%rip),%ymm1 # 5d84 <_sk_callback_hsw+0x562>
+ .byte 196,226,125,24,13,56,8,0,0 // vbroadcastss 0x838(%rip),%ymm1 # 5f6c <_sk_callback_hsw+0x592>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,254,7,0,0 // vbroadcastss 0x7fe(%rip),%ymm8 # 5d88 <_sk_callback_hsw+0x566>
+ .byte 196,98,125,24,5,46,8,0,0 // vbroadcastss 0x82e(%rip),%ymm8 # 5f70 <_sk_callback_hsw+0x596>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18606,7 +18967,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,230,7,0,0 // vbroadcastss 0x7e6(%rip),%ymm1 # 5d8c <_sk_callback_hsw+0x56a>
+ .byte 196,226,125,24,13,22,8,0,0 // vbroadcastss 0x816(%rip),%ymm1 # 5f74 <_sk_callback_hsw+0x59a>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -18618,13 +18979,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,201,7,0,0 // vbroadcastss 0x7c9(%rip),%ymm0 # 5d90 <_sk_callback_hsw+0x56e>
+ .byte 196,226,125,24,5,249,7,0,0 // vbroadcastss 0x7f9(%rip),%ymm0 # 5f78 <_sk_callback_hsw+0x59e>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,192,7,0,0 // vbroadcastss 0x7c0(%rip),%ymm8 # 5d94 <_sk_callback_hsw+0x572>
+ .byte 196,98,125,24,5,240,7,0,0 // vbroadcastss 0x7f0(%rip),%ymm8 # 5f7c <_sk_callback_hsw+0x5a2>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,177,7,0,0 // vbroadcastss 0x7b1(%rip),%ymm10 # 5d98 <_sk_callback_hsw+0x576>
- .byte 196,98,125,24,29,172,7,0,0 // vbroadcastss 0x7ac(%rip),%ymm11 # 5d9c <_sk_callback_hsw+0x57a>
+ .byte 196,98,125,24,21,225,7,0,0 // vbroadcastss 0x7e1(%rip),%ymm10 # 5f80 <_sk_callback_hsw+0x5a6>
+ .byte 196,98,125,24,29,220,7,0,0 // vbroadcastss 0x7dc(%rip),%ymm11 # 5f84 <_sk_callback_hsw+0x5aa>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18636,16 +18997,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,143,7,0,0 // vbroadcastss 0x78f(%rip),%ymm0 # 5da0 <_sk_callback_hsw+0x57e>
+ .byte 196,226,125,24,5,191,7,0,0 // vbroadcastss 0x7bf(%rip),%ymm0 # 5f88 <_sk_callback_hsw+0x5ae>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,134,7,0,0 // vbroadcastss 0x786(%rip),%ymm8 # 5da4 <_sk_callback_hsw+0x582>
+ .byte 196,98,125,24,5,182,7,0,0 // vbroadcastss 0x7b6(%rip),%ymm8 # 5f8c <_sk_callback_hsw+0x5b2>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,124,7,0,0 // vbroadcastss 0x77c(%rip),%ymm9 # 5da8 <_sk_callback_hsw+0x586>
- .byte 196,98,125,24,21,119,7,0,0 // vbroadcastss 0x777(%rip),%ymm10 # 5dac <_sk_callback_hsw+0x58a>
+ .byte 196,98,125,24,13,172,7,0,0 // vbroadcastss 0x7ac(%rip),%ymm9 # 5f90 <_sk_callback_hsw+0x5b6>
+ .byte 196,98,125,24,21,167,7,0,0 // vbroadcastss 0x7a7(%rip),%ymm10 # 5f94 <_sk_callback_hsw+0x5ba>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,109,7,0,0 // vbroadcastss 0x76d(%rip),%ymm9 # 5db0 <_sk_callback_hsw+0x58e>
+ .byte 196,98,125,24,13,157,7,0,0 // vbroadcastss 0x79d(%rip),%ymm9 # 5f98 <_sk_callback_hsw+0x5be>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,99,7,0,0 // vbroadcastss 0x763(%rip),%ymm10 # 5db4 <_sk_callback_hsw+0x592>
+ .byte 196,98,125,24,21,147,7,0,0 // vbroadcastss 0x793(%rip),%ymm10 # 5f9c <_sk_callback_hsw+0x5c2>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18656,14 +19017,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,75,7,0,0 // vbroadcastss 0x74b(%rip),%ymm8 # 5db8 <_sk_callback_hsw+0x596>
+ .byte 196,98,125,24,5,123,7,0,0 // vbroadcastss 0x77b(%rip),%ymm8 # 5fa0 <_sk_callback_hsw+0x5c6>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,61,7,0,0 // vbroadcastss 0x73d(%rip),%ymm10 # 5dbc <_sk_callback_hsw+0x59a>
- .byte 196,98,125,24,29,56,7,0,0 // vbroadcastss 0x738(%rip),%ymm11 # 5dc0 <_sk_callback_hsw+0x59e>
+ .byte 196,98,125,24,21,109,7,0,0 // vbroadcastss 0x76d(%rip),%ymm10 # 5fa4 <_sk_callback_hsw+0x5ca>
+ .byte 196,98,125,24,29,104,7,0,0 // vbroadcastss 0x768(%rip),%ymm11 # 5fa8 <_sk_callback_hsw+0x5ce>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,41,7,0,0 // vbroadcastss 0x729(%rip),%ymm8 # 5dc4 <_sk_callback_hsw+0x5a2>
+ .byte 196,98,125,24,5,89,7,0,0 // vbroadcastss 0x759(%rip),%ymm8 # 5fac <_sk_callback_hsw+0x5d2>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18674,12 +19035,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,17,7,0,0 // vbroadcastss 0x711(%rip),%ymm0 # 5dc8 <_sk_callback_hsw+0x5a6>
+ .byte 196,226,125,24,5,65,7,0,0 // vbroadcastss 0x741(%rip),%ymm0 # 5fb0 <_sk_callback_hsw+0x5d6>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,254,6,0,0 // vbroadcastss 0x6fe(%rip),%ymm10 # 5dcc <_sk_callback_hsw+0x5aa>
- .byte 196,98,125,24,29,249,6,0,0 // vbroadcastss 0x6f9(%rip),%ymm11 # 5dd0 <_sk_callback_hsw+0x5ae>
+ .byte 196,98,125,24,21,46,7,0,0 // vbroadcastss 0x72e(%rip),%ymm10 # 5fb4 <_sk_callback_hsw+0x5da>
+ .byte 196,98,125,24,29,41,7,0,0 // vbroadcastss 0x729(%rip),%ymm11 # 5fb8 <_sk_callback_hsw+0x5de>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18691,13 +19052,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,220,6,0,0 // vbroadcastss 0x6dc(%rip),%ymm1 # 5dd4 <_sk_callback_hsw+0x5b2>
+ .byte 196,226,125,24,13,12,7,0,0 // vbroadcastss 0x70c(%rip),%ymm1 # 5fbc <_sk_callback_hsw+0x5e2>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,210,6,0,0 // vbroadcastss 0x6d2(%rip),%ymm8 # 5dd8 <_sk_callback_hsw+0x5b6>
+ .byte 196,98,125,24,5,2,7,0,0 // vbroadcastss 0x702(%rip),%ymm8 # 5fc0 <_sk_callback_hsw+0x5e6>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,195,6,0,0 // vbroadcastss 0x6c3(%rip),%ymm10 # 5ddc <_sk_callback_hsw+0x5ba>
- .byte 196,98,125,24,29,190,6,0,0 // vbroadcastss 0x6be(%rip),%ymm11 # 5de0 <_sk_callback_hsw+0x5be>
+ .byte 196,98,125,24,21,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm10 # 5fc4 <_sk_callback_hsw+0x5ea>
+ .byte 196,98,125,24,29,238,6,0,0 // vbroadcastss 0x6ee(%rip),%ymm11 # 5fc8 <_sk_callback_hsw+0x5ee>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -18709,16 +19070,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,161,6,0,0 // vbroadcastss 0x6a1(%rip),%ymm1 # 5de4 <_sk_callback_hsw+0x5c2>
+ .byte 196,226,125,24,13,209,6,0,0 // vbroadcastss 0x6d1(%rip),%ymm1 # 5fcc <_sk_callback_hsw+0x5f2>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,151,6,0,0 // vbroadcastss 0x697(%rip),%ymm8 # 5de8 <_sk_callback_hsw+0x5c6>
+ .byte 196,98,125,24,5,199,6,0,0 // vbroadcastss 0x6c7(%rip),%ymm8 # 5fd0 <_sk_callback_hsw+0x5f6>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,141,6,0,0 // vbroadcastss 0x68d(%rip),%ymm9 # 5dec <_sk_callback_hsw+0x5ca>
- .byte 196,98,125,24,21,136,6,0,0 // vbroadcastss 0x688(%rip),%ymm10 # 5df0 <_sk_callback_hsw+0x5ce>
+ .byte 196,98,125,24,13,189,6,0,0 // vbroadcastss 0x6bd(%rip),%ymm9 # 5fd4 <_sk_callback_hsw+0x5fa>
+ .byte 196,98,125,24,21,184,6,0,0 // vbroadcastss 0x6b8(%rip),%ymm10 # 5fd8 <_sk_callback_hsw+0x5fe>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,126,6,0,0 // vbroadcastss 0x67e(%rip),%ymm9 # 5df4 <_sk_callback_hsw+0x5d2>
+ .byte 196,98,125,24,13,174,6,0,0 // vbroadcastss 0x6ae(%rip),%ymm9 # 5fdc <_sk_callback_hsw+0x602>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,116,6,0,0 // vbroadcastss 0x674(%rip),%ymm10 # 5df8 <_sk_callback_hsw+0x5d6>
+ .byte 196,98,125,24,21,164,6,0,0 // vbroadcastss 0x6a4(%rip),%ymm10 # 5fe0 <_sk_callback_hsw+0x606>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18729,14 +19090,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,92,6,0,0 // vbroadcastss 0x65c(%rip),%ymm8 # 5dfc <_sk_callback_hsw+0x5da>
+ .byte 196,98,125,24,5,140,6,0,0 // vbroadcastss 0x68c(%rip),%ymm8 # 5fe4 <_sk_callback_hsw+0x60a>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,77,6,0,0 // vbroadcastss 0x64d(%rip),%ymm10 # 5e00 <_sk_callback_hsw+0x5de>
- .byte 196,98,125,24,29,72,6,0,0 // vbroadcastss 0x648(%rip),%ymm11 # 5e04 <_sk_callback_hsw+0x5e2>
+ .byte 196,98,125,24,21,125,6,0,0 // vbroadcastss 0x67d(%rip),%ymm10 # 5fe8 <_sk_callback_hsw+0x60e>
+ .byte 196,98,125,24,29,120,6,0,0 // vbroadcastss 0x678(%rip),%ymm11 # 5fec <_sk_callback_hsw+0x612>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,57,6,0,0 // vbroadcastss 0x639(%rip),%ymm8 # 5e08 <_sk_callback_hsw+0x5e6>
+ .byte 196,98,125,24,5,105,6,0,0 // vbroadcastss 0x669(%rip),%ymm8 # 5ff0 <_sk_callback_hsw+0x616>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18747,12 +19108,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,33,6,0,0 // vbroadcastss 0x621(%rip),%ymm1 # 5e0c <_sk_callback_hsw+0x5ea>
+ .byte 196,226,125,24,13,81,6,0,0 // vbroadcastss 0x651(%rip),%ymm1 # 5ff4 <_sk_callback_hsw+0x61a>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,13,6,0,0 // vbroadcastss 0x60d(%rip),%ymm10 # 5e10 <_sk_callback_hsw+0x5ee>
- .byte 196,98,125,24,29,8,6,0,0 // vbroadcastss 0x608(%rip),%ymm11 # 5e14 <_sk_callback_hsw+0x5f2>
+ .byte 196,98,125,24,21,61,6,0,0 // vbroadcastss 0x63d(%rip),%ymm10 # 5ff8 <_sk_callback_hsw+0x61e>
+ .byte 196,98,125,24,29,56,6,0,0 // vbroadcastss 0x638(%rip),%ymm11 # 5ffc <_sk_callback_hsw+0x622>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -18884,25 +19245,25 @@ BALIGN4
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5a1d <.literal4+0xb9>
+ .byte 71,225,61 // rex.RXB loope 5bd5 <.literal4+0xb9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5a2d <.literal4+0xc9>
+ .byte 71,225,61 // rex.RXB loope 5be5 <.literal4+0xc9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5a3d <.literal4+0xd9>
+ .byte 71,225,61 // rex.RXB loope 5bf5 <.literal4+0xd9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5a4d <.literal4+0xe9>
+ .byte 71,225,61 // rex.RXB loope 5c05 <.literal4+0xe9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
@@ -18965,7 +19326,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5ac1 <.literal4+0x15d>
+ .byte 224,7 // loopne 5c79 <.literal4+0x15d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -18981,10 +19342,10 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 5ae8 <.literal4+0x184>
+ .byte 127,0 // jg 5ca0 <.literal4+0x184>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5b61 <.literal4+0x1fd>
+ .byte 119,115 // ja 5d19 <.literal4+0x1fd>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -18998,10 +19359,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5b1c <.literal4+0x1b8>
+ .byte 127,0 // jg 5cd4 <.literal4+0x1b8>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5b95 <.literal4+0x231>
+ .byte 119,115 // ja 5d4d <.literal4+0x231>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19015,10 +19376,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5b50 <.literal4+0x1ec>
+ .byte 127,0 // jg 5d08 <.literal4+0x1ec>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5bc9 <.literal4+0x265>
+ .byte 119,115 // ja 5d81 <.literal4+0x265>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19032,10 +19393,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5b84 <.literal4+0x220>
+ .byte 127,0 // jg 5d3c <.literal4+0x220>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5bfd <.literal4+0x299>
+ .byte 119,115 // ja 5db5 <.literal4+0x299>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19046,9 +19407,26 @@ BALIGN4
.byte 210,221 // rcr %cl,%ch
.byte 65,0,0 // add %al,(%r8)
.byte 0,75,0 // add %cl,0x0(%rbx)
- .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax)
+ .byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 5d70 <.literal4+0x254>
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 119,115 // ja 5de9 <.literal4+0x2cd>
+ .byte 248 // clc
+ .byte 194,117,191 // retq $0xbf75
+ .byte 191,63,249,68,180 // mov $0xb444f93f,%edi
+ .byte 62,163,233,220,63,81,140,242,66,141 // movabs %eax,%ds:0x8d42f28c513fdce9
+ .byte 188,190,63,248,245 // mov $0xf5f83fbe,%esp
+ .byte 154 // (bad)
+ .byte 64,254 // rex (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,200 // add %cl,%al
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 5bfb <.literal4+0x297>
+ .byte 127,67 // jg 5de3 <.literal4+0x2c7>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -19060,7 +19438,7 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 5c1b <.literal4+0x2b7>
+ .byte 118,63 // jbe 5e03 <.literal4+0x2e7>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
@@ -19082,7 +19460,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5c35 <.literal4+0x2d1>
+ .byte 224,7 // loopne 5e1d <.literal4+0x301>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19094,7 +19472,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5c51 <.literal4+0x2ed>
+ .byte 224,7 // loopne 5e39 <.literal4+0x31d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19105,7 +19483,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 5ca6 <.literal4+0x342>
+ .byte 124,66 // jl 5e8e <.literal4+0x372>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -19131,7 +19509,7 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 5d09 <.literal4+0x3a5>
+ .byte 112,65 // jo 5ef1 <.literal4+0x3d5>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
@@ -19145,7 +19523,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 5d3f <.literal4+0x3db>
+ .byte 127,71 // jg 5f27 <.literal4+0x40b>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -19272,16 +19650,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005e48 <_sk_callback_hsw+0xa000626>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006028 <_sk_callback_hsw+0xa00064e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005e50 <_sk_callback_hsw+0x1200062e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006030 <_sk_callback_hsw+0x12000656>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005e58 <_sk_callback_hsw+0x1a000636>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006038 <_sk_callback_hsw+0x1a00065e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005e60 <_sk_callback_hsw+0x300063e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006040 <_sk_callback_hsw+0x3000666>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19324,16 +19702,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005ea8 <_sk_callback_hsw+0xa000686>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006088 <_sk_callback_hsw+0xa0006ae>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005eb0 <_sk_callback_hsw+0x1200068e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006090 <_sk_callback_hsw+0x120006b6>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005eb8 <_sk_callback_hsw+0x1a000696>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006098 <_sk_callback_hsw+0x1a0006be>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005ec0 <_sk_callback_hsw+0x300069e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30060a0 <_sk_callback_hsw+0x30006c6>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19376,16 +19754,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005f08 <_sk_callback_hsw+0xa0006e6>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0060e8 <_sk_callback_hsw+0xa00070e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005f10 <_sk_callback_hsw+0x120006ee>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120060f0 <_sk_callback_hsw+0x12000716>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005f18 <_sk_callback_hsw+0x1a0006f6>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0060f8 <_sk_callback_hsw+0x1a00071e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005f20 <_sk_callback_hsw+0x30006fe>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006100 <_sk_callback_hsw+0x3000726>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19428,16 +19806,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005f68 <_sk_callback_hsw+0xa000746>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006148 <_sk_callback_hsw+0xa00076e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005f70 <_sk_callback_hsw+0x1200074e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006150 <_sk_callback_hsw+0x12000776>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005f78 <_sk_callback_hsw+0x1a000756>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006158 <_sk_callback_hsw+0x1a00077e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005f80 <_sk_callback_hsw+0x300075e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006160 <_sk_callback_hsw+0x3000786>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19480,16 +19858,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005fc8 <_sk_callback_hsw+0xa0007a6>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0061a8 <_sk_callback_hsw+0xa0007ce>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005fd0 <_sk_callback_hsw+0x120007ae>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120061b0 <_sk_callback_hsw+0x120007d6>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005fd8 <_sk_callback_hsw+0x1a0007b6>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0061b8 <_sk_callback_hsw+0x1a0007de>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005fe0 <_sk_callback_hsw+0x30007be>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30061c0 <_sk_callback_hsw+0x30007e6>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19532,16 +19910,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006028 <_sk_callback_hsw+0xa000806>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006208 <_sk_callback_hsw+0xa00082e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006030 <_sk_callback_hsw+0x1200080e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006210 <_sk_callback_hsw+0x12000836>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006038 <_sk_callback_hsw+0x1a000816>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006218 <_sk_callback_hsw+0x1a00083e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006040 <_sk_callback_hsw+0x300081e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006220 <_sk_callback_hsw+0x3000846>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19584,16 +19962,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006088 <_sk_callback_hsw+0xa000866>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006268 <_sk_callback_hsw+0xa00088e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006090 <_sk_callback_hsw+0x1200086e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006270 <_sk_callback_hsw+0x12000896>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006098 <_sk_callback_hsw+0x1a000876>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006278 <_sk_callback_hsw+0x1a00089e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30060a0 <_sk_callback_hsw+0x300087e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006280 <_sk_callback_hsw+0x30008a6>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19636,16 +20014,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0060e8 <_sk_callback_hsw+0xa0008c6>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0062c8 <_sk_callback_hsw+0xa0008ee>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120060f0 <_sk_callback_hsw+0x120008ce>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120062d0 <_sk_callback_hsw+0x120008f6>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0060f8 <_sk_callback_hsw+0x1a0008d6>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0062d8 <_sk_callback_hsw+0x1a0008fe>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006100 <_sk_callback_hsw+0x30008de>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30062e0 <_sk_callback_hsw+0x3000906>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19835,7 +20213,7 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,4,121,0,0 // vbroadcastss 0x7904(%rip),%ymm1 # 79d4 <_sk_callback_avx+0x144>
+ .byte 196,226,125,24,13,228,122,0,0 // vbroadcastss 0x7ae4(%rip),%ymm1 # 7bb4 <_sk_callback_avx+0x144>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -19844,7 +20222,7 @@ _sk_seed_shader_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,222,120,0,0 // vbroadcastss 0x78de(%rip),%ymm2 # 79d8 <_sk_callback_avx+0x148>
+ .byte 196,226,125,24,21,190,122,0,0 // vbroadcastss 0x7abe(%rip),%ymm2 # 7bb8 <_sk_callback_avx+0x148>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -19868,7 +20246,7 @@ _sk_dither_avx:
.byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,135,120,0,0 // vbroadcastss 0x7887(%rip),%ymm11 # 79dc <_sk_callback_avx+0x14c>
+ .byte 196,98,125,24,29,103,122,0,0 // vbroadcastss 0x7a67(%rip),%ymm11 # 7bbc <_sk_callback_avx+0x14c>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -19879,8 +20257,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,72,120,0,0 // vbroadcastss 0x7848(%rip),%ymm12 # 79e0 <_sk_callback_avx+0x150>
- .byte 196,98,125,24,45,67,120,0,0 // vbroadcastss 0x7843(%rip),%ymm13 # 79e4 <_sk_callback_avx+0x154>
+ .byte 196,98,125,24,37,40,122,0,0 // vbroadcastss 0x7a28(%rip),%ymm12 # 7bc0 <_sk_callback_avx+0x150>
+ .byte 196,98,125,24,45,35,122,0,0 // vbroadcastss 0x7a23(%rip),%ymm13 # 7bc4 <_sk_callback_avx+0x154>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -19907,9 +20285,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,174,119,0,0 // vbroadcastss 0x77ae(%rip),%ymm9 # 79e8 <_sk_callback_avx+0x158>
+ .byte 196,98,125,24,13,142,121,0,0 // vbroadcastss 0x798e(%rip),%ymm9 # 7bc8 <_sk_callback_avx+0x158>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,164,119,0,0 // vbroadcastss 0x77a4(%rip),%ymm9 # 79ec <_sk_callback_avx+0x15c>
+ .byte 196,98,125,24,13,132,121,0,0 // vbroadcastss 0x7984(%rip),%ymm9 # 7bcc <_sk_callback_avx+0x15c>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
@@ -19943,7 +20321,7 @@ HIDDEN _sk_black_color_avx
FUNCTION(_sk_black_color_avx)
_sk_black_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,68,119,0,0 // vbroadcastss 0x7744(%rip),%ymm3 # 79f0 <_sk_callback_avx+0x160>
+ .byte 196,226,125,24,29,36,121,0,0 // vbroadcastss 0x7924(%rip),%ymm3 # 7bd0 <_sk_callback_avx+0x160>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -19954,7 +20332,7 @@ HIDDEN _sk_white_color_avx
FUNCTION(_sk_white_color_avx)
_sk_white_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,47,119,0,0 // vbroadcastss 0x772f(%rip),%ymm0 # 79f4 <_sk_callback_avx+0x164>
+ .byte 196,226,125,24,5,15,121,0,0 // vbroadcastss 0x790f(%rip),%ymm0 # 7bd4 <_sk_callback_avx+0x164>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -20000,7 +20378,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,210,118,0,0 // vbroadcastss 0x76d2(%rip),%ymm8 # 79f8 <_sk_callback_avx+0x168>
+ .byte 196,98,125,24,5,178,120,0,0 // vbroadcastss 0x78b2(%rip),%ymm8 # 7bd8 <_sk_callback_avx+0x168>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -20021,7 +20399,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,148,118,0,0 // vbroadcastss 0x7694(%rip),%ymm9 # 79fc <_sk_callback_avx+0x16c>
+ .byte 196,98,125,24,13,116,120,0,0 // vbroadcastss 0x7874(%rip),%ymm9 # 7bdc <_sk_callback_avx+0x16c>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -20063,7 +20441,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,51,118,0,0 // vbroadcastss 0x7633(%rip),%ymm8 # 7a00 <_sk_callback_avx+0x170>
+ .byte 196,98,125,24,5,19,120,0,0 // vbroadcastss 0x7813(%rip),%ymm8 # 7be0 <_sk_callback_avx+0x170>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -20076,7 +20454,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,22,118,0,0 // vbroadcastss 0x7616(%rip),%ymm0 # 7a04 <_sk_callback_avx+0x174>
+ .byte 196,226,125,24,5,246,119,0,0 // vbroadcastss 0x77f6(%rip),%ymm0 # 7be4 <_sk_callback_avx+0x174>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -20089,7 +20467,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,249,117,0,0 // vbroadcastss 0x75f9(%rip),%ymm8 # 7a08 <_sk_callback_avx+0x178>
+ .byte 196,98,125,24,5,217,119,0,0 // vbroadcastss 0x77d9(%rip),%ymm8 # 7be8 <_sk_callback_avx+0x178>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -20106,7 +20484,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,204,117,0,0 // vbroadcastss 0x75cc(%rip),%ymm8 # 7a0c <_sk_callback_avx+0x17c>
+ .byte 196,98,125,24,5,172,119,0,0 // vbroadcastss 0x77ac(%rip),%ymm8 # 7bec <_sk_callback_avx+0x17c>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -20134,7 +20512,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,139,117,0,0 // vbroadcastss 0x758b(%rip),%ymm8 # 7a10 <_sk_callback_avx+0x180>
+ .byte 196,98,125,24,5,107,119,0,0 // vbroadcastss 0x776b(%rip),%ymm8 # 7bf0 <_sk_callback_avx+0x180>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20194,7 +20572,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,218,116,0,0 // vbroadcastss 0x74da(%rip),%ymm8 # 7a14 <_sk_callback_avx+0x184>
+ .byte 196,98,125,24,5,186,118,0,0 // vbroadcastss 0x76ba(%rip),%ymm8 # 7bf4 <_sk_callback_avx+0x184>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20231,7 +20609,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,90,116,0,0 // vbroadcastss 0x745a(%rip),%ymm8 # 7a18 <_sk_callback_avx+0x188>
+ .byte 196,98,125,24,5,58,118,0,0 // vbroadcastss 0x763a(%rip),%ymm8 # 7bf8 <_sk_callback_avx+0x188>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20257,7 +20635,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,6,116,0,0 // vbroadcastss 0x7406(%rip),%ymm8 # 7a1c <_sk_callback_avx+0x18c>
+ .byte 196,98,125,24,5,230,117,0,0 // vbroadcastss 0x75e6(%rip),%ymm8 # 7bfc <_sk_callback_avx+0x18c>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20286,7 +20664,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,166,115,0,0 // vbroadcastss 0x73a6(%rip),%ymm8 # 7a20 <_sk_callback_avx+0x190>
+ .byte 196,98,125,24,5,134,117,0,0 // vbroadcastss 0x7586(%rip),%ymm8 # 7c00 <_sk_callback_avx+0x190>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20309,7 +20687,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,97,115,0,0 // vbroadcastss 0x7361(%rip),%ymm8 # 7a24 <_sk_callback_avx+0x194>
+ .byte 196,98,125,24,5,65,117,0,0 // vbroadcastss 0x7541(%rip),%ymm8 # 7c04 <_sk_callback_avx+0x194>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20320,7 +20698,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,76,115,0,0 // vbroadcastss 0x734c(%rip),%ymm8 # 7a28 <_sk_callback_avx+0x198>
+ .byte 196,98,125,24,5,44,117,0,0 // vbroadcastss 0x752c(%rip),%ymm8 # 7c08 <_sk_callback_avx+0x198>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -20382,7 +20760,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,72,114,0,0 // vbroadcastss 0x7248(%rip),%ymm9 # 7a2c <_sk_callback_avx+0x19c>
+ .byte 196,98,125,24,13,40,116,0,0 // vbroadcastss 0x7428(%rip),%ymm9 # 7c0c <_sk_callback_avx+0x19c>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -20439,7 +20817,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,90,113,0,0 // vbroadcastss 0x715a(%rip),%ymm8 # 7a30 <_sk_callback_avx+0x1a0>
+ .byte 196,98,125,24,5,58,115,0,0 // vbroadcastss 0x733a(%rip),%ymm8 # 7c10 <_sk_callback_avx+0x1a0>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20494,7 +20872,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,131,112,0,0 // vbroadcastss 0x7083(%rip),%ymm8 # 7a34 <_sk_callback_avx+0x1a4>
+ .byte 196,98,125,24,5,99,114,0,0 // vbroadcastss 0x7263(%rip),%ymm8 # 7c14 <_sk_callback_avx+0x1a4>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20560,10 +20938,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,122,111,0,0 // vbroadcastss 0x6f7a(%rip),%ymm11 # 7a3c <_sk_callback_avx+0x1ac>
+ .byte 196,98,125,24,29,90,113,0,0 // vbroadcastss 0x715a(%rip),%ymm11 # 7c1c <_sk_callback_avx+0x1ac>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,107,111,0,0 // vbroadcastss 0x6f6b(%rip),%ymm13 # 7a40 <_sk_callback_avx+0x1b0>
+ .byte 196,98,125,24,45,75,113,0,0 // vbroadcastss 0x714b(%rip),%ymm13 # 7c20 <_sk_callback_avx+0x1b0>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -20574,7 +20952,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,41,111,0,0 // vbroadcastss 0x6f29(%rip),%ymm8 # 7a38 <_sk_callback_avx+0x1a8>
+ .byte 196,98,125,24,5,9,113,0,0 // vbroadcastss 0x7109(%rip),%ymm8 # 7c18 <_sk_callback_avx+0x1a8>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -20701,12 +21079,12 @@ _sk_hue_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,248,108,0,0 // vbroadcastss 0x6cf8(%rip),%ymm14 # 7a44 <_sk_callback_avx+0x1b4>
+ .byte 196,98,125,24,53,216,110,0,0 // vbroadcastss 0x6ed8(%rip),%ymm14 # 7c24 <_sk_callback_avx+0x1b4>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,238,108,0,0 // vbroadcastss 0x6cee(%rip),%ymm15 # 7a48 <_sk_callback_avx+0x1b8>
+ .byte 196,98,125,24,61,206,110,0,0 // vbroadcastss 0x6ece(%rip),%ymm15 # 7c28 <_sk_callback_avx+0x1b8>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,223,108,0,0 // vbroadcastss 0x6cdf(%rip),%ymm0 # 7a4c <_sk_callback_avx+0x1bc>
+ .byte 196,226,125,24,5,191,110,0,0 // vbroadcastss 0x6ebf(%rip),%ymm0 # 7c2c <_sk_callback_avx+0x1bc>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -20767,7 +21145,7 @@ _sk_hue_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,184,107,0,0 // vbroadcastss 0x6bb8(%rip),%ymm8 # 7a50 <_sk_callback_avx+0x1c0>
+ .byte 196,98,125,24,5,152,109,0,0 // vbroadcastss 0x6d98(%rip),%ymm8 # 7c30 <_sk_callback_avx+0x1c0>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20824,12 +21202,12 @@ _sk_saturation_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,198,106,0,0 // vbroadcastss 0x6ac6(%rip),%ymm14 # 7a54 <_sk_callback_avx+0x1c4>
+ .byte 196,98,125,24,53,166,108,0,0 // vbroadcastss 0x6ca6(%rip),%ymm14 # 7c34 <_sk_callback_avx+0x1c4>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,188,106,0,0 // vbroadcastss 0x6abc(%rip),%ymm15 # 7a58 <_sk_callback_avx+0x1c8>
+ .byte 196,98,125,24,61,156,108,0,0 // vbroadcastss 0x6c9c(%rip),%ymm15 # 7c38 <_sk_callback_avx+0x1c8>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,173,106,0,0 // vbroadcastss 0x6aad(%rip),%ymm0 # 7a5c <_sk_callback_avx+0x1cc>
+ .byte 196,226,125,24,5,141,108,0,0 // vbroadcastss 0x6c8d(%rip),%ymm0 # 7c3c <_sk_callback_avx+0x1cc>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -20890,7 +21268,7 @@ _sk_saturation_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,134,105,0,0 // vbroadcastss 0x6986(%rip),%ymm8 # 7a60 <_sk_callback_avx+0x1d0>
+ .byte 196,98,125,24,5,102,107,0,0 // vbroadcastss 0x6b66(%rip),%ymm8 # 7c40 <_sk_callback_avx+0x1d0>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20919,12 +21297,12 @@ _sk_color_avx:
.byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
.byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
.byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
- .byte 196,98,125,24,45,28,105,0,0 // vbroadcastss 0x691c(%rip),%ymm13 # 7a64 <_sk_callback_avx+0x1d4>
+ .byte 196,98,125,24,45,252,106,0,0 // vbroadcastss 0x6afc(%rip),%ymm13 # 7c44 <_sk_callback_avx+0x1d4>
.byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
- .byte 196,98,125,24,53,18,105,0,0 // vbroadcastss 0x6912(%rip),%ymm14 # 7a68 <_sk_callback_avx+0x1d8>
+ .byte 196,98,125,24,53,242,106,0,0 // vbroadcastss 0x6af2(%rip),%ymm14 # 7c48 <_sk_callback_avx+0x1d8>
.byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,3,105,0,0 // vbroadcastss 0x6903(%rip),%ymm15 # 7a6c <_sk_callback_avx+0x1dc>
+ .byte 196,98,125,24,61,227,106,0,0 // vbroadcastss 0x6ae3(%rip),%ymm15 # 7c4c <_sk_callback_avx+0x1dc>
.byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -20987,7 +21365,7 @@ _sk_color_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,202,103,0,0 // vbroadcastss 0x67ca(%rip),%ymm0 # 7a70 <_sk_callback_avx+0x1e0>
+ .byte 196,226,125,24,5,170,105,0,0 // vbroadcastss 0x69aa(%rip),%ymm0 # 7c50 <_sk_callback_avx+0x1e0>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -21017,12 +21395,12 @@ _sk_luminosity_avx:
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
- .byte 196,98,125,24,45,92,103,0,0 // vbroadcastss 0x675c(%rip),%ymm13 # 7a74 <_sk_callback_avx+0x1e4>
+ .byte 196,98,125,24,45,60,105,0,0 // vbroadcastss 0x693c(%rip),%ymm13 # 7c54 <_sk_callback_avx+0x1e4>
.byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
- .byte 196,98,125,24,53,82,103,0,0 // vbroadcastss 0x6752(%rip),%ymm14 # 7a78 <_sk_callback_avx+0x1e8>
+ .byte 196,98,125,24,53,50,105,0,0 // vbroadcastss 0x6932(%rip),%ymm14 # 7c58 <_sk_callback_avx+0x1e8>
.byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,67,103,0,0 // vbroadcastss 0x6743(%rip),%ymm15 # 7a7c <_sk_callback_avx+0x1ec>
+ .byte 196,98,125,24,61,35,105,0,0 // vbroadcastss 0x6923(%rip),%ymm15 # 7c5c <_sk_callback_avx+0x1ec>
.byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -21085,7 +21463,7 @@ _sk_luminosity_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,10,102,0,0 // vbroadcastss 0x660a(%rip),%ymm0 # 7a80 <_sk_callback_avx+0x1f0>
+ .byte 196,226,125,24,5,234,103,0,0 // vbroadcastss 0x67ea(%rip),%ymm0 # 7c60 <_sk_callback_avx+0x1f0>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -21121,7 +21499,7 @@ _sk_srcover_rgba_8888_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,41,1,0,0 // jne 1611 <_sk_srcover_rgba_8888_avx+0x150>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,124,40,13,108,107,0,0 // vmovaps 0x6b6c(%rip),%ymm9 # 8060 <_sk_callback_avx+0x7d0>
+ .byte 197,124,40,13,140,109,0,0 // vmovaps 0x6d8c(%rip),%ymm9 # 8280 <_sk_callback_avx+0x810>
.byte 196,193,68,84,225 // vandps %ymm9,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
@@ -21139,9 +21517,9 @@ _sk_srcover_rgba_8888_avx:
.byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7
.byte 196,227,53,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,47,101,0,0 // vbroadcastss 0x652f(%rip),%ymm8 # 7a84 <_sk_callback_avx+0x1f4>
+ .byte 196,98,125,24,5,15,103,0,0 // vbroadcastss 0x670f(%rip),%ymm8 # 7c64 <_sk_callback_avx+0x1f4>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,38,101,0,0 // vbroadcastss 0x6526(%rip),%ymm9 # 7a88 <_sk_callback_avx+0x1f8>
+ .byte 196,98,125,24,13,6,103,0,0 // vbroadcastss 0x6706(%rip),%ymm9 # 7c68 <_sk_callback_avx+0x1f8>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
@@ -21186,9 +21564,9 @@ _sk_srcover_rgba_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,135,104,0,0 // vpshufb 0x6887(%rip),%xmm4,%xmm5 # 7ec0 <_sk_callback_avx+0x630>
+ .byte 196,226,89,0,45,151,106,0,0 // vpshufb 0x6a97(%rip),%xmm4,%xmm5 # 80d0 <_sk_callback_avx+0x660>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,137,104,0,0 // vpshufb 0x6889(%rip),%xmm4,%xmm4 # 7ed0 <_sk_callback_avx+0x640>
+ .byte 196,226,89,0,37,153,106,0,0 // vpshufb 0x6a99(%rip),%xmm4,%xmm4 # 80e0 <_sk_callback_avx+0x670>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
@@ -21200,9 +21578,9 @@ _sk_srcover_rgba_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,60,104,0,0 // vpshufb 0x683c(%rip),%xmm9,%xmm10 # 7ec0 <_sk_callback_avx+0x630>
+ .byte 196,98,49,0,21,76,106,0,0 // vpshufb 0x6a4c(%rip),%xmm9,%xmm10 # 80d0 <_sk_callback_avx+0x660>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,62,104,0,0 // vpshufb 0x683e(%rip),%xmm9,%xmm9 # 7ed0 <_sk_callback_avx+0x640>
+ .byte 196,98,49,0,13,78,106,0,0 // vpshufb 0x6a4e(%rip),%xmm9,%xmm9 # 80e0 <_sk_callback_avx+0x670>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
@@ -21224,7 +21602,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,191,99,0,0 // vbroadcastss 0x63bf(%rip),%ymm8 # 7a8c <_sk_callback_avx+0x1fc>
+ .byte 196,98,125,24,5,159,101,0,0 // vbroadcastss 0x659f(%rip),%ymm8 # 7c6c <_sk_callback_avx+0x1fc>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -21236,7 +21614,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,162,99,0,0 // vbroadcastss 0x63a2(%rip),%ymm8 # 7a90 <_sk_callback_avx+0x200>
+ .byte 196,98,125,24,5,130,101,0,0 // vbroadcastss 0x6582(%rip),%ymm8 # 7c70 <_sk_callback_avx+0x200>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -21248,7 +21626,7 @@ HIDDEN _sk_clamp_a_dst_avx
.globl _sk_clamp_a_dst_avx
FUNCTION(_sk_clamp_a_dst_avx)
_sk_clamp_a_dst_avx:
- .byte 196,98,125,24,5,136,99,0,0 // vbroadcastss 0x6388(%rip),%ymm8 # 7a94 <_sk_callback_avx+0x204>
+ .byte 196,98,125,24,5,104,101,0,0 // vbroadcastss 0x6568(%rip),%ymm8 # 7c74 <_sk_callback_avx+0x204>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -21281,7 +21659,7 @@ HIDDEN _sk_invert_avx
.globl _sk_invert_avx
FUNCTION(_sk_invert_avx)
_sk_invert_avx:
- .byte 196,98,125,24,5,71,99,0,0 // vbroadcastss 0x6347(%rip),%ymm8 # 7a98 <_sk_callback_avx+0x208>
+ .byte 196,98,125,24,5,39,101,0,0 // vbroadcastss 0x6527(%rip),%ymm8 # 7c78 <_sk_callback_avx+0x208>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -21337,7 +21715,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,219,98,0,0 // vbroadcastss 0x62db(%rip),%ymm10 # 7a9c <_sk_callback_avx+0x20c>
+ .byte 196,98,125,24,21,187,100,0,0 // vbroadcastss 0x64bb(%rip),%ymm10 # 7c7c <_sk_callback_avx+0x20c>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -21350,17 +21728,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,188,98,0,0 // vbroadcastss 0x62bc(%rip),%ymm8 # 7aa0 <_sk_callback_avx+0x210>
+ .byte 196,98,125,24,5,156,100,0,0 // vbroadcastss 0x649c(%rip),%ymm8 # 7c80 <_sk_callback_avx+0x210>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,174,98,0,0 // vbroadcastss 0x62ae(%rip),%ymm11 # 7aa4 <_sk_callback_avx+0x214>
+ .byte 196,98,125,24,29,142,100,0,0 // vbroadcastss 0x648e(%rip),%ymm11 # 7c84 <_sk_callback_avx+0x214>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,164,98,0,0 // vbroadcastss 0x62a4(%rip),%ymm13 # 7aa8 <_sk_callback_avx+0x218>
+ .byte 196,98,125,24,45,132,100,0,0 // vbroadcastss 0x6484(%rip),%ymm13 # 7c88 <_sk_callback_avx+0x218>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,149,98,0,0 // vbroadcastss 0x6295(%rip),%ymm12 # 7aac <_sk_callback_avx+0x21c>
+ .byte 196,98,125,24,37,117,100,0,0 // vbroadcastss 0x6475(%rip),%ymm12 # 7c8c <_sk_callback_avx+0x21c>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,139,98,0,0 // vbroadcastss 0x628b(%rip),%ymm14 # 7ab0 <_sk_callback_avx+0x220>
+ .byte 196,98,125,24,53,107,100,0,0 // vbroadcastss 0x646b(%rip),%ymm14 # 7c90 <_sk_callback_avx+0x220>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -21386,17 +21764,17 @@ HIDDEN _sk_from_srgb_dst_avx
.globl _sk_from_srgb_dst_avx
FUNCTION(_sk_from_srgb_dst_avx)
_sk_from_srgb_dst_avx:
- .byte 196,98,125,24,5,36,98,0,0 // vbroadcastss 0x6224(%rip),%ymm8 # 7ab4 <_sk_callback_avx+0x224>
+ .byte 196,98,125,24,5,4,100,0,0 // vbroadcastss 0x6404(%rip),%ymm8 # 7c94 <_sk_callback_avx+0x224>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,22,98,0,0 // vbroadcastss 0x6216(%rip),%ymm11 # 7ab8 <_sk_callback_avx+0x228>
+ .byte 196,98,125,24,29,246,99,0,0 // vbroadcastss 0x63f6(%rip),%ymm11 # 7c98 <_sk_callback_avx+0x228>
.byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12
- .byte 196,98,125,24,45,12,98,0,0 // vbroadcastss 0x620c(%rip),%ymm13 # 7abc <_sk_callback_avx+0x22c>
+ .byte 196,98,125,24,45,236,99,0,0 // vbroadcastss 0x63ec(%rip),%ymm13 # 7c9c <_sk_callback_avx+0x22c>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,253,97,0,0 // vbroadcastss 0x61fd(%rip),%ymm12 # 7ac0 <_sk_callback_avx+0x230>
+ .byte 196,98,125,24,37,221,99,0,0 // vbroadcastss 0x63dd(%rip),%ymm12 # 7ca0 <_sk_callback_avx+0x230>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,243,97,0,0 // vbroadcastss 0x61f3(%rip),%ymm14 # 7ac4 <_sk_callback_avx+0x234>
+ .byte 196,98,125,24,53,211,99,0,0 // vbroadcastss 0x63d3(%rip),%ymm14 # 7ca4 <_sk_callback_avx+0x234>
.byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4
.byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -21423,20 +21801,20 @@ HIDDEN _sk_to_srgb_avx
FUNCTION(_sk_to_srgb_avx)
_sk_to_srgb_avx:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,136,97,0,0 // vbroadcastss 0x6188(%rip),%ymm8 # 7ac8 <_sk_callback_avx+0x238>
+ .byte 196,98,125,24,5,104,99,0,0 // vbroadcastss 0x6368(%rip),%ymm8 # 7ca8 <_sk_callback_avx+0x238>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,126,97,0,0 // vbroadcastss 0x617e(%rip),%ymm11 # 7acc <_sk_callback_avx+0x23c>
+ .byte 196,98,125,24,29,94,99,0,0 // vbroadcastss 0x635e(%rip),%ymm11 # 7cac <_sk_callback_avx+0x23c>
.byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12
- .byte 196,98,125,24,45,116,97,0,0 // vbroadcastss 0x6174(%rip),%ymm13 # 7ad0 <_sk_callback_avx+0x240>
+ .byte 196,98,125,24,45,84,99,0,0 // vbroadcastss 0x6354(%rip),%ymm13 # 7cb0 <_sk_callback_avx+0x240>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12
- .byte 196,98,125,24,53,101,97,0,0 // vbroadcastss 0x6165(%rip),%ymm14 # 7ad4 <_sk_callback_avx+0x244>
+ .byte 196,98,125,24,53,69,99,0,0 // vbroadcastss 0x6345(%rip),%ymm14 # 7cb4 <_sk_callback_avx+0x244>
.byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12
- .byte 196,98,125,24,61,91,97,0,0 // vbroadcastss 0x615b(%rip),%ymm15 # 7ad8 <_sk_callback_avx+0x248>
+ .byte 196,98,125,24,61,59,99,0,0 // vbroadcastss 0x633b(%rip),%ymm15 # 7cb8 <_sk_callback_avx+0x248>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,37,71,97,0,0 // vbroadcastss 0x6147(%rip),%ymm12 # 7adc <_sk_callback_avx+0x24c>
+ .byte 196,98,125,24,37,39,99,0,0 // vbroadcastss 0x6327(%rip),%ymm12 # 7cbc <_sk_callback_avx+0x24c>
.byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -21473,7 +21851,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,173,96,0,0 // vbroadcastss 0x60ad(%rip),%ymm11 # 7ae0 <_sk_callback_avx+0x250>
+ .byte 196,98,125,24,29,141,98,0,0 // vbroadcastss 0x628d(%rip),%ymm11 # 7cc0 <_sk_callback_avx+0x250>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -21483,19 +21861,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,134,96,0,0 // vbroadcastss 0x6086(%rip),%ymm11 # 7aec <_sk_callback_avx+0x25c>
+ .byte 196,98,125,24,29,102,98,0,0 // vbroadcastss 0x6266(%rip),%ymm11 # 7ccc <_sk_callback_avx+0x25c>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,116,96,0,0 // vbroadcastss 0x6074(%rip),%ymm11 # 7ae8 <_sk_callback_avx+0x258>
+ .byte 196,98,125,24,29,84,98,0,0 // vbroadcastss 0x6254(%rip),%ymm11 # 7cc8 <_sk_callback_avx+0x258>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,92,96,0,0 // vbroadcastss 0x605c(%rip),%ymm2 # 7ae4 <_sk_callback_avx+0x254>
+ .byte 196,226,125,24,21,60,98,0,0 // vbroadcastss 0x623c(%rip),%ymm2 # 7cc4 <_sk_callback_avx+0x254>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,67,96,0,0 // vbroadcastss 0x6043(%rip),%ymm12 # 7af4 <_sk_callback_avx+0x264>
+ .byte 196,98,125,24,37,35,98,0,0 // vbroadcastss 0x6223(%rip),%ymm12 # 7cd4 <_sk_callback_avx+0x264>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -21505,7 +21883,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,6,96,0,0 // vbroadcastss 0x6006(%rip),%ymm8 # 7af0 <_sk_callback_avx+0x260>
+ .byte 196,98,125,24,5,230,97,0,0 // vbroadcastss 0x61e6(%rip),%ymm8 # 7cd0 <_sk_callback_avx+0x260>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21522,7 +21900,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,211,95,0,0 // vbroadcastss 0x5fd3(%rip),%ymm8 # 7af8 <_sk_callback_avx+0x268>
+ .byte 196,98,125,24,5,179,97,0,0 // vbroadcastss 0x61b3(%rip),%ymm8 # 7cd8 <_sk_callback_avx+0x268>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -21530,23 +21908,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,173,95,0,0 // vbroadcastss 0x5fad(%rip),%ymm11 # 7afc <_sk_callback_avx+0x26c>
+ .byte 196,98,125,24,29,141,97,0,0 // vbroadcastss 0x618d(%rip),%ymm11 # 7cdc <_sk_callback_avx+0x26c>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,151,95,0,0 // vbroadcastss 0x5f97(%rip),%ymm12 # 7b04 <_sk_callback_avx+0x274>
+ .byte 196,98,125,24,37,119,97,0,0 // vbroadcastss 0x6177(%rip),%ymm12 # 7ce4 <_sk_callback_avx+0x274>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,141,95,0,0 // vbroadcastss 0x5f8d(%rip),%ymm13 # 7b08 <_sk_callback_avx+0x278>
+ .byte 196,98,125,24,45,109,97,0,0 // vbroadcastss 0x616d(%rip),%ymm13 # 7ce8 <_sk_callback_avx+0x278>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,110,95,0,0 // vbroadcastss 0x5f6e(%rip),%ymm1 # 7b00 <_sk_callback_avx+0x270>
+ .byte 196,226,125,24,13,78,97,0,0 // vbroadcastss 0x614e(%rip),%ymm1 # 7ce0 <_sk_callback_avx+0x270>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,89,95,0,0 // vbroadcastss 0x5f59(%rip),%ymm14 # 7b0c <_sk_callback_avx+0x27c>
+ .byte 196,98,125,24,53,57,97,0,0 // vbroadcastss 0x6139(%rip),%ymm14 # 7cec <_sk_callback_avx+0x27c>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -21565,7 +21943,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,251,94,0,0 // vbroadcastss 0x5efb(%rip),%ymm0 # 7b10 <_sk_callback_avx+0x280>
+ .byte 196,226,125,24,5,219,96,0,0 // vbroadcastss 0x60db(%rip),%ymm0 # 7cf0 <_sk_callback_avx+0x280>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -21622,13 +22000,13 @@ _sk_scale_u8_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,75 // jne 1d1c <_sk_scale_u8_avx+0x64>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,1,98,0,0 // vpand 0x6201(%rip),%xmm8,%xmm8 # 7ee0 <_sk_callback_avx+0x650>
+ .byte 197,57,219,5,17,100,0,0 // vpand 0x6411(%rip),%xmm8,%xmm8 # 80f0 <_sk_callback_avx+0x680>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,18,94,0,0 // vbroadcastss 0x5e12(%rip),%ymm9 # 7b14 <_sk_callback_avx+0x284>
+ .byte 196,98,125,24,13,242,95,0,0 // vbroadcastss 0x5ff2(%rip),%ymm9 # 7cf4 <_sk_callback_avx+0x284>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -21726,13 +22104,13 @@ _sk_lerp_u8_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,111 // jne 1e9b <_sk_lerp_u8_avx+0x88>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,182,96,0,0 // vpand 0x60b6(%rip),%xmm8,%xmm8 # 7ef0 <_sk_callback_avx+0x660>
+ .byte 197,57,219,5,198,98,0,0 // vpand 0x62c6(%rip),%xmm8,%xmm8 # 8100 <_sk_callback_avx+0x690>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,187,92,0,0 // vbroadcastss 0x5cbb(%rip),%ymm9 # 7b18 <_sk_callback_avx+0x288>
+ .byte 196,98,125,24,13,155,94,0,0 // vbroadcastss 0x5e9b(%rip),%ymm9 # 7cf8 <_sk_callback_avx+0x288>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -21789,7 +22167,7 @@ _sk_lerp_u8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf001f48 <_sk_callback_avx+0xffffffffdeffa6b8>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf001f48 <_sk_callback_avx+0xffffffffdeffa4d8>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -21819,20 +22197,20 @@ _sk_lerp_565_avx:
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,132,91,0,0 // vbroadcastss 0x5b84(%rip),%ymm9 # 7b1c <_sk_callback_avx+0x28c>
+ .byte 196,98,125,24,13,100,93,0,0 // vbroadcastss 0x5d64(%rip),%ymm9 # 7cfc <_sk_callback_avx+0x28c>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,117,91,0,0 // vbroadcastss 0x5b75(%rip),%ymm10 # 7b20 <_sk_callback_avx+0x290>
+ .byte 196,98,125,24,21,85,93,0,0 // vbroadcastss 0x5d55(%rip),%ymm10 # 7d00 <_sk_callback_avx+0x290>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,107,91,0,0 // vbroadcastss 0x5b6b(%rip),%ymm10 # 7b24 <_sk_callback_avx+0x294>
+ .byte 196,98,125,24,21,75,93,0,0 // vbroadcastss 0x5d4b(%rip),%ymm10 # 7d04 <_sk_callback_avx+0x294>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,92,91,0,0 // vbroadcastss 0x5b5c(%rip),%ymm11 # 7b28 <_sk_callback_avx+0x298>
+ .byte 196,98,125,24,29,60,93,0,0 // vbroadcastss 0x5d3c(%rip),%ymm11 # 7d08 <_sk_callback_avx+0x298>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,82,91,0,0 // vbroadcastss 0x5b52(%rip),%ymm11 # 7b2c <_sk_callback_avx+0x29c>
+ .byte 196,98,125,24,29,50,93,0,0 // vbroadcastss 0x5d32(%rip),%ymm11 # 7d0c <_sk_callback_avx+0x29c>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,67,91,0,0 // vbroadcastss 0x5b43(%rip),%ymm11 # 7b30 <_sk_callback_avx+0x2a0>
+ .byte 196,98,125,24,29,35,93,0,0 // vbroadcastss 0x5d23(%rip),%ymm11 # 7d10 <_sk_callback_avx+0x2a0>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
@@ -21913,7 +22291,7 @@ _sk_load_tables_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,248,1,0,0 // jne 2300 <_sk_load_tables_avx+0x218>
.byte 196,65,124,16,18 // vmovups (%r10),%ymm10
- .byte 197,124,40,13,107,95,0,0 // vmovaps 0x5f6b(%rip),%ymm9 # 8080 <_sk_callback_avx+0x7f0>
+ .byte 197,124,40,13,139,97,0,0 // vmovaps 0x618b(%rip),%ymm9 # 82a0 <_sk_callback_avx+0x830>
.byte 196,193,44,84,201 // vandps %ymm9,%ymm10,%ymm1
.byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0
.byte 196,193,249,126,195 // vmovq %xmm0,%r11
@@ -22005,7 +22383,7 @@ _sk_load_tables_avx:
.byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,70,88,0,0 // vbroadcastss 0x5846(%rip),%ymm7 # 7b34 <_sk_callback_avx+0x2a4>
+ .byte 196,226,125,24,61,38,90,0,0 // vbroadcastss 0x5a26(%rip),%ymm7 # 7d14 <_sk_callback_avx+0x2a4>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -22019,9 +22397,9 @@ _sk_load_tables_avx:
.byte 73,211,235 // shr %cl,%r11
.byte 196,193,249,110,195 // vmovq %r11,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,216,91,0,0 // vpshufb 0x5bd8(%rip),%xmm0,%xmm1 # 7f00 <_sk_callback_avx+0x670>
+ .byte 196,226,121,0,13,232,93,0,0 // vpshufb 0x5de8(%rip),%xmm0,%xmm1 # 8110 <_sk_callback_avx+0x6a0>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,218,91,0,0 // vpshufb 0x5bda(%rip),%xmm0,%xmm0 # 7f10 <_sk_callback_avx+0x680>
+ .byte 196,226,121,0,5,234,93,0,0 // vpshufb 0x5dea(%rip),%xmm0,%xmm0 # 8120 <_sk_callback_avx+0x6b0>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,66,125,44,18 // vmaskmovps (%r10),%ymm0,%ymm10
@@ -22051,7 +22429,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11
.byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1
.byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12
- .byte 197,121,111,21,108,91,0,0 // vmovdqa 0x5b6c(%rip),%xmm10 # 7f20 <_sk_callback_avx+0x690>
+ .byte 197,121,111,21,124,93,0,0 // vmovdqa 0x5d7c(%rip),%xmm10 # 8130 <_sk_callback_avx+0x6c0>
.byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -22149,7 +22527,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,139,85,0,0 // vbroadcastss 0x558b(%rip),%ymm7 # 7b38 <_sk_callback_avx+0x2a8>
+ .byte 196,226,125,24,61,107,87,0,0 // vbroadcastss 0x576b(%rip),%ymm7 # 7d18 <_sk_callback_avx+0x2a8>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -22212,7 +22590,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,113,88,0,0 // vmovdqa 0x5871(%rip),%xmm9 # 7f30 <_sk_callback_avx+0x6a0>
+ .byte 197,121,111,13,129,90,0,0 // vmovdqa 0x5a81(%rip),%xmm9 # 8140 <_sk_callback_avx+0x6d0>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -22302,7 +22680,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2
.byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,174,82,0,0 // vbroadcastss 0x52ae(%rip),%ymm3 # 7b3c <_sk_callback_avx+0x2ac>
+ .byte 196,226,125,24,29,142,84,0,0 // vbroadcastss 0x548e(%rip),%ymm3 # 7d1c <_sk_callback_avx+0x2ac>
.byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
.byte 255,224 // jmpq *%rax
@@ -22345,7 +22723,7 @@ HIDDEN _sk_byte_tables_avx
FUNCTION(_sk_byte_tables_avx)
_sk_byte_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,234,81,0,0 // vbroadcastss 0x51ea(%rip),%ymm8 # 7b40 <_sk_callback_avx+0x2b0>
+ .byte 196,98,125,24,5,202,83,0,0 // vbroadcastss 0x53ca(%rip),%ymm8 # 7d20 <_sk_callback_avx+0x2b0>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -22464,7 +22842,7 @@ _sk_byte_tables_avx:
.byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1
.byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- .byte 196,98,125,24,13,148,79,0,0 // vbroadcastss 0x4f94(%rip),%ymm9 # 7b44 <_sk_callback_avx+0x2b4>
+ .byte 196,98,125,24,13,116,81,0,0 // vbroadcastss 0x5174(%rip),%ymm9 # 7d24 <_sk_callback_avx+0x2b4>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -22580,7 +22958,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,117,77,0,0 // vbroadcastss 0x4d75(%rip),%ymm9 # 7b48 <_sk_callback_avx+0x2b8>
+ .byte 196,98,125,24,13,85,79,0,0 // vbroadcastss 0x4f55(%rip),%ymm9 # 7d28 <_sk_callback_avx+0x2b8>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1
.byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2
@@ -22785,36 +23163,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,34,74,0,0 // vbroadcastss 0x4a22(%rip),%ymm12 # 7b4c <_sk_callback_avx+0x2bc>
+ .byte 196,98,125,24,37,2,76,0,0 // vbroadcastss 0x4c02(%rip),%ymm12 # 7d2c <_sk_callback_avx+0x2bc>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,24,74,0,0 // vbroadcastss 0x4a18(%rip),%ymm12 # 7b50 <_sk_callback_avx+0x2c0>
+ .byte 196,98,125,24,37,248,75,0,0 // vbroadcastss 0x4bf8(%rip),%ymm12 # 7d30 <_sk_callback_avx+0x2c0>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,14,74,0,0 // vbroadcastss 0x4a0e(%rip),%ymm12 # 7b54 <_sk_callback_avx+0x2c4>
+ .byte 196,98,125,24,37,238,75,0,0 // vbroadcastss 0x4bee(%rip),%ymm12 # 7d34 <_sk_callback_avx+0x2c4>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,4,74,0,0 // vbroadcastss 0x4a04(%rip),%ymm12 # 7b58 <_sk_callback_avx+0x2c8>
+ .byte 196,98,125,24,37,228,75,0,0 // vbroadcastss 0x4be4(%rip),%ymm12 # 7d38 <_sk_callback_avx+0x2c8>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,250,73,0,0 // vbroadcastss 0x49fa(%rip),%ymm12 # 7b5c <_sk_callback_avx+0x2cc>
+ .byte 196,98,125,24,37,218,75,0,0 // vbroadcastss 0x4bda(%rip),%ymm12 # 7d3c <_sk_callback_avx+0x2cc>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,235,73,0,0 // vbroadcastss 0x49eb(%rip),%ymm12 # 7b60 <_sk_callback_avx+0x2d0>
+ .byte 196,98,125,24,37,203,75,0,0 // vbroadcastss 0x4bcb(%rip),%ymm12 # 7d40 <_sk_callback_avx+0x2d0>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,225,73,0,0 // vbroadcastss 0x49e1(%rip),%ymm12 # 7b64 <_sk_callback_avx+0x2d4>
+ .byte 196,98,125,24,37,193,75,0,0 // vbroadcastss 0x4bc1(%rip),%ymm12 # 7d44 <_sk_callback_avx+0x2d4>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,197,73,0,0 // vbroadcastss 0x49c5(%rip),%ymm11 # 7b68 <_sk_callback_avx+0x2d8>
+ .byte 196,98,125,24,29,165,75,0,0 // vbroadcastss 0x4ba5(%rip),%ymm11 # 7d48 <_sk_callback_avx+0x2d8>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,187,73,0,0 // vbroadcastss 0x49bb(%rip),%ymm11 # 7b6c <_sk_callback_avx+0x2dc>
+ .byte 196,98,125,24,29,155,75,0,0 // vbroadcastss 0x4b9b(%rip),%ymm11 # 7d4c <_sk_callback_avx+0x2dc>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,172,73,0,0 // vbroadcastss 0x49ac(%rip),%ymm11 # 7b70 <_sk_callback_avx+0x2e0>
+ .byte 196,98,125,24,29,140,75,0,0 // vbroadcastss 0x4b8c(%rip),%ymm11 # 7d50 <_sk_callback_avx+0x2e0>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,162,73,0,0 // vbroadcastss 0x49a2(%rip),%ymm11 # 7b74 <_sk_callback_avx+0x2e4>
+ .byte 196,98,125,24,29,130,75,0,0 // vbroadcastss 0x4b82(%rip),%ymm11 # 7d54 <_sk_callback_avx+0x2e4>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,147,73,0,0 // vbroadcastss 0x4993(%rip),%ymm10 # 7b78 <_sk_callback_avx+0x2e8>
+ .byte 196,98,125,24,21,115,75,0,0 // vbroadcastss 0x4b73(%rip),%ymm10 # 7d58 <_sk_callback_avx+0x2e8>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -22822,7 +23200,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,106,73,0,0 // vbroadcastss 0x496a(%rip),%ymm8 # 7b7c <_sk_callback_avx+0x2ec>
+ .byte 196,98,125,24,5,74,75,0,0 // vbroadcastss 0x4b4a(%rip),%ymm8 # 7d5c <_sk_callback_avx+0x2ec>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -22844,36 +23222,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,27,73,0,0 // vbroadcastss 0x491b(%rip),%ymm12 # 7b80 <_sk_callback_avx+0x2f0>
+ .byte 196,98,125,24,37,251,74,0,0 // vbroadcastss 0x4afb(%rip),%ymm12 # 7d60 <_sk_callback_avx+0x2f0>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,17,73,0,0 // vbroadcastss 0x4911(%rip),%ymm12 # 7b84 <_sk_callback_avx+0x2f4>
+ .byte 196,98,125,24,37,241,74,0,0 // vbroadcastss 0x4af1(%rip),%ymm12 # 7d64 <_sk_callback_avx+0x2f4>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,7,73,0,0 // vbroadcastss 0x4907(%rip),%ymm12 # 7b88 <_sk_callback_avx+0x2f8>
+ .byte 196,98,125,24,37,231,74,0,0 // vbroadcastss 0x4ae7(%rip),%ymm12 # 7d68 <_sk_callback_avx+0x2f8>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,253,72,0,0 // vbroadcastss 0x48fd(%rip),%ymm12 # 7b8c <_sk_callback_avx+0x2fc>
+ .byte 196,98,125,24,37,221,74,0,0 // vbroadcastss 0x4add(%rip),%ymm12 # 7d6c <_sk_callback_avx+0x2fc>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,243,72,0,0 // vbroadcastss 0x48f3(%rip),%ymm12 # 7b90 <_sk_callback_avx+0x300>
+ .byte 196,98,125,24,37,211,74,0,0 // vbroadcastss 0x4ad3(%rip),%ymm12 # 7d70 <_sk_callback_avx+0x300>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,228,72,0,0 // vbroadcastss 0x48e4(%rip),%ymm12 # 7b94 <_sk_callback_avx+0x304>
+ .byte 196,98,125,24,37,196,74,0,0 // vbroadcastss 0x4ac4(%rip),%ymm12 # 7d74 <_sk_callback_avx+0x304>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,218,72,0,0 // vbroadcastss 0x48da(%rip),%ymm12 # 7b98 <_sk_callback_avx+0x308>
+ .byte 196,98,125,24,37,186,74,0,0 // vbroadcastss 0x4aba(%rip),%ymm12 # 7d78 <_sk_callback_avx+0x308>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,190,72,0,0 // vbroadcastss 0x48be(%rip),%ymm11 # 7b9c <_sk_callback_avx+0x30c>
+ .byte 196,98,125,24,29,158,74,0,0 // vbroadcastss 0x4a9e(%rip),%ymm11 # 7d7c <_sk_callback_avx+0x30c>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,180,72,0,0 // vbroadcastss 0x48b4(%rip),%ymm11 # 7ba0 <_sk_callback_avx+0x310>
+ .byte 196,98,125,24,29,148,74,0,0 // vbroadcastss 0x4a94(%rip),%ymm11 # 7d80 <_sk_callback_avx+0x310>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,165,72,0,0 // vbroadcastss 0x48a5(%rip),%ymm11 # 7ba4 <_sk_callback_avx+0x314>
+ .byte 196,98,125,24,29,133,74,0,0 // vbroadcastss 0x4a85(%rip),%ymm11 # 7d84 <_sk_callback_avx+0x314>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,155,72,0,0 // vbroadcastss 0x489b(%rip),%ymm11 # 7ba8 <_sk_callback_avx+0x318>
+ .byte 196,98,125,24,29,123,74,0,0 // vbroadcastss 0x4a7b(%rip),%ymm11 # 7d88 <_sk_callback_avx+0x318>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,140,72,0,0 // vbroadcastss 0x488c(%rip),%ymm10 # 7bac <_sk_callback_avx+0x31c>
+ .byte 196,98,125,24,21,108,74,0,0 // vbroadcastss 0x4a6c(%rip),%ymm10 # 7d8c <_sk_callback_avx+0x31c>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -22881,7 +23259,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,99,72,0,0 // vbroadcastss 0x4863(%rip),%ymm8 # 7bb0 <_sk_callback_avx+0x320>
+ .byte 196,98,125,24,5,67,74,0,0 // vbroadcastss 0x4a43(%rip),%ymm8 # 7d90 <_sk_callback_avx+0x320>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -22903,36 +23281,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,20,72,0,0 // vbroadcastss 0x4814(%rip),%ymm12 # 7bb4 <_sk_callback_avx+0x324>
+ .byte 196,98,125,24,37,244,73,0,0 // vbroadcastss 0x49f4(%rip),%ymm12 # 7d94 <_sk_callback_avx+0x324>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,10,72,0,0 // vbroadcastss 0x480a(%rip),%ymm12 # 7bb8 <_sk_callback_avx+0x328>
+ .byte 196,98,125,24,37,234,73,0,0 // vbroadcastss 0x49ea(%rip),%ymm12 # 7d98 <_sk_callback_avx+0x328>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,0,72,0,0 // vbroadcastss 0x4800(%rip),%ymm12 # 7bbc <_sk_callback_avx+0x32c>
+ .byte 196,98,125,24,37,224,73,0,0 // vbroadcastss 0x49e0(%rip),%ymm12 # 7d9c <_sk_callback_avx+0x32c>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,246,71,0,0 // vbroadcastss 0x47f6(%rip),%ymm12 # 7bc0 <_sk_callback_avx+0x330>
+ .byte 196,98,125,24,37,214,73,0,0 // vbroadcastss 0x49d6(%rip),%ymm12 # 7da0 <_sk_callback_avx+0x330>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,236,71,0,0 // vbroadcastss 0x47ec(%rip),%ymm12 # 7bc4 <_sk_callback_avx+0x334>
+ .byte 196,98,125,24,37,204,73,0,0 // vbroadcastss 0x49cc(%rip),%ymm12 # 7da4 <_sk_callback_avx+0x334>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,221,71,0,0 // vbroadcastss 0x47dd(%rip),%ymm12 # 7bc8 <_sk_callback_avx+0x338>
+ .byte 196,98,125,24,37,189,73,0,0 // vbroadcastss 0x49bd(%rip),%ymm12 # 7da8 <_sk_callback_avx+0x338>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,211,71,0,0 // vbroadcastss 0x47d3(%rip),%ymm12 # 7bcc <_sk_callback_avx+0x33c>
+ .byte 196,98,125,24,37,179,73,0,0 // vbroadcastss 0x49b3(%rip),%ymm12 # 7dac <_sk_callback_avx+0x33c>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,183,71,0,0 // vbroadcastss 0x47b7(%rip),%ymm11 # 7bd0 <_sk_callback_avx+0x340>
+ .byte 196,98,125,24,29,151,73,0,0 // vbroadcastss 0x4997(%rip),%ymm11 # 7db0 <_sk_callback_avx+0x340>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,173,71,0,0 // vbroadcastss 0x47ad(%rip),%ymm11 # 7bd4 <_sk_callback_avx+0x344>
+ .byte 196,98,125,24,29,141,73,0,0 // vbroadcastss 0x498d(%rip),%ymm11 # 7db4 <_sk_callback_avx+0x344>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,158,71,0,0 // vbroadcastss 0x479e(%rip),%ymm11 # 7bd8 <_sk_callback_avx+0x348>
+ .byte 196,98,125,24,29,126,73,0,0 // vbroadcastss 0x497e(%rip),%ymm11 # 7db8 <_sk_callback_avx+0x348>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,148,71,0,0 // vbroadcastss 0x4794(%rip),%ymm11 # 7bdc <_sk_callback_avx+0x34c>
+ .byte 196,98,125,24,29,116,73,0,0 // vbroadcastss 0x4974(%rip),%ymm11 # 7dbc <_sk_callback_avx+0x34c>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,133,71,0,0 // vbroadcastss 0x4785(%rip),%ymm10 # 7be0 <_sk_callback_avx+0x350>
+ .byte 196,98,125,24,21,101,73,0,0 // vbroadcastss 0x4965(%rip),%ymm10 # 7dc0 <_sk_callback_avx+0x350>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -22940,7 +23318,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,92,71,0,0 // vbroadcastss 0x475c(%rip),%ymm8 # 7be4 <_sk_callback_avx+0x354>
+ .byte 196,98,125,24,5,60,73,0,0 // vbroadcastss 0x493c(%rip),%ymm8 # 7dc4 <_sk_callback_avx+0x354>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -22962,36 +23340,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,13,71,0,0 // vbroadcastss 0x470d(%rip),%ymm12 # 7be8 <_sk_callback_avx+0x358>
+ .byte 196,98,125,24,37,237,72,0,0 // vbroadcastss 0x48ed(%rip),%ymm12 # 7dc8 <_sk_callback_avx+0x358>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,3,71,0,0 // vbroadcastss 0x4703(%rip),%ymm12 # 7bec <_sk_callback_avx+0x35c>
+ .byte 196,98,125,24,37,227,72,0,0 // vbroadcastss 0x48e3(%rip),%ymm12 # 7dcc <_sk_callback_avx+0x35c>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,249,70,0,0 // vbroadcastss 0x46f9(%rip),%ymm12 # 7bf0 <_sk_callback_avx+0x360>
+ .byte 196,98,125,24,37,217,72,0,0 // vbroadcastss 0x48d9(%rip),%ymm12 # 7dd0 <_sk_callback_avx+0x360>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,239,70,0,0 // vbroadcastss 0x46ef(%rip),%ymm12 # 7bf4 <_sk_callback_avx+0x364>
+ .byte 196,98,125,24,37,207,72,0,0 // vbroadcastss 0x48cf(%rip),%ymm12 # 7dd4 <_sk_callback_avx+0x364>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,229,70,0,0 // vbroadcastss 0x46e5(%rip),%ymm12 # 7bf8 <_sk_callback_avx+0x368>
+ .byte 196,98,125,24,37,197,72,0,0 // vbroadcastss 0x48c5(%rip),%ymm12 # 7dd8 <_sk_callback_avx+0x368>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,214,70,0,0 // vbroadcastss 0x46d6(%rip),%ymm12 # 7bfc <_sk_callback_avx+0x36c>
+ .byte 196,98,125,24,37,182,72,0,0 // vbroadcastss 0x48b6(%rip),%ymm12 # 7ddc <_sk_callback_avx+0x36c>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,204,70,0,0 // vbroadcastss 0x46cc(%rip),%ymm12 # 7c00 <_sk_callback_avx+0x370>
+ .byte 196,98,125,24,37,172,72,0,0 // vbroadcastss 0x48ac(%rip),%ymm12 # 7de0 <_sk_callback_avx+0x370>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,176,70,0,0 // vbroadcastss 0x46b0(%rip),%ymm11 # 7c04 <_sk_callback_avx+0x374>
+ .byte 196,98,125,24,29,144,72,0,0 // vbroadcastss 0x4890(%rip),%ymm11 # 7de4 <_sk_callback_avx+0x374>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,166,70,0,0 // vbroadcastss 0x46a6(%rip),%ymm11 # 7c08 <_sk_callback_avx+0x378>
+ .byte 196,98,125,24,29,134,72,0,0 // vbroadcastss 0x4886(%rip),%ymm11 # 7de8 <_sk_callback_avx+0x378>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,151,70,0,0 // vbroadcastss 0x4697(%rip),%ymm11 # 7c0c <_sk_callback_avx+0x37c>
+ .byte 196,98,125,24,29,119,72,0,0 // vbroadcastss 0x4877(%rip),%ymm11 # 7dec <_sk_callback_avx+0x37c>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,141,70,0,0 // vbroadcastss 0x468d(%rip),%ymm11 # 7c10 <_sk_callback_avx+0x380>
+ .byte 196,98,125,24,29,109,72,0,0 // vbroadcastss 0x486d(%rip),%ymm11 # 7df0 <_sk_callback_avx+0x380>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,126,70,0,0 // vbroadcastss 0x467e(%rip),%ymm10 # 7c14 <_sk_callback_avx+0x384>
+ .byte 196,98,125,24,21,94,72,0,0 // vbroadcastss 0x485e(%rip),%ymm10 # 7df4 <_sk_callback_avx+0x384>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -22999,40 +23377,139 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,85,70,0,0 // vbroadcastss 0x4655(%rip),%ymm8 # 7c18 <_sk_callback_avx+0x388>
+ .byte 196,98,125,24,5,53,72,0,0 // vbroadcastss 0x4835(%rip),%ymm8 # 7df8 <_sk_callback_avx+0x388>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_gamma_avx
+.globl _sk_gamma_avx
+FUNCTION(_sk_gamma_avx)
+_sk_gamma_avx:
+ .byte 72,131,236,88 // sub $0x58,%rsp
+ .byte 197,252,17,124,36,32 // vmovups %ymm7,0x20(%rsp)
+ .byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
+ .byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
+ .byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
+ .byte 197,252,17,92,36,160 // vmovups %ymm3,-0x60(%rsp)
+ .byte 197,252,40,250 // vmovaps %ymm2,%ymm7
+ .byte 197,252,40,233 // vmovaps %ymm1,%ymm5
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,252,91,200 // vcvtdq2ps %ymm0,%ymm1
+ .byte 196,98,125,24,5,248,71,0,0 // vbroadcastss 0x47f8(%rip),%ymm8 # 7dfc <_sk_callback_avx+0x38c>
+ .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
+ .byte 196,98,125,24,13,238,71,0,0 // vbroadcastss 0x47ee(%rip),%ymm9 # 7e00 <_sk_callback_avx+0x390>
+ .byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
+ .byte 196,226,125,24,37,228,71,0,0 // vbroadcastss 0x47e4(%rip),%ymm4 # 7e04 <_sk_callback_avx+0x394>
+ .byte 197,252,86,196 // vorps %ymm4,%ymm0,%ymm0
+ .byte 196,98,125,24,21,219,71,0,0 // vbroadcastss 0x47db(%rip),%ymm10 # 7e08 <_sk_callback_avx+0x398>
+ .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
+ .byte 196,98,125,24,29,209,71,0,0 // vbroadcastss 0x47d1(%rip),%ymm11 # 7e0c <_sk_callback_avx+0x39c>
+ .byte 196,193,124,89,211 // vmulps %ymm11,%ymm0,%ymm2
+ .byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
+ .byte 196,98,125,24,37,195,71,0,0 // vbroadcastss 0x47c3(%rip),%ymm12 # 7e10 <_sk_callback_avx+0x3a0>
+ .byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
+ .byte 196,98,125,24,45,185,71,0,0 // vbroadcastss 0x47b9(%rip),%ymm13 # 7e14 <_sk_callback_avx+0x3a4>
+ .byte 197,148,94,192 // vdivps %ymm0,%ymm13,%ymm0
+ .byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
+ .byte 196,98,125,24,48 // vbroadcastss (%rax),%ymm14
+ .byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
+ .byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
+ .byte 197,252,92,241 // vsubps %ymm1,%ymm0,%ymm6
+ .byte 196,98,125,24,61,152,71,0,0 // vbroadcastss 0x4798(%rip),%ymm15 # 7e18 <_sk_callback_avx+0x3a8>
+ .byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
+ .byte 196,226,125,24,29,142,71,0,0 // vbroadcastss 0x478e(%rip),%ymm3 # 7e1c <_sk_callback_avx+0x3ac>
+ .byte 197,204,89,203 // vmulps %ymm3,%ymm6,%ymm1
+ .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
+ .byte 196,226,125,24,21,129,71,0,0 // vbroadcastss 0x4781(%rip),%ymm2 # 7e20 <_sk_callback_avx+0x3b0>
+ .byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0
+ .byte 196,226,125,24,53,120,71,0,0 // vbroadcastss 0x4778(%rip),%ymm6 # 7e24 <_sk_callback_avx+0x3b4>
+ .byte 197,204,94,192 // vdivps %ymm0,%ymm6,%ymm0
+ .byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
+ .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
+ .byte 197,252,91,205 // vcvtdq2ps %ymm5,%ymm1
+ .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
+ .byte 196,193,84,84,233 // vandps %ymm9,%ymm5,%ymm5
+ .byte 197,212,86,236 // vorps %ymm4,%ymm5,%ymm5
+ .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
+ .byte 196,193,84,89,195 // vmulps %ymm11,%ymm5,%ymm0
+ .byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
+ .byte 196,193,84,88,204 // vaddps %ymm12,%ymm5,%ymm1
+ .byte 197,148,94,201 // vdivps %ymm1,%ymm13,%ymm1
+ .byte 197,252,92,193 // vsubps %ymm1,%ymm0,%ymm0
+ .byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
+ .byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
+ .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
+ .byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
+ .byte 197,244,89,235 // vmulps %ymm3,%ymm1,%ymm5
+ .byte 197,252,92,197 // vsubps %ymm5,%ymm0,%ymm0
+ .byte 197,236,92,201 // vsubps %ymm1,%ymm2,%ymm1
+ .byte 197,204,94,201 // vdivps %ymm1,%ymm6,%ymm1
+ .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
+ .byte 197,252,91,207 // vcvtdq2ps %ymm7,%ymm1
+ .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
+ .byte 196,193,68,84,233 // vandps %ymm9,%ymm7,%ymm5
+ .byte 197,212,86,228 // vorps %ymm4,%ymm5,%ymm4
+ .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
+ .byte 196,193,92,89,235 // vmulps %ymm11,%ymm4,%ymm5
+ .byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
+ .byte 196,193,92,88,228 // vaddps %ymm12,%ymm4,%ymm4
+ .byte 197,148,94,228 // vdivps %ymm4,%ymm13,%ymm4
+ .byte 197,244,92,204 // vsubps %ymm4,%ymm1,%ymm1
+ .byte 196,193,116,89,206 // vmulps %ymm14,%ymm1,%ymm1
+ .byte 196,227,125,8,225,1 // vroundps $0x1,%ymm1,%ymm4
+ .byte 197,244,92,228 // vsubps %ymm4,%ymm1,%ymm4
+ .byte 196,193,116,88,207 // vaddps %ymm15,%ymm1,%ymm1
+ .byte 197,220,89,219 // vmulps %ymm3,%ymm4,%ymm3
+ .byte 197,244,92,203 // vsubps %ymm3,%ymm1,%ymm1
+ .byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
+ .byte 197,204,94,210 // vdivps %ymm2,%ymm6,%ymm2
+ .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
+ .byte 196,226,125,24,21,187,70,0,0 // vbroadcastss 0x46bb(%rip),%ymm2 # 7e28 <_sk_callback_avx+0x3b8>
+ .byte 197,236,89,92,36,128 // vmulps -0x80(%rsp),%ymm2,%ymm3
+ .byte 197,252,89,226 // vmulps %ymm2,%ymm0,%ymm4
+ .byte 197,244,89,210 // vmulps %ymm2,%ymm1,%ymm2
+ .byte 197,253,91,195 // vcvtps2dq %ymm3,%ymm0
+ .byte 197,253,91,204 // vcvtps2dq %ymm4,%ymm1
+ .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,252,16,92,36,160 // vmovups -0x60(%rsp),%ymm3
+ .byte 197,252,16,100,36,192 // vmovups -0x40(%rsp),%ymm4
+ .byte 197,252,16,108,36,224 // vmovups -0x20(%rsp),%ymm5
+ .byte 197,252,16,52,36 // vmovups (%rsp),%ymm6
+ .byte 197,252,16,124,36,32 // vmovups 0x20(%rsp),%ymm7
+ .byte 72,131,196,88 // add $0x58,%rsp
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,71,70,0,0 // vbroadcastss 0x4647(%rip),%ymm8 # 7c1c <_sk_callback_avx+0x38c>
+ .byte 196,98,125,24,5,119,70,0,0 // vbroadcastss 0x4677(%rip),%ymm8 # 7e2c <_sk_callback_avx+0x3bc>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,61,70,0,0 // vbroadcastss 0x463d(%rip),%ymm8 # 7c20 <_sk_callback_avx+0x390>
+ .byte 196,98,125,24,5,109,70,0,0 // vbroadcastss 0x466d(%rip),%ymm8 # 7e30 <_sk_callback_avx+0x3c0>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,51,70,0,0 // vbroadcastss 0x4633(%rip),%ymm9 # 7c24 <_sk_callback_avx+0x394>
+ .byte 196,98,125,24,13,99,70,0,0 // vbroadcastss 0x4663(%rip),%ymm9 # 7e34 <_sk_callback_avx+0x3c4>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,31,70,0,0 // vbroadcastss 0x461f(%rip),%ymm8 # 7c28 <_sk_callback_avx+0x398>
+ .byte 196,98,125,24,5,79,70,0,0 // vbroadcastss 0x464f(%rip),%ymm8 # 7e38 <_sk_callback_avx+0x3c8>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,21,70,0,0 // vbroadcastss 0x4615(%rip),%ymm8 # 7c2c <_sk_callback_avx+0x39c>
+ .byte 196,98,125,24,5,69,70,0,0 // vbroadcastss 0x4645(%rip),%ymm8 # 7e3c <_sk_callback_avx+0x3cc>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,11,70,0,0 // vbroadcastss 0x460b(%rip),%ymm8 # 7c30 <_sk_callback_avx+0x3a0>
+ .byte 196,98,125,24,5,59,70,0,0 // vbroadcastss 0x463b(%rip),%ymm8 # 7e40 <_sk_callback_avx+0x3d0>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,253,69,0,0 // vbroadcastss 0x45fd(%rip),%ymm8 # 7c34 <_sk_callback_avx+0x3a4>
+ .byte 196,98,125,24,5,45,70,0,0 // vbroadcastss 0x462d(%rip),%ymm8 # 7e44 <_sk_callback_avx+0x3d4>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,230,69,0,0 // vbroadcastss 0x45e6(%rip),%ymm9 # 7c38 <_sk_callback_avx+0x3a8>
+ .byte 196,98,125,24,13,22,70,0,0 // vbroadcastss 0x4616(%rip),%ymm9 # 7e48 <_sk_callback_avx+0x3d8>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,219,69,0,0 // vbroadcastss 0x45db(%rip),%ymm11 # 7c3c <_sk_callback_avx+0x3ac>
+ .byte 196,98,125,24,29,11,70,0,0 // vbroadcastss 0x460b(%rip),%ymm11 # 7e4c <_sk_callback_avx+0x3dc>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,209,69,0,0 // vbroadcastss 0x45d1(%rip),%ymm12 # 7c40 <_sk_callback_avx+0x3b0>
+ .byte 196,98,125,24,37,1,70,0,0 // vbroadcastss 0x4601(%rip),%ymm12 # 7e50 <_sk_callback_avx+0x3e0>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -23047,9 +23524,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,135,69,0,0 // vbroadcastss 0x4587(%rip),%ymm0 # 7c44 <_sk_callback_avx+0x3b4>
+ .byte 196,226,125,24,5,183,69,0,0 // vbroadcastss 0x45b7(%rip),%ymm0 # 7e54 <_sk_callback_avx+0x3e4>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,126,69,0,0 // vbroadcastss 0x457e(%rip),%ymm8 # 7c48 <_sk_callback_avx+0x3b8>
+ .byte 196,98,125,24,5,174,69,0,0 // vbroadcastss 0x45ae(%rip),%ymm8 # 7e58 <_sk_callback_avx+0x3e8>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23066,15 +23543,15 @@ _sk_load_a8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne 372f <_sk_load_a8_avx+0x5c>
+ .byte 117,67 // jne 390f <_sk_load_a8_avx+0x5c>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,70,72,0,0 // vpand 0x4846(%rip),%xmm0,%xmm0 # 7f40 <_sk_callback_avx+0x6b0>
+ .byte 197,249,219,5,118,72,0,0 // vpand 0x4876(%rip),%xmm0,%xmm0 # 8150 <_sk_callback_avx+0x6e0>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,50,69,0,0 // vbroadcastss 0x4532(%rip),%ymm1 # 7c4c <_sk_callback_avx+0x3bc>
+ .byte 196,226,125,24,13,98,69,0,0 // vbroadcastss 0x4562(%rip),%ymm1 # 7e5c <_sk_callback_avx+0x3ec>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -23087,15 +23564,15 @@ _sk_load_a8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja 36f2 <_sk_load_a8_avx+0x1f>
+ .byte 119,175 // ja 38d2 <_sk_load_a8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 37c8 <_sk_load_a8_avx+0xf5>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 39a8 <_sk_load_a8_avx+0xf5>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,144 // jmp 36f2 <_sk_load_a8_avx+0x1f>
+ .byte 235,144 // jmp 38d2 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -23103,7 +23580,7 @@ _sk_load_a8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,104,255,255,255 // jmpq 36f2 <_sk_load_a8_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq 38d2 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -23114,7 +23591,7 @@ _sk_load_a8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,45,255,255,255 // jmpq 36f2 <_sk_load_a8_avx+0x1f>
+ .byte 233,45,255,255,255 // jmpq 38d2 <_sk_load_a8_avx+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -23148,15 +23625,15 @@ _sk_load_a8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne 3840 <_sk_load_a8_dst_avx+0x5c>
+ .byte 117,67 // jne 3a20 <_sk_load_a8_dst_avx+0x5c>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,69,71,0,0 // vpand 0x4745(%rip),%xmm4,%xmm4 # 7f50 <_sk_callback_avx+0x6c0>
+ .byte 197,217,219,37,117,71,0,0 // vpand 0x4775(%rip),%xmm4,%xmm4 # 8160 <_sk_callback_avx+0x6f0>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,37,68,0,0 // vbroadcastss 0x4425(%rip),%ymm5 # 7c50 <_sk_callback_avx+0x3c0>
+ .byte 196,226,125,24,45,85,68,0,0 // vbroadcastss 0x4455(%rip),%ymm5 # 7e60 <_sk_callback_avx+0x3f0>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -23169,15 +23646,15 @@ _sk_load_a8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja 3803 <_sk_load_a8_dst_avx+0x1f>
+ .byte 119,175 // ja 39e3 <_sk_load_a8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 38d8 <_sk_load_a8_dst_avx+0xf4>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 3ab8 <_sk_load_a8_dst_avx+0xf4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,144 // jmp 3803 <_sk_load_a8_dst_avx+0x1f>
+ .byte 235,144 // jmp 39e3 <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -23185,7 +23662,7 @@ _sk_load_a8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,104,255,255,255 // jmpq 3803 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq 39e3 <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -23196,7 +23673,7 @@ _sk_load_a8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,45,255,255,255 // jmpq 3803 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,45,255,255,255 // jmpq 39e3 <_sk_load_a8_dst_avx+0x1f>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -23205,7 +23682,7 @@ _sk_load_a8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde0038e8 <_sk_callback_avx+0xffffffffddffc058>
+ .byte 232,255,255,255,221 // callq ffffffffde003ac8 <_sk_callback_avx+0xffffffffddffc058>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -23260,7 +23737,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,148,66,0,0 // vbroadcastss 0x4294(%rip),%ymm1 # 7c54 <_sk_callback_avx+0x3c4>
+ .byte 196,226,125,24,13,196,66,0,0 // vbroadcastss 0x42c4(%rip),%ymm1 # 7e64 <_sk_callback_avx+0x3f4>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -23279,14 +23756,14 @@ _sk_store_a8_avx:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,103,66,0,0 // vbroadcastss 0x4267(%rip),%ymm8 # 7c58 <_sk_callback_avx+0x3c8>
+ .byte 196,98,125,24,5,151,66,0,0 // vbroadcastss 0x4297(%rip),%ymm8 # 7e68 <_sk_callback_avx+0x3f8>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3a1b <_sk_store_a8_avx+0x47>
+ .byte 117,11 // jne 3bfb <_sk_store_a8_avx+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -23295,25 +23772,25 @@ _sk_store_a8_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3a16 <_sk_store_a8_avx+0x42>
+ .byte 119,235 // ja 3bf6 <_sk_store_a8_avx+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 3a90 <_sk_store_a8_avx+0xbc>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 3c70 <_sk_store_a8_avx+0xbc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp 3a16 <_sk_store_a8_avx+0x42>
+ .byte 235,201 // jmp 3bf6 <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,2,69,0,0 // vpshufb 0x4502(%rip),%xmm8,%xmm8 # 7f60 <_sk_callback_avx+0x6d0>
+ .byte 196,98,57,0,5,50,69,0,0 // vpshufb 0x4532(%rip),%xmm8,%xmm8 # 8170 <_sk_callback_avx+0x700>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp 3a16 <_sk_store_a8_avx+0x42>
+ .byte 235,175 // jmp 3bf6 <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,232,68,0,0 // vpshufb 0x44e8(%rip),%xmm8,%xmm8 # 7f70 <_sk_callback_avx+0x6e0>
+ .byte 196,98,57,0,5,24,69,0,0 // vpshufb 0x4518(%rip),%xmm8,%xmm8 # 8180 <_sk_callback_avx+0x710>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp 3a16 <_sk_store_a8_avx+0x42>
+ .byte 235,134 // jmp 3bf6 <_sk_store_a8_avx+0x42>
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
.byte 255,197 // inc %ebp
@@ -23346,18 +23823,18 @@ _sk_load_g8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 3b0d <_sk_load_g8_avx+0x61>
+ .byte 117,72 // jne 3ced <_sk_load_g8_avx+0x61>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,173,68,0,0 // vpand 0x44ad(%rip),%xmm0,%xmm0 # 7f80 <_sk_callback_avx+0x6f0>
+ .byte 197,249,219,5,221,68,0,0 // vpand 0x44dd(%rip),%xmm0,%xmm0 # 8190 <_sk_callback_avx+0x720>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,105,65,0,0 // vbroadcastss 0x4169(%rip),%ymm1 # 7c5c <_sk_callback_avx+0x3cc>
+ .byte 196,226,125,24,13,153,65,0,0 // vbroadcastss 0x4199(%rip),%ymm1 # 7e6c <_sk_callback_avx+0x3fc>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,94,65,0,0 // vbroadcastss 0x415e(%rip),%ymm3 # 7c60 <_sk_callback_avx+0x3d0>
+ .byte 196,226,125,24,29,142,65,0,0 // vbroadcastss 0x418e(%rip),%ymm3 # 7e70 <_sk_callback_avx+0x400>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -23367,15 +23844,15 @@ _sk_load_g8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja 3acb <_sk_load_g8_avx+0x1f>
+ .byte 119,170 // ja 3cab <_sk_load_g8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # 3ba4 <_sk_load_g8_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # 3d84 <_sk_load_g8_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,139 // jmp 3acb <_sk_load_g8_avx+0x1f>
+ .byte 235,139 // jmp 3cab <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -23383,7 +23860,7 @@ _sk_load_g8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,99,255,255,255 // jmpq 3acb <_sk_load_g8_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq 3cab <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -23394,7 +23871,7 @@ _sk_load_g8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,40,255,255,255 // jmpq 3acb <_sk_load_g8_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq 3cab <_sk_load_g8_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -23403,7 +23880,7 @@ _sk_load_g8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf003bb4 <_sk_callback_avx+0xffffffffdeffc324>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf003d94 <_sk_callback_avx+0xffffffffdeffc324>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -23426,18 +23903,18 @@ _sk_load_g8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 3c21 <_sk_load_g8_dst_avx+0x61>
+ .byte 117,72 // jne 3e01 <_sk_load_g8_dst_avx+0x61>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,169,67,0,0 // vpand 0x43a9(%rip),%xmm4,%xmm4 # 7f90 <_sk_callback_avx+0x700>
+ .byte 197,217,219,37,217,67,0,0 // vpand 0x43d9(%rip),%xmm4,%xmm4 # 81a0 <_sk_callback_avx+0x730>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,93,64,0,0 // vbroadcastss 0x405d(%rip),%ymm5 # 7c64 <_sk_callback_avx+0x3d4>
+ .byte 196,226,125,24,45,141,64,0,0 // vbroadcastss 0x408d(%rip),%ymm5 # 7e74 <_sk_callback_avx+0x404>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,82,64,0,0 // vbroadcastss 0x4052(%rip),%ymm7 # 7c68 <_sk_callback_avx+0x3d8>
+ .byte 196,226,125,24,61,130,64,0,0 // vbroadcastss 0x4082(%rip),%ymm7 # 7e78 <_sk_callback_avx+0x408>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -23447,15 +23924,15 @@ _sk_load_g8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja 3bdf <_sk_load_g8_dst_avx+0x1f>
+ .byte 119,170 // ja 3dbf <_sk_load_g8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # 3cb8 <_sk_load_g8_dst_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # 3e98 <_sk_load_g8_dst_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,139 // jmp 3bdf <_sk_load_g8_dst_avx+0x1f>
+ .byte 235,139 // jmp 3dbf <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -23463,7 +23940,7 @@ _sk_load_g8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,99,255,255,255 // jmpq 3bdf <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq 3dbf <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -23474,7 +23951,7 @@ _sk_load_g8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,40,255,255,255 // jmpq 3bdf <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq 3dbf <_sk_load_g8_dst_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -23483,7 +23960,7 @@ _sk_load_g8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf003cc8 <_sk_callback_avx+0xffffffffdeffc438>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf003ea8 <_sk_callback_avx+0xffffffffdeffc438>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -23538,10 +24015,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,204,62,0,0 // vbroadcastss 0x3ecc(%rip),%ymm1 # 7c6c <_sk_callback_avx+0x3dc>
+ .byte 196,226,125,24,13,252,62,0,0 // vbroadcastss 0x3efc(%rip),%ymm1 # 7e7c <_sk_callback_avx+0x40c>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,193,62,0,0 // vbroadcastss 0x3ec1(%rip),%ymm3 # 7c70 <_sk_callback_avx+0x3e0>
+ .byte 196,226,125,24,29,241,62,0,0 // vbroadcastss 0x3ef1(%rip),%ymm3 # 7e80 <_sk_callback_avx+0x410>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -23559,29 +24036,29 @@ _sk_load_565_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne 3e5a <_sk_load_565_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne 403a <_sk_load_565_avx+0xa1>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,121,62,0,0 // vbroadcastss 0x3e79(%rip),%ymm0 # 7c74 <_sk_callback_avx+0x3e4>
+ .byte 196,226,125,24,5,169,62,0,0 // vbroadcastss 0x3ea9(%rip),%ymm0 # 7e84 <_sk_callback_avx+0x414>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,108,62,0,0 // vbroadcastss 0x3e6c(%rip),%ymm1 # 7c78 <_sk_callback_avx+0x3e8>
+ .byte 196,226,125,24,13,156,62,0,0 // vbroadcastss 0x3e9c(%rip),%ymm1 # 7e88 <_sk_callback_avx+0x418>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,99,62,0,0 // vbroadcastss 0x3e63(%rip),%ymm1 # 7c7c <_sk_callback_avx+0x3ec>
+ .byte 196,226,125,24,13,147,62,0,0 // vbroadcastss 0x3e93(%rip),%ymm1 # 7e8c <_sk_callback_avx+0x41c>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,86,62,0,0 // vbroadcastss 0x3e56(%rip),%ymm3 # 7c80 <_sk_callback_avx+0x3f0>
+ .byte 196,226,125,24,29,134,62,0,0 // vbroadcastss 0x3e86(%rip),%ymm3 # 7e90 <_sk_callback_avx+0x420>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,77,62,0,0 // vbroadcastss 0x3e4d(%rip),%ymm3 # 7c84 <_sk_callback_avx+0x3f4>
+ .byte 196,226,125,24,29,125,62,0,0 // vbroadcastss 0x3e7d(%rip),%ymm3 # 7e94 <_sk_callback_avx+0x424>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,64,62,0,0 // vbroadcastss 0x3e40(%rip),%ymm3 # 7c88 <_sk_callback_avx+0x3f8>
+ .byte 196,226,125,24,29,112,62,0,0 // vbroadcastss 0x3e70(%rip),%ymm3 # 7e98 <_sk_callback_avx+0x428>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,53,62,0,0 // vbroadcastss 0x3e35(%rip),%ymm3 # 7c8c <_sk_callback_avx+0x3fc>
+ .byte 196,226,125,24,29,101,62,0,0 // vbroadcastss 0x3e65(%rip),%ymm3 # 7e9c <_sk_callback_avx+0x42c>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -23589,27 +24066,27 @@ _sk_load_565_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja 3ddf <_sk_load_565_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja 3fbf <_sk_load_565_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 3ee0 <_sk_load_565_avx+0x127>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 40c0 <_sk_load_565_avx+0x127>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,75,255,255,255 // jmpq 3ddf <_sk_load_565_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq 3fbf <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,46,255,255,255 // jmpq 3ddf <_sk_load_565_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq 3fbf <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,1,255,255,255 // jmpq 3ddf <_sk_load_565_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq 3fbf <_sk_load_565_avx+0x26>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -23643,29 +24120,29 @@ _sk_load_565_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne 3f9d <_sk_load_565_dst_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne 417d <_sk_load_565_dst_avx+0xa1>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- .byte 196,226,125,24,37,82,61,0,0 // vbroadcastss 0x3d52(%rip),%ymm4 # 7c90 <_sk_callback_avx+0x400>
+ .byte 196,226,125,24,37,130,61,0,0 // vbroadcastss 0x3d82(%rip),%ymm4 # 7ea0 <_sk_callback_avx+0x430>
.byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,69,61,0,0 // vbroadcastss 0x3d45(%rip),%ymm5 # 7c94 <_sk_callback_avx+0x404>
+ .byte 196,226,125,24,45,117,61,0,0 // vbroadcastss 0x3d75(%rip),%ymm5 # 7ea4 <_sk_callback_avx+0x434>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,60,61,0,0 // vbroadcastss 0x3d3c(%rip),%ymm5 # 7c98 <_sk_callback_avx+0x408>
+ .byte 196,226,125,24,45,108,61,0,0 // vbroadcastss 0x3d6c(%rip),%ymm5 # 7ea8 <_sk_callback_avx+0x438>
.byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,47,61,0,0 // vbroadcastss 0x3d2f(%rip),%ymm7 # 7c9c <_sk_callback_avx+0x40c>
+ .byte 196,226,125,24,61,95,61,0,0 // vbroadcastss 0x3d5f(%rip),%ymm7 # 7eac <_sk_callback_avx+0x43c>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,24,61,38,61,0,0 // vbroadcastss 0x3d26(%rip),%ymm7 # 7ca0 <_sk_callback_avx+0x410>
+ .byte 196,226,125,24,61,86,61,0,0 // vbroadcastss 0x3d56(%rip),%ymm7 # 7eb0 <_sk_callback_avx+0x440>
.byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,25,61,0,0 // vbroadcastss 0x3d19(%rip),%ymm7 # 7ca4 <_sk_callback_avx+0x414>
+ .byte 196,226,125,24,61,73,61,0,0 // vbroadcastss 0x3d49(%rip),%ymm7 # 7eb4 <_sk_callback_avx+0x444>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,14,61,0,0 // vbroadcastss 0x3d0e(%rip),%ymm7 # 7ca8 <_sk_callback_avx+0x418>
+ .byte 196,226,125,24,61,62,61,0,0 // vbroadcastss 0x3d3e(%rip),%ymm7 # 7eb8 <_sk_callback_avx+0x448>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -23673,27 +24150,27 @@ _sk_load_565_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja 3f22 <_sk_load_565_dst_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja 4102 <_sk_load_565_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 4024 <_sk_load_565_dst_avx+0x128>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 4204 <_sk_load_565_dst_avx+0x128>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,75,255,255,255 // jmpq 3f22 <_sk_load_565_dst_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq 4102 <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,46,255,255,255 // jmpq 3f22 <_sk_load_565_dst_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq 4102 <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,1,255,255,255 // jmpq 3f22 <_sk_load_565_dst_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq 4102 <_sk_load_565_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -23765,23 +24242,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,154,59,0,0 // vbroadcastss 0x3b9a(%rip),%ymm0 # 7cac <_sk_callback_avx+0x41c>
+ .byte 196,226,125,24,5,202,59,0,0 // vbroadcastss 0x3bca(%rip),%ymm0 # 7ebc <_sk_callback_avx+0x44c>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,141,59,0,0 // vbroadcastss 0x3b8d(%rip),%ymm1 # 7cb0 <_sk_callback_avx+0x420>
+ .byte 196,226,125,24,13,189,59,0,0 // vbroadcastss 0x3bbd(%rip),%ymm1 # 7ec0 <_sk_callback_avx+0x450>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,132,59,0,0 // vbroadcastss 0x3b84(%rip),%ymm1 # 7cb4 <_sk_callback_avx+0x424>
+ .byte 196,226,125,24,13,180,59,0,0 // vbroadcastss 0x3bb4(%rip),%ymm1 # 7ec4 <_sk_callback_avx+0x454>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,119,59,0,0 // vbroadcastss 0x3b77(%rip),%ymm3 # 7cb8 <_sk_callback_avx+0x428>
+ .byte 196,226,125,24,29,167,59,0,0 // vbroadcastss 0x3ba7(%rip),%ymm3 # 7ec8 <_sk_callback_avx+0x458>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,110,59,0,0 // vbroadcastss 0x3b6e(%rip),%ymm3 # 7cbc <_sk_callback_avx+0x42c>
+ .byte 196,226,125,24,29,158,59,0,0 // vbroadcastss 0x3b9e(%rip),%ymm3 # 7ecc <_sk_callback_avx+0x45c>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,97,59,0,0 // vbroadcastss 0x3b61(%rip),%ymm3 # 7cc0 <_sk_callback_avx+0x430>
+ .byte 196,226,125,24,29,145,59,0,0 // vbroadcastss 0x3b91(%rip),%ymm3 # 7ed0 <_sk_callback_avx+0x460>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,86,59,0,0 // vbroadcastss 0x3b56(%rip),%ymm3 # 7cc4 <_sk_callback_avx+0x434>
+ .byte 196,226,125,24,29,134,59,0,0 // vbroadcastss 0x3b86(%rip),%ymm3 # 7ed4 <_sk_callback_avx+0x464>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_avx
@@ -23796,14 +24273,14 @@ _sk_store_565_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,56,59,0,0 // vbroadcastss 0x3b38(%rip),%ymm8 # 7cc8 <_sk_callback_avx+0x438>
+ .byte 196,98,125,24,5,104,59,0,0 // vbroadcastss 0x3b68(%rip),%ymm8 # 7ed8 <_sk_callback_avx+0x468>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,17,59,0,0 // vbroadcastss 0x3b11(%rip),%ymm10 # 7ccc <_sk_callback_avx+0x43c>
+ .byte 196,98,125,24,21,65,59,0,0 // vbroadcastss 0x3b41(%rip),%ymm10 # 7edc <_sk_callback_avx+0x46c>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -23817,7 +24294,7 @@ _sk_store_565_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 420c <_sk_store_565_avx+0x9c>
+ .byte 117,11 // jne 43ec <_sk_store_565_avx+0x9c>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -23826,22 +24303,22 @@ _sk_store_565_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 4207 <_sk_store_565_avx+0x97>
+ .byte 119,235 // ja 43e7 <_sk_store_565_avx+0x97>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # 426c <_sk_store_565_avx+0xfc>
+ .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # 444c <_sk_store_565_avx+0xfc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 4207 <_sk_store_565_avx+0x97>
+ .byte 235,206 // jmp 43e7 <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 4207 <_sk_store_565_avx+0x97>
+ .byte 235,190 // jmp 43e7 <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 4207 <_sk_store_565_avx+0x97>
+ .byte 235,158 // jmp 43e7 <_sk_store_565_avx+0x97>
.byte 15,31,0 // nopl (%rax)
.byte 196 // (bad)
.byte 255 // (bad)
@@ -23880,31 +24357,31 @@ _sk_load_4444_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne 4341 <_sk_load_4444_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne 4521 <_sk_load_4444_avx+0xb9>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,6,58,0,0 // vbroadcastss 0x3a06(%rip),%ymm0 # 7cd0 <_sk_callback_avx+0x440>
+ .byte 196,226,125,24,5,54,58,0,0 // vbroadcastss 0x3a36(%rip),%ymm0 # 7ee0 <_sk_callback_avx+0x470>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,249,57,0,0 // vbroadcastss 0x39f9(%rip),%ymm1 # 7cd4 <_sk_callback_avx+0x444>
+ .byte 196,226,125,24,13,41,58,0,0 // vbroadcastss 0x3a29(%rip),%ymm1 # 7ee4 <_sk_callback_avx+0x474>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,240,57,0,0 // vbroadcastss 0x39f0(%rip),%ymm1 # 7cd8 <_sk_callback_avx+0x448>
+ .byte 196,226,125,24,13,32,58,0,0 // vbroadcastss 0x3a20(%rip),%ymm1 # 7ee8 <_sk_callback_avx+0x478>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,227,57,0,0 // vbroadcastss 0x39e3(%rip),%ymm2 # 7cdc <_sk_callback_avx+0x44c>
+ .byte 196,226,125,24,21,19,58,0,0 // vbroadcastss 0x3a13(%rip),%ymm2 # 7eec <_sk_callback_avx+0x47c>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,218,57,0,0 // vbroadcastss 0x39da(%rip),%ymm2 # 7ce0 <_sk_callback_avx+0x450>
+ .byte 196,226,125,24,21,10,58,0,0 // vbroadcastss 0x3a0a(%rip),%ymm2 # 7ef0 <_sk_callback_avx+0x480>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,205,57,0,0 // vbroadcastss 0x39cd(%rip),%ymm8 # 7ce4 <_sk_callback_avx+0x454>
+ .byte 196,98,125,24,5,253,57,0,0 // vbroadcastss 0x39fd(%rip),%ymm8 # 7ef4 <_sk_callback_avx+0x484>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,195,57,0,0 // vbroadcastss 0x39c3(%rip),%ymm8 # 7ce8 <_sk_callback_avx+0x458>
+ .byte 196,98,125,24,5,243,57,0,0 // vbroadcastss 0x39f3(%rip),%ymm8 # 7ef8 <_sk_callback_avx+0x488>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,181,57,0,0 // vbroadcastss 0x39b5(%rip),%ymm8 # 7cec <_sk_callback_avx+0x45c>
+ .byte 196,98,125,24,5,229,57,0,0 // vbroadcastss 0x39e5(%rip),%ymm8 # 7efc <_sk_callback_avx+0x48c>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -23914,27 +24391,27 @@ _sk_load_4444_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja 42ae <_sk_load_4444_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja 448e <_sk_load_4444_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 43c8 <_sk_load_4444_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 45a8 <_sk_load_4444_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,51,255,255,255 // jmpq 42ae <_sk_load_4444_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq 448e <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,22,255,255,255 // jmpq 42ae <_sk_load_4444_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq 448e <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,233,254,255,255 // jmpq 42ae <_sk_load_4444_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq 448e <_sk_load_4444_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -23971,31 +24448,31 @@ _sk_load_4444_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne 449d <_sk_load_4444_dst_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne 467d <_sk_load_4444_dst_avx+0xb9>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- .byte 196,226,125,24,37,202,56,0,0 // vbroadcastss 0x38ca(%rip),%ymm4 # 7cf0 <_sk_callback_avx+0x460>
+ .byte 196,226,125,24,37,250,56,0,0 // vbroadcastss 0x38fa(%rip),%ymm4 # 7f00 <_sk_callback_avx+0x490>
.byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,189,56,0,0 // vbroadcastss 0x38bd(%rip),%ymm5 # 7cf4 <_sk_callback_avx+0x464>
+ .byte 196,226,125,24,45,237,56,0,0 // vbroadcastss 0x38ed(%rip),%ymm5 # 7f04 <_sk_callback_avx+0x494>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,180,56,0,0 // vbroadcastss 0x38b4(%rip),%ymm5 # 7cf8 <_sk_callback_avx+0x468>
+ .byte 196,226,125,24,45,228,56,0,0 // vbroadcastss 0x38e4(%rip),%ymm5 # 7f08 <_sk_callback_avx+0x498>
.byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,167,56,0,0 // vbroadcastss 0x38a7(%rip),%ymm6 # 7cfc <_sk_callback_avx+0x46c>
+ .byte 196,226,125,24,53,215,56,0,0 // vbroadcastss 0x38d7(%rip),%ymm6 # 7f0c <_sk_callback_avx+0x49c>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,24,53,158,56,0,0 // vbroadcastss 0x389e(%rip),%ymm6 # 7d00 <_sk_callback_avx+0x470>
+ .byte 196,226,125,24,53,206,56,0,0 // vbroadcastss 0x38ce(%rip),%ymm6 # 7f10 <_sk_callback_avx+0x4a0>
.byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,145,56,0,0 // vbroadcastss 0x3891(%rip),%ymm8 # 7d04 <_sk_callback_avx+0x474>
+ .byte 196,98,125,24,5,193,56,0,0 // vbroadcastss 0x38c1(%rip),%ymm8 # 7f14 <_sk_callback_avx+0x4a4>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,24,5,135,56,0,0 // vbroadcastss 0x3887(%rip),%ymm8 # 7d08 <_sk_callback_avx+0x478>
+ .byte 196,98,125,24,5,183,56,0,0 // vbroadcastss 0x38b7(%rip),%ymm8 # 7f18 <_sk_callback_avx+0x4a8>
.byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,121,56,0,0 // vbroadcastss 0x3879(%rip),%ymm8 # 7d0c <_sk_callback_avx+0x47c>
+ .byte 196,98,125,24,5,169,56,0,0 // vbroadcastss 0x38a9(%rip),%ymm8 # 7f1c <_sk_callback_avx+0x4ac>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -24005,27 +24482,27 @@ _sk_load_4444_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja 440a <_sk_load_4444_dst_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja 45ea <_sk_load_4444_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 4524 <_sk_load_4444_dst_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 4704 <_sk_load_4444_dst_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,51,255,255,255 // jmpq 440a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq 45ea <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,22,255,255,255 // jmpq 440a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq 45ea <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,233,254,255,255 // jmpq 440a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq 45ea <_sk_load_4444_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -24097,25 +24574,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,254,54,0,0 // vbroadcastss 0x36fe(%rip),%ymm0 # 7d10 <_sk_callback_avx+0x480>
+ .byte 196,226,125,24,5,46,55,0,0 // vbroadcastss 0x372e(%rip),%ymm0 # 7f20 <_sk_callback_avx+0x4b0>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,241,54,0,0 // vbroadcastss 0x36f1(%rip),%ymm1 # 7d14 <_sk_callback_avx+0x484>
+ .byte 196,226,125,24,13,33,55,0,0 // vbroadcastss 0x3721(%rip),%ymm1 # 7f24 <_sk_callback_avx+0x4b4>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,232,54,0,0 // vbroadcastss 0x36e8(%rip),%ymm1 # 7d18 <_sk_callback_avx+0x488>
+ .byte 196,226,125,24,13,24,55,0,0 // vbroadcastss 0x3718(%rip),%ymm1 # 7f28 <_sk_callback_avx+0x4b8>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,219,54,0,0 // vbroadcastss 0x36db(%rip),%ymm2 # 7d1c <_sk_callback_avx+0x48c>
+ .byte 196,226,125,24,21,11,55,0,0 // vbroadcastss 0x370b(%rip),%ymm2 # 7f2c <_sk_callback_avx+0x4bc>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,210,54,0,0 // vbroadcastss 0x36d2(%rip),%ymm2 # 7d20 <_sk_callback_avx+0x490>
+ .byte 196,226,125,24,21,2,55,0,0 // vbroadcastss 0x3702(%rip),%ymm2 # 7f30 <_sk_callback_avx+0x4c0>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,197,54,0,0 // vbroadcastss 0x36c5(%rip),%ymm8 # 7d24 <_sk_callback_avx+0x494>
+ .byte 196,98,125,24,5,245,54,0,0 // vbroadcastss 0x36f5(%rip),%ymm8 # 7f34 <_sk_callback_avx+0x4c4>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,187,54,0,0 // vbroadcastss 0x36bb(%rip),%ymm8 # 7d28 <_sk_callback_avx+0x498>
+ .byte 196,98,125,24,5,235,54,0,0 // vbroadcastss 0x36eb(%rip),%ymm8 # 7f38 <_sk_callback_avx+0x4c8>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,173,54,0,0 // vbroadcastss 0x36ad(%rip),%ymm8 # 7d2c <_sk_callback_avx+0x49c>
+ .byte 196,98,125,24,5,221,54,0,0 // vbroadcastss 0x36dd(%rip),%ymm8 # 7f3c <_sk_callback_avx+0x4cc>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -24132,7 +24609,7 @@ _sk_store_4444_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,136,54,0,0 // vbroadcastss 0x3688(%rip),%ymm8 # 7d30 <_sk_callback_avx+0x4a0>
+ .byte 196,98,125,24,5,184,54,0,0 // vbroadcastss 0x36b8(%rip),%ymm8 # 7f40 <_sk_callback_avx+0x4d0>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -24159,7 +24636,7 @@ _sk_store_4444_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 4742 <_sk_store_4444_avx+0xba>
+ .byte 117,11 // jne 4922 <_sk_store_4444_avx+0xba>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -24168,22 +24645,22 @@ _sk_store_4444_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 473d <_sk_store_4444_avx+0xb5>
+ .byte 119,235 // ja 491d <_sk_store_4444_avx+0xb5>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # 47a0 <_sk_store_4444_avx+0x118>
+ .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # 4980 <_sk_store_4444_avx+0x118>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 473d <_sk_store_4444_avx+0xb5>
+ .byte 235,206 // jmp 491d <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 473d <_sk_store_4444_avx+0xb5>
+ .byte 235,190 // jmp 491d <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 473d <_sk_store_4444_avx+0xb5>
+ .byte 235,158 // jmp 491d <_sk_store_4444_avx+0xb5>
.byte 144 // nop
.byte 198 // (bad)
.byte 255 // (bad)
@@ -24223,12 +24700,12 @@ _sk_load_8888_avx:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne 486b <_sk_load_8888_avx+0xaf>
+ .byte 15,133,136,0,0,0 // jne 4a4b <_sk_load_8888_avx+0xaf>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,124,40,21,177,56,0,0 // vmovaps 0x38b1(%rip),%ymm10 # 80a0 <_sk_callback_avx+0x810>
+ .byte 197,124,40,21,241,56,0,0 // vmovaps 0x38f1(%rip),%ymm10 # 82c0 <_sk_callback_avx+0x850>
.byte 196,193,100,84,194 // vandps %ymm10,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,51,53,0,0 // vbroadcastss 0x3533(%rip),%ymm8 # 7d34 <_sk_callback_avx+0x4a4>
+ .byte 196,98,125,24,5,99,53,0,0 // vbroadcastss 0x3563(%rip),%ymm8 # 7f44 <_sk_callback_avx+0x4d4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
.byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9
@@ -24258,13 +24735,13 @@ _sk_load_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,13,55,0,0 // vpshufb 0x370d(%rip),%xmm0,%xmm1 # 7fa0 <_sk_callback_avx+0x710>
+ .byte 196,226,121,0,13,61,55,0,0 // vpshufb 0x373d(%rip),%xmm0,%xmm1 # 81b0 <_sk_callback_avx+0x740>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,15,55,0,0 // vpshufb 0x370f(%rip),%xmm0,%xmm0 # 7fb0 <_sk_callback_avx+0x720>
+ .byte 196,226,121,0,5,63,55,0,0 // vpshufb 0x373f(%rip),%xmm0,%xmm0 # 81c0 <_sk_callback_avx+0x750>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
- .byte 233,49,255,255,255 // jmpq 47e7 <_sk_load_8888_avx+0x2b>
+ .byte 233,49,255,255,255 // jmpq 49c7 <_sk_load_8888_avx+0x2b>
HIDDEN _sk_load_8888_dst_avx
.globl _sk_load_8888_dst_avx
@@ -24280,12 +24757,12 @@ _sk_load_8888_dst_avx:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne 4965 <_sk_load_8888_dst_avx+0xaf>
+ .byte 15,133,136,0,0,0 // jne 4b45 <_sk_load_8888_dst_avx+0xaf>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,124,40,21,215,55,0,0 // vmovaps 0x37d7(%rip),%ymm10 # 80c0 <_sk_callback_avx+0x830>
+ .byte 197,124,40,21,23,56,0,0 // vmovaps 0x3817(%rip),%ymm10 # 82e0 <_sk_callback_avx+0x870>
.byte 196,193,68,84,226 // vandps %ymm10,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,61,52,0,0 // vbroadcastss 0x343d(%rip),%ymm8 # 7d38 <_sk_callback_avx+0x4a8>
+ .byte 196,98,125,24,5,109,52,0,0 // vbroadcastss 0x346d(%rip),%ymm8 # 7f48 <_sk_callback_avx+0x4d8>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
.byte 196,195,125,25,249,1 // vextractf128 $0x1,%ymm7,%xmm9
@@ -24315,13 +24792,13 @@ _sk_load_8888_dst_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,51,54,0,0 // vpshufb 0x3633(%rip),%xmm4,%xmm5 # 7fc0 <_sk_callback_avx+0x730>
+ .byte 196,226,89,0,45,99,54,0,0 // vpshufb 0x3663(%rip),%xmm4,%xmm5 # 81d0 <_sk_callback_avx+0x760>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,53,54,0,0 // vpshufb 0x3635(%rip),%xmm4,%xmm4 # 7fd0 <_sk_callback_avx+0x740>
+ .byte 196,226,89,0,37,101,54,0,0 // vpshufb 0x3665(%rip),%xmm4,%xmm4 # 81e0 <_sk_callback_avx+0x770>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
- .byte 233,49,255,255,255 // jmpq 48e1 <_sk_load_8888_dst_avx+0x2b>
+ .byte 233,49,255,255,255 // jmpq 4ac1 <_sk_load_8888_dst_avx+0x2b>
HIDDEN _sk_gather_8888_avx
.globl _sk_gather_8888_avx
@@ -24360,10 +24837,10 @@ _sk_gather_8888_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,133,54,0,0 // vmovaps 0x3685(%rip),%ymm10 # 80e0 <_sk_callback_avx+0x850>
+ .byte 197,124,40,21,197,54,0,0 // vmovaps 0x36c5(%rip),%ymm10 # 8300 <_sk_callback_avx+0x890>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,207,50,0,0 // vbroadcastss 0x32cf(%rip),%ymm9 # 7d3c <_sk_callback_avx+0x4ac>
+ .byte 196,98,125,24,13,255,50,0,0 // vbroadcastss 0x32ff(%rip),%ymm9 # 7f4c <_sk_callback_avx+0x4dc>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -24398,7 +24875,7 @@ _sk_store_8888_avx:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,75,50,0,0 // vbroadcastss 0x324b(%rip),%ymm8 # 7d40 <_sk_callback_avx+0x4b0>
+ .byte 196,98,125,24,5,123,50,0,0 // vbroadcastss 0x327b(%rip),%ymm8 # 7f50 <_sk_callback_avx+0x4e0>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -24423,7 +24900,7 @@ _sk_store_8888_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 4b84 <_sk_store_8888_avx+0xb6>
+ .byte 117,11 // jne 4d64 <_sk_store_8888_avx+0xb6>
.byte 197,124,17,0 // vmovups %ymm8,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -24435,13 +24912,13 @@ _sk_store_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,52,52,0,0 // vpshufb 0x3434(%rip),%xmm9,%xmm10 # 7fe0 <_sk_callback_avx+0x750>
+ .byte 196,98,49,0,21,100,52,0,0 // vpshufb 0x3464(%rip),%xmm9,%xmm10 # 81f0 <_sk_callback_avx+0x780>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,54,52,0,0 // vpshufb 0x3436(%rip),%xmm9,%xmm9 # 7ff0 <_sk_callback_avx+0x760>
+ .byte 196,98,49,0,13,102,52,0,0 // vpshufb 0x3466(%rip),%xmm9,%xmm9 # 8200 <_sk_callback_avx+0x790>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
- .byte 235,177 // jmp 4b7d <_sk_store_8888_avx+0xaf>
+ .byte 235,177 // jmp 4d5d <_sk_store_8888_avx+0xaf>
HIDDEN _sk_load_bgra_avx
.globl _sk_load_bgra_avx
@@ -24457,12 +24934,12 @@ _sk_load_bgra_avx:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne 4c7b <_sk_load_bgra_avx+0xaf>
+ .byte 15,133,136,0,0,0 // jne 4e5b <_sk_load_bgra_avx+0xaf>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,124,40,21,1,53,0,0 // vmovaps 0x3501(%rip),%ymm10 # 8100 <_sk_callback_avx+0x870>
+ .byte 197,124,40,21,65,53,0,0 // vmovaps 0x3541(%rip),%ymm10 # 8320 <_sk_callback_avx+0x8b0>
.byte 196,193,100,84,202 // vandps %ymm10,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,98,125,24,5,51,49,0,0 // vbroadcastss 0x3133(%rip),%ymm8 # 7d44 <_sk_callback_avx+0x4b4>
+ .byte 196,98,125,24,5,99,49,0,0 // vbroadcastss 0x3163(%rip),%ymm8 # 7f54 <_sk_callback_avx+0x4e4>
.byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
.byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9
@@ -24492,13 +24969,13 @@ _sk_load_bgra_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,93,51,0,0 // vpshufb 0x335d(%rip),%xmm0,%xmm1 # 8000 <_sk_callback_avx+0x770>
+ .byte 196,226,121,0,13,141,51,0,0 // vpshufb 0x338d(%rip),%xmm0,%xmm1 # 8210 <_sk_callback_avx+0x7a0>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,95,51,0,0 // vpshufb 0x335f(%rip),%xmm0,%xmm0 # 8010 <_sk_callback_avx+0x780>
+ .byte 196,226,121,0,5,143,51,0,0 // vpshufb 0x338f(%rip),%xmm0,%xmm0 # 8220 <_sk_callback_avx+0x7b0>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
- .byte 233,49,255,255,255 // jmpq 4bf7 <_sk_load_bgra_avx+0x2b>
+ .byte 233,49,255,255,255 // jmpq 4dd7 <_sk_load_bgra_avx+0x2b>
HIDDEN _sk_load_bgra_dst_avx
.globl _sk_load_bgra_dst_avx
@@ -24514,12 +24991,12 @@ _sk_load_bgra_dst_avx:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne 4d75 <_sk_load_bgra_dst_avx+0xaf>
+ .byte 15,133,136,0,0,0 // jne 4f55 <_sk_load_bgra_dst_avx+0xaf>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,124,40,21,39,52,0,0 // vmovaps 0x3427(%rip),%ymm10 # 8120 <_sk_callback_avx+0x890>
+ .byte 197,124,40,21,103,52,0,0 // vmovaps 0x3467(%rip),%ymm10 # 8340 <_sk_callback_avx+0x8d0>
.byte 196,193,68,84,234 // vandps %ymm10,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,98,125,24,5,61,48,0,0 // vbroadcastss 0x303d(%rip),%ymm8 # 7d48 <_sk_callback_avx+0x4b8>
+ .byte 196,98,125,24,5,109,48,0,0 // vbroadcastss 0x306d(%rip),%ymm8 # 7f58 <_sk_callback_avx+0x4e8>
.byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
.byte 196,195,125,25,249,1 // vextractf128 $0x1,%ymm7,%xmm9
@@ -24549,13 +25026,13 @@ _sk_load_bgra_dst_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,131,50,0,0 // vpshufb 0x3283(%rip),%xmm4,%xmm5 # 8020 <_sk_callback_avx+0x790>
+ .byte 196,226,89,0,45,179,50,0,0 // vpshufb 0x32b3(%rip),%xmm4,%xmm5 # 8230 <_sk_callback_avx+0x7c0>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,133,50,0,0 // vpshufb 0x3285(%rip),%xmm4,%xmm4 # 8030 <_sk_callback_avx+0x7a0>
+ .byte 196,226,89,0,37,181,50,0,0 // vpshufb 0x32b5(%rip),%xmm4,%xmm4 # 8240 <_sk_callback_avx+0x7d0>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
- .byte 233,49,255,255,255 // jmpq 4cf1 <_sk_load_bgra_dst_avx+0x2b>
+ .byte 233,49,255,255,255 // jmpq 4ed1 <_sk_load_bgra_dst_avx+0x2b>
HIDDEN _sk_gather_bgra_avx
.globl _sk_gather_bgra_avx
@@ -24594,10 +25071,10 @@ _sk_gather_bgra_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,13,213,50,0,0 // vmovaps 0x32d5(%rip),%ymm9 # 8140 <_sk_callback_avx+0x8b0>
+ .byte 197,124,40,13,21,51,0,0 // vmovaps 0x3315(%rip),%ymm9 # 8360 <_sk_callback_avx+0x8f0>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,207,46,0,0 // vbroadcastss 0x2ecf(%rip),%ymm10 # 7d4c <_sk_callback_avx+0x4bc>
+ .byte 196,98,125,24,21,255,46,0,0 // vbroadcastss 0x2eff(%rip),%ymm10 # 7f5c <_sk_callback_avx+0x4ec>
.byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2
.byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
@@ -24632,7 +25109,7 @@ _sk_store_bgra_avx:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,75,46,0,0 // vbroadcastss 0x2e4b(%rip),%ymm8 # 7d50 <_sk_callback_avx+0x4c0>
+ .byte 196,98,125,24,5,123,46,0,0 // vbroadcastss 0x2e7b(%rip),%ymm8 # 7f60 <_sk_callback_avx+0x4f0>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -24657,7 +25134,7 @@ _sk_store_bgra_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 4f94 <_sk_store_bgra_avx+0xb6>
+ .byte 117,11 // jne 5174 <_sk_store_bgra_avx+0xb6>
.byte 197,124,17,0 // vmovups %ymm8,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -24669,13 +25146,13 @@ _sk_store_bgra_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,132,48,0,0 // vpshufb 0x3084(%rip),%xmm9,%xmm10 # 8040 <_sk_callback_avx+0x7b0>
+ .byte 196,98,49,0,21,180,48,0,0 // vpshufb 0x30b4(%rip),%xmm9,%xmm10 # 8250 <_sk_callback_avx+0x7e0>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,134,48,0,0 // vpshufb 0x3086(%rip),%xmm9,%xmm9 # 8050 <_sk_callback_avx+0x7c0>
+ .byte 196,98,49,0,13,182,48,0,0 // vpshufb 0x30b6(%rip),%xmm9,%xmm9 # 8260 <_sk_callback_avx+0x7f0>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
- .byte 235,177 // jmp 4f8d <_sk_store_bgra_avx+0xaf>
+ .byte 235,177 // jmp 516d <_sk_store_bgra_avx+0xaf>
HIDDEN _sk_load_f16_avx
.globl _sk_load_f16_avx
@@ -24694,7 +25171,7 @@ _sk_load_f16_avx:
.byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp)
.byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp)
.byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne 52a9 <_sk_load_f16_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne 5489 <_sk_load_f16_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,76,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm1
@@ -24712,13 +25189,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,223,44,0,0 // vbroadcastss 0x2cdf(%rip),%ymm12 # 7d54 <_sk_callback_avx+0x4c4>
+ .byte 196,98,125,24,37,15,45,0,0 // vbroadcastss 0x2d0f(%rip),%ymm12 # 7f64 <_sk_callback_avx+0x4f4>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,203,44,0,0 // vbroadcastss 0x2ccb(%rip),%xmm11 # 7d58 <_sk_callback_avx+0x4c8>
+ .byte 196,98,121,24,29,251,44,0,0 // vbroadcastss 0x2cfb(%rip),%xmm11 # 7f68 <_sk_callback_avx+0x4f8>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,193,44,0,0 // vbroadcastss 0x2cc1(%rip),%xmm13 # 7d5c <_sk_callback_avx+0x4cc>
+ .byte 196,98,121,24,45,241,44,0,0 // vbroadcastss 0x2cf1(%rip),%xmm13 # 7f6c <_sk_callback_avx+0x4fc>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -24732,7 +25209,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,119,44,0,0 // vbroadcastss 0x2c77(%rip),%xmm3 # 7d60 <_sk_callback_avx+0x4d0>
+ .byte 196,226,121,24,29,167,44,0,0 // vbroadcastss 0x2ca7(%rip),%xmm3 # 7f70 <_sk_callback_avx+0x500>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -24825,29 +25302,29 @@ _sk_load_f16_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 530f <_sk_load_f16_avx+0x333>
+ .byte 116,85 // je 54ef <_sk_load_f16_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 530f <_sk_load_f16_avx+0x333>
+ .byte 114,72 // jb 54ef <_sk_load_f16_avx+0x333>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 531c <_sk_load_f16_avx+0x340>
+ .byte 116,72 // je 54fc <_sk_load_f16_avx+0x340>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 531c <_sk_load_f16_avx+0x340>
+ .byte 114,59 // jb 54fc <_sk_load_f16_avx+0x340>
.byte 196,193,123,16,76,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je 5033 <_sk_load_f16_avx+0x57>
+ .byte 15,132,65,253,255,255 // je 5213 <_sk_load_f16_avx+0x57>
.byte 196,193,113,22,76,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb 5033 <_sk_load_f16_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb 5213 <_sk_load_f16_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq 5033 <_sk_load_f16_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq 5213 <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,23,253,255,255 // jmpq 5033 <_sk_load_f16_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq 5213 <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
- .byte 233,14,253,255,255 // jmpq 5033 <_sk_load_f16_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq 5213 <_sk_load_f16_avx+0x57>
HIDDEN _sk_load_f16_dst_avx
.globl _sk_load_f16_dst_avx
@@ -24866,7 +25343,7 @@ _sk_load_f16_dst_avx:
.byte 197,252,17,84,36,192 // vmovups %ymm2,-0x40(%rsp)
.byte 197,252,17,76,36,160 // vmovups %ymm1,-0x60(%rsp)
.byte 197,254,127,68,36,128 // vmovdqu %ymm0,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne 55f2 <_sk_load_f16_dst_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne 57d2 <_sk_load_f16_dst_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,108,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm5
@@ -24884,13 +25361,13 @@ _sk_load_f16_dst_avx:
.byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- .byte 196,98,125,24,37,166,41,0,0 // vbroadcastss 0x29a6(%rip),%ymm12 # 7d64 <_sk_callback_avx+0x4d4>
+ .byte 196,98,125,24,37,214,41,0,0 // vbroadcastss 0x29d6(%rip),%ymm12 # 7f74 <_sk_callback_avx+0x504>
.byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5
.byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4
.byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14
- .byte 196,98,121,24,29,146,41,0,0 // vbroadcastss 0x2992(%rip),%xmm11 # 7d68 <_sk_callback_avx+0x4d8>
+ .byte 196,98,121,24,29,194,41,0,0 // vbroadcastss 0x29c2(%rip),%xmm11 # 7f78 <_sk_callback_avx+0x508>
.byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7
- .byte 196,98,121,24,45,136,41,0,0 // vbroadcastss 0x2988(%rip),%xmm13 # 7d6c <_sk_callback_avx+0x4dc>
+ .byte 196,98,121,24,45,184,41,0,0 // vbroadcastss 0x29b8(%rip),%xmm13 # 7f7c <_sk_callback_avx+0x50c>
.byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7
.byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -24904,7 +25381,7 @@ _sk_load_f16_dst_avx:
.byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
.byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4
.byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5
- .byte 196,226,121,24,61,62,41,0,0 // vbroadcastss 0x293e(%rip),%xmm7 # 7d70 <_sk_callback_avx+0x4e0>
+ .byte 196,226,121,24,61,110,41,0,0 // vbroadcastss 0x296e(%rip),%xmm7 # 7f80 <_sk_callback_avx+0x510>
.byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5
.byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -24997,29 +25474,29 @@ _sk_load_f16_dst_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 5658 <_sk_load_f16_dst_avx+0x333>
+ .byte 116,85 // je 5838 <_sk_load_f16_dst_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 5658 <_sk_load_f16_dst_avx+0x333>
+ .byte 114,72 // jb 5838 <_sk_load_f16_dst_avx+0x333>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 5665 <_sk_load_f16_dst_avx+0x340>
+ .byte 116,72 // je 5845 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 5665 <_sk_load_f16_dst_avx+0x340>
+ .byte 114,59 // jb 5845 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,123,16,108,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm5
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 15,132,65,253,255,255 // je 555c <_sk_load_f16_dst_avx+0x57>
.byte 196,193,81,22,108,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb 555c <_sk_load_f16_dst_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq 555c <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,23,253,255,255 // jmpq 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq 555c <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
- .byte 233,14,253,255,255 // jmpq 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq 555c <_sk_load_f16_dst_avx+0x57>
HIDDEN _sk_gather_f16_avx
.globl _sk_gather_f16_avx
@@ -25080,13 +25557,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,252,37,0,0 // vbroadcastss 0x25fc(%rip),%ymm12 # 7d74 <_sk_callback_avx+0x4e4>
+ .byte 196,98,125,24,37,44,38,0,0 // vbroadcastss 0x262c(%rip),%ymm12 # 7f84 <_sk_callback_avx+0x514>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,232,37,0,0 // vbroadcastss 0x25e8(%rip),%xmm11 # 7d78 <_sk_callback_avx+0x4e8>
+ .byte 196,98,121,24,29,24,38,0,0 // vbroadcastss 0x2618(%rip),%xmm11 # 7f88 <_sk_callback_avx+0x518>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,222,37,0,0 // vbroadcastss 0x25de(%rip),%xmm13 # 7d7c <_sk_callback_avx+0x4ec>
+ .byte 196,98,121,24,45,14,38,0,0 // vbroadcastss 0x260e(%rip),%xmm13 # 7f8c <_sk_callback_avx+0x51c>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -25100,7 +25577,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,148,37,0,0 // vbroadcastss 0x2594(%rip),%xmm3 # 7d80 <_sk_callback_avx+0x4f0>
+ .byte 196,226,121,24,29,196,37,0,0 // vbroadcastss 0x25c4(%rip),%xmm3 # 7f90 <_sk_callback_avx+0x520>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -25200,12 +25677,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,180,35,0,0 // vbroadcastss 0x23b4(%rip),%ymm9 # 7d84 <_sk_callback_avx+0x4f4>
+ .byte 196,98,125,24,13,228,35,0,0 // vbroadcastss 0x23e4(%rip),%ymm9 # 7f94 <_sk_callback_avx+0x524>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,153,35,0,0 // vbroadcastss 0x2399(%rip),%xmm8 # 7d88 <_sk_callback_avx+0x4f8>
+ .byte 196,98,121,24,5,201,35,0,0 // vbroadcastss 0x23c9(%rip),%xmm8 # 7f98 <_sk_callback_avx+0x528>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -25215,7 +25692,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,96,35,0,0 // vbroadcastss 0x2360(%rip),%ymm10 # 7d8c <_sk_callback_avx+0x4fc>
+ .byte 196,98,125,24,21,144,35,0,0 // vbroadcastss 0x2390(%rip),%ymm10 # 7f9c <_sk_callback_avx+0x52c>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -25302,7 +25779,7 @@ _sk_store_f16_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,70 // jne 5c20 <_sk_store_f16_avx+0x274>
+ .byte 117,70 // jne 5e00 <_sk_store_f16_avx+0x274>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -25318,22 +25795,22 @@ _sk_store_f16_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,201 // je 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 116,201 // je 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,188 // jb 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 114,188 // jb 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,179 // je 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 116,179 // je 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,166 // jb 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 114,166 // jb 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,157 // je 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 116,157 // je 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,144 // jb 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 114,144 // jb 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,135 // jmp 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 235,135 // jmp 5dd5 <_sk_store_f16_avx+0x249>
HIDDEN _sk_load_u16_be_avx
.globl _sk_load_u16_be_avx
@@ -25348,7 +25825,7 @@ _sk_load_u16_be_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,253,0,0,0 // jne 5d92 <_sk_load_u16_be_avx+0x124>
+ .byte 15,133,253,0,0,0 // jne 5f72 <_sk_load_u16_be_avx+0x124>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -25370,7 +25847,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,138,32,0,0 // vbroadcastss 0x208a(%rip),%ymm11 # 7d90 <_sk_callback_avx+0x500>
+ .byte 196,98,125,24,29,186,32,0,0 // vbroadcastss 0x20ba(%rip),%ymm11 # 7fa0 <_sk_callback_avx+0x530>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -25404,29 +25881,29 @@ _sk_load_u16_be_avx:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 5df8 <_sk_load_u16_be_avx+0x18a>
+ .byte 116,85 // je 5fd8 <_sk_load_u16_be_avx+0x18a>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 5df8 <_sk_load_u16_be_avx+0x18a>
+ .byte 114,72 // jb 5fd8 <_sk_load_u16_be_avx+0x18a>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 5e05 <_sk_load_u16_be_avx+0x197>
+ .byte 116,72 // je 5fe5 <_sk_load_u16_be_avx+0x197>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 5e05 <_sk_load_u16_be_avx+0x197>
+ .byte 114,59 // jb 5fe5 <_sk_load_u16_be_avx+0x197>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,213,254,255,255 // je 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 15,132,213,254,255,255 // je 5e90 <_sk_load_u16_be_avx+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,196,254,255,255 // jb 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 15,130,196,254,255,255 // jb 5e90 <_sk_load_u16_be_avx+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,184,254,255,255 // jmpq 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 233,184,254,255,255 // jmpq 5e90 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,171,254,255,255 // jmpq 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 233,171,254,255,255 // jmpq 5e90 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,162,254,255,255 // jmpq 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 233,162,254,255,255 // jmpq 5e90 <_sk_load_u16_be_avx+0x42>
HIDDEN _sk_load_rgb_u16_be_avx
.globl _sk_load_rgb_u16_be_avx
@@ -25443,7 +25920,7 @@ _sk_load_rgb_u16_be_avx:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,243,0,0,0 // jne 5f2c <_sk_load_rgb_u16_be_avx+0x11e>
+ .byte 15,133,243,0,0,0 // jne 610c <_sk_load_rgb_u16_be_avx+0x11e>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -25470,7 +25947,7 @@ _sk_load_rgb_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,209,30,0,0 // vbroadcastss 0x1ed1(%rip),%ymm11 # 7d94 <_sk_callback_avx+0x504>
+ .byte 196,98,125,24,29,1,31,0,0 // vbroadcastss 0x1f01(%rip),%ymm11 # 7fa4 <_sk_callback_avx+0x534>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -25491,41 +25968,41 @@ _sk_load_rgb_u16_be_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,110,30,0,0 // vbroadcastss 0x1e6e(%rip),%ymm3 # 7d98 <_sk_callback_avx+0x508>
+ .byte 196,226,125,24,29,158,30,0,0 // vbroadcastss 0x1e9e(%rip),%ymm3 # 7fa8 <_sk_callback_avx+0x538>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 5f45 <_sk_load_rgb_u16_be_avx+0x137>
- .byte 233,40,255,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,5 // jne 6125 <_sk_load_rgb_u16_be_avx+0x137>
+ .byte 233,40,255,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 5f74 <_sk_load_rgb_u16_be_avx+0x166>
+ .byte 114,26 // jb 6154 <_sk_load_rgb_u16_be_avx+0x166>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 5f79 <_sk_load_rgb_u16_be_avx+0x16b>
- .byte 233,249,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,244,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,10 // jne 6159 <_sk_load_rgb_u16_be_avx+0x16b>
+ .byte 233,249,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,244,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 5fa8 <_sk_load_rgb_u16_be_avx+0x19a>
+ .byte 114,26 // jb 6188 <_sk_load_rgb_u16_be_avx+0x19a>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 5fad <_sk_load_rgb_u16_be_avx+0x19f>
- .byte 233,197,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,192,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,10 // jne 618d <_sk_load_rgb_u16_be_avx+0x19f>
+ .byte 233,197,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,192,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 5fd6 <_sk_load_rgb_u16_be_avx+0x1c8>
+ .byte 114,20 // jb 61b6 <_sk_load_rgb_u16_be_avx+0x1c8>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,151,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,146,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,151,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,146,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
HIDDEN _sk_store_u16_be_avx
.globl _sk_store_u16_be_avx
@@ -25539,7 +26016,7 @@ _sk_store_u16_be_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,154,29,0,0 // vbroadcastss 0x1d9a(%rip),%ymm8 # 7d9c <_sk_callback_avx+0x50c>
+ .byte 196,98,125,24,5,202,29,0,0 // vbroadcastss 0x1dca(%rip),%ymm8 # 7fac <_sk_callback_avx+0x53c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -25577,7 +26054,7 @@ _sk_store_u16_be_avx:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 60e6 <_sk_store_u16_be_avx+0x10b>
+ .byte 117,31 // jne 62c6 <_sk_store_u16_be_avx+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -25586,22 +26063,22 @@ _sk_store_u16_be_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 116,240 // je 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 114,227 // jb 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 116,218 // je 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 114,205 // jb 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 116,196 // je 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 114,183 // jb 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 235,174 // jmp 62c2 <_sk_store_u16_be_avx+0x107>
HIDDEN _sk_load_f32_avx
.globl _sk_load_f32_avx
@@ -25609,7 +26086,7 @@ FUNCTION(_sk_load_f32_avx)
_sk_load_f32_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 61c0 <_sk_load_f32_avx+0x8c>
+ .byte 15,135,128,0,0,0 // ja 63a0 <_sk_load_f32_avx+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -25617,7 +26094,7 @@ _sk_load_f32_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 61e8 <_sk_load_f32_avx+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 63c8 <_sk_load_f32_avx+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -25666,7 +26143,7 @@ FUNCTION(_sk_load_f32_dst_avx)
_sk_load_f32_dst_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 6294 <_sk_load_f32_dst_avx+0x8c>
+ .byte 15,135,128,0,0,0 // ja 6474 <_sk_load_f32_dst_avx+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -25674,7 +26151,7 @@ _sk_load_f32_dst_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 62bc <_sk_load_f32_dst_avx+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 649c <_sk_load_f32_dst_avx+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -25738,7 +26215,7 @@ _sk_store_f32_avx:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne 635b <_sk_store_f32_avx+0x7f>
+ .byte 117,55 // jne 653b <_sk_store_f32_avx+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -25751,22 +26228,22 @@ _sk_store_f32_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 6357 <_sk_store_f32_avx+0x7b>
+ .byte 116,240 // je 6537 <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 6357 <_sk_store_f32_avx+0x7b>
+ .byte 114,227 // jb 6537 <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je 6357 <_sk_store_f32_avx+0x7b>
+ .byte 116,218 // je 6537 <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 6357 <_sk_store_f32_avx+0x7b>
+ .byte 114,205 // jb 6537 <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je 6357 <_sk_store_f32_avx+0x7b>
+ .byte 116,195 // je 6537 <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb 6357 <_sk_store_f32_avx+0x7b>
+ .byte 114,181 // jb 6537 <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp 6357 <_sk_store_f32_avx+0x7b>
+ .byte 235,171 // jmp 6537 <_sk_store_f32_avx+0x7b>
HIDDEN _sk_clamp_x_avx
.globl _sk_clamp_x_avx
@@ -25859,7 +26336,7 @@ _sk_mirror_x_avx:
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- .byte 197,178,89,5,191,24,0,0 // vmulss 0x18bf(%rip),%xmm9,%xmm0 # 7da0 <_sk_callback_avx+0x510>
+ .byte 197,178,89,5,239,24,0,0 // vmulss 0x18ef(%rip),%xmm9,%xmm0 # 7fb0 <_sk_callback_avx+0x540>
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
@@ -25893,7 +26370,7 @@ _sk_mirror_y_avx:
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- .byte 197,178,89,13,54,24,0,0 // vmulss 0x1836(%rip),%xmm9,%xmm1 # 7da4 <_sk_callback_avx+0x514>
+ .byte 197,178,89,13,102,24,0,0 // vmulss 0x1866(%rip),%xmm9,%xmm1 # 7fb4 <_sk_callback_avx+0x544>
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
@@ -25920,7 +26397,7 @@ FUNCTION(_sk_clamp_x_1_avx)
_sk_clamp_x_1_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,208,23,0,0 // vbroadcastss 0x17d0(%rip),%ymm8 # 7da8 <_sk_callback_avx+0x518>
+ .byte 196,98,125,24,5,0,24,0,0 // vbroadcastss 0x1800(%rip),%ymm8 # 7fb8 <_sk_callback_avx+0x548>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -25938,9 +26415,9 @@ HIDDEN _sk_mirror_x_1_avx
.globl _sk_mirror_x_1_avx
FUNCTION(_sk_mirror_x_1_avx)
_sk_mirror_x_1_avx:
- .byte 196,98,125,24,5,179,23,0,0 // vbroadcastss 0x17b3(%rip),%ymm8 # 7dac <_sk_callback_avx+0x51c>
+ .byte 196,98,125,24,5,227,23,0,0 // vbroadcastss 0x17e3(%rip),%ymm8 # 7fbc <_sk_callback_avx+0x54c>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,169,23,0,0 // vbroadcastss 0x17a9(%rip),%ymm9 # 7db0 <_sk_callback_avx+0x520>
+ .byte 196,98,125,24,13,217,23,0,0 // vbroadcastss 0x17d9(%rip),%ymm9 # 7fc0 <_sk_callback_avx+0x550>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -25956,12 +26433,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,121,23,0,0 // vbroadcastss 0x1779(%rip),%ymm3 # 7db4 <_sk_callback_avx+0x524>
+ .byte 196,226,125,24,29,169,23,0,0 // vbroadcastss 0x17a9(%rip),%ymm3 # 7fc4 <_sk_callback_avx+0x554>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,112,23,0,0 // vbroadcastss 0x1770(%rip),%ymm3 # 7db8 <_sk_callback_avx+0x528>
+ .byte 196,226,125,24,29,160,23,0,0 // vbroadcastss 0x17a0(%rip),%ymm3 # 7fc8 <_sk_callback_avx+0x558>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,99,23,0,0 // vbroadcastss 0x1763(%rip),%ymm1 # 7dbc <_sk_callback_avx+0x52c>
+ .byte 196,226,125,24,13,147,23,0,0 // vbroadcastss 0x1793(%rip),%ymm1 # 7fcc <_sk_callback_avx+0x55c>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26209,9 +26686,9 @@ _sk_evenly_spaced_gradient_avx:
.byte 72,139,24 // mov (%rax),%rbx
.byte 72,139,104,8 // mov 0x8(%rax),%rbp
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 69fd <_sk_evenly_spaced_gradient_avx+0x25>
+ .byte 120,7 // js 6bdd <_sk_evenly_spaced_gradient_avx+0x25>
.byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1
- .byte 235,21 // jmp 6a12 <_sk_evenly_spaced_gradient_avx+0x3a>
+ .byte 235,21 // jmp 6bf2 <_sk_evenly_spaced_gradient_avx+0x3a>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -26369,18 +26846,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx
.globl _sk_gauss_a_to_rgba_avx
FUNCTION(_sk_gauss_a_to_rgba_avx)
_sk_gauss_a_to_rgba_avx:
- .byte 196,226,125,24,5,74,16,0,0 // vbroadcastss 0x104a(%rip),%ymm0 # 7dc0 <_sk_callback_avx+0x530>
+ .byte 196,226,125,24,5,122,16,0,0 // vbroadcastss 0x107a(%rip),%ymm0 # 7fd0 <_sk_callback_avx+0x560>
.byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
- .byte 196,226,125,24,13,65,16,0,0 // vbroadcastss 0x1041(%rip),%ymm1 # 7dc4 <_sk_callback_avx+0x534>
+ .byte 196,226,125,24,13,113,16,0,0 // vbroadcastss 0x1071(%rip),%ymm1 # 7fd4 <_sk_callback_avx+0x564>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,52,16,0,0 // vbroadcastss 0x1034(%rip),%ymm1 # 7dc8 <_sk_callback_avx+0x538>
+ .byte 196,226,125,24,13,100,16,0,0 // vbroadcastss 0x1064(%rip),%ymm1 # 7fd8 <_sk_callback_avx+0x568>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,39,16,0,0 // vbroadcastss 0x1027(%rip),%ymm1 # 7dcc <_sk_callback_avx+0x53c>
+ .byte 196,226,125,24,13,87,16,0,0 // vbroadcastss 0x1057(%rip),%ymm1 # 7fdc <_sk_callback_avx+0x56c>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,26,16,0,0 // vbroadcastss 0x101a(%rip),%ymm1 # 7dd0 <_sk_callback_avx+0x540>
+ .byte 196,226,125,24,13,74,16,0,0 // vbroadcastss 0x104a(%rip),%ymm1 # 7fe0 <_sk_callback_avx+0x570>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -26403,12 +26880,12 @@ _sk_gradient_avx:
.byte 76,139,8 // mov (%rax),%r9
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,80 // jb 6e39 <_sk_gradient_avx+0x6f>
+ .byte 114,80 // jb 7019 <_sk_gradient_avx+0x6f>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
- .byte 196,98,125,24,21,210,15,0,0 // vbroadcastss 0xfd2(%rip),%ymm10 # 7dd4 <_sk_callback_avx+0x544>
+ .byte 196,98,125,24,21,2,16,0,0 // vbroadcastss 0x1002(%rip),%ymm10 # 7fe4 <_sk_callback_avx+0x574>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8
.byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8
@@ -26420,7 +26897,7 @@ _sk_gradient_avx:
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,205 // jne 6e06 <_sk_gradient_avx+0x3c>
+ .byte 117,205 // jne 6fe6 <_sk_gradient_avx+0x3c>
.byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -26603,27 +27080,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,200,11,0,0 // vbroadcastss 0xbc8(%rip),%ymm13 # 7dd8 <_sk_callback_avx+0x548>
+ .byte 196,98,125,24,45,248,11,0,0 // vbroadcastss 0xbf8(%rip),%ymm13 # 7fe8 <_sk_callback_avx+0x578>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,190,11,0,0 // vbroadcastss 0xbbe(%rip),%ymm14 # 7ddc <_sk_callback_avx+0x54c>
+ .byte 196,98,125,24,53,238,11,0,0 // vbroadcastss 0xbee(%rip),%ymm14 # 7fec <_sk_callback_avx+0x57c>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,175,11,0,0 // vbroadcastss 0xbaf(%rip),%ymm14 # 7de0 <_sk_callback_avx+0x550>
+ .byte 196,98,125,24,53,223,11,0,0 // vbroadcastss 0xbdf(%rip),%ymm14 # 7ff0 <_sk_callback_avx+0x580>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,160,11,0,0 // vbroadcastss 0xba0(%rip),%ymm13 # 7de4 <_sk_callback_avx+0x554>
+ .byte 196,98,125,24,45,208,11,0,0 // vbroadcastss 0xbd0(%rip),%ymm13 # 7ff4 <_sk_callback_avx+0x584>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,139,11,0,0 // vbroadcastss 0xb8b(%rip),%ymm10 # 7de8 <_sk_callback_avx+0x558>
+ .byte 196,98,125,24,21,187,11,0,0 // vbroadcastss 0xbbb(%rip),%ymm10 # 7ff8 <_sk_callback_avx+0x588>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,117,11,0,0 // vbroadcastss 0xb75(%rip),%ymm10 # 7dec <_sk_callback_avx+0x55c>
+ .byte 196,98,125,24,21,165,11,0,0 // vbroadcastss 0xba5(%rip),%ymm10 # 7ffc <_sk_callback_avx+0x58c>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,95,11,0,0 // vbroadcastss 0xb5f(%rip),%ymm10 # 7df0 <_sk_callback_avx+0x560>
+ .byte 196,98,125,24,21,143,11,0,0 // vbroadcastss 0xb8f(%rip),%ymm10 # 8000 <_sk_callback_avx+0x590>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -26653,7 +27130,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,9,11,0,0 // vbroadcastss 0xb09(%rip),%ymm11 # 7df4 <_sk_callback_avx+0x564>
+ .byte 196,98,125,24,29,57,11,0,0 // vbroadcastss 0xb39(%rip),%ymm11 # 8004 <_sk_callback_avx+0x594>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -26662,17 +27139,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,221,10,0,0 // vbroadcastss 0xadd(%rip),%ymm9 # 7df8 <_sk_callback_avx+0x568>
+ .byte 196,98,125,24,13,13,11,0,0 // vbroadcastss 0xb0d(%rip),%ymm9 # 8008 <_sk_callback_avx+0x598>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,187,10,0,0 // vbroadcastss 0xabb(%rip),%ymm9 # 7dfc <_sk_callback_avx+0x56c>
+ .byte 196,98,125,24,13,235,10,0,0 // vbroadcastss 0xaeb(%rip),%ymm9 # 800c <_sk_callback_avx+0x59c>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,172,10,0,0 // vbroadcastss 0xaac(%rip),%ymm11 # 7e00 <_sk_callback_avx+0x570>
+ .byte 196,98,125,24,29,220,10,0,0 // vbroadcastss 0xadc(%rip),%ymm11 # 8010 <_sk_callback_avx+0x5a0>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -26692,7 +27169,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,107,10,0,0 // vbroadcastss 0xa6b(%rip),%ymm11 # 7e04 <_sk_callback_avx+0x574>
+ .byte 196,98,125,24,29,155,10,0,0 // vbroadcastss 0xa9b(%rip),%ymm11 # 8014 <_sk_callback_avx+0x5a4>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -26701,17 +27178,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,63,10,0,0 // vbroadcastss 0xa3f(%rip),%ymm9 # 7e08 <_sk_callback_avx+0x578>
+ .byte 196,98,125,24,13,111,10,0,0 // vbroadcastss 0xa6f(%rip),%ymm9 # 8018 <_sk_callback_avx+0x5a8>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,29,10,0,0 // vbroadcastss 0xa1d(%rip),%ymm9 # 7e0c <_sk_callback_avx+0x57c>
+ .byte 196,98,125,24,13,77,10,0,0 // vbroadcastss 0xa4d(%rip),%ymm9 # 801c <_sk_callback_avx+0x5ac>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,14,10,0,0 // vbroadcastss 0xa0e(%rip),%ymm11 # 7e10 <_sk_callback_avx+0x580>
+ .byte 196,98,125,24,29,62,10,0,0 // vbroadcastss 0xa3e(%rip),%ymm11 # 8020 <_sk_callback_avx+0x5b0>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -26730,7 +27207,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,67,121,4,201,0 // vpermilps $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,211,9,0,0 // vbroadcastss 0x9d3(%rip),%ymm10 # 7e14 <_sk_callback_avx+0x584>
+ .byte 196,98,125,24,21,3,10,0,0 // vbroadcastss 0xa03(%rip),%ymm10 # 8024 <_sk_callback_avx+0x5b4>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
@@ -26739,7 +27216,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,167,9,0,0 // vbroadcastss 0x9a7(%rip),%ymm8 # 7e18 <_sk_callback_avx+0x588>
+ .byte 196,98,125,24,5,215,9,0,0 // vbroadcastss 0x9d7(%rip),%ymm8 # 8028 <_sk_callback_avx+0x5b8>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26780,7 +27257,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,67,9,0,0 // vbroadcastss 0x943(%rip),%ymm8 # 7e1c <_sk_callback_avx+0x58c>
+ .byte 196,98,125,24,5,115,9,0,0 // vbroadcastss 0x973(%rip),%ymm8 # 802c <_sk_callback_avx+0x5bc>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -26817,9 +27294,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,207,8,0,0 // vbroadcastss 0x8cf(%rip),%ymm0 # 7e20 <_sk_callback_avx+0x590>
+ .byte 196,226,125,24,5,255,8,0,0 // vbroadcastss 0x8ff(%rip),%ymm0 # 8030 <_sk_callback_avx+0x5c0>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,198,8,0,0 // vbroadcastss 0x8c6(%rip),%ymm8 # 7e24 <_sk_callback_avx+0x594>
+ .byte 196,98,125,24,5,246,8,0,0 // vbroadcastss 0x8f6(%rip),%ymm8 # 8034 <_sk_callback_avx+0x5c4>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26830,7 +27307,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,174,8,0,0 // vbroadcastss 0x8ae(%rip),%ymm0 # 7e28 <_sk_callback_avx+0x598>
+ .byte 196,226,125,24,5,222,8,0,0 // vbroadcastss 0x8de(%rip),%ymm0 # 8038 <_sk_callback_avx+0x5c8>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -26842,9 +27319,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,146,8,0,0 // vbroadcastss 0x892(%rip),%ymm1 # 7e2c <_sk_callback_avx+0x59c>
+ .byte 196,226,125,24,13,194,8,0,0 // vbroadcastss 0x8c2(%rip),%ymm1 # 803c <_sk_callback_avx+0x5cc>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,136,8,0,0 // vbroadcastss 0x888(%rip),%ymm8 # 7e30 <_sk_callback_avx+0x5a0>
+ .byte 196,98,125,24,5,184,8,0,0 // vbroadcastss 0x8b8(%rip),%ymm8 # 8040 <_sk_callback_avx+0x5d0>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26855,7 +27332,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,112,8,0,0 // vbroadcastss 0x870(%rip),%ymm1 # 7e34 <_sk_callback_avx+0x5a4>
+ .byte 196,226,125,24,13,160,8,0,0 // vbroadcastss 0x8a0(%rip),%ymm1 # 8044 <_sk_callback_avx+0x5d4>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -26867,14 +27344,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,83,8,0,0 // vbroadcastss 0x853(%rip),%ymm0 # 7e38 <_sk_callback_avx+0x5a8>
+ .byte 196,226,125,24,5,131,8,0,0 // vbroadcastss 0x883(%rip),%ymm0 # 8048 <_sk_callback_avx+0x5d8>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,74,8,0,0 // vbroadcastss 0x84a(%rip),%ymm8 # 7e3c <_sk_callback_avx+0x5ac>
+ .byte 196,98,125,24,5,122,8,0,0 // vbroadcastss 0x87a(%rip),%ymm8 # 804c <_sk_callback_avx+0x5dc>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,59,8,0,0 // vbroadcastss 0x83b(%rip),%ymm10 # 7e40 <_sk_callback_avx+0x5b0>
+ .byte 196,98,125,24,21,107,8,0,0 // vbroadcastss 0x86b(%rip),%ymm10 # 8050 <_sk_callback_avx+0x5e0>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,49,8,0,0 // vbroadcastss 0x831(%rip),%ymm10 # 7e44 <_sk_callback_avx+0x5b4>
+ .byte 196,98,125,24,21,97,8,0,0 // vbroadcastss 0x861(%rip),%ymm10 # 8054 <_sk_callback_avx+0x5e4>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -26886,19 +27363,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,20,8,0,0 // vbroadcastss 0x814(%rip),%ymm0 # 7e48 <_sk_callback_avx+0x5b8>
+ .byte 196,226,125,24,5,68,8,0,0 // vbroadcastss 0x844(%rip),%ymm0 # 8058 <_sk_callback_avx+0x5e8>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,11,8,0,0 // vbroadcastss 0x80b(%rip),%ymm8 # 7e4c <_sk_callback_avx+0x5bc>
+ .byte 196,98,125,24,5,59,8,0,0 // vbroadcastss 0x83b(%rip),%ymm8 # 805c <_sk_callback_avx+0x5ec>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,1,8,0,0 // vbroadcastss 0x801(%rip),%ymm9 # 7e50 <_sk_callback_avx+0x5c0>
+ .byte 196,98,125,24,13,49,8,0,0 // vbroadcastss 0x831(%rip),%ymm9 # 8060 <_sk_callback_avx+0x5f0>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,247,7,0,0 // vbroadcastss 0x7f7(%rip),%ymm10 # 7e54 <_sk_callback_avx+0x5c4>
+ .byte 196,98,125,24,21,39,8,0,0 // vbroadcastss 0x827(%rip),%ymm10 # 8064 <_sk_callback_avx+0x5f4>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,232,7,0,0 // vbroadcastss 0x7e8(%rip),%ymm10 # 7e58 <_sk_callback_avx+0x5c8>
+ .byte 196,98,125,24,21,24,8,0,0 // vbroadcastss 0x818(%rip),%ymm10 # 8068 <_sk_callback_avx+0x5f8>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,217,7,0,0 // vbroadcastss 0x7d9(%rip),%ymm9 # 7e5c <_sk_callback_avx+0x5cc>
+ .byte 196,98,125,24,13,9,8,0,0 // vbroadcastss 0x809(%rip),%ymm9 # 806c <_sk_callback_avx+0x5fc>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26909,17 +27386,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,193,7,0,0 // vbroadcastss 0x7c1(%rip),%ymm8 # 7e60 <_sk_callback_avx+0x5d0>
+ .byte 196,98,125,24,5,241,7,0,0 // vbroadcastss 0x7f1(%rip),%ymm8 # 8070 <_sk_callback_avx+0x600>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,179,7,0,0 // vbroadcastss 0x7b3(%rip),%ymm10 # 7e64 <_sk_callback_avx+0x5d4>
+ .byte 196,98,125,24,21,227,7,0,0 // vbroadcastss 0x7e3(%rip),%ymm10 # 8074 <_sk_callback_avx+0x604>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,169,7,0,0 // vbroadcastss 0x7a9(%rip),%ymm11 # 7e68 <_sk_callback_avx+0x5d8>
+ .byte 196,98,125,24,29,217,7,0,0 // vbroadcastss 0x7d9(%rip),%ymm11 # 8078 <_sk_callback_avx+0x608>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,144,7,0,0 // vbroadcastss 0x790(%rip),%ymm9 # 7e6c <_sk_callback_avx+0x5dc>
+ .byte 196,98,125,24,13,192,7,0,0 // vbroadcastss 0x7c0(%rip),%ymm9 # 807c <_sk_callback_avx+0x60c>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26930,13 +27407,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,120,7,0,0 // vbroadcastss 0x778(%rip),%ymm0 # 7e70 <_sk_callback_avx+0x5e0>
+ .byte 196,226,125,24,5,168,7,0,0 // vbroadcastss 0x7a8(%rip),%ymm0 # 8080 <_sk_callback_avx+0x610>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,101,7,0,0 // vbroadcastss 0x765(%rip),%ymm10 # 7e74 <_sk_callback_avx+0x5e4>
+ .byte 196,98,125,24,21,149,7,0,0 // vbroadcastss 0x795(%rip),%ymm10 # 8084 <_sk_callback_avx+0x614>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,91,7,0,0 // vbroadcastss 0x75b(%rip),%ymm10 # 7e78 <_sk_callback_avx+0x5e8>
+ .byte 196,98,125,24,21,139,7,0,0 // vbroadcastss 0x78b(%rip),%ymm10 # 8088 <_sk_callback_avx+0x618>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -26948,14 +27425,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,62,7,0,0 // vbroadcastss 0x73e(%rip),%ymm1 # 7e7c <_sk_callback_avx+0x5ec>
+ .byte 196,226,125,24,13,110,7,0,0 // vbroadcastss 0x76e(%rip),%ymm1 # 808c <_sk_callback_avx+0x61c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,52,7,0,0 // vbroadcastss 0x734(%rip),%ymm8 # 7e80 <_sk_callback_avx+0x5f0>
+ .byte 196,98,125,24,5,100,7,0,0 // vbroadcastss 0x764(%rip),%ymm8 # 8090 <_sk_callback_avx+0x620>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,37,7,0,0 // vbroadcastss 0x725(%rip),%ymm10 # 7e84 <_sk_callback_avx+0x5f4>
+ .byte 196,98,125,24,21,85,7,0,0 // vbroadcastss 0x755(%rip),%ymm10 # 8094 <_sk_callback_avx+0x624>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,27,7,0,0 // vbroadcastss 0x71b(%rip),%ymm10 # 7e88 <_sk_callback_avx+0x5f8>
+ .byte 196,98,125,24,21,75,7,0,0 // vbroadcastss 0x74b(%rip),%ymm10 # 8098 <_sk_callback_avx+0x628>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -26967,19 +27444,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,254,6,0,0 // vbroadcastss 0x6fe(%rip),%ymm1 # 7e8c <_sk_callback_avx+0x5fc>
+ .byte 196,226,125,24,13,46,7,0,0 // vbroadcastss 0x72e(%rip),%ymm1 # 809c <_sk_callback_avx+0x62c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,244,6,0,0 // vbroadcastss 0x6f4(%rip),%ymm8 # 7e90 <_sk_callback_avx+0x600>
+ .byte 196,98,125,24,5,36,7,0,0 // vbroadcastss 0x724(%rip),%ymm8 # 80a0 <_sk_callback_avx+0x630>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,234,6,0,0 // vbroadcastss 0x6ea(%rip),%ymm9 # 7e94 <_sk_callback_avx+0x604>
+ .byte 196,98,125,24,13,26,7,0,0 // vbroadcastss 0x71a(%rip),%ymm9 # 80a4 <_sk_callback_avx+0x634>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,224,6,0,0 // vbroadcastss 0x6e0(%rip),%ymm10 # 7e98 <_sk_callback_avx+0x608>
+ .byte 196,98,125,24,21,16,7,0,0 // vbroadcastss 0x710(%rip),%ymm10 # 80a8 <_sk_callback_avx+0x638>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,209,6,0,0 // vbroadcastss 0x6d1(%rip),%ymm10 # 7e9c <_sk_callback_avx+0x60c>
+ .byte 196,98,125,24,21,1,7,0,0 // vbroadcastss 0x701(%rip),%ymm10 # 80ac <_sk_callback_avx+0x63c>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,194,6,0,0 // vbroadcastss 0x6c2(%rip),%ymm9 # 7ea0 <_sk_callback_avx+0x610>
+ .byte 196,98,125,24,13,242,6,0,0 // vbroadcastss 0x6f2(%rip),%ymm9 # 80b0 <_sk_callback_avx+0x640>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26990,17 +27467,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,170,6,0,0 // vbroadcastss 0x6aa(%rip),%ymm8 # 7ea4 <_sk_callback_avx+0x614>
+ .byte 196,98,125,24,5,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm8 # 80b4 <_sk_callback_avx+0x644>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,155,6,0,0 // vbroadcastss 0x69b(%rip),%ymm10 # 7ea8 <_sk_callback_avx+0x618>
+ .byte 196,98,125,24,21,203,6,0,0 // vbroadcastss 0x6cb(%rip),%ymm10 # 80b8 <_sk_callback_avx+0x648>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,145,6,0,0 // vbroadcastss 0x691(%rip),%ymm11 # 7eac <_sk_callback_avx+0x61c>
+ .byte 196,98,125,24,29,193,6,0,0 // vbroadcastss 0x6c1(%rip),%ymm11 # 80bc <_sk_callback_avx+0x64c>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,120,6,0,0 // vbroadcastss 0x678(%rip),%ymm9 # 7eb0 <_sk_callback_avx+0x620>
+ .byte 196,98,125,24,13,168,6,0,0 // vbroadcastss 0x6a8(%rip),%ymm9 # 80c0 <_sk_callback_avx+0x650>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27011,13 +27488,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,96,6,0,0 // vbroadcastss 0x660(%rip),%ymm1 # 7eb4 <_sk_callback_avx+0x624>
+ .byte 196,226,125,24,13,144,6,0,0 // vbroadcastss 0x690(%rip),%ymm1 # 80c4 <_sk_callback_avx+0x654>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,76,6,0,0 // vbroadcastss 0x64c(%rip),%ymm10 # 7eb8 <_sk_callback_avx+0x628>
+ .byte 196,98,125,24,21,124,6,0,0 // vbroadcastss 0x67c(%rip),%ymm10 # 80c8 <_sk_callback_avx+0x658>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,66,6,0,0 // vbroadcastss 0x642(%rip),%ymm10 # 7ebc <_sk_callback_avx+0x62c>
+ .byte 196,98,125,24,21,114,6,0,0 // vbroadcastss 0x672(%rip),%ymm10 # 80cc <_sk_callback_avx+0x65c>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -27149,25 +27626,25 @@ BALIGN4
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7a8d <.literal4+0xb9>
+ .byte 71,225,61 // rex.RXB loope 7c6d <.literal4+0xb9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7a9d <.literal4+0xc9>
+ .byte 71,225,61 // rex.RXB loope 7c7d <.literal4+0xc9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7aad <.literal4+0xd9>
+ .byte 71,225,61 // rex.RXB loope 7c8d <.literal4+0xd9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7abd <.literal4+0xe9>
+ .byte 71,225,61 // rex.RXB loope 7c9d <.literal4+0xe9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
@@ -27232,7 +27709,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7b2d <.literal4+0x159>
+ .byte 224,7 // loopne 7d0d <.literal4+0x159>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -27248,10 +27725,27 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 7b54 <.literal4+0x180>
+ .byte 127,0 // jg 7d34 <.literal4+0x180>
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 119,115 // ja 7dad <.literal4+0x1f9>
+ .byte 248 // clc
+ .byte 194,117,191 // retq $0xbf75
+ .byte 191,63,249,68,180 // mov $0xb444f93f,%edi
+ .byte 62,163,233,220,63,81,140,242,66,141 // movabs %eax,%ds:0x8d42f28c513fdce9
+ .byte 188,190,63,248,245 // mov $0xf5f83fbe,%esp
+ .byte 154 // (bad)
+ .byte 64,254 // rex (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 7d68 <.literal4+0x1b4>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7bcd <.literal4+0x1f9>
+ .byte 119,115 // ja 7de1 <.literal4+0x22d>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27265,10 +27759,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7b88 <.literal4+0x1b4>
+ .byte 127,0 // jg 7d9c <.literal4+0x1e8>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7c01 <.literal4+0x22d>
+ .byte 119,115 // ja 7e15 <.literal4+0x261>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27282,10 +27776,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7bbc <.literal4+0x1e8>
+ .byte 127,0 // jg 7dd0 <.literal4+0x21c>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7c35 <.literal4+0x261>
+ .byte 119,115 // ja 7e49 <.literal4+0x295>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27299,10 +27793,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7bf0 <.literal4+0x21c>
+ .byte 127,0 // jg 7e04 <.literal4+0x250>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7c69 <.literal4+0x295>
+ .byte 119,115 // ja 7e7d <.literal4+0x2c9>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27313,9 +27807,9 @@ BALIGN4
.byte 210,221 // rcr %cl,%ch
.byte 65,0,0 // add %al,(%r8)
.byte 0,75,0 // add %cl,0x0(%rbx)
- .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax)
+ .byte 0,200 // add %cl,%al
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 7c67 <.literal4+0x293>
+ .byte 127,67 // jg 7e77 <.literal4+0x2c3>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -27327,7 +27821,7 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 7c87 <.literal4+0x2b3>
+ .byte 118,63 // jbe 7e97 <.literal4+0x2e3>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
@@ -27349,7 +27843,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7ca1 <.literal4+0x2cd>
+ .byte 224,7 // loopne 7eb1 <.literal4+0x2fd>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -27361,7 +27855,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7cbd <.literal4+0x2e9>
+ .byte 224,7 // loopne 7ecd <.literal4+0x319>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -27372,7 +27866,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 7d12 <.literal4+0x33e>
+ .byte 124,66 // jl 7f22 <.literal4+0x36e>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -27398,7 +27892,7 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 7d75 <.literal4+0x3a1>
+ .byte 112,65 // jo 7f85 <.literal4+0x3d1>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
@@ -27424,7 +27918,7 @@ BALIGN4
.byte 0,128,55,0,0,128 // add %al,-0x7fffffc9(%rax)
.byte 63 // (bad)
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7de7 <.literal4+0x413>
+ .byte 127,71 // jg 7ff7 <.literal4+0x443>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -27959,7 +28453,7 @@ _sk_seed_shader_sse41:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,28,93,0,0 // movaps 0x5d1c(%rip),%xmm2 # 5de0 <_sk_callback_sse41+0xf2>
+ .byte 15,40,21,220,94,0,0 // movaps 0x5edc(%rip),%xmm2 # 5fa0 <_sk_callback_sse41+0xf4>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -27968,7 +28462,7 @@ _sk_seed_shader_sse41:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,11,93,0,0 // movaps 0x5d0b(%rip),%xmm2 # 5df0 <_sk_callback_sse41+0x102>
+ .byte 15,40,21,203,94,0,0 // movaps 0x5ecb(%rip),%xmm2 # 5fb0 <_sk_callback_sse41+0x104>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -27988,14 +28482,14 @@ _sk_dither_sse41:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,217,92,0,0 // movdqa 0x5cd9(%rip),%xmm10 # 5e00 <_sk_callback_sse41+0x112>
+ .byte 102,68,15,111,21,153,94,0,0 // movdqa 0x5e99(%rip),%xmm10 # 5fc0 <_sk_callback_sse41+0x114>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,197,92,0,0 // movdqa 0x5cc5(%rip),%xmm12 # 5e10 <_sk_callback_sse41+0x122>
- .byte 102,68,15,111,45,204,92,0,0 // movdqa 0x5ccc(%rip),%xmm13 # 5e20 <_sk_callback_sse41+0x132>
+ .byte 102,68,15,111,37,133,94,0,0 // movdqa 0x5e85(%rip),%xmm12 # 5fd0 <_sk_callback_sse41+0x124>
+ .byte 102,68,15,111,45,140,94,0,0 // movdqa 0x5e8c(%rip),%xmm13 # 5fe0 <_sk_callback_sse41+0x134>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -28011,8 +28505,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,135,92,0,0 // mulps 0x5c87(%rip),%xmm8 # 5e30 <_sk_callback_sse41+0x142>
- .byte 68,15,88,5,143,92,0,0 // addps 0x5c8f(%rip),%xmm8 # 5e40 <_sk_callback_sse41+0x152>
+ .byte 68,15,89,5,71,94,0,0 // mulps 0x5e47(%rip),%xmm8 # 5ff0 <_sk_callback_sse41+0x144>
+ .byte 68,15,88,5,79,94,0,0 // addps 0x5e4f(%rip),%xmm8 # 6000 <_sk_callback_sse41+0x154>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -28054,7 +28548,7 @@ HIDDEN _sk_black_color_sse41
FUNCTION(_sk_black_color_sse41)
_sk_black_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,37,92,0,0 // movaps 0x5c25(%rip),%xmm3 # 5e50 <_sk_callback_sse41+0x162>
+ .byte 15,40,29,229,93,0,0 // movaps 0x5de5(%rip),%xmm3 # 6010 <_sk_callback_sse41+0x164>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -28065,7 +28559,7 @@ HIDDEN _sk_white_color_sse41
FUNCTION(_sk_white_color_sse41)
_sk_white_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,33,92,0,0 // movaps 0x5c21(%rip),%xmm0 # 5e60 <_sk_callback_sse41+0x172>
+ .byte 15,40,5,225,93,0,0 // movaps 0x5de1(%rip),%xmm0 # 6020 <_sk_callback_sse41+0x174>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -28111,7 +28605,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,225,91,0,0 // movaps 0x5be1(%rip),%xmm8 # 5e70 <_sk_callback_sse41+0x182>
+ .byte 68,15,40,5,161,93,0,0 // movaps 0x5da1(%rip),%xmm8 # 6030 <_sk_callback_sse41+0x184>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -28136,7 +28630,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,164,91,0,0 // movaps 0x5ba4(%rip),%xmm9 # 5e80 <_sk_callback_sse41+0x192>
+ .byte 68,15,40,13,100,93,0,0 // movaps 0x5d64(%rip),%xmm9 # 6040 <_sk_callback_sse41+0x194>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -28183,7 +28677,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,72,91,0,0 // movaps 0x5b48(%rip),%xmm8 # 5e90 <_sk_callback_sse41+0x1a2>
+ .byte 68,15,40,5,8,93,0,0 // movaps 0x5d08(%rip),%xmm8 # 6050 <_sk_callback_sse41+0x1a4>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -28196,7 +28690,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,56,91,0,0 // movaps 0x5b38(%rip),%xmm8 # 5ea0 <_sk_callback_sse41+0x1b2>
+ .byte 68,15,40,5,248,92,0,0 // movaps 0x5cf8(%rip),%xmm8 # 6060 <_sk_callback_sse41+0x1b4>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -28213,7 +28707,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,27,91,0,0 // movaps 0x5b1b(%rip),%xmm8 # 5eb0 <_sk_callback_sse41+0x1c2>
+ .byte 68,15,40,5,219,92,0,0 // movaps 0x5cdb(%rip),%xmm8 # 6070 <_sk_callback_sse41+0x1c4>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -28233,7 +28727,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,239,90,0,0 // movaps 0x5aef(%rip),%xmm8 # 5ec0 <_sk_callback_sse41+0x1d2>
+ .byte 68,15,40,5,175,92,0,0 // movaps 0x5caf(%rip),%xmm8 # 6080 <_sk_callback_sse41+0x1d4>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -28261,7 +28755,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,195,90,0,0 // movaps 0x5ac3(%rip),%xmm8 # 5ed0 <_sk_callback_sse41+0x1e2>
+ .byte 68,15,40,5,131,92,0,0 // movaps 0x5c83(%rip),%xmm8 # 6090 <_sk_callback_sse41+0x1e4>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -28336,7 +28830,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,248,89,0,0 // movaps 0x59f8(%rip),%xmm3 # 5ee0 <_sk_callback_sse41+0x1f2>
+ .byte 15,40,29,184,91,0,0 // movaps 0x5bb8(%rip),%xmm3 # 60a0 <_sk_callback_sse41+0x1f4>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -28384,7 +28878,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,99,89,0,0 // movaps 0x5963(%rip),%xmm2 # 5ef0 <_sk_callback_sse41+0x202>
+ .byte 15,40,21,35,91,0,0 // movaps 0x5b23(%rip),%xmm2 # 60b0 <_sk_callback_sse41+0x204>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28418,7 +28912,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,8,89,0,0 // movaps 0x5908(%rip),%xmm2 # 5f00 <_sk_callback_sse41+0x212>
+ .byte 15,40,21,200,90,0,0 // movaps 0x5ac8(%rip),%xmm2 # 60c0 <_sk_callback_sse41+0x214>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28455,7 +28949,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,162,88,0,0 // movaps 0x58a2(%rip),%xmm2 # 5f10 <_sk_callback_sse41+0x222>
+ .byte 15,40,21,98,90,0,0 // movaps 0x5a62(%rip),%xmm2 # 60d0 <_sk_callback_sse41+0x224>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28483,7 +28977,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,98,88,0,0 // movaps 0x5862(%rip),%xmm2 # 5f20 <_sk_callback_sse41+0x232>
+ .byte 15,40,21,34,90,0,0 // movaps 0x5a22(%rip),%xmm2 # 60e0 <_sk_callback_sse41+0x234>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28496,7 +28990,7 @@ HIDDEN _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,85,88,0,0 // movaps 0x5855(%rip),%xmm10 # 5f30 <_sk_callback_sse41+0x242>
+ .byte 68,15,40,21,21,90,0,0 // movaps 0x5a15(%rip),%xmm10 # 60f0 <_sk_callback_sse41+0x244>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,203 // movaps %xmm11,%xmm9
@@ -28578,7 +29072,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,51,87,0,0 // movaps 0x5733(%rip),%xmm10 # 5f40 <_sk_callback_sse41+0x252>
+ .byte 68,15,40,21,243,88,0,0 // movaps 0x58f3(%rip),%xmm10 # 6100 <_sk_callback_sse41+0x254>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -28660,7 +29154,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,12,86,0,0 // movaps 0x560c(%rip),%xmm10 # 5f50 <_sk_callback_sse41+0x262>
+ .byte 68,15,40,21,204,87,0,0 // movaps 0x57cc(%rip),%xmm10 # 6110 <_sk_callback_sse41+0x264>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -28743,7 +29237,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,241,84,0,0 // movaps 0x54f1(%rip),%xmm10 # 5f60 <_sk_callback_sse41+0x272>
+ .byte 68,15,40,21,177,86,0,0 // movaps 0x56b1(%rip),%xmm10 # 6120 <_sk_callback_sse41+0x274>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -28828,7 +29322,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,200,83,0,0 // movaps 0x53c8(%rip),%xmm1 # 5f70 <_sk_callback_sse41+0x282>
+ .byte 15,40,13,136,85,0,0 // movaps 0x5588(%rip),%xmm1 # 6130 <_sk_callback_sse41+0x284>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -28841,10 +29335,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,166,83,0,0 // movaps 0x53a6(%rip),%xmm13 # 5f80 <_sk_callback_sse41+0x292>
+ .byte 68,15,40,45,102,85,0,0 // movaps 0x5566(%rip),%xmm13 # 6140 <_sk_callback_sse41+0x294>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,166,83,0,0 // movaps 0x53a6(%rip),%xmm12 # 5f90 <_sk_callback_sse41+0x2a2>
+ .byte 68,15,40,37,102,85,0,0 // movaps 0x5566(%rip),%xmm12 # 6150 <_sk_callback_sse41+0x2a4>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -29030,12 +29524,12 @@ _sk_hue_sse41:
.byte 68,15,84,208 // andps %xmm0,%xmm10
.byte 15,84,200 // andps %xmm0,%xmm1
.byte 68,15,84,232 // andps %xmm0,%xmm13
- .byte 15,40,5,17,81,0,0 // movaps 0x5111(%rip),%xmm0 # 5fa0 <_sk_callback_sse41+0x2b2>
+ .byte 15,40,5,209,82,0,0 // movaps 0x52d1(%rip),%xmm0 # 6160 <_sk_callback_sse41+0x2b4>
.byte 68,15,89,224 // mulps %xmm0,%xmm12
- .byte 15,40,21,22,81,0,0 // movaps 0x5116(%rip),%xmm2 # 5fb0 <_sk_callback_sse41+0x2c2>
+ .byte 15,40,21,214,82,0,0 // movaps 0x52d6(%rip),%xmm2 # 6170 <_sk_callback_sse41+0x2c4>
.byte 15,89,250 // mulps %xmm2,%xmm7
.byte 65,15,88,252 // addps %xmm12,%xmm7
- .byte 68,15,40,53,23,81,0,0 // movaps 0x5117(%rip),%xmm14 # 5fc0 <_sk_callback_sse41+0x2d2>
+ .byte 68,15,40,53,215,82,0,0 // movaps 0x52d7(%rip),%xmm14 # 6180 <_sk_callback_sse41+0x2d4>
.byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,255 // addps %xmm7,%xmm15
@@ -29118,7 +29612,7 @@ _sk_hue_sse41:
.byte 65,15,88,214 // addps %xmm14,%xmm2
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,40,13,219,79,0,0 // movaps 0x4fdb(%rip),%xmm9 # 5fd0 <_sk_callback_sse41+0x2e2>
+ .byte 68,15,40,13,155,81,0,0 // movaps 0x519b(%rip),%xmm9 # 6190 <_sk_callback_sse41+0x2e4>
.byte 65,15,40,225 // movaps %xmm9,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
@@ -29212,14 +29706,14 @@ _sk_saturation_sse41:
.byte 68,15,84,215 // andps %xmm7,%xmm10
.byte 68,15,84,223 // andps %xmm7,%xmm11
.byte 68,15,84,199 // andps %xmm7,%xmm8
- .byte 15,40,21,149,78,0,0 // movaps 0x4e95(%rip),%xmm2 # 5fe0 <_sk_callback_sse41+0x2f2>
+ .byte 15,40,21,85,80,0,0 // movaps 0x5055(%rip),%xmm2 # 61a0 <_sk_callback_sse41+0x2f4>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,40,13,152,78,0,0 // movaps 0x4e98(%rip),%xmm1 # 5ff0 <_sk_callback_sse41+0x302>
+ .byte 15,40,13,88,80,0,0 // movaps 0x5058(%rip),%xmm1 # 61b0 <_sk_callback_sse41+0x304>
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,251 // addps %xmm3,%xmm7
- .byte 68,15,40,45,151,78,0,0 // movaps 0x4e97(%rip),%xmm13 # 6000 <_sk_callback_sse41+0x312>
+ .byte 68,15,40,45,87,80,0,0 // movaps 0x5057(%rip),%xmm13 # 61c0 <_sk_callback_sse41+0x314>
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 68,15,88,247 // addps %xmm7,%xmm14
.byte 65,15,40,218 // movaps %xmm10,%xmm3
@@ -29300,7 +29794,7 @@ _sk_saturation_sse41:
.byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
- .byte 68,15,40,13,93,77,0,0 // movaps 0x4d5d(%rip),%xmm9 # 6010 <_sk_callback_sse41+0x322>
+ .byte 68,15,40,13,29,79,0,0 // movaps 0x4f1d(%rip),%xmm9 # 61d0 <_sk_callback_sse41+0x324>
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 68,15,92,204 // subps %xmm4,%xmm9
.byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
@@ -29355,14 +29849,14 @@ _sk_color_sse41:
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 68,15,89,244 // mulps %xmm4,%xmm14
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 68,15,40,13,168,76,0,0 // movaps 0x4ca8(%rip),%xmm9 # 6020 <_sk_callback_sse41+0x332>
+ .byte 68,15,40,13,104,78,0,0 // movaps 0x4e68(%rip),%xmm9 # 61e0 <_sk_callback_sse41+0x334>
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 65,15,89,249 // mulps %xmm9,%xmm7
- .byte 68,15,40,21,168,76,0,0 // movaps 0x4ca8(%rip),%xmm10 # 6030 <_sk_callback_sse41+0x342>
+ .byte 68,15,40,21,104,78,0,0 // movaps 0x4e68(%rip),%xmm10 # 61f0 <_sk_callback_sse41+0x344>
.byte 65,15,40,219 // movaps %xmm11,%xmm3
.byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,40,29,165,76,0,0 // movaps 0x4ca5(%rip),%xmm11 # 6040 <_sk_callback_sse41+0x352>
+ .byte 68,15,40,29,101,78,0,0 // movaps 0x4e65(%rip),%xmm11 # 6200 <_sk_callback_sse41+0x354>
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
@@ -29447,7 +29941,7 @@ _sk_color_sse41:
.byte 65,15,88,251 // addps %xmm11,%xmm7
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
- .byte 68,15,40,13,97,75,0,0 // movaps 0x4b61(%rip),%xmm9 # 6050 <_sk_callback_sse41+0x362>
+ .byte 68,15,40,13,33,77,0,0 // movaps 0x4d21(%rip),%xmm9 # 6210 <_sk_callback_sse41+0x364>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 68,15,89,192 // mulps %xmm0,%xmm8
@@ -29499,13 +29993,13 @@ _sk_luminosity_sse41:
.byte 69,15,89,216 // mulps %xmm8,%xmm11
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,89,205 // mulps %xmm5,%xmm9
- .byte 68,15,40,5,185,74,0,0 // movaps 0x4ab9(%rip),%xmm8 # 6060 <_sk_callback_sse41+0x372>
+ .byte 68,15,40,5,121,76,0,0 // movaps 0x4c79(%rip),%xmm8 # 6220 <_sk_callback_sse41+0x374>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,21,189,74,0,0 // movaps 0x4abd(%rip),%xmm10 # 6070 <_sk_callback_sse41+0x382>
+ .byte 68,15,40,21,125,76,0,0 // movaps 0x4c7d(%rip),%xmm10 # 6230 <_sk_callback_sse41+0x384>
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 65,15,89,234 // mulps %xmm10,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 68,15,40,37,187,74,0,0 // movaps 0x4abb(%rip),%xmm12 # 6080 <_sk_callback_sse41+0x392>
+ .byte 68,15,40,37,123,76,0,0 // movaps 0x4c7b(%rip),%xmm12 # 6240 <_sk_callback_sse41+0x394>
.byte 68,15,40,242 // movaps %xmm2,%xmm14
.byte 69,15,89,244 // mulps %xmm12,%xmm14
.byte 68,15,88,245 // addps %xmm5,%xmm14
@@ -29590,7 +30084,7 @@ _sk_luminosity_sse41:
.byte 65,15,88,244 // addps %xmm12,%xmm6
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
- .byte 15,40,5,113,73,0,0 // movaps 0x4971(%rip),%xmm0 # 6090 <_sk_callback_sse41+0x3a2>
+ .byte 15,40,5,49,75,0,0 // movaps 0x4b31(%rip),%xmm0 # 6250 <_sk_callback_sse41+0x3a4>
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,226 // mulps %xmm2,%xmm4
@@ -29638,20 +30132,20 @@ _sk_srcover_rgba_8888_sse41:
.byte 15,133,219,0,0,0 // jne 1887 <_sk_srcover_rgba_8888_sse41+0xfb>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,227,72,0,0 // movdqa 0x48e3(%rip),%xmm4 # 60a0 <_sk_callback_sse41+0x3b2>
+ .byte 102,15,111,37,163,74,0,0 // movdqa 0x4aa3(%rip),%xmm4 # 6260 <_sk_callback_sse41+0x3b4>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,223,72,0,0 // pshufb 0x48df(%rip),%xmm5 # 60b0 <_sk_callback_sse41+0x3c2>
+ .byte 102,15,56,0,45,159,74,0,0 // pshufb 0x4a9f(%rip),%xmm5 # 6270 <_sk_callback_sse41+0x3c4>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,223,72,0,0 // pshufb 0x48df(%rip),%xmm6 # 60c0 <_sk_callback_sse41+0x3d2>
+ .byte 102,15,56,0,53,159,74,0,0 // pshufb 0x4a9f(%rip),%xmm6 # 6280 <_sk_callback_sse41+0x3d4>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 68,15,40,5,220,72,0,0 // movaps 0x48dc(%rip),%xmm8 # 60d0 <_sk_callback_sse41+0x3e2>
+ .byte 68,15,40,5,156,74,0,0 // movaps 0x4a9c(%rip),%xmm8 # 6290 <_sk_callback_sse41+0x3e4>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,224,72,0,0 // movaps 0x48e0(%rip),%xmm12 # 60e0 <_sk_callback_sse41+0x3f2>
+ .byte 68,15,40,37,160,74,0,0 // movaps 0x4aa0(%rip),%xmm12 # 62a0 <_sk_callback_sse41+0x3f4>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -29731,7 +30225,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,203,71,0,0 // movaps 0x47cb(%rip),%xmm8 # 60f0 <_sk_callback_sse41+0x402>
+ .byte 68,15,40,5,139,73,0,0 // movaps 0x498b(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x404>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -29743,7 +30237,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,192,71,0,0 // minps 0x47c0(%rip),%xmm3 # 6100 <_sk_callback_sse41+0x412>
+ .byte 15,93,29,128,73,0,0 // minps 0x4980(%rip),%xmm3 # 62c0 <_sk_callback_sse41+0x414>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -29754,7 +30248,7 @@ HIDDEN _sk_clamp_a_dst_sse41
.globl _sk_clamp_a_dst_sse41
FUNCTION(_sk_clamp_a_dst_sse41)
_sk_clamp_a_dst_sse41:
- .byte 15,93,61,188,71,0,0 // minps 0x47bc(%rip),%xmm7 # 6110 <_sk_callback_sse41+0x422>
+ .byte 15,93,61,124,73,0,0 // minps 0x497c(%rip),%xmm7 # 62d0 <_sk_callback_sse41+0x424>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -29789,7 +30283,7 @@ HIDDEN _sk_invert_sse41
.globl _sk_invert_sse41
FUNCTION(_sk_invert_sse41)
_sk_invert_sse41:
- .byte 68,15,40,5,136,71,0,0 // movaps 0x4788(%rip),%xmm8 # 6120 <_sk_callback_sse41+0x432>
+ .byte 68,15,40,5,72,73,0,0 // movaps 0x4948(%rip),%xmm8 # 62e0 <_sk_callback_sse41+0x434>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -29851,7 +30345,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,34,71,0,0 // movaps 0x4722(%rip),%xmm9 # 6130 <_sk_callback_sse41+0x442>
+ .byte 68,15,40,13,226,72,0,0 // movaps 0x48e2(%rip),%xmm9 # 62f0 <_sk_callback_sse41+0x444>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -29865,20 +30359,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,13,71,0,0 // movaps 0x470d(%rip),%xmm11 # 6140 <_sk_callback_sse41+0x452>
+ .byte 68,15,40,29,205,72,0,0 // movaps 0x48cd(%rip),%xmm11 # 6300 <_sk_callback_sse41+0x454>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,5,71,0,0 // movaps 0x4705(%rip),%xmm12 # 6150 <_sk_callback_sse41+0x462>
+ .byte 68,15,40,37,197,72,0,0 // movaps 0x48c5(%rip),%xmm12 # 6310 <_sk_callback_sse41+0x464>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,5,71,0,0 // movaps 0x4705(%rip),%xmm13 # 6160 <_sk_callback_sse41+0x472>
+ .byte 68,15,40,45,197,72,0,0 // movaps 0x48c5(%rip),%xmm13 # 6320 <_sk_callback_sse41+0x474>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,5,71,0,0 // movaps 0x4705(%rip),%xmm14 # 6170 <_sk_callback_sse41+0x482>
+ .byte 68,15,40,53,197,72,0,0 // movaps 0x48c5(%rip),%xmm14 # 6330 <_sk_callback_sse41+0x484>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,9,71,0,0 // movaps 0x4709(%rip),%xmm15 # 6180 <_sk_callback_sse41+0x492>
+ .byte 68,15,40,61,201,72,0,0 // movaps 0x48c9(%rip),%xmm15 # 6340 <_sk_callback_sse41+0x494>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -29915,19 +30409,19 @@ FUNCTION(_sk_from_srgb_dst_sse41)
_sk_from_srgb_dst_sse41:
.byte 68,15,40,204 // movaps %xmm4,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,29,148,70,0,0 // movaps 0x4694(%rip),%xmm11 # 6190 <_sk_callback_sse41+0x4a2>
+ .byte 68,15,40,29,84,72,0,0 // movaps 0x4854(%rip),%xmm11 # 6350 <_sk_callback_sse41+0x4a4>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 68,15,40,37,141,70,0,0 // movaps 0x468d(%rip),%xmm12 # 61a0 <_sk_callback_sse41+0x4b2>
+ .byte 68,15,40,37,77,72,0,0 // movaps 0x484d(%rip),%xmm12 # 6360 <_sk_callback_sse41+0x4b4>
.byte 65,15,89,228 // mulps %xmm12,%xmm4
- .byte 68,15,40,45,145,70,0,0 // movaps 0x4691(%rip),%xmm13 # 61b0 <_sk_callback_sse41+0x4c2>
+ .byte 68,15,40,45,81,72,0,0 // movaps 0x4851(%rip),%xmm13 # 6370 <_sk_callback_sse41+0x4c4>
.byte 65,15,88,229 // addps %xmm13,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 68,15,40,53,146,70,0,0 // movaps 0x4692(%rip),%xmm14 # 61c0 <_sk_callback_sse41+0x4d2>
+ .byte 68,15,40,53,82,72,0,0 // movaps 0x4852(%rip),%xmm14 # 6380 <_sk_callback_sse41+0x4d4>
.byte 65,15,88,230 // addps %xmm14,%xmm4
- .byte 68,15,40,61,150,70,0,0 // movaps 0x4696(%rip),%xmm15 # 61d0 <_sk_callback_sse41+0x4e2>
+ .byte 68,15,40,61,86,72,0,0 // movaps 0x4856(%rip),%xmm15 # 6390 <_sk_callback_sse41+0x4e4>
.byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4
@@ -29971,22 +30465,22 @@ _sk_to_srgb_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
- .byte 68,15,40,29,10,70,0,0 // movaps 0x460a(%rip),%xmm11 # 61e0 <_sk_callback_sse41+0x4f2>
+ .byte 68,15,40,29,202,71,0,0 // movaps 0x47ca(%rip),%xmm11 # 63a0 <_sk_callback_sse41+0x4f4>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 68,15,40,37,10,70,0,0 // movaps 0x460a(%rip),%xmm12 # 61f0 <_sk_callback_sse41+0x502>
+ .byte 68,15,40,37,202,71,0,0 // movaps 0x47ca(%rip),%xmm12 # 63b0 <_sk_callback_sse41+0x504>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,40,21,10,70,0,0 // movaps 0x460a(%rip),%xmm10 # 6200 <_sk_callback_sse41+0x512>
+ .byte 68,15,40,21,202,71,0,0 // movaps 0x47ca(%rip),%xmm10 # 63c0 <_sk_callback_sse41+0x514>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 68,15,40,45,10,70,0,0 // movaps 0x460a(%rip),%xmm13 # 6210 <_sk_callback_sse41+0x522>
+ .byte 68,15,40,45,202,71,0,0 // movaps 0x47ca(%rip),%xmm13 # 63d0 <_sk_callback_sse41+0x524>
.byte 69,15,88,253 // addps %xmm13,%xmm15
- .byte 68,15,40,53,14,70,0,0 // movaps 0x460e(%rip),%xmm14 # 6220 <_sk_callback_sse41+0x532>
+ .byte 68,15,40,53,206,71,0,0 // movaps 0x47ce(%rip),%xmm14 # 63e0 <_sk_callback_sse41+0x534>
.byte 69,15,88,198 // addps %xmm14,%xmm8
.byte 69,15,83,192 // rcpps %xmm8,%xmm8
.byte 69,15,89,199 // mulps %xmm15,%xmm8
- .byte 68,15,40,61,10,70,0,0 // movaps 0x460a(%rip),%xmm15 # 6230 <_sk_callback_sse41+0x542>
+ .byte 68,15,40,61,202,71,0,0 // movaps 0x47ca(%rip),%xmm15 # 63f0 <_sk_callback_sse41+0x544>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,82,202 // rsqrtps %xmm2,%xmm9
@@ -30039,7 +30533,7 @@ _sk_rgb_to_hsl_sse41:
.byte 68,15,93,226 // minps %xmm2,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,87,69,0,0 // movaps 0x4557(%rip),%xmm14 # 6240 <_sk_callback_sse41+0x552>
+ .byte 68,15,40,53,23,71,0,0 // movaps 0x4717(%rip),%xmm14 # 6400 <_sk_callback_sse41+0x554>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -30048,27 +30542,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,62,69,0,0 // andps 0x453e(%rip),%xmm15 # 6250 <_sk_callback_sse41+0x562>
+ .byte 68,15,84,61,254,70,0,0 // andps 0x46fe(%rip),%xmm15 # 6410 <_sk_callback_sse41+0x564>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,49,69,0,0 // movaps 0x4531(%rip),%xmm13 # 6260 <_sk_callback_sse41+0x572>
+ .byte 68,15,40,45,241,70,0,0 // movaps 0x46f1(%rip),%xmm13 # 6420 <_sk_callback_sse41+0x574>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,45,69,0,0 // addps 0x452d(%rip),%xmm8 # 6270 <_sk_callback_sse41+0x582>
+ .byte 68,15,88,5,237,70,0,0 // addps 0x46ed(%rip),%xmm8 # 6430 <_sk_callback_sse41+0x584>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,37,69,0,0 // mulps 0x4525(%rip),%xmm8 # 6280 <_sk_callback_sse41+0x592>
+ .byte 68,15,89,5,229,70,0,0 // mulps 0x46e5(%rip),%xmm8 # 6440 <_sk_callback_sse41+0x594>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,25,69,0,0 // movaps 0x4519(%rip),%xmm0 # 6290 <_sk_callback_sse41+0x5a2>
+ .byte 15,40,5,217,70,0,0 // movaps 0x46d9(%rip),%xmm0 # 6450 <_sk_callback_sse41+0x5a4>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -30090,7 +30584,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,223,68,0,0 // movaps 0x44df(%rip),%xmm9 # 62a0 <_sk_callback_sse41+0x5b2>
+ .byte 68,15,40,13,159,70,0,0 // movaps 0x469f(%rip),%xmm9 # 6460 <_sk_callback_sse41+0x5b4>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -30103,19 +30597,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,186,68,0,0 // movaps 0x44ba(%rip),%xmm14 # 62b0 <_sk_callback_sse41+0x5c2>
+ .byte 68,15,40,53,122,70,0,0 // movaps 0x467a(%rip),%xmm14 # 6470 <_sk_callback_sse41+0x5c4>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,179,68,0,0 // movaps 0x44b3(%rip),%xmm11 # 62c0 <_sk_callback_sse41+0x5d2>
+ .byte 68,15,40,29,115,70,0,0 // movaps 0x4673(%rip),%xmm11 # 6480 <_sk_callback_sse41+0x5d4>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,172,68,0,0 // movaps 0x44ac(%rip),%xmm7 # 62d0 <_sk_callback_sse41+0x5e2>
+ .byte 15,40,61,108,70,0,0 // movaps 0x466c(%rip),%xmm7 # 6490 <_sk_callback_sse41+0x5e4>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,173,68,0,0 // movaps 0x44ad(%rip),%xmm3 # 62e0 <_sk_callback_sse41+0x5f2>
+ .byte 15,40,29,109,70,0,0 // movaps 0x466d(%rip),%xmm3 # 64a0 <_sk_callback_sse41+0x5f4>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -30125,7 +30619,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,140,68,0,0 // movaps 0x448c(%rip),%xmm12 # 62f0 <_sk_callback_sse41+0x602>
+ .byte 68,15,40,37,76,70,0,0 // movaps 0x464c(%rip),%xmm12 # 64b0 <_sk_callback_sse41+0x604>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -30159,7 +30653,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,4,68,0,0 // addps 0x4404(%rip),%xmm10 # 6300 <_sk_callback_sse41+0x612>
+ .byte 68,15,88,21,196,69,0,0 // addps 0x45c4(%rip),%xmm10 # 64c0 <_sk_callback_sse41+0x614>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -30216,9 +30710,9 @@ _sk_scale_u8_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,52 // jne 1fe3 <_sk_scale_u8_sse41+0x4c>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,81,67,0,0 // pand 0x4351(%rip),%xmm8 # 6310 <_sk_callback_sse41+0x622>
+ .byte 102,68,15,219,5,17,69,0,0 // pand 0x4511(%rip),%xmm8 # 64d0 <_sk_callback_sse41+0x624>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,85,67,0,0 // mulps 0x4355(%rip),%xmm8 # 6320 <_sk_callback_sse41+0x632>
+ .byte 68,15,89,5,21,69,0,0 // mulps 0x4515(%rip),%xmm8 # 64e0 <_sk_callback_sse41+0x634>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -30282,9 +30776,9 @@ _sk_lerp_u8_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,72 // jne 20d2 <_sk_lerp_u8_sse41+0x60>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,150,66,0,0 // pand 0x4296(%rip),%xmm8 # 6330 <_sk_callback_sse41+0x642>
+ .byte 102,68,15,219,5,86,68,0,0 // pand 0x4456(%rip),%xmm8 # 64f0 <_sk_callback_sse41+0x644>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,154,66,0,0 // mulps 0x429a(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x652>
+ .byte 68,15,89,5,90,68,0,0 // mulps 0x445a(%rip),%xmm8 # 6500 <_sk_callback_sse41+0x654>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -30334,17 +30828,17 @@ _sk_lerp_565_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,152,0,0,0 // jne 21e3 <_sk_lerp_565_sse41+0xb7>
.byte 102,71,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm10
- .byte 102,68,15,111,5,245,65,0,0 // movdqa 0x41f5(%rip),%xmm8 # 6350 <_sk_callback_sse41+0x662>
+ .byte 102,68,15,111,5,181,67,0,0 // movdqa 0x43b5(%rip),%xmm8 # 6510 <_sk_callback_sse41+0x664>
.byte 102,69,15,219,194 // pand %xmm10,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,244,65,0,0 // mulps 0x41f4(%rip),%xmm8 # 6360 <_sk_callback_sse41+0x672>
- .byte 102,68,15,111,13,251,65,0,0 // movdqa 0x41fb(%rip),%xmm9 # 6370 <_sk_callback_sse41+0x682>
+ .byte 68,15,89,5,180,67,0,0 // mulps 0x43b4(%rip),%xmm8 # 6520 <_sk_callback_sse41+0x674>
+ .byte 102,68,15,111,13,187,67,0,0 // movdqa 0x43bb(%rip),%xmm9 # 6530 <_sk_callback_sse41+0x684>
.byte 102,69,15,219,202 // pand %xmm10,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,250,65,0,0 // mulps 0x41fa(%rip),%xmm9 # 6380 <_sk_callback_sse41+0x692>
- .byte 102,68,15,219,21,1,66,0,0 // pand 0x4201(%rip),%xmm10 # 6390 <_sk_callback_sse41+0x6a2>
+ .byte 68,15,89,13,186,67,0,0 // mulps 0x43ba(%rip),%xmm9 # 6540 <_sk_callback_sse41+0x694>
+ .byte 102,68,15,219,21,193,67,0,0 // pand 0x43c1(%rip),%xmm10 # 6550 <_sk_callback_sse41+0x6a4>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,5,66,0,0 // mulps 0x4205(%rip),%xmm10 # 63a0 <_sk_callback_sse41+0x6b2>
+ .byte 68,15,89,21,197,67,0,0 // mulps 0x43c5(%rip),%xmm10 # 6560 <_sk_callback_sse41+0x6b4>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -30398,7 +30892,7 @@ _sk_load_tables_sse41:
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,15,111,5,82,65,0,0 // movdqa 0x4152(%rip),%xmm0 # 63b0 <_sk_callback_sse41+0x6c2>
+ .byte 102,15,111,5,18,67,0,0 // movdqa 0x4312(%rip),%xmm0 # 6570 <_sk_callback_sse41+0x6c4>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -30413,7 +30907,7 @@ _sk_load_tables_sse41:
.byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0
.byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,13,65,0,0 // pshufb 0x410d(%rip),%xmm1 # 63c0 <_sk_callback_sse41+0x6d2>
+ .byte 102,15,56,0,13,205,66,0,0 // pshufb 0x42cd(%rip),%xmm1 # 6580 <_sk_callback_sse41+0x6d4>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
.byte 68,15,182,211 // movzbl %bl,%r10d
@@ -30428,7 +30922,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,72,24 // mov 0x18(%rax),%r9
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,201,64,0,0 // pshufb 0x40c9(%rip),%xmm2 # 63d0 <_sk_callback_sse41+0x6e2>
+ .byte 102,15,56,0,21,137,66,0,0 // pshufb 0x4289(%rip),%xmm2 # 6590 <_sk_callback_sse41+0x6e4>
.byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,208 // movzbl %al,%r10d
@@ -30443,7 +30937,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,134,64,0,0 // mulps 0x4086(%rip),%xmm3 # 63e0 <_sk_callback_sse41+0x6f2>
+ .byte 15,89,29,70,66,0,0 // mulps 0x4246(%rip),%xmm3 # 65a0 <_sk_callback_sse41+0x6f4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -30486,7 +30980,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,244,63,0,0 // movdqa 0x3ff4(%rip),%xmm8 # 63f0 <_sk_callback_sse41+0x702>
+ .byte 102,68,15,111,5,180,65,0,0 // movdqa 0x41b4(%rip),%xmm8 # 65b0 <_sk_callback_sse41+0x704>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -30504,7 +30998,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
.byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
- .byte 102,15,56,0,13,163,63,0,0 // pshufb 0x3fa3(%rip),%xmm1 # 6400 <_sk_callback_sse41+0x712>
+ .byte 102,15,56,0,13,99,65,0,0 // pshufb 0x4163(%rip),%xmm1 # 65c0 <_sk_callback_sse41+0x714>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -30540,7 +31034,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,241,62,0,0 // mulps 0x3ef1(%rip),%xmm3 # 6410 <_sk_callback_sse41+0x722>
+ .byte 15,89,29,177,64,0,0 // mulps 0x40b1(%rip),%xmm3 # 65d0 <_sk_callback_sse41+0x724>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -30582,7 +31076,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,102,62,0,0 // movdqa 0x3e66(%rip),%xmm8 # 6420 <_sk_callback_sse41+0x732>
+ .byte 102,68,15,111,5,38,64,0,0 // movdqa 0x4026(%rip),%xmm8 # 65e0 <_sk_callback_sse41+0x734>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -30600,7 +31094,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0
.byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
- .byte 102,15,56,0,13,21,62,0,0 // pshufb 0x3e15(%rip),%xmm1 # 6430 <_sk_callback_sse41+0x742>
+ .byte 102,15,56,0,13,213,63,0,0 // pshufb 0x3fd5(%rip),%xmm1 # 65f0 <_sk_callback_sse41+0x744>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -30631,7 +31125,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,128,61,0,0 // movaps 0x3d80(%rip),%xmm3 # 6440 <_sk_callback_sse41+0x752>
+ .byte 15,40,29,64,63,0,0 // movaps 0x3f40(%rip),%xmm3 # 6600 <_sk_callback_sse41+0x754>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -30665,7 +31159,7 @@ _sk_byte_tables_sse41:
.byte 65,84 // push %r12
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,24,61,0,0 // movaps 0x3d18(%rip),%xmm8 # 6450 <_sk_callback_sse41+0x762>
+ .byte 68,15,40,5,216,62,0,0 // movaps 0x3ed8(%rip),%xmm8 # 6610 <_sk_callback_sse41+0x764>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
@@ -30684,7 +31178,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,201,60,0,0 // movaps 0x3cc9(%rip),%xmm9 # 6460 <_sk_callback_sse41+0x772>
+ .byte 68,15,40,13,137,62,0,0 // movaps 0x3e89(%rip),%xmm9 # 6620 <_sk_callback_sse41+0x774>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -30780,7 +31274,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,65,59,0,0 // movaps 0x3b41(%rip),%xmm9 # 6470 <_sk_callback_sse41+0x782>
+ .byte 68,15,40,13,1,61,0,0 // movaps 0x3d01(%rip),%xmm9 # 6630 <_sk_callback_sse41+0x784>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -30967,31 +31461,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,137,56,0,0 // mulps 0x3889(%rip),%xmm8 # 6480 <_sk_callback_sse41+0x792>
- .byte 68,15,84,21,145,56,0,0 // andps 0x3891(%rip),%xmm10 # 6490 <_sk_callback_sse41+0x7a2>
- .byte 68,15,86,21,153,56,0,0 // orps 0x3899(%rip),%xmm10 # 64a0 <_sk_callback_sse41+0x7b2>
- .byte 68,15,88,5,161,56,0,0 // addps 0x38a1(%rip),%xmm8 # 64b0 <_sk_callback_sse41+0x7c2>
- .byte 68,15,40,37,169,56,0,0 // movaps 0x38a9(%rip),%xmm12 # 64c0 <_sk_callback_sse41+0x7d2>
+ .byte 68,15,89,5,73,58,0,0 // mulps 0x3a49(%rip),%xmm8 # 6640 <_sk_callback_sse41+0x794>
+ .byte 68,15,84,21,81,58,0,0 // andps 0x3a51(%rip),%xmm10 # 6650 <_sk_callback_sse41+0x7a4>
+ .byte 68,15,86,21,89,58,0,0 // orps 0x3a59(%rip),%xmm10 # 6660 <_sk_callback_sse41+0x7b4>
+ .byte 68,15,88,5,97,58,0,0 // addps 0x3a61(%rip),%xmm8 # 6670 <_sk_callback_sse41+0x7c4>
+ .byte 68,15,40,37,105,58,0,0 // movaps 0x3a69(%rip),%xmm12 # 6680 <_sk_callback_sse41+0x7d4>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,169,56,0,0 // addps 0x38a9(%rip),%xmm10 # 64d0 <_sk_callback_sse41+0x7e2>
- .byte 68,15,40,37,177,56,0,0 // movaps 0x38b1(%rip),%xmm12 # 64e0 <_sk_callback_sse41+0x7f2>
+ .byte 68,15,88,21,105,58,0,0 // addps 0x3a69(%rip),%xmm10 # 6690 <_sk_callback_sse41+0x7e4>
+ .byte 68,15,40,37,113,58,0,0 // movaps 0x3a71(%rip),%xmm12 # 66a0 <_sk_callback_sse41+0x7f4>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,158,56,0,0 // addps 0x389e(%rip),%xmm8 # 64f0 <_sk_callback_sse41+0x802>
- .byte 68,15,40,21,166,56,0,0 // movaps 0x38a6(%rip),%xmm10 # 6500 <_sk_callback_sse41+0x812>
+ .byte 68,15,88,5,94,58,0,0 // addps 0x3a5e(%rip),%xmm8 # 66b0 <_sk_callback_sse41+0x804>
+ .byte 68,15,40,21,102,58,0,0 // movaps 0x3a66(%rip),%xmm10 # 66c0 <_sk_callback_sse41+0x814>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,166,56,0,0 // movaps 0x38a6(%rip),%xmm10 # 6510 <_sk_callback_sse41+0x822>
+ .byte 68,15,40,21,102,58,0,0 // movaps 0x3a66(%rip),%xmm10 # 66d0 <_sk_callback_sse41+0x824>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,170,56,0,0 // movaps 0x38aa(%rip),%xmm11 # 6520 <_sk_callback_sse41+0x832>
+ .byte 68,15,40,29,106,58,0,0 // movaps 0x3a6a(%rip),%xmm11 # 66e0 <_sk_callback_sse41+0x834>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,170,56,0,0 // mulps 0x38aa(%rip),%xmm11 # 6530 <_sk_callback_sse41+0x842>
+ .byte 68,15,89,29,106,58,0,0 // mulps 0x3a6a(%rip),%xmm11 # 66f0 <_sk_callback_sse41+0x844>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -30999,7 +31493,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,145,56,0,0 // minps 0x3891(%rip),%xmm8 # 6540 <_sk_callback_sse41+0x852>
+ .byte 68,15,93,5,81,58,0,0 // minps 0x3a51(%rip),%xmm8 # 6700 <_sk_callback_sse41+0x854>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31029,31 +31523,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,50,56,0,0 // mulps 0x3832(%rip),%xmm12 # 6550 <_sk_callback_sse41+0x862>
- .byte 68,15,84,29,58,56,0,0 // andps 0x383a(%rip),%xmm11 # 6560 <_sk_callback_sse41+0x872>
- .byte 68,15,86,29,66,56,0,0 // orps 0x3842(%rip),%xmm11 # 6570 <_sk_callback_sse41+0x882>
- .byte 68,15,88,37,74,56,0,0 // addps 0x384a(%rip),%xmm12 # 6580 <_sk_callback_sse41+0x892>
- .byte 15,40,13,83,56,0,0 // movaps 0x3853(%rip),%xmm1 # 6590 <_sk_callback_sse41+0x8a2>
+ .byte 68,15,89,37,242,57,0,0 // mulps 0x39f2(%rip),%xmm12 # 6710 <_sk_callback_sse41+0x864>
+ .byte 68,15,84,29,250,57,0,0 // andps 0x39fa(%rip),%xmm11 # 6720 <_sk_callback_sse41+0x874>
+ .byte 68,15,86,29,2,58,0,0 // orps 0x3a02(%rip),%xmm11 # 6730 <_sk_callback_sse41+0x884>
+ .byte 68,15,88,37,10,58,0,0 // addps 0x3a0a(%rip),%xmm12 # 6740 <_sk_callback_sse41+0x894>
+ .byte 15,40,13,19,58,0,0 // movaps 0x3a13(%rip),%xmm1 # 6750 <_sk_callback_sse41+0x8a4>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,83,56,0,0 // addps 0x3853(%rip),%xmm11 # 65a0 <_sk_callback_sse41+0x8b2>
- .byte 15,40,13,92,56,0,0 // movaps 0x385c(%rip),%xmm1 # 65b0 <_sk_callback_sse41+0x8c2>
+ .byte 68,15,88,29,19,58,0,0 // addps 0x3a13(%rip),%xmm11 # 6760 <_sk_callback_sse41+0x8b4>
+ .byte 15,40,13,28,58,0,0 // movaps 0x3a1c(%rip),%xmm1 # 6770 <_sk_callback_sse41+0x8c4>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,73,56,0,0 // addps 0x3849(%rip),%xmm12 # 65c0 <_sk_callback_sse41+0x8d2>
- .byte 15,40,13,82,56,0,0 // movaps 0x3852(%rip),%xmm1 # 65d0 <_sk_callback_sse41+0x8e2>
+ .byte 68,15,88,37,9,58,0,0 // addps 0x3a09(%rip),%xmm12 # 6780 <_sk_callback_sse41+0x8d4>
+ .byte 15,40,13,18,58,0,0 // movaps 0x3a12(%rip),%xmm1 # 6790 <_sk_callback_sse41+0x8e4>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,82,56,0,0 // movaps 0x3852(%rip),%xmm10 # 65e0 <_sk_callback_sse41+0x8f2>
+ .byte 68,15,40,21,18,58,0,0 // movaps 0x3a12(%rip),%xmm10 # 67a0 <_sk_callback_sse41+0x8f4>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,87,56,0,0 // movaps 0x3857(%rip),%xmm1 # 65f0 <_sk_callback_sse41+0x902>
+ .byte 15,40,13,23,58,0,0 // movaps 0x3a17(%rip),%xmm1 # 67b0 <_sk_callback_sse41+0x904>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,88,56,0,0 // mulps 0x3858(%rip),%xmm1 # 6600 <_sk_callback_sse41+0x912>
+ .byte 15,89,13,24,58,0,0 // mulps 0x3a18(%rip),%xmm1 # 67c0 <_sk_callback_sse41+0x914>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -31061,7 +31555,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,67,56,0,0 // minps 0x3843(%rip),%xmm1 # 6610 <_sk_callback_sse41+0x922>
+ .byte 15,93,13,3,58,0,0 // minps 0x3a03(%rip),%xmm1 # 67d0 <_sk_callback_sse41+0x924>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31091,31 +31585,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,228,55,0,0 // mulps 0x37e4(%rip),%xmm12 # 6620 <_sk_callback_sse41+0x932>
- .byte 68,15,84,29,236,55,0,0 // andps 0x37ec(%rip),%xmm11 # 6630 <_sk_callback_sse41+0x942>
- .byte 68,15,86,29,244,55,0,0 // orps 0x37f4(%rip),%xmm11 # 6640 <_sk_callback_sse41+0x952>
- .byte 68,15,88,37,252,55,0,0 // addps 0x37fc(%rip),%xmm12 # 6650 <_sk_callback_sse41+0x962>
- .byte 15,40,21,5,56,0,0 // movaps 0x3805(%rip),%xmm2 # 6660 <_sk_callback_sse41+0x972>
+ .byte 68,15,89,37,164,57,0,0 // mulps 0x39a4(%rip),%xmm12 # 67e0 <_sk_callback_sse41+0x934>
+ .byte 68,15,84,29,172,57,0,0 // andps 0x39ac(%rip),%xmm11 # 67f0 <_sk_callback_sse41+0x944>
+ .byte 68,15,86,29,180,57,0,0 // orps 0x39b4(%rip),%xmm11 # 6800 <_sk_callback_sse41+0x954>
+ .byte 68,15,88,37,188,57,0,0 // addps 0x39bc(%rip),%xmm12 # 6810 <_sk_callback_sse41+0x964>
+ .byte 15,40,21,197,57,0,0 // movaps 0x39c5(%rip),%xmm2 # 6820 <_sk_callback_sse41+0x974>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,5,56,0,0 // addps 0x3805(%rip),%xmm11 # 6670 <_sk_callback_sse41+0x982>
- .byte 15,40,21,14,56,0,0 // movaps 0x380e(%rip),%xmm2 # 6680 <_sk_callback_sse41+0x992>
+ .byte 68,15,88,29,197,57,0,0 // addps 0x39c5(%rip),%xmm11 # 6830 <_sk_callback_sse41+0x984>
+ .byte 15,40,21,206,57,0,0 // movaps 0x39ce(%rip),%xmm2 # 6840 <_sk_callback_sse41+0x994>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,251,55,0,0 // addps 0x37fb(%rip),%xmm12 # 6690 <_sk_callback_sse41+0x9a2>
- .byte 15,40,21,4,56,0,0 // movaps 0x3804(%rip),%xmm2 # 66a0 <_sk_callback_sse41+0x9b2>
+ .byte 68,15,88,37,187,57,0,0 // addps 0x39bb(%rip),%xmm12 # 6850 <_sk_callback_sse41+0x9a4>
+ .byte 15,40,21,196,57,0,0 // movaps 0x39c4(%rip),%xmm2 # 6860 <_sk_callback_sse41+0x9b4>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,4,56,0,0 // movaps 0x3804(%rip),%xmm10 # 66b0 <_sk_callback_sse41+0x9c2>
+ .byte 68,15,40,21,196,57,0,0 // movaps 0x39c4(%rip),%xmm10 # 6870 <_sk_callback_sse41+0x9c4>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,9,56,0,0 // movaps 0x3809(%rip),%xmm2 # 66c0 <_sk_callback_sse41+0x9d2>
+ .byte 15,40,21,201,57,0,0 // movaps 0x39c9(%rip),%xmm2 # 6880 <_sk_callback_sse41+0x9d4>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,10,56,0,0 // mulps 0x380a(%rip),%xmm2 # 66d0 <_sk_callback_sse41+0x9e2>
+ .byte 15,89,21,202,57,0,0 // mulps 0x39ca(%rip),%xmm2 # 6890 <_sk_callback_sse41+0x9e4>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -31123,7 +31617,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,245,55,0,0 // minps 0x37f5(%rip),%xmm2 # 66e0 <_sk_callback_sse41+0x9f2>
+ .byte 15,93,21,181,57,0,0 // minps 0x39b5(%rip),%xmm2 # 68a0 <_sk_callback_sse41+0x9f4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31153,31 +31647,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,150,55,0,0 // mulps 0x3796(%rip),%xmm12 # 66f0 <_sk_callback_sse41+0xa02>
- .byte 68,15,84,29,158,55,0,0 // andps 0x379e(%rip),%xmm11 # 6700 <_sk_callback_sse41+0xa12>
- .byte 68,15,86,29,166,55,0,0 // orps 0x37a6(%rip),%xmm11 # 6710 <_sk_callback_sse41+0xa22>
- .byte 68,15,88,37,174,55,0,0 // addps 0x37ae(%rip),%xmm12 # 6720 <_sk_callback_sse41+0xa32>
- .byte 15,40,29,183,55,0,0 // movaps 0x37b7(%rip),%xmm3 # 6730 <_sk_callback_sse41+0xa42>
+ .byte 68,15,89,37,86,57,0,0 // mulps 0x3956(%rip),%xmm12 # 68b0 <_sk_callback_sse41+0xa04>
+ .byte 68,15,84,29,94,57,0,0 // andps 0x395e(%rip),%xmm11 # 68c0 <_sk_callback_sse41+0xa14>
+ .byte 68,15,86,29,102,57,0,0 // orps 0x3966(%rip),%xmm11 # 68d0 <_sk_callback_sse41+0xa24>
+ .byte 68,15,88,37,110,57,0,0 // addps 0x396e(%rip),%xmm12 # 68e0 <_sk_callback_sse41+0xa34>
+ .byte 15,40,29,119,57,0,0 // movaps 0x3977(%rip),%xmm3 # 68f0 <_sk_callback_sse41+0xa44>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,183,55,0,0 // addps 0x37b7(%rip),%xmm11 # 6740 <_sk_callback_sse41+0xa52>
- .byte 15,40,29,192,55,0,0 // movaps 0x37c0(%rip),%xmm3 # 6750 <_sk_callback_sse41+0xa62>
+ .byte 68,15,88,29,119,57,0,0 // addps 0x3977(%rip),%xmm11 # 6900 <_sk_callback_sse41+0xa54>
+ .byte 15,40,29,128,57,0,0 // movaps 0x3980(%rip),%xmm3 # 6910 <_sk_callback_sse41+0xa64>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,173,55,0,0 // addps 0x37ad(%rip),%xmm12 # 6760 <_sk_callback_sse41+0xa72>
- .byte 15,40,29,182,55,0,0 // movaps 0x37b6(%rip),%xmm3 # 6770 <_sk_callback_sse41+0xa82>
+ .byte 68,15,88,37,109,57,0,0 // addps 0x396d(%rip),%xmm12 # 6920 <_sk_callback_sse41+0xa74>
+ .byte 15,40,29,118,57,0,0 // movaps 0x3976(%rip),%xmm3 # 6930 <_sk_callback_sse41+0xa84>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,182,55,0,0 // movaps 0x37b6(%rip),%xmm10 # 6780 <_sk_callback_sse41+0xa92>
+ .byte 68,15,40,21,118,57,0,0 // movaps 0x3976(%rip),%xmm10 # 6940 <_sk_callback_sse41+0xa94>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,187,55,0,0 // movaps 0x37bb(%rip),%xmm3 # 6790 <_sk_callback_sse41+0xaa2>
+ .byte 15,40,29,123,57,0,0 // movaps 0x397b(%rip),%xmm3 # 6950 <_sk_callback_sse41+0xaa4>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,188,55,0,0 // mulps 0x37bc(%rip),%xmm3 # 67a0 <_sk_callback_sse41+0xab2>
+ .byte 15,89,29,124,57,0,0 // mulps 0x397c(%rip),%xmm3 # 6960 <_sk_callback_sse41+0xab4>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -31185,39 +31679,149 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,167,55,0,0 // minps 0x37a7(%rip),%xmm3 # 67b0 <_sk_callback_sse41+0xac2>
+ .byte 15,93,29,103,57,0,0 // minps 0x3967(%rip),%xmm3 # 6970 <_sk_callback_sse41+0xac4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_gamma_sse41
+.globl _sk_gamma_sse41
+FUNCTION(_sk_gamma_sse41)
+_sk_gamma_sse41:
+ .byte 15,41,124,36,232 // movaps %xmm7,-0x18(%rsp)
+ .byte 15,41,116,36,216 // movaps %xmm6,-0x28(%rsp)
+ .byte 15,41,108,36,200 // movaps %xmm5,-0x38(%rsp)
+ .byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
+ .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
+ .byte 15,89,5,70,57,0,0 // mulps 0x3946(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xad4>
+ .byte 68,15,40,53,78,57,0,0 // movaps 0x394e(%rip),%xmm14 # 6990 <_sk_callback_sse41+0xae4>
+ .byte 65,15,84,214 // andps %xmm14,%xmm2
+ .byte 68,15,40,37,82,57,0,0 // movaps 0x3952(%rip),%xmm12 # 69a0 <_sk_callback_sse41+0xaf4>
+ .byte 65,15,86,212 // orps %xmm12,%xmm2
+ .byte 68,15,40,21,86,57,0,0 // movaps 0x3956(%rip),%xmm10 # 69b0 <_sk_callback_sse41+0xb04>
+ .byte 65,15,88,194 // addps %xmm10,%xmm0
+ .byte 68,15,40,29,90,57,0,0 // movaps 0x395a(%rip),%xmm11 # 69c0 <_sk_callback_sse41+0xb14>
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 65,15,89,227 // mulps %xmm11,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 68,15,40,13,88,57,0,0 // movaps 0x3958(%rip),%xmm9 # 69d0 <_sk_callback_sse41+0xb24>
+ .byte 65,15,88,209 // addps %xmm9,%xmm2
+ .byte 68,15,40,45,92,57,0,0 // movaps 0x395c(%rip),%xmm13 # 69e0 <_sk_callback_sse41+0xb34>
+ .byte 65,15,40,229 // movaps %xmm13,%xmm4
+ .byte 15,94,226 // divps %xmm2,%xmm4
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 243,68,15,16,0 // movss (%rax),%xmm8
+ .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 102,15,58,8,208,1 // roundps $0x1,%xmm0,%xmm2
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,92,226 // subps %xmm2,%xmm4
+ .byte 15,40,53,63,57,0,0 // movaps 0x393f(%rip),%xmm6 # 69f0 <_sk_callback_sse41+0xb44>
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,40,61,85,57,0,0 // movaps 0x3955(%rip),%xmm7 # 6a10 <_sk_callback_sse41+0xb64>
+ .byte 15,40,239 // movaps %xmm7,%xmm5
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 15,40,212 // movaps %xmm4,%xmm2
+ .byte 15,40,37,53,57,0,0 // movaps 0x3935(%rip),%xmm4 # 6a00 <_sk_callback_sse41+0xb54>
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,92,194 // subps %xmm2,%xmm0
+ .byte 68,15,40,61,71,57,0,0 // movaps 0x3947(%rip),%xmm15 # 6a20 <_sk_callback_sse41+0xb74>
+ .byte 65,15,40,215 // movaps %xmm15,%xmm2
+ .byte 15,94,213 // divps %xmm5,%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
+ .byte 15,89,5,147,56,0,0 // mulps 0x3893(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xad4>
+ .byte 65,15,84,206 // andps %xmm14,%xmm1
+ .byte 65,15,86,204 // orps %xmm12,%xmm1
+ .byte 65,15,88,194 // addps %xmm10,%xmm0
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 65,15,89,235 // mulps %xmm11,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,88,201 // addps %xmm9,%xmm1
+ .byte 69,15,40,241 // movaps %xmm9,%xmm14
+ .byte 65,15,40,237 // movaps %xmm13,%xmm5
+ .byte 15,94,233 // divps %xmm1,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 102,15,58,8,200,1 // roundps $0x1,%xmm0,%xmm1
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 68,15,40,206 // movaps %xmm6,%xmm9
+ .byte 15,40,247 // movaps %xmm7,%xmm6
+ .byte 15,92,245 // subps %xmm5,%xmm6
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,40,207 // movaps %xmm15,%xmm1
+ .byte 15,94,206 // divps %xmm6,%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
+ .byte 15,89,5,52,56,0,0 // mulps 0x3834(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xad4>
+ .byte 15,84,29,61,56,0,0 // andps 0x383d(%rip),%xmm3 # 6990 <_sk_callback_sse41+0xae4>
+ .byte 65,15,86,220 // orps %xmm12,%xmm3
+ .byte 65,15,88,194 // addps %xmm10,%xmm0
+ .byte 68,15,89,219 // mulps %xmm3,%xmm11
+ .byte 65,15,92,195 // subps %xmm11,%xmm0
+ .byte 65,15,88,222 // addps %xmm14,%xmm3
+ .byte 68,15,94,235 // divps %xmm3,%xmm13
+ .byte 65,15,92,197 // subps %xmm13,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 102,15,58,8,216,1 // roundps $0x1,%xmm0,%xmm3
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,92,235 // subps %xmm3,%xmm5
+ .byte 65,15,88,193 // addps %xmm9,%xmm0
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,92,253 // subps %xmm5,%xmm7
+ .byte 68,15,94,255 // divps %xmm7,%xmm15
+ .byte 68,15,88,248 // addps %xmm0,%xmm15
+ .byte 15,40,5,149,56,0,0 // movaps 0x3895(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xb84>
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 68,15,89,248 // mulps %xmm0,%xmm15
+ .byte 102,15,91,194 // cvtps2dq %xmm2,%xmm0
+ .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
+ .byte 102,65,15,91,215 // cvtps2dq %xmm15,%xmm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,92,36,168 // movaps -0x58(%rsp),%xmm3
+ .byte 15,40,100,36,184 // movaps -0x48(%rsp),%xmm4
+ .byte 15,40,108,36,200 // movaps -0x38(%rsp),%xmm5
+ .byte 15,40,116,36,216 // movaps -0x28(%rsp),%xmm6
+ .byte 15,40,124,36,232 // movaps -0x18(%rsp),%xmm7
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_lab_to_xyz_sse41
.globl _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,163,55,0,0 // mulps 0x37a3(%rip),%xmm8 # 67c0 <_sk_callback_sse41+0xad2>
- .byte 68,15,40,13,171,55,0,0 // movaps 0x37ab(%rip),%xmm9 # 67d0 <_sk_callback_sse41+0xae2>
+ .byte 68,15,89,5,101,56,0,0 // mulps 0x3865(%rip),%xmm8 # 6a40 <_sk_callback_sse41+0xb94>
+ .byte 68,15,40,13,109,56,0,0 // movaps 0x386d(%rip),%xmm9 # 6a50 <_sk_callback_sse41+0xba4>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,176,55,0,0 // movaps 0x37b0(%rip),%xmm0 # 67e0 <_sk_callback_sse41+0xaf2>
+ .byte 15,40,5,114,56,0,0 // movaps 0x3872(%rip),%xmm0 # 6a60 <_sk_callback_sse41+0xbb4>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,174,55,0,0 // addps 0x37ae(%rip),%xmm8 # 67f0 <_sk_callback_sse41+0xb02>
- .byte 68,15,89,5,182,55,0,0 // mulps 0x37b6(%rip),%xmm8 # 6800 <_sk_callback_sse41+0xb12>
- .byte 15,89,13,191,55,0,0 // mulps 0x37bf(%rip),%xmm1 # 6810 <_sk_callback_sse41+0xb22>
+ .byte 68,15,88,5,112,56,0,0 // addps 0x3870(%rip),%xmm8 # 6a70 <_sk_callback_sse41+0xbc4>
+ .byte 68,15,89,5,120,56,0,0 // mulps 0x3878(%rip),%xmm8 # 6a80 <_sk_callback_sse41+0xbd4>
+ .byte 15,89,13,129,56,0,0 // mulps 0x3881(%rip),%xmm1 # 6a90 <_sk_callback_sse41+0xbe4>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,196,55,0,0 // mulps 0x37c4(%rip),%xmm2 # 6820 <_sk_callback_sse41+0xb32>
+ .byte 15,89,21,134,56,0,0 // mulps 0x3886(%rip),%xmm2 # 6aa0 <_sk_callback_sse41+0xbf4>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,184,55,0,0 // movaps 0x37b8(%rip),%xmm9 # 6830 <_sk_callback_sse41+0xb42>
+ .byte 68,15,40,13,122,56,0,0 // movaps 0x387a(%rip),%xmm9 # 6ab0 <_sk_callback_sse41+0xc04>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,184,55,0,0 // movaps 0x37b8(%rip),%xmm2 # 6840 <_sk_callback_sse41+0xb52>
+ .byte 15,40,21,122,56,0,0 // movaps 0x387a(%rip),%xmm2 # 6ac0 <_sk_callback_sse41+0xc14>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,189,55,0,0 // movaps 0x37bd(%rip),%xmm12 # 6850 <_sk_callback_sse41+0xb62>
+ .byte 68,15,40,37,127,56,0,0 // movaps 0x387f(%rip),%xmm12 # 6ad0 <_sk_callback_sse41+0xc24>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -31236,8 +31840,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,118,55,0,0 // mulps 0x3776(%rip),%xmm1 # 6860 <_sk_callback_sse41+0xb72>
- .byte 15,89,21,127,55,0,0 // mulps 0x377f(%rip),%xmm2 # 6870 <_sk_callback_sse41+0xb82>
+ .byte 15,89,13,56,56,0,0 // mulps 0x3838(%rip),%xmm1 # 6ae0 <_sk_callback_sse41+0xc34>
+ .byte 15,89,21,65,56,0,0 // mulps 0x3841(%rip),%xmm2 # 6af0 <_sk_callback_sse41+0xc44>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -31254,11 +31858,11 @@ _sk_load_a8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 313b <_sk_load_a8_sse41+0x3f>
+ .byte 117,39 // jne 32f9 <_sk_load_a8_sse41+0x3f>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,93,55,0,0 // pand 0x375d(%rip),%xmm0 # 6880 <_sk_callback_sse41+0xb92>
+ .byte 102,15,219,5,31,56,0,0 // pand 0x381f(%rip),%xmm0 # 6b00 <_sk_callback_sse41+0xc54>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,99,55,0,0 // mulps 0x3763(%rip),%xmm3 # 6890 <_sk_callback_sse41+0xba2>
+ .byte 15,89,29,37,56,0,0 // mulps 0x3825(%rip),%xmm3 # 6b10 <_sk_callback_sse41+0xc64>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -31267,12 +31871,12 @@ _sk_load_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 317d <_sk_load_a8_sse41+0x81>
+ .byte 116,53 // je 333b <_sk_load_a8_sse41+0x81>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3167 <_sk_load_a8_sse41+0x6b>
+ .byte 116,21 // je 3325 <_sk_load_a8_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 311b <_sk_load_a8_sse41+0x1f>
+ .byte 117,195 // jne 32d9 <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -31280,10 +31884,10 @@ _sk_load_a8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,158 // jmp 311b <_sk_load_a8_sse41+0x1f>
+ .byte 235,158 // jmp 32d9 <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,147 // jmp 311b <_sk_load_a8_sse41+0x1f>
+ .byte 235,147 // jmp 32d9 <_sk_load_a8_sse41+0x1f>
HIDDEN _sk_load_a8_dst_sse41
.globl _sk_load_a8_dst_sse41
@@ -31296,11 +31900,11 @@ _sk_load_a8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 31c7 <_sk_load_a8_dst_sse41+0x3f>
+ .byte 117,39 // jne 3385 <_sk_load_a8_dst_sse41+0x3f>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,241,54,0,0 // pand 0x36f1(%rip),%xmm4 # 68a0 <_sk_callback_sse41+0xbb2>
+ .byte 102,15,219,37,179,55,0,0 // pand 0x37b3(%rip),%xmm4 # 6b20 <_sk_callback_sse41+0xc74>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,247,54,0,0 // mulps 0x36f7(%rip),%xmm7 # 68b0 <_sk_callback_sse41+0xbc2>
+ .byte 15,89,61,185,55,0,0 // mulps 0x37b9(%rip),%xmm7 # 6b30 <_sk_callback_sse41+0xc84>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
@@ -31309,12 +31913,12 @@ _sk_load_a8_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3209 <_sk_load_a8_dst_sse41+0x81>
+ .byte 116,53 // je 33c7 <_sk_load_a8_dst_sse41+0x81>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 31f3 <_sk_load_a8_dst_sse41+0x6b>
+ .byte 116,21 // je 33b1 <_sk_load_a8_dst_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 31a7 <_sk_load_a8_dst_sse41+0x1f>
+ .byte 117,195 // jne 3365 <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -31322,10 +31926,10 @@ _sk_load_a8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,158 // jmp 31a7 <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,158 // jmp 3365 <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,147 // jmp 31a7 <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,147 // jmp 3365 <_sk_load_a8_dst_sse41+0x1f>
HIDDEN _sk_gather_a8_sse41
.globl _sk_gather_a8_sse41
@@ -31354,7 +31958,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,60,54,0,0 // mulps 0x363c(%rip),%xmm3 # 68c0 <_sk_callback_sse41+0xbd2>
+ .byte 15,89,29,254,54,0,0 // mulps 0x36fe(%rip),%xmm3 # 6b40 <_sk_callback_sse41+0xc94>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -31372,13 +31976,13 @@ _sk_store_a8_sse41:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,33,54,0,0 // movaps 0x3621(%rip),%xmm8 # 68d0 <_sk_callback_sse41+0xbe2>
+ .byte 68,15,40,5,227,54,0,0 // movaps 0x36e3(%rip),%xmm8 # 6b50 <_sk_callback_sse41+0xca4>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 32d5 <_sk_store_a8_sse41+0x41>
+ .byte 117,13 // jne 3493 <_sk_store_a8_sse41+0x41>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -31387,17 +31991,17 @@ _sk_store_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 3311 <_sk_store_a8_sse41+0x7d>
+ .byte 116,41 // je 34cf <_sk_store_a8_sse41+0x7d>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 32fd <_sk_store_a8_sse41+0x69>
+ .byte 116,15 // je 34bb <_sk_store_a8_sse41+0x69>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 32d1 <_sk_store_a8_sse41+0x3d>
+ .byte 117,221 // jne 348f <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,68,25,2,8 // pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- .byte 102,68,15,56,0,5,217,53,0,0 // pshufb 0x35d9(%rip),%xmm8 # 68e0 <_sk_callback_sse41+0xbf2>
+ .byte 102,68,15,56,0,5,155,54,0,0 // pshufb 0x369b(%rip),%xmm8 # 6b60 <_sk_callback_sse41+0xcb4>
.byte 102,71,15,58,21,4,25,0 // pextrw $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,192 // jmp 32d1 <_sk_store_a8_sse41+0x3d>
+ .byte 235,192 // jmp 348f <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,4,25,0 // pextrb $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,182 // jmp 32d1 <_sk_store_a8_sse41+0x3d>
+ .byte 235,182 // jmp 348f <_sk_store_a8_sse41+0x3d>
HIDDEN _sk_load_g8_sse41
.globl _sk_load_g8_sse41
@@ -31410,25 +32014,25 @@ _sk_load_g8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 335d <_sk_load_g8_sse41+0x42>
+ .byte 117,42 // jne 351b <_sk_load_g8_sse41+0x42>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,174,53,0,0 // pand 0x35ae(%rip),%xmm0 # 68f0 <_sk_callback_sse41+0xc02>
+ .byte 102,15,219,5,112,54,0,0 // pand 0x3670(%rip),%xmm0 # 6b70 <_sk_callback_sse41+0xcc4>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,180,53,0,0 // mulps 0x35b4(%rip),%xmm0 # 6900 <_sk_callback_sse41+0xc12>
+ .byte 15,89,5,118,54,0,0 // mulps 0x3676(%rip),%xmm0 # 6b80 <_sk_callback_sse41+0xcd4>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,187,53,0,0 // movaps 0x35bb(%rip),%xmm3 # 6910 <_sk_callback_sse41+0xc22>
+ .byte 15,40,29,125,54,0,0 // movaps 0x367d(%rip),%xmm3 # 6b90 <_sk_callback_sse41+0xce4>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 339f <_sk_load_g8_sse41+0x84>
+ .byte 116,53 // je 355d <_sk_load_g8_sse41+0x84>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3389 <_sk_load_g8_sse41+0x6e>
+ .byte 116,21 // je 3547 <_sk_load_g8_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 333a <_sk_load_g8_sse41+0x1f>
+ .byte 117,192 // jne 34f8 <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -31436,10 +32040,10 @@ _sk_load_g8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,155 // jmp 333a <_sk_load_g8_sse41+0x1f>
+ .byte 235,155 // jmp 34f8 <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,144 // jmp 333a <_sk_load_g8_sse41+0x1f>
+ .byte 235,144 // jmp 34f8 <_sk_load_g8_sse41+0x1f>
HIDDEN _sk_load_g8_dst_sse41
.globl _sk_load_g8_dst_sse41
@@ -31452,25 +32056,25 @@ _sk_load_g8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 33ec <_sk_load_g8_dst_sse41+0x42>
+ .byte 117,42 // jne 35aa <_sk_load_g8_dst_sse41+0x42>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,79,53,0,0 // pand 0x354f(%rip),%xmm4 # 6920 <_sk_callback_sse41+0xc32>
+ .byte 102,15,219,37,17,54,0,0 // pand 0x3611(%rip),%xmm4 # 6ba0 <_sk_callback_sse41+0xcf4>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,85,53,0,0 // mulps 0x3555(%rip),%xmm4 # 6930 <_sk_callback_sse41+0xc42>
+ .byte 15,89,37,23,54,0,0 // mulps 0x3617(%rip),%xmm4 # 6bb0 <_sk_callback_sse41+0xd04>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,92,53,0,0 // movaps 0x355c(%rip),%xmm7 # 6940 <_sk_callback_sse41+0xc52>
+ .byte 15,40,61,30,54,0,0 // movaps 0x361e(%rip),%xmm7 # 6bc0 <_sk_callback_sse41+0xd14>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 342e <_sk_load_g8_dst_sse41+0x84>
+ .byte 116,53 // je 35ec <_sk_load_g8_dst_sse41+0x84>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3418 <_sk_load_g8_dst_sse41+0x6e>
+ .byte 116,21 // je 35d6 <_sk_load_g8_dst_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 33c9 <_sk_load_g8_dst_sse41+0x1f>
+ .byte 117,192 // jne 3587 <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -31478,10 +32082,10 @@ _sk_load_g8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,155 // jmp 33c9 <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,155 // jmp 3587 <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,144 // jmp 33c9 <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,144 // jmp 3587 <_sk_load_g8_dst_sse41+0x1f>
HIDDEN _sk_gather_g8_sse41
.globl _sk_gather_g8_sse41
@@ -31510,9 +32114,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,167,52,0,0 // mulps 0x34a7(%rip),%xmm0 # 6950 <_sk_callback_sse41+0xc62>
+ .byte 15,89,5,105,53,0,0 // mulps 0x3569(%rip),%xmm0 # 6bd0 <_sk_callback_sse41+0xd24>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,174,52,0,0 // movaps 0x34ae(%rip),%xmm3 # 6960 <_sk_callback_sse41+0xc72>
+ .byte 15,40,29,112,53,0,0 // movaps 0x3570(%rip),%xmm3 # 6be0 <_sk_callback_sse41+0xd34>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -31530,41 +32134,41 @@ _sk_load_565_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 3526 <_sk_load_565_sse41+0x6b>
+ .byte 117,80 // jne 36e4 <_sk_load_565_sse41+0x6b>
.byte 102,67,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm2
- .byte 102,15,111,5,139,52,0,0 // movdqa 0x348b(%rip),%xmm0 # 6970 <_sk_callback_sse41+0xc82>
+ .byte 102,15,111,5,77,53,0,0 // movdqa 0x354d(%rip),%xmm0 # 6bf0 <_sk_callback_sse41+0xd44>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,141,52,0,0 // mulps 0x348d(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xc92>
- .byte 102,15,111,13,149,52,0,0 // movdqa 0x3495(%rip),%xmm1 # 6990 <_sk_callback_sse41+0xca2>
+ .byte 15,89,5,79,53,0,0 // mulps 0x354f(%rip),%xmm0 # 6c00 <_sk_callback_sse41+0xd54>
+ .byte 102,15,111,13,87,53,0,0 // movdqa 0x3557(%rip),%xmm1 # 6c10 <_sk_callback_sse41+0xd64>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,151,52,0,0 // mulps 0x3497(%rip),%xmm1 # 69a0 <_sk_callback_sse41+0xcb2>
- .byte 102,15,219,21,159,52,0,0 // pand 0x349f(%rip),%xmm2 # 69b0 <_sk_callback_sse41+0xcc2>
+ .byte 15,89,13,89,53,0,0 // mulps 0x3559(%rip),%xmm1 # 6c20 <_sk_callback_sse41+0xd74>
+ .byte 102,15,219,21,97,53,0,0 // pand 0x3561(%rip),%xmm2 # 6c30 <_sk_callback_sse41+0xd84>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,165,52,0,0 // mulps 0x34a5(%rip),%xmm2 # 69c0 <_sk_callback_sse41+0xcd2>
+ .byte 15,89,21,103,53,0,0 // mulps 0x3567(%rip),%xmm2 # 6c40 <_sk_callback_sse41+0xd94>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,172,52,0,0 // movaps 0x34ac(%rip),%xmm3 # 69d0 <_sk_callback_sse41+0xce2>
+ .byte 15,40,29,110,53,0,0 // movaps 0x356e(%rip),%xmm3 # 6c50 <_sk_callback_sse41+0xda4>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3568 <_sk_load_565_sse41+0xad>
+ .byte 116,53 // je 3726 <_sk_load_565_sse41+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3552 <_sk_load_565_sse41+0x97>
+ .byte 116,21 // je 3710 <_sk_load_565_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 34dd <_sk_load_565_sse41+0x22>
+ .byte 117,154 // jne 369b <_sk_load_565_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm2
- .byte 233,117,255,255,255 // jmpq 34dd <_sk_load_565_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 369b <_sk_load_565_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,103,255,255,255 // jmpq 34dd <_sk_load_565_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 369b <_sk_load_565_sse41+0x22>
HIDDEN _sk_load_565_dst_sse41
.globl _sk_load_565_dst_sse41
@@ -31578,41 +32182,41 @@ _sk_load_565_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 35e1 <_sk_load_565_dst_sse41+0x6b>
+ .byte 117,80 // jne 379f <_sk_load_565_dst_sse41+0x6b>
.byte 102,67,15,56,51,52,89 // pmovzxwd (%r9,%r11,2),%xmm6
- .byte 102,15,111,37,64,52,0,0 // movdqa 0x3440(%rip),%xmm4 # 69e0 <_sk_callback_sse41+0xcf2>
+ .byte 102,15,111,37,2,53,0,0 // movdqa 0x3502(%rip),%xmm4 # 6c60 <_sk_callback_sse41+0xdb4>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,66,52,0,0 // mulps 0x3442(%rip),%xmm4 # 69f0 <_sk_callback_sse41+0xd02>
- .byte 102,15,111,45,74,52,0,0 // movdqa 0x344a(%rip),%xmm5 # 6a00 <_sk_callback_sse41+0xd12>
+ .byte 15,89,37,4,53,0,0 // mulps 0x3504(%rip),%xmm4 # 6c70 <_sk_callback_sse41+0xdc4>
+ .byte 102,15,111,45,12,53,0,0 // movdqa 0x350c(%rip),%xmm5 # 6c80 <_sk_callback_sse41+0xdd4>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,76,52,0,0 // mulps 0x344c(%rip),%xmm5 # 6a10 <_sk_callback_sse41+0xd22>
- .byte 102,15,219,53,84,52,0,0 // pand 0x3454(%rip),%xmm6 # 6a20 <_sk_callback_sse41+0xd32>
+ .byte 15,89,45,14,53,0,0 // mulps 0x350e(%rip),%xmm5 # 6c90 <_sk_callback_sse41+0xde4>
+ .byte 102,15,219,53,22,53,0,0 // pand 0x3516(%rip),%xmm6 # 6ca0 <_sk_callback_sse41+0xdf4>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,90,52,0,0 // mulps 0x345a(%rip),%xmm6 # 6a30 <_sk_callback_sse41+0xd42>
+ .byte 15,89,53,28,53,0,0 // mulps 0x351c(%rip),%xmm6 # 6cb0 <_sk_callback_sse41+0xe04>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,97,52,0,0 // movaps 0x3461(%rip),%xmm7 # 6a40 <_sk_callback_sse41+0xd52>
+ .byte 15,40,61,35,53,0,0 // movaps 0x3523(%rip),%xmm7 # 6cc0 <_sk_callback_sse41+0xe14>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3623 <_sk_load_565_dst_sse41+0xad>
+ .byte 116,53 // je 37e1 <_sk_load_565_dst_sse41+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 360d <_sk_load_565_dst_sse41+0x97>
+ .byte 116,21 // je 37cb <_sk_load_565_dst_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 3598 <_sk_load_565_dst_sse41+0x22>
+ .byte 117,154 // jne 3756 <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,117,255,255,255 // jmpq 3598 <_sk_load_565_dst_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 3756 <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,103,255,255,255 // jmpq 3598 <_sk_load_565_dst_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 3756 <_sk_load_565_dst_sse41+0x22>
HIDDEN _sk_gather_565_sse41
.globl _sk_gather_565_sse41
@@ -31640,19 +32244,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,181,51,0,0 // movdqa 0x33b5(%rip),%xmm0 # 6a50 <_sk_callback_sse41+0xd62>
+ .byte 102,15,111,5,119,52,0,0 // movdqa 0x3477(%rip),%xmm0 # 6cd0 <_sk_callback_sse41+0xe24>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,183,51,0,0 // mulps 0x33b7(%rip),%xmm0 # 6a60 <_sk_callback_sse41+0xd72>
- .byte 102,15,111,13,191,51,0,0 // movdqa 0x33bf(%rip),%xmm1 # 6a70 <_sk_callback_sse41+0xd82>
+ .byte 15,89,5,121,52,0,0 // mulps 0x3479(%rip),%xmm0 # 6ce0 <_sk_callback_sse41+0xe34>
+ .byte 102,15,111,13,129,52,0,0 // movdqa 0x3481(%rip),%xmm1 # 6cf0 <_sk_callback_sse41+0xe44>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,193,51,0,0 // mulps 0x33c1(%rip),%xmm1 # 6a80 <_sk_callback_sse41+0xd92>
- .byte 102,15,219,21,201,51,0,0 // pand 0x33c9(%rip),%xmm2 # 6a90 <_sk_callback_sse41+0xda2>
+ .byte 15,89,13,131,52,0,0 // mulps 0x3483(%rip),%xmm1 # 6d00 <_sk_callback_sse41+0xe54>
+ .byte 102,15,219,21,139,52,0,0 // pand 0x348b(%rip),%xmm2 # 6d10 <_sk_callback_sse41+0xe64>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,207,51,0,0 // mulps 0x33cf(%rip),%xmm2 # 6aa0 <_sk_callback_sse41+0xdb2>
+ .byte 15,89,21,145,52,0,0 // mulps 0x3491(%rip),%xmm2 # 6d20 <_sk_callback_sse41+0xe74>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,214,51,0,0 // movaps 0x33d6(%rip),%xmm3 # 6ab0 <_sk_callback_sse41+0xdc2>
+ .byte 15,40,29,152,52,0,0 // movaps 0x3498(%rip),%xmm3 # 6d30 <_sk_callback_sse41+0xe84>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -31667,12 +32271,12 @@ _sk_store_565_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,197,51,0,0 // movaps 0x33c5(%rip),%xmm8 # 6ac0 <_sk_callback_sse41+0xdd2>
+ .byte 68,15,40,5,135,52,0,0 // movaps 0x3487(%rip),%xmm8 # 6d40 <_sk_callback_sse41+0xe94>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,186,51,0,0 // movaps 0x33ba(%rip),%xmm10 # 6ad0 <_sk_callback_sse41+0xde2>
+ .byte 68,15,40,21,124,52,0,0 // movaps 0x347c(%rip),%xmm10 # 6d50 <_sk_callback_sse41+0xea4>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -31682,7 +32286,7 @@ _sk_store_565_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 374d <_sk_store_565_sse41+0x70>
+ .byte 117,10 // jne 390b <_sk_store_565_sse41+0x70>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -31690,17 +32294,17 @@ _sk_store_565_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 3783 <_sk_store_565_sse41+0xa6>
+ .byte 116,35 // je 3941 <_sk_store_565_sse41+0xa6>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 3775 <_sk_store_565_sse41+0x98>
+ .byte 116,15 // je 3933 <_sk_store_565_sse41+0x98>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 3749 <_sk_store_565_sse41+0x6c>
+ .byte 117,221 // jne 3907 <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 3749 <_sk_store_565_sse41+0x6c>
+ .byte 235,198 // jmp 3907 <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 3749 <_sk_store_565_sse41+0x6c>
+ .byte 235,188 // jmp 3907 <_sk_store_565_sse41+0x6c>
HIDDEN _sk_load_4444_sse41
.globl _sk_load_4444_sse41
@@ -31714,44 +32318,44 @@ _sk_load_4444_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 3807 <_sk_load_4444_sse41+0x7a>
+ .byte 117,95 // jne 39c5 <_sk_load_4444_sse41+0x7a>
.byte 102,67,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm3
- .byte 102,15,111,5,41,51,0,0 // movdqa 0x3329(%rip),%xmm0 # 6ae0 <_sk_callback_sse41+0xdf2>
+ .byte 102,15,111,5,235,51,0,0 // movdqa 0x33eb(%rip),%xmm0 # 6d60 <_sk_callback_sse41+0xeb4>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,43,51,0,0 // mulps 0x332b(%rip),%xmm0 # 6af0 <_sk_callback_sse41+0xe02>
- .byte 102,15,111,13,51,51,0,0 // movdqa 0x3333(%rip),%xmm1 # 6b00 <_sk_callback_sse41+0xe12>
+ .byte 15,89,5,237,51,0,0 // mulps 0x33ed(%rip),%xmm0 # 6d70 <_sk_callback_sse41+0xec4>
+ .byte 102,15,111,13,245,51,0,0 // movdqa 0x33f5(%rip),%xmm1 # 6d80 <_sk_callback_sse41+0xed4>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,53,51,0,0 // mulps 0x3335(%rip),%xmm1 # 6b10 <_sk_callback_sse41+0xe22>
- .byte 102,15,111,21,61,51,0,0 // movdqa 0x333d(%rip),%xmm2 # 6b20 <_sk_callback_sse41+0xe32>
+ .byte 15,89,13,247,51,0,0 // mulps 0x33f7(%rip),%xmm1 # 6d90 <_sk_callback_sse41+0xee4>
+ .byte 102,15,111,21,255,51,0,0 // movdqa 0x33ff(%rip),%xmm2 # 6da0 <_sk_callback_sse41+0xef4>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,63,51,0,0 // mulps 0x333f(%rip),%xmm2 # 6b30 <_sk_callback_sse41+0xe42>
- .byte 102,15,219,29,71,51,0,0 // pand 0x3347(%rip),%xmm3 # 6b40 <_sk_callback_sse41+0xe52>
+ .byte 15,89,21,1,52,0,0 // mulps 0x3401(%rip),%xmm2 # 6db0 <_sk_callback_sse41+0xf04>
+ .byte 102,15,219,29,9,52,0,0 // pand 0x3409(%rip),%xmm3 # 6dc0 <_sk_callback_sse41+0xf14>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,77,51,0,0 // mulps 0x334d(%rip),%xmm3 # 6b50 <_sk_callback_sse41+0xe62>
+ .byte 15,89,29,15,52,0,0 // mulps 0x340f(%rip),%xmm3 # 6dd0 <_sk_callback_sse41+0xf24>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3849 <_sk_load_4444_sse41+0xbc>
+ .byte 116,53 // je 3a07 <_sk_load_4444_sse41+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3833 <_sk_load_4444_sse41+0xa6>
+ .byte 116,21 // je 39f1 <_sk_load_4444_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 37af <_sk_load_4444_sse41+0x22>
+ .byte 117,139 // jne 396d <_sk_load_4444_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,102,255,255,255 // jmpq 37af <_sk_load_4444_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 396d <_sk_load_4444_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,88,255,255,255 // jmpq 37af <_sk_load_4444_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 396d <_sk_load_4444_sse41+0x22>
HIDDEN _sk_load_4444_dst_sse41
.globl _sk_load_4444_dst_sse41
@@ -31765,44 +32369,44 @@ _sk_load_4444_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 38d1 <_sk_load_4444_dst_sse41+0x7a>
+ .byte 117,95 // jne 3a8f <_sk_load_4444_dst_sse41+0x7a>
.byte 102,67,15,56,51,60,89 // pmovzxwd (%r9,%r11,2),%xmm7
- .byte 102,15,111,37,223,50,0,0 // movdqa 0x32df(%rip),%xmm4 # 6b60 <_sk_callback_sse41+0xe72>
+ .byte 102,15,111,37,161,51,0,0 // movdqa 0x33a1(%rip),%xmm4 # 6de0 <_sk_callback_sse41+0xf34>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,225,50,0,0 // mulps 0x32e1(%rip),%xmm4 # 6b70 <_sk_callback_sse41+0xe82>
- .byte 102,15,111,45,233,50,0,0 // movdqa 0x32e9(%rip),%xmm5 # 6b80 <_sk_callback_sse41+0xe92>
+ .byte 15,89,37,163,51,0,0 // mulps 0x33a3(%rip),%xmm4 # 6df0 <_sk_callback_sse41+0xf44>
+ .byte 102,15,111,45,171,51,0,0 // movdqa 0x33ab(%rip),%xmm5 # 6e00 <_sk_callback_sse41+0xf54>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,235,50,0,0 // mulps 0x32eb(%rip),%xmm5 # 6b90 <_sk_callback_sse41+0xea2>
- .byte 102,15,111,53,243,50,0,0 // movdqa 0x32f3(%rip),%xmm6 # 6ba0 <_sk_callback_sse41+0xeb2>
+ .byte 15,89,45,173,51,0,0 // mulps 0x33ad(%rip),%xmm5 # 6e10 <_sk_callback_sse41+0xf64>
+ .byte 102,15,111,53,181,51,0,0 // movdqa 0x33b5(%rip),%xmm6 # 6e20 <_sk_callback_sse41+0xf74>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,245,50,0,0 // mulps 0x32f5(%rip),%xmm6 # 6bb0 <_sk_callback_sse41+0xec2>
- .byte 102,15,219,61,253,50,0,0 // pand 0x32fd(%rip),%xmm7 # 6bc0 <_sk_callback_sse41+0xed2>
+ .byte 15,89,53,183,51,0,0 // mulps 0x33b7(%rip),%xmm6 # 6e30 <_sk_callback_sse41+0xf84>
+ .byte 102,15,219,61,191,51,0,0 // pand 0x33bf(%rip),%xmm7 # 6e40 <_sk_callback_sse41+0xf94>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,3,51,0,0 // mulps 0x3303(%rip),%xmm7 # 6bd0 <_sk_callback_sse41+0xee2>
+ .byte 15,89,61,197,51,0,0 // mulps 0x33c5(%rip),%xmm7 # 6e50 <_sk_callback_sse41+0xfa4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3913 <_sk_load_4444_dst_sse41+0xbc>
+ .byte 116,53 // je 3ad1 <_sk_load_4444_dst_sse41+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 38fd <_sk_load_4444_dst_sse41+0xa6>
+ .byte 116,21 // je 3abb <_sk_load_4444_dst_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 3879 <_sk_load_4444_dst_sse41+0x22>
+ .byte 117,139 // jne 3a37 <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,102,255,255,255 // jmpq 3879 <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 3a37 <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,88,255,255,255 // jmpq 3879 <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 3a37 <_sk_load_4444_dst_sse41+0x22>
HIDDEN _sk_gather_4444_sse41
.globl _sk_gather_4444_sse41
@@ -31830,21 +32434,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,85,50,0,0 // movdqa 0x3255(%rip),%xmm0 # 6be0 <_sk_callback_sse41+0xef2>
+ .byte 102,15,111,5,23,51,0,0 // movdqa 0x3317(%rip),%xmm0 # 6e60 <_sk_callback_sse41+0xfb4>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,87,50,0,0 // mulps 0x3257(%rip),%xmm0 # 6bf0 <_sk_callback_sse41+0xf02>
- .byte 102,15,111,13,95,50,0,0 // movdqa 0x325f(%rip),%xmm1 # 6c00 <_sk_callback_sse41+0xf12>
+ .byte 15,89,5,25,51,0,0 // mulps 0x3319(%rip),%xmm0 # 6e70 <_sk_callback_sse41+0xfc4>
+ .byte 102,15,111,13,33,51,0,0 // movdqa 0x3321(%rip),%xmm1 # 6e80 <_sk_callback_sse41+0xfd4>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,97,50,0,0 // mulps 0x3261(%rip),%xmm1 # 6c10 <_sk_callback_sse41+0xf22>
- .byte 102,15,111,21,105,50,0,0 // movdqa 0x3269(%rip),%xmm2 # 6c20 <_sk_callback_sse41+0xf32>
+ .byte 15,89,13,35,51,0,0 // mulps 0x3323(%rip),%xmm1 # 6e90 <_sk_callback_sse41+0xfe4>
+ .byte 102,15,111,21,43,51,0,0 // movdqa 0x332b(%rip),%xmm2 # 6ea0 <_sk_callback_sse41+0xff4>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,107,50,0,0 // mulps 0x326b(%rip),%xmm2 # 6c30 <_sk_callback_sse41+0xf42>
- .byte 102,15,219,29,115,50,0,0 // pand 0x3273(%rip),%xmm3 # 6c40 <_sk_callback_sse41+0xf52>
+ .byte 15,89,21,45,51,0,0 // mulps 0x332d(%rip),%xmm2 # 6eb0 <_sk_callback_sse41+0x1004>
+ .byte 102,15,219,29,53,51,0,0 // pand 0x3335(%rip),%xmm3 # 6ec0 <_sk_callback_sse41+0x1014>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,121,50,0,0 // mulps 0x3279(%rip),%xmm3 # 6c50 <_sk_callback_sse41+0xf62>
+ .byte 15,89,29,59,51,0,0 // mulps 0x333b(%rip),%xmm3 # 6ed0 <_sk_callback_sse41+0x1024>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -31860,7 +32464,7 @@ _sk_store_4444_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,102,50,0,0 // movaps 0x3266(%rip),%xmm8 # 6c60 <_sk_callback_sse41+0xf72>
+ .byte 68,15,40,5,40,51,0,0 // movaps 0x3328(%rip),%xmm8 # 6ee0 <_sk_callback_sse41+0x1034>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -31880,7 +32484,7 @@ _sk_store_4444_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3a60 <_sk_store_4444_sse41+0x84>
+ .byte 117,10 // jne 3c1e <_sk_store_4444_sse41+0x84>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -31888,17 +32492,17 @@ _sk_store_4444_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 3a96 <_sk_store_4444_sse41+0xba>
+ .byte 116,35 // je 3c54 <_sk_store_4444_sse41+0xba>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 3a88 <_sk_store_4444_sse41+0xac>
+ .byte 116,15 // je 3c46 <_sk_store_4444_sse41+0xac>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 3a5c <_sk_store_4444_sse41+0x80>
+ .byte 117,221 // jne 3c1a <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 3a5c <_sk_store_4444_sse41+0x80>
+ .byte 235,198 // jmp 3c1a <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 3a5c <_sk_store_4444_sse41+0x80>
+ .byte 235,188 // jmp 3c1a <_sk_store_4444_sse41+0x80>
HIDDEN _sk_load_8888_sse41
.globl _sk_load_8888_sse41
@@ -31912,19 +32516,19 @@ _sk_load_8888_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 3b15 <_sk_load_8888_sse41+0x75>
+ .byte 117,89 // jne 3cd3 <_sk_load_8888_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,166,49,0,0 // movdqa 0x31a6(%rip),%xmm0 # 6c70 <_sk_callback_sse41+0xf82>
+ .byte 102,15,111,5,104,50,0,0 // movdqa 0x3268(%rip),%xmm0 # 6ef0 <_sk_callback_sse41+0x1044>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,167,49,0,0 // movaps 0x31a7(%rip),%xmm8 # 6c80 <_sk_callback_sse41+0xf92>
+ .byte 68,15,40,5,105,50,0,0 // movaps 0x3269(%rip),%xmm8 # 6f00 <_sk_callback_sse41+0x1054>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,166,49,0,0 // pshufb 0x31a6(%rip),%xmm1 # 6c90 <_sk_callback_sse41+0xfa2>
+ .byte 102,15,56,0,13,104,50,0,0 // pshufb 0x3268(%rip),%xmm1 # 6f10 <_sk_callback_sse41+0x1064>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,162,49,0,0 // pshufb 0x31a2(%rip),%xmm2 # 6ca0 <_sk_callback_sse41+0xfb2>
+ .byte 102,15,56,0,21,100,50,0,0 // pshufb 0x3264(%rip),%xmm2 # 6f20 <_sk_callback_sse41+0x1074>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31935,19 +32539,19 @@ _sk_load_8888_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 3b4f <_sk_load_8888_sse41+0xaf>
+ .byte 116,45 // je 3d0d <_sk_load_8888_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3b3e <_sk_load_8888_sse41+0x9e>
+ .byte 116,18 // je 3cfc <_sk_load_8888_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 3ac2 <_sk_load_8888_sse41+0x22>
+ .byte 117,144 // jne 3c80 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 3ac2 <_sk_load_8888_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 3c80 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 3ac2 <_sk_load_8888_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 3c80 <_sk_load_8888_sse41+0x22>
HIDDEN _sk_load_8888_dst_sse41
.globl _sk_load_8888_dst_sse41
@@ -31961,19 +32565,19 @@ _sk_load_8888_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 3bcf <_sk_load_8888_dst_sse41+0x75>
+ .byte 117,89 // jne 3d8d <_sk_load_8888_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,44,49,0,0 // movdqa 0x312c(%rip),%xmm4 # 6cb0 <_sk_callback_sse41+0xfc2>
+ .byte 102,15,111,37,238,49,0,0 // movdqa 0x31ee(%rip),%xmm4 # 6f30 <_sk_callback_sse41+0x1084>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,45,49,0,0 // movaps 0x312d(%rip),%xmm8 # 6cc0 <_sk_callback_sse41+0xfd2>
+ .byte 68,15,40,5,239,49,0,0 // movaps 0x31ef(%rip),%xmm8 # 6f40 <_sk_callback_sse41+0x1094>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,44,49,0,0 // pshufb 0x312c(%rip),%xmm5 # 6cd0 <_sk_callback_sse41+0xfe2>
+ .byte 102,15,56,0,45,238,49,0,0 // pshufb 0x31ee(%rip),%xmm5 # 6f50 <_sk_callback_sse41+0x10a4>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,40,49,0,0 // pshufb 0x3128(%rip),%xmm6 # 6ce0 <_sk_callback_sse41+0xff2>
+ .byte 102,15,56,0,53,234,49,0,0 // pshufb 0x31ea(%rip),%xmm6 # 6f60 <_sk_callback_sse41+0x10b4>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -31984,19 +32588,19 @@ _sk_load_8888_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 3c09 <_sk_load_8888_dst_sse41+0xaf>
+ .byte 116,45 // je 3dc7 <_sk_load_8888_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3bf8 <_sk_load_8888_dst_sse41+0x9e>
+ .byte 116,18 // je 3db6 <_sk_load_8888_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 3b7c <_sk_load_8888_dst_sse41+0x22>
+ .byte 117,144 // jne 3d3a <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 3b7c <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 3d3a <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 3b7c <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 3d3a <_sk_load_8888_dst_sse41+0x22>
HIDDEN _sk_gather_8888_sse41
.globl _sk_gather_8888_sse41
@@ -32021,17 +32625,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,123,48,0,0 // movdqa 0x307b(%rip),%xmm0 # 6cf0 <_sk_callback_sse41+0x1002>
+ .byte 102,15,111,5,61,49,0,0 // movdqa 0x313d(%rip),%xmm0 # 6f70 <_sk_callback_sse41+0x10c4>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,124,48,0,0 // movaps 0x307c(%rip),%xmm8 # 6d00 <_sk_callback_sse41+0x1012>
+ .byte 68,15,40,5,62,49,0,0 // movaps 0x313e(%rip),%xmm8 # 6f80 <_sk_callback_sse41+0x10d4>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,123,48,0,0 // pshufb 0x307b(%rip),%xmm1 # 6d10 <_sk_callback_sse41+0x1022>
+ .byte 102,15,56,0,13,61,49,0,0 // pshufb 0x313d(%rip),%xmm1 # 6f90 <_sk_callback_sse41+0x10e4>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,119,48,0,0 // pshufb 0x3077(%rip),%xmm2 # 6d20 <_sk_callback_sse41+0x1032>
+ .byte 102,15,56,0,21,57,49,0,0 // pshufb 0x3139(%rip),%xmm2 # 6fa0 <_sk_callback_sse41+0x10f4>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32052,7 +32656,7 @@ _sk_store_8888_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,80,48,0,0 // movaps 0x3050(%rip),%xmm8 # 6d30 <_sk_callback_sse41+0x1042>
+ .byte 68,15,40,5,18,49,0,0 // movaps 0x3112(%rip),%xmm8 # 6fb0 <_sk_callback_sse41+0x1104>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -32071,23 +32675,23 @@ _sk_store_8888_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3d40 <_sk_store_8888_sse41+0x7f>
+ .byte 117,10 // jne 3efe <_sk_store_8888_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 3d6a <_sk_store_8888_sse41+0xa9>
+ .byte 116,29 // je 3f28 <_sk_store_8888_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 3d62 <_sk_store_8888_sse41+0xa1>
+ .byte 116,15 // je 3f20 <_sk_store_8888_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 3d3c <_sk_store_8888_sse41+0x7b>
+ .byte 117,227 // jne 3efa <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 3d3c <_sk_store_8888_sse41+0x7b>
+ .byte 235,210 // jmp 3efa <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 3d3c <_sk_store_8888_sse41+0x7b>
+ .byte 235,202 // jmp 3efa <_sk_store_8888_sse41+0x7b>
HIDDEN _sk_load_bgra_sse41
.globl _sk_load_bgra_sse41
@@ -32101,19 +32705,19 @@ _sk_load_bgra_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 3de7 <_sk_load_bgra_sse41+0x75>
+ .byte 117,89 // jne 3fa5 <_sk_load_bgra_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,164,47,0,0 // movdqa 0x2fa4(%rip),%xmm0 # 6d40 <_sk_callback_sse41+0x1052>
+ .byte 102,15,111,5,102,48,0,0 // movdqa 0x3066(%rip),%xmm0 # 6fc0 <_sk_callback_sse41+0x1114>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,165,47,0,0 // movaps 0x2fa5(%rip),%xmm8 # 6d50 <_sk_callback_sse41+0x1062>
+ .byte 68,15,40,5,103,48,0,0 // movaps 0x3067(%rip),%xmm8 # 6fd0 <_sk_callback_sse41+0x1124>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,164,47,0,0 // pshufb 0x2fa4(%rip),%xmm0 # 6d60 <_sk_callback_sse41+0x1072>
+ .byte 102,15,56,0,5,102,48,0,0 // pshufb 0x3066(%rip),%xmm0 # 6fe0 <_sk_callback_sse41+0x1134>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,160,47,0,0 // pshufb 0x2fa0(%rip),%xmm0 # 6d70 <_sk_callback_sse41+0x1082>
+ .byte 102,15,56,0,5,98,48,0,0 // pshufb 0x3062(%rip),%xmm0 # 6ff0 <_sk_callback_sse41+0x1144>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32124,19 +32728,19 @@ _sk_load_bgra_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 3e21 <_sk_load_bgra_sse41+0xaf>
+ .byte 116,45 // je 3fdf <_sk_load_bgra_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3e10 <_sk_load_bgra_sse41+0x9e>
+ .byte 116,18 // je 3fce <_sk_load_bgra_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 3d94 <_sk_load_bgra_sse41+0x22>
+ .byte 117,144 // jne 3f52 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 3d94 <_sk_load_bgra_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 3f52 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 3d94 <_sk_load_bgra_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 3f52 <_sk_load_bgra_sse41+0x22>
HIDDEN _sk_load_bgra_dst_sse41
.globl _sk_load_bgra_dst_sse41
@@ -32150,19 +32754,19 @@ _sk_load_bgra_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 3ea1 <_sk_load_bgra_dst_sse41+0x75>
+ .byte 117,89 // jne 405f <_sk_load_bgra_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,42,47,0,0 // movdqa 0x2f2a(%rip),%xmm4 # 6d80 <_sk_callback_sse41+0x1092>
+ .byte 102,15,111,37,236,47,0,0 // movdqa 0x2fec(%rip),%xmm4 # 7000 <_sk_callback_sse41+0x1154>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,244 // cvtdq2ps %xmm4,%xmm6
- .byte 68,15,40,5,43,47,0,0 // movaps 0x2f2b(%rip),%xmm8 # 6d90 <_sk_callback_sse41+0x10a2>
+ .byte 68,15,40,5,237,47,0,0 // movaps 0x2fed(%rip),%xmm8 # 7010 <_sk_callback_sse41+0x1164>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,42,47,0,0 // pshufb 0x2f2a(%rip),%xmm4 # 6da0 <_sk_callback_sse41+0x10b2>
+ .byte 102,15,56,0,37,236,47,0,0 // pshufb 0x2fec(%rip),%xmm4 # 7020 <_sk_callback_sse41+0x1174>
.byte 15,91,236 // cvtdq2ps %xmm4,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,38,47,0,0 // pshufb 0x2f26(%rip),%xmm4 # 6db0 <_sk_callback_sse41+0x10c2>
+ .byte 102,15,56,0,37,232,47,0,0 // pshufb 0x2fe8(%rip),%xmm4 # 7030 <_sk_callback_sse41+0x1184>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -32173,19 +32777,19 @@ _sk_load_bgra_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 3edb <_sk_load_bgra_dst_sse41+0xaf>
+ .byte 116,45 // je 4099 <_sk_load_bgra_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3eca <_sk_load_bgra_dst_sse41+0x9e>
+ .byte 116,18 // je 4088 <_sk_load_bgra_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 3e4e <_sk_load_bgra_dst_sse41+0x22>
+ .byte 117,144 // jne 400c <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 3e4e <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 400c <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 3e4e <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 400c <_sk_load_bgra_dst_sse41+0x22>
HIDDEN _sk_gather_bgra_sse41
.globl _sk_gather_bgra_sse41
@@ -32210,17 +32814,17 @@ _sk_gather_bgra_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,121,46,0,0 // movdqa 0x2e79(%rip),%xmm0 # 6dc0 <_sk_callback_sse41+0x10d2>
+ .byte 102,15,111,5,59,47,0,0 // movdqa 0x2f3b(%rip),%xmm0 # 7040 <_sk_callback_sse41+0x1194>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,122,46,0,0 // movaps 0x2e7a(%rip),%xmm8 # 6dd0 <_sk_callback_sse41+0x10e2>
+ .byte 68,15,40,5,60,47,0,0 // movaps 0x2f3c(%rip),%xmm8 # 7050 <_sk_callback_sse41+0x11a4>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,121,46,0,0 // pshufb 0x2e79(%rip),%xmm0 # 6de0 <_sk_callback_sse41+0x10f2>
+ .byte 102,15,56,0,5,59,47,0,0 // pshufb 0x2f3b(%rip),%xmm0 # 7060 <_sk_callback_sse41+0x11b4>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,117,46,0,0 // pshufb 0x2e75(%rip),%xmm0 # 6df0 <_sk_callback_sse41+0x1102>
+ .byte 102,15,56,0,5,55,47,0,0 // pshufb 0x2f37(%rip),%xmm0 # 7070 <_sk_callback_sse41+0x11c4>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32241,7 +32845,7 @@ _sk_store_bgra_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,78,46,0,0 // movaps 0x2e4e(%rip),%xmm8 # 6e00 <_sk_callback_sse41+0x1112>
+ .byte 68,15,40,5,16,47,0,0 // movaps 0x2f10(%rip),%xmm8 # 7080 <_sk_callback_sse41+0x11d4>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -32260,23 +32864,23 @@ _sk_store_bgra_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 4012 <_sk_store_bgra_sse41+0x7f>
+ .byte 117,10 // jne 41d0 <_sk_store_bgra_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 403c <_sk_store_bgra_sse41+0xa9>
+ .byte 116,29 // je 41fa <_sk_store_bgra_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 4034 <_sk_store_bgra_sse41+0xa1>
+ .byte 116,15 // je 41f2 <_sk_store_bgra_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 400e <_sk_store_bgra_sse41+0x7b>
+ .byte 117,227 // jne 41cc <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 400e <_sk_store_bgra_sse41+0x7b>
+ .byte 235,210 // jmp 41cc <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 400e <_sk_store_bgra_sse41+0x7b>
+ .byte 235,202 // jmp 41cc <_sk_store_bgra_sse41+0x7b>
HIDDEN _sk_load_f16_sse41
.globl _sk_load_f16_sse41
@@ -32290,7 +32894,7 @@ _sk_load_f16_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 41a2 <_sk_load_f16_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 4360 <_sk_load_f16_sse41+0x15e>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 243,65,15,111,76,193,16 // movdqu 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,200 // movapd %xmm0,%xmm9
@@ -32300,18 +32904,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,115,45,0,0 // movdqa 0x2d73(%rip),%xmm8 # 6e10 <_sk_callback_sse41+0x1122>
+ .byte 102,68,15,111,5,53,46,0,0 // movdqa 0x2e35(%rip),%xmm8 # 7090 <_sk_callback_sse41+0x11e4>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,110,45,0,0 // movdqa 0x2d6e(%rip),%xmm3 # 6e20 <_sk_callback_sse41+0x1132>
+ .byte 102,15,111,29,48,46,0,0 // movdqa 0x2e30(%rip),%xmm3 # 70a0 <_sk_callback_sse41+0x11f4>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,90,45,0,0 // movdqa 0x2d5a(%rip),%xmm10 # 6e30 <_sk_callback_sse41+0x1142>
+ .byte 102,68,15,111,21,28,46,0,0 // movdqa 0x2e1c(%rip),%xmm10 # 70b0 <_sk_callback_sse41+0x1204>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -32354,16 +32958,16 @@ _sk_load_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 41bb <_sk_load_f16_sse41+0x177>
+ .byte 117,13 // jne 4379 <_sk_load_f16_sse41+0x177>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,182,254,255,255 // jmpq 4071 <_sk_load_f16_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 422f <_sk_load_f16_sse41+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 4071 <_sk_load_f16_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 422f <_sk_load_f16_sse41+0x2d>
.byte 243,65,15,126,76,193,16 // movq 0x10(%r9,%rax,8),%xmm1
- .byte 233,149,254,255,255 // jmpq 4071 <_sk_load_f16_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 422f <_sk_load_f16_sse41+0x2d>
HIDDEN _sk_load_f16_dst_sse41
.globl _sk_load_f16_dst_sse41
@@ -32377,7 +32981,7 @@ _sk_load_f16_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 433a <_sk_load_f16_dst_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 44f8 <_sk_load_f16_dst_sse41+0x15e>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 243,65,15,111,108,193,16 // movdqu 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,204 // movapd %xmm4,%xmm9
@@ -32387,18 +32991,18 @@ _sk_load_f16_dst_sse41:
.byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11
.byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9
.byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5
- .byte 102,68,15,111,5,11,44,0,0 // movdqa 0x2c0b(%rip),%xmm8 # 6e40 <_sk_callback_sse41+0x1152>
+ .byte 102,68,15,111,5,205,44,0,0 // movdqa 0x2ccd(%rip),%xmm8 # 70c0 <_sk_callback_sse41+0x1214>
.byte 102,15,111,245 // movdqa %xmm5,%xmm6
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,239,238 // pxor %xmm6,%xmm5
- .byte 102,15,111,61,6,44,0,0 // movdqa 0x2c06(%rip),%xmm7 # 6e50 <_sk_callback_sse41+0x1162>
+ .byte 102,15,111,61,200,44,0,0 // movdqa 0x2cc8(%rip),%xmm7 # 70d0 <_sk_callback_sse41+0x1224>
.byte 102,15,114,246,16 // pslld $0x10,%xmm6
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4
.byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4
.byte 102,15,114,245,13 // pslld $0xd,%xmm5
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,68,15,111,21,242,43,0,0 // movdqa 0x2bf2(%rip),%xmm10 # 6e60 <_sk_callback_sse41+0x1172>
+ .byte 102,68,15,111,21,180,44,0,0 // movdqa 0x2cb4(%rip),%xmm10 # 70e0 <_sk_callback_sse41+0x1234>
.byte 102,65,15,254,234 // paddd %xmm10,%xmm5
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -32441,16 +33045,16 @@ _sk_load_f16_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 4353 <_sk_load_f16_dst_sse41+0x177>
+ .byte 117,13 // jne 4511 <_sk_load_f16_dst_sse41+0x177>
.byte 243,15,126,228 // movq %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
- .byte 233,182,254,255,255 // jmpq 4209 <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 43c7 <_sk_load_f16_dst_sse41+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 4209 <_sk_load_f16_dst_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 43c7 <_sk_load_f16_dst_sse41+0x2d>
.byte 243,65,15,126,108,193,16 // movq 0x10(%r9,%rax,8),%xmm5
- .byte 233,149,254,255,255 // jmpq 4209 <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 43c7 <_sk_load_f16_dst_sse41+0x2d>
HIDDEN _sk_gather_f16_sse41
.globl _sk_gather_f16_sse41
@@ -32484,18 +33088,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,117,42,0,0 // movdqa 0x2a75(%rip),%xmm8 # 6e70 <_sk_callback_sse41+0x1182>
+ .byte 102,68,15,111,5,55,43,0,0 // movdqa 0x2b37(%rip),%xmm8 # 70f0 <_sk_callback_sse41+0x1244>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,112,42,0,0 // movdqa 0x2a70(%rip),%xmm3 # 6e80 <_sk_callback_sse41+0x1192>
+ .byte 102,15,111,29,50,43,0,0 // movdqa 0x2b32(%rip),%xmm3 # 7100 <_sk_callback_sse41+0x1254>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,92,42,0,0 // movdqa 0x2a5c(%rip),%xmm10 # 6e90 <_sk_callback_sse41+0x11a2>
+ .byte 102,68,15,111,21,30,43,0,0 // movdqa 0x2b1e(%rip),%xmm10 # 7110 <_sk_callback_sse41+0x1264>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -32549,17 +33153,17 @@ _sk_store_f16_sse41:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,127,41,0,0 // movdqa 0x297f(%rip),%xmm10 # 6ea0 <_sk_callback_sse41+0x11b2>
+ .byte 102,68,15,111,21,65,42,0,0 // movdqa 0x2a41(%rip),%xmm10 # 7120 <_sk_callback_sse41+0x1274>
.byte 102,68,15,111,216 // movdqa %xmm0,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,235 // pxor %xmm11,%xmm13
- .byte 102,68,15,111,13,114,41,0,0 // movdqa 0x2972(%rip),%xmm9 # 6eb0 <_sk_callback_sse41+0x11c2>
+ .byte 102,68,15,111,13,52,42,0,0 // movdqa 0x2a34(%rip),%xmm9 # 7130 <_sk_callback_sse41+0x1284>
.byte 102,65,15,114,211,16 // psrld $0x10,%xmm11
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,37,99,41,0,0 // movdqa 0x2963(%rip),%xmm12 # 6ec0 <_sk_callback_sse41+0x11d2>
+ .byte 102,68,15,111,37,37,42,0,0 // movdqa 0x2a25(%rip),%xmm12 # 7140 <_sk_callback_sse41+0x1294>
.byte 102,69,15,235,220 // por %xmm12,%xmm11
.byte 102,69,15,254,221 // paddd %xmm13,%xmm11
.byte 102,69,15,223,195 // pandn %xmm11,%xmm8
@@ -32603,7 +33207,7 @@ _sk_store_f16_sse41:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,203 // punpckldq %xmm11,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 4653 <_sk_store_f16_sse41+0x152>
+ .byte 117,21 // jne 4811 <_sk_store_f16_sse41+0x152>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -32611,13 +33215,13 @@ _sk_store_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 464f <_sk_store_f16_sse41+0x14e>
+ .byte 116,240 // je 480d <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 464f <_sk_store_f16_sse41+0x14e>
+ .byte 114,227 // jb 480d <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 464f <_sk_store_f16_sse41+0x14e>
+ .byte 235,213 // jmp 480d <_sk_store_f16_sse41+0x14e>
HIDDEN _sk_load_u16_be_sse41
.globl _sk_load_u16_be_sse41
@@ -32632,7 +33236,7 @@ _sk_load_u16_be_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,185,0,0,0 // jne 475a <_sk_load_u16_be_sse41+0xe0>
+ .byte 15,133,185,0,0,0 // jne 4918 <_sk_load_u16_be_sse41+0xe0>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 243,65,15,111,76,65,16 // movdqu 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -32648,7 +33252,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,227,39,0,0 // movaps 0x27e3(%rip),%xmm8 # 6ed0 <_sk_callback_sse41+0x11e2>
+ .byte 68,15,40,5,165,40,0,0 // movaps 0x28a5(%rip),%xmm8 # 7150 <_sk_callback_sse41+0x12a4>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -32676,16 +33280,16 @@ _sk_load_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 4773 <_sk_load_u16_be_sse41+0xf9>
+ .byte 117,13 // jne 4931 <_sk_load_u16_be_sse41+0xf9>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,59,255,255,255 // jmpq 46ae <_sk_load_u16_be_sse41+0x34>
+ .byte 233,59,255,255,255 // jmpq 486c <_sk_load_u16_be_sse41+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,38,255,255,255 // jb 46ae <_sk_load_u16_be_sse41+0x34>
+ .byte 15,130,38,255,255,255 // jb 486c <_sk_load_u16_be_sse41+0x34>
.byte 243,65,15,126,76,65,16 // movq 0x10(%r9,%rax,2),%xmm1
- .byte 233,26,255,255,255 // jmpq 46ae <_sk_load_u16_be_sse41+0x34>
+ .byte 233,26,255,255,255 // jmpq 486c <_sk_load_u16_be_sse41+0x34>
HIDDEN _sk_load_rgb_u16_be_sse41
.globl _sk_load_rgb_u16_be_sse41
@@ -32702,7 +33306,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,170,0,0,0 // jne 4869 <_sk_load_rgb_u16_be_sse41+0xd5>
+ .byte 15,133,170,0,0,0 // jne 4a27 <_sk_load_rgb_u16_be_sse41+0xd5>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -32722,7 +33326,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,194,38,0,0 // movaps 0x26c2(%rip),%xmm8 # 6ee0 <_sk_callback_sse41+0x11f2>
+ .byte 68,15,40,5,132,39,0,0 // movaps 0x2784(%rip),%xmm8 # 7160 <_sk_callback_sse41+0x12b4>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -32739,27 +33343,27 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,137,38,0,0 // movaps 0x2689(%rip),%xmm3 # 6ef0 <_sk_callback_sse41+0x1202>
+ .byte 15,40,29,75,39,0,0 // movaps 0x274b(%rip),%xmm3 # 7170 <_sk_callback_sse41+0x12c4>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 488e <_sk_load_rgb_u16_be_sse41+0xfa>
+ .byte 117,13 // jne 4a4c <_sk_load_rgb_u16_be_sse41+0xfa>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,85,255,255,255 // jmpq 47e3 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,85,255,255,255 // jmpq 49a1 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 48bf <_sk_load_rgb_u16_be_sse41+0x12b>
+ .byte 114,24 // jb 4a7d <_sk_load_rgb_u16_be_sse41+0x12b>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,36,255,255,255 // jmpq 47e3 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,36,255,255,255 // jmpq 49a1 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,27,255,255,255 // jmpq 47e3 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,27,255,255,255 // jmpq 49a1 <_sk_load_rgb_u16_be_sse41+0x4f>
HIDDEN _sk_store_u16_be_sse41
.globl _sk_store_u16_be_sse41
@@ -32773,7 +33377,7 @@ _sk_store_u16_be_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,18,38,0,0 // movaps 0x2612(%rip),%xmm10 # 6f00 <_sk_callback_sse41+0x1212>
+ .byte 68,15,40,21,212,38,0,0 // movaps 0x26d4(%rip),%xmm10 # 7180 <_sk_callback_sse41+0x12d4>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -32810,7 +33414,7 @@ _sk_store_u16_be_sse41:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 49bc <_sk_store_u16_be_sse41+0xf4>
+ .byte 117,21 // jne 4b7a <_sk_store_u16_be_sse41+0xf4>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -32818,13 +33422,13 @@ _sk_store_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 49b8 <_sk_store_u16_be_sse41+0xf0>
+ .byte 116,240 // je 4b76 <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 49b8 <_sk_store_u16_be_sse41+0xf0>
+ .byte 114,227 // jb 4b76 <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 49b8 <_sk_store_u16_be_sse41+0xf0>
+ .byte 235,213 // jmp 4b76 <_sk_store_u16_be_sse41+0xf0>
HIDDEN _sk_load_f32_sse41
.globl _sk_load_f32_sse41
@@ -32840,7 +33444,7 @@ _sk_load_f32_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 4a4e <_sk_load_f32_sse41+0x6b>
+ .byte 117,66 // jne 4c0c <_sk_load_f32_sse41+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -32860,17 +33464,17 @@ _sk_load_f32_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 4a60 <_sk_load_f32_sse41+0x7d>
+ .byte 117,8 // jne 4c1e <_sk_load_f32_sse41+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 4a1e <_sk_load_f32_sse41+0x3b>
+ .byte 235,190 // jmp 4bdc <_sk_load_f32_sse41+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 4a74 <_sk_load_f32_sse41+0x91>
+ .byte 114,8 // jb 4c32 <_sk_load_f32_sse41+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 4a1e <_sk_load_f32_sse41+0x3b>
+ .byte 235,170 // jmp 4bdc <_sk_load_f32_sse41+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 4a1e <_sk_load_f32_sse41+0x3b>
+ .byte 235,165 // jmp 4bdc <_sk_load_f32_sse41+0x3b>
HIDDEN _sk_load_f32_dst_sse41
.globl _sk_load_f32_dst_sse41
@@ -32886,7 +33490,7 @@ _sk_load_f32_dst_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 4ae4 <_sk_load_f32_dst_sse41+0x6b>
+ .byte 117,66 // jne 4ca2 <_sk_load_f32_dst_sse41+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -32906,17 +33510,17 @@ _sk_load_f32_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 4af6 <_sk_load_f32_dst_sse41+0x7d>
+ .byte 117,8 // jne 4cb4 <_sk_load_f32_dst_sse41+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 4ab4 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,190 // jmp 4c72 <_sk_load_f32_dst_sse41+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 4b0a <_sk_load_f32_dst_sse41+0x91>
+ .byte 114,8 // jb 4cc8 <_sk_load_f32_dst_sse41+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 4ab4 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,170 // jmp 4c72 <_sk_load_f32_dst_sse41+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 4ab4 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,165 // jmp 4c72 <_sk_load_f32_dst_sse41+0x3b>
HIDDEN _sk_store_f32_sse41
.globl _sk_store_f32_sse41
@@ -32945,7 +33549,7 @@ _sk_store_f32_sse41:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 4b8c <_sk_store_f32_sse41+0x7d>
+ .byte 117,29 // jne 4d4a <_sk_store_f32_sse41+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -32953,12 +33557,12 @@ _sk_store_f32_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 4b88 <_sk_store_f32_sse41+0x79>
+ .byte 116,246 // je 4d46 <_sk_store_f32_sse41+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 4b88 <_sk_store_f32_sse41+0x79>
+ .byte 114,234 // jb 4d46 <_sk_store_f32_sse41+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 4b88 <_sk_store_f32_sse41+0x79>
+ .byte 235,225 // jmp 4d46 <_sk_store_f32_sse41+0x79>
HIDDEN _sk_clamp_x_sse41
.globl _sk_clamp_x_sse41
@@ -33048,7 +33652,7 @@ _sk_mirror_x_sse41:
.byte 65,15,92,194 // subps %xmm10,%xmm0
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,188,38,0,0 // mulss 0x26bc(%rip),%xmm9 # 7370 <_sk_callback_sse41+0x1682>
+ .byte 243,68,15,89,13,126,39,0,0 // mulss 0x277e(%rip),%xmm9 # 75f0 <_sk_callback_sse41+0x1744>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -33079,7 +33683,7 @@ _sk_mirror_y_sse41:
.byte 65,15,92,202 // subps %xmm10,%xmm1
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,78,38,0,0 // mulss 0x264e(%rip),%xmm9 # 7374 <_sk_callback_sse41+0x1686>
+ .byte 243,68,15,89,13,16,39,0,0 // mulss 0x2710(%rip),%xmm9 # 75f4 <_sk_callback_sse41+0x1748>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,201 // mulps %xmm1,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -33104,7 +33708,7 @@ FUNCTION(_sk_clamp_x_1_sse41)
_sk_clamp_x_1_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,149,33,0,0 // minps 0x2195(%rip),%xmm8 # 6f10 <_sk_callback_sse41+0x1222>
+ .byte 68,15,93,5,87,34,0,0 // minps 0x2257(%rip),%xmm8 # 7190 <_sk_callback_sse41+0x12e4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -33122,9 +33726,9 @@ HIDDEN _sk_mirror_x_1_sse41
.globl _sk_mirror_x_1_sse41
FUNCTION(_sk_mirror_x_1_sse41)
_sk_mirror_x_1_sse41:
- .byte 68,15,40,5,134,33,0,0 // movaps 0x2186(%rip),%xmm8 # 6f20 <_sk_callback_sse41+0x1232>
+ .byte 68,15,40,5,72,34,0,0 // movaps 0x2248(%rip),%xmm8 # 71a0 <_sk_callback_sse41+0x12f4>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,138,33,0,0 // movaps 0x218a(%rip),%xmm9 # 6f30 <_sk_callback_sse41+0x1242>
+ .byte 68,15,40,13,76,34,0,0 // movaps 0x224c(%rip),%xmm9 # 71b0 <_sk_callback_sse41+0x1304>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
.byte 69,15,88,201 // addps %xmm9,%xmm9
@@ -33141,10 +33745,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,105,33,0,0 // mulps 0x2169(%rip),%xmm0 # 6f40 <_sk_callback_sse41+0x1252>
- .byte 15,89,13,114,33,0,0 // mulps 0x2172(%rip),%xmm1 # 6f50 <_sk_callback_sse41+0x1262>
+ .byte 15,89,5,43,34,0,0 // mulps 0x222b(%rip),%xmm0 # 71c0 <_sk_callback_sse41+0x1314>
+ .byte 15,89,13,52,34,0,0 // mulps 0x2234(%rip),%xmm1 # 71d0 <_sk_callback_sse41+0x1324>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,120,33,0,0 // mulps 0x2178(%rip),%xmm3 # 6f60 <_sk_callback_sse41+0x1272>
+ .byte 15,89,29,58,34,0,0 // mulps 0x223a(%rip),%xmm3 # 71e0 <_sk_callback_sse41+0x1334>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -33457,9 +34061,9 @@ _sk_evenly_spaced_gradient_sse41:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 528a <_sk_evenly_spaced_gradient_sse41+0x1a>
+ .byte 120,7 // js 5448 <_sk_evenly_spaced_gradient_sse41+0x1a>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 529f <_sk_evenly_spaced_gradient_sse41+0x2f>
+ .byte 235,21 // jmp 545d <_sk_evenly_spaced_gradient_sse41+0x2f>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -33549,15 +34153,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41
.globl _sk_gauss_a_to_rgba_sse41
FUNCTION(_sk_gauss_a_to_rgba_sse41)
_sk_gauss_a_to_rgba_sse41:
- .byte 15,40,5,35,27,0,0 // movaps 0x1b23(%rip),%xmm0 # 6f70 <_sk_callback_sse41+0x1282>
+ .byte 15,40,5,229,27,0,0 // movaps 0x1be5(%rip),%xmm0 # 71f0 <_sk_callback_sse41+0x1344>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,41,27,0,0 // addps 0x1b29(%rip),%xmm0 # 6f80 <_sk_callback_sse41+0x1292>
+ .byte 15,88,5,235,27,0,0 // addps 0x1beb(%rip),%xmm0 # 7200 <_sk_callback_sse41+0x1354>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,47,27,0,0 // addps 0x1b2f(%rip),%xmm0 # 6f90 <_sk_callback_sse41+0x12a2>
+ .byte 15,88,5,241,27,0,0 // addps 0x1bf1(%rip),%xmm0 # 7210 <_sk_callback_sse41+0x1364>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,53,27,0,0 // addps 0x1b35(%rip),%xmm0 # 6fa0 <_sk_callback_sse41+0x12b2>
+ .byte 15,88,5,247,27,0,0 // addps 0x1bf7(%rip),%xmm0 # 7220 <_sk_callback_sse41+0x1374>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,59,27,0,0 // addps 0x1b3b(%rip),%xmm0 # 6fb0 <_sk_callback_sse41+0x12c2>
+ .byte 15,88,5,253,27,0,0 // addps 0x1bfd(%rip),%xmm0 # 7230 <_sk_callback_sse41+0x1384>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -33575,12 +34179,12 @@ _sk_gradient_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 54c8 <_sk_gradient_sse41+0x46>
+ .byte 114,50 // jb 5686 <_sk_gradient_sse41+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,20,27,0,0 // movaps 0x1b14(%rip),%xmm2 # 6fc0 <_sk_callback_sse41+0x12d2>
+ .byte 15,40,21,214,27,0,0 // movaps 0x1bd6(%rip),%xmm2 # 7240 <_sk_callback_sse41+0x1394>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -33588,7 +34192,7 @@ _sk_gradient_sse41:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 54ac <_sk_gradient_sse41+0x2a>
+ .byte 117,228 // jne 566a <_sk_gradient_sse41+0x2a>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -33718,26 +34322,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,181,24,0,0 // movaps 0x18b5(%rip),%xmm10 # 6fd0 <_sk_callback_sse41+0x12e2>
+ .byte 68,15,40,21,119,25,0,0 // movaps 0x1977(%rip),%xmm10 # 7250 <_sk_callback_sse41+0x13a4>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,185,24,0,0 // addps 0x18b9(%rip),%xmm10 # 6fe0 <_sk_callback_sse41+0x12f2>
+ .byte 68,15,88,21,123,25,0,0 // addps 0x197b(%rip),%xmm10 # 7260 <_sk_callback_sse41+0x13b4>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,189,24,0,0 // addps 0x18bd(%rip),%xmm10 # 6ff0 <_sk_callback_sse41+0x1302>
+ .byte 68,15,88,21,127,25,0,0 // addps 0x197f(%rip),%xmm10 # 7270 <_sk_callback_sse41+0x13c4>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,193,24,0,0 // addps 0x18c1(%rip),%xmm10 # 7000 <_sk_callback_sse41+0x1312>
+ .byte 68,15,88,21,131,25,0,0 // addps 0x1983(%rip),%xmm10 # 7280 <_sk_callback_sse41+0x13d4>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,192,24,0,0 // movaps 0x18c0(%rip),%xmm11 # 7010 <_sk_callback_sse41+0x1322>
+ .byte 68,15,40,29,130,25,0,0 // movaps 0x1982(%rip),%xmm11 # 7290 <_sk_callback_sse41+0x13e4>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,185,24,0,0 // movaps 0x18b9(%rip),%xmm11 # 7020 <_sk_callback_sse41+0x1332>
+ .byte 68,15,40,29,123,25,0,0 // movaps 0x197b(%rip),%xmm11 # 72a0 <_sk_callback_sse41+0x13f4>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,171,24,0,0 // movaps 0x18ab(%rip),%xmm9 # 7030 <_sk_callback_sse41+0x1342>
+ .byte 68,15,40,13,109,25,0,0 // movaps 0x196d(%rip),%xmm9 # 72b0 <_sk_callback_sse41+0x1404>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -33771,7 +34375,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,84,24,0,0 // mulps 0x1854(%rip),%xmm9 # 7040 <_sk_callback_sse41+0x1352>
+ .byte 68,15,89,13,22,25,0,0 // mulps 0x1916(%rip),%xmm9 # 72c0 <_sk_callback_sse41+0x1414>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -33779,7 +34383,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,63,24,0,0 // mulps 0x183f(%rip),%xmm10 # 7050 <_sk_callback_sse41+0x1362>
+ .byte 68,15,89,21,1,25,0,0 // mulps 0x1901(%rip),%xmm10 # 72d0 <_sk_callback_sse41+0x1424>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -33788,8 +34392,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,39,24,0,0 // xorps 0x1827(%rip),%xmm9 # 7060 <_sk_callback_sse41+0x1372>
- .byte 68,15,89,5,47,24,0,0 // mulps 0x182f(%rip),%xmm8 # 7070 <_sk_callback_sse41+0x1382>
+ .byte 68,15,87,13,233,24,0,0 // xorps 0x18e9(%rip),%xmm9 # 72e0 <_sk_callback_sse41+0x1434>
+ .byte 68,15,89,5,241,24,0,0 // mulps 0x18f1(%rip),%xmm8 # 72f0 <_sk_callback_sse41+0x1444>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -33810,7 +34414,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,246,23,0,0 // mulps 0x17f6(%rip),%xmm9 # 7080 <_sk_callback_sse41+0x1392>
+ .byte 68,15,89,13,184,24,0,0 // mulps 0x18b8(%rip),%xmm9 # 7300 <_sk_callback_sse41+0x1454>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -33818,7 +34422,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,225,23,0,0 // mulps 0x17e1(%rip),%xmm10 # 7090 <_sk_callback_sse41+0x13a2>
+ .byte 68,15,89,21,163,24,0,0 // mulps 0x18a3(%rip),%xmm10 # 7310 <_sk_callback_sse41+0x1464>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -33827,8 +34431,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,201,23,0,0 // xorps 0x17c9(%rip),%xmm9 # 70a0 <_sk_callback_sse41+0x13b2>
- .byte 68,15,89,5,209,23,0,0 // mulps 0x17d1(%rip),%xmm8 # 70b0 <_sk_callback_sse41+0x13c2>
+ .byte 68,15,87,13,139,24,0,0 // xorps 0x188b(%rip),%xmm9 # 7320 <_sk_callback_sse41+0x1474>
+ .byte 68,15,89,5,147,24,0,0 // mulps 0x1893(%rip),%xmm8 # 7330 <_sk_callback_sse41+0x1484>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -33846,7 +34450,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,169,23,0,0 // mulps 0x17a9(%rip),%xmm9 # 70c0 <_sk_callback_sse41+0x13d2>
+ .byte 68,15,89,13,107,24,0,0 // mulps 0x186b(%rip),%xmm9 # 7340 <_sk_callback_sse41+0x1494>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -33854,7 +34458,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,149,23,0,0 // xorps 0x1795(%rip),%xmm0 # 70d0 <_sk_callback_sse41+0x13e2>
+ .byte 15,87,5,87,24,0,0 // xorps 0x1857(%rip),%xmm0 # 7350 <_sk_callback_sse41+0x14a4>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33897,7 +34501,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,59,23,0,0 // movaps 0x173b(%rip),%xmm8 # 70e0 <_sk_callback_sse41+0x13f2>
+ .byte 68,15,40,5,253,23,0,0 // movaps 0x17fd(%rip),%xmm8 # 7360 <_sk_callback_sse41+0x14b4>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -33941,8 +34545,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,189,22,0,0 // addps 0x16bd(%rip),%xmm0 # 70f0 <_sk_callback_sse41+0x1402>
- .byte 68,15,40,13,197,22,0,0 // movaps 0x16c5(%rip),%xmm9 # 7100 <_sk_callback_sse41+0x1412>
+ .byte 15,88,5,127,23,0,0 // addps 0x177f(%rip),%xmm0 # 7370 <_sk_callback_sse41+0x14c4>
+ .byte 68,15,40,13,135,23,0,0 // movaps 0x1787(%rip),%xmm9 # 7380 <_sk_callback_sse41+0x14d4>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33955,7 +34559,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,180,22,0,0 // addps 0x16b4(%rip),%xmm0 # 7110 <_sk_callback_sse41+0x1422>
+ .byte 15,88,5,118,23,0,0 // addps 0x1776(%rip),%xmm0 # 7390 <_sk_callback_sse41+0x14e4>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33967,8 +34571,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,166,22,0,0 // addps 0x16a6(%rip),%xmm1 # 7120 <_sk_callback_sse41+0x1432>
- .byte 68,15,40,13,174,22,0,0 // movaps 0x16ae(%rip),%xmm9 # 7130 <_sk_callback_sse41+0x1442>
+ .byte 15,88,13,104,23,0,0 // addps 0x1768(%rip),%xmm1 # 73a0 <_sk_callback_sse41+0x14f4>
+ .byte 68,15,40,13,112,23,0,0 // movaps 0x1770(%rip),%xmm9 # 73b0 <_sk_callback_sse41+0x1504>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33981,7 +34585,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,156,22,0,0 // addps 0x169c(%rip),%xmm1 # 7140 <_sk_callback_sse41+0x1452>
+ .byte 15,88,13,94,23,0,0 // addps 0x175e(%rip),%xmm1 # 73c0 <_sk_callback_sse41+0x1514>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33993,13 +34597,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,143,22,0,0 // addps 0x168f(%rip),%xmm0 # 7150 <_sk_callback_sse41+0x1462>
- .byte 68,15,40,13,151,22,0,0 // movaps 0x1697(%rip),%xmm9 # 7160 <_sk_callback_sse41+0x1472>
+ .byte 15,88,5,81,23,0,0 // addps 0x1751(%rip),%xmm0 # 73d0 <_sk_callback_sse41+0x1524>
+ .byte 68,15,40,13,89,23,0,0 // movaps 0x1759(%rip),%xmm9 # 73e0 <_sk_callback_sse41+0x1534>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,147,22,0,0 // mulps 0x1693(%rip),%xmm9 # 7170 <_sk_callback_sse41+0x1482>
- .byte 68,15,88,13,155,22,0,0 // addps 0x169b(%rip),%xmm9 # 7180 <_sk_callback_sse41+0x1492>
+ .byte 68,15,89,13,85,23,0,0 // mulps 0x1755(%rip),%xmm9 # 73f0 <_sk_callback_sse41+0x1544>
+ .byte 68,15,88,13,93,23,0,0 // addps 0x175d(%rip),%xmm9 # 7400 <_sk_callback_sse41+0x1554>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34012,16 +34616,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,138,22,0,0 // addps 0x168a(%rip),%xmm0 # 7190 <_sk_callback_sse41+0x14a2>
- .byte 68,15,40,13,146,22,0,0 // movaps 0x1692(%rip),%xmm9 # 71a0 <_sk_callback_sse41+0x14b2>
+ .byte 15,88,5,76,23,0,0 // addps 0x174c(%rip),%xmm0 # 7410 <_sk_callback_sse41+0x1564>
+ .byte 68,15,40,13,84,23,0,0 // movaps 0x1754(%rip),%xmm9 # 7420 <_sk_callback_sse41+0x1574>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,150,22,0,0 // movaps 0x1696(%rip),%xmm8 # 71b0 <_sk_callback_sse41+0x14c2>
+ .byte 68,15,40,5,88,23,0,0 // movaps 0x1758(%rip),%xmm8 # 7430 <_sk_callback_sse41+0x1584>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,154,22,0,0 // addps 0x169a(%rip),%xmm8 # 71c0 <_sk_callback_sse41+0x14d2>
+ .byte 68,15,88,5,92,23,0,0 // addps 0x175c(%rip),%xmm8 # 7440 <_sk_callback_sse41+0x1594>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,158,22,0,0 // addps 0x169e(%rip),%xmm8 # 71d0 <_sk_callback_sse41+0x14e2>
+ .byte 68,15,88,5,96,23,0,0 // addps 0x1760(%rip),%xmm8 # 7450 <_sk_callback_sse41+0x15a4>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,162,22,0,0 // addps 0x16a2(%rip),%xmm8 # 71e0 <_sk_callback_sse41+0x14f2>
+ .byte 68,15,88,5,100,23,0,0 // addps 0x1764(%rip),%xmm8 # 7460 <_sk_callback_sse41+0x15b4>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34031,17 +34635,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,156,22,0,0 // movaps 0x169c(%rip),%xmm8 # 71f0 <_sk_callback_sse41+0x1502>
+ .byte 68,15,40,5,94,23,0,0 // movaps 0x175e(%rip),%xmm8 # 7470 <_sk_callback_sse41+0x15c4>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,152,22,0,0 // movaps 0x1698(%rip),%xmm10 # 7200 <_sk_callback_sse41+0x1512>
+ .byte 68,15,40,21,90,23,0,0 // movaps 0x175a(%rip),%xmm10 # 7480 <_sk_callback_sse41+0x15d4>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,156,22,0,0 // addps 0x169c(%rip),%xmm10 # 7210 <_sk_callback_sse41+0x1522>
+ .byte 68,15,88,21,94,23,0,0 // addps 0x175e(%rip),%xmm10 # 7490 <_sk_callback_sse41+0x15e4>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,152,22,0,0 // addps 0x1698(%rip),%xmm10 # 7220 <_sk_callback_sse41+0x1532>
+ .byte 68,15,88,21,90,23,0,0 // addps 0x175a(%rip),%xmm10 # 74a0 <_sk_callback_sse41+0x15f4>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34053,11 +34657,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,139,22,0,0 // addps 0x168b(%rip),%xmm0 # 7230 <_sk_callback_sse41+0x1542>
+ .byte 15,88,5,77,23,0,0 // addps 0x174d(%rip),%xmm0 # 74b0 <_sk_callback_sse41+0x1604>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,139,22,0,0 // mulps 0x168b(%rip),%xmm8 # 7240 <_sk_callback_sse41+0x1552>
- .byte 68,15,88,5,147,22,0,0 // addps 0x1693(%rip),%xmm8 # 7250 <_sk_callback_sse41+0x1562>
+ .byte 68,15,89,5,77,23,0,0 // mulps 0x174d(%rip),%xmm8 # 74c0 <_sk_callback_sse41+0x1614>
+ .byte 68,15,88,5,85,23,0,0 // addps 0x1755(%rip),%xmm8 # 74d0 <_sk_callback_sse41+0x1624>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34070,13 +34674,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,129,22,0,0 // addps 0x1681(%rip),%xmm1 # 7260 <_sk_callback_sse41+0x1572>
- .byte 68,15,40,13,137,22,0,0 // movaps 0x1689(%rip),%xmm9 # 7270 <_sk_callback_sse41+0x1582>
+ .byte 15,88,13,67,23,0,0 // addps 0x1743(%rip),%xmm1 # 74e0 <_sk_callback_sse41+0x1634>
+ .byte 68,15,40,13,75,23,0,0 // movaps 0x174b(%rip),%xmm9 # 74f0 <_sk_callback_sse41+0x1644>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,133,22,0,0 // mulps 0x1685(%rip),%xmm9 # 7280 <_sk_callback_sse41+0x1592>
- .byte 68,15,88,13,141,22,0,0 // addps 0x168d(%rip),%xmm9 # 7290 <_sk_callback_sse41+0x15a2>
+ .byte 68,15,89,13,71,23,0,0 // mulps 0x1747(%rip),%xmm9 # 7500 <_sk_callback_sse41+0x1654>
+ .byte 68,15,88,13,79,23,0,0 // addps 0x174f(%rip),%xmm9 # 7510 <_sk_callback_sse41+0x1664>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34089,16 +34693,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,123,22,0,0 // addps 0x167b(%rip),%xmm1 # 72a0 <_sk_callback_sse41+0x15b2>
- .byte 68,15,40,13,131,22,0,0 // movaps 0x1683(%rip),%xmm9 # 72b0 <_sk_callback_sse41+0x15c2>
+ .byte 15,88,13,61,23,0,0 // addps 0x173d(%rip),%xmm1 # 7520 <_sk_callback_sse41+0x1674>
+ .byte 68,15,40,13,69,23,0,0 // movaps 0x1745(%rip),%xmm9 # 7530 <_sk_callback_sse41+0x1684>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,135,22,0,0 // movaps 0x1687(%rip),%xmm8 # 72c0 <_sk_callback_sse41+0x15d2>
+ .byte 68,15,40,5,73,23,0,0 // movaps 0x1749(%rip),%xmm8 # 7540 <_sk_callback_sse41+0x1694>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,139,22,0,0 // addps 0x168b(%rip),%xmm8 # 72d0 <_sk_callback_sse41+0x15e2>
+ .byte 68,15,88,5,77,23,0,0 // addps 0x174d(%rip),%xmm8 # 7550 <_sk_callback_sse41+0x16a4>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,143,22,0,0 // addps 0x168f(%rip),%xmm8 # 72e0 <_sk_callback_sse41+0x15f2>
+ .byte 68,15,88,5,81,23,0,0 // addps 0x1751(%rip),%xmm8 # 7560 <_sk_callback_sse41+0x16b4>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,147,22,0,0 // addps 0x1693(%rip),%xmm8 # 72f0 <_sk_callback_sse41+0x1602>
+ .byte 68,15,88,5,85,23,0,0 // addps 0x1755(%rip),%xmm8 # 7570 <_sk_callback_sse41+0x16c4>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34108,17 +34712,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,141,22,0,0 // movaps 0x168d(%rip),%xmm8 # 7300 <_sk_callback_sse41+0x1612>
+ .byte 68,15,40,5,79,23,0,0 // movaps 0x174f(%rip),%xmm8 # 7580 <_sk_callback_sse41+0x16d4>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,136,22,0,0 // movaps 0x1688(%rip),%xmm10 # 7310 <_sk_callback_sse41+0x1622>
+ .byte 68,15,40,21,74,23,0,0 // movaps 0x174a(%rip),%xmm10 # 7590 <_sk_callback_sse41+0x16e4>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,140,22,0,0 // addps 0x168c(%rip),%xmm10 # 7320 <_sk_callback_sse41+0x1632>
+ .byte 68,15,88,21,78,23,0,0 // addps 0x174e(%rip),%xmm10 # 75a0 <_sk_callback_sse41+0x16f4>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,136,22,0,0 // addps 0x1688(%rip),%xmm10 # 7330 <_sk_callback_sse41+0x1642>
+ .byte 68,15,88,21,74,23,0,0 // addps 0x174a(%rip),%xmm10 # 75b0 <_sk_callback_sse41+0x1704>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34130,11 +34734,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,122,22,0,0 // addps 0x167a(%rip),%xmm1 # 7340 <_sk_callback_sse41+0x1652>
+ .byte 15,88,13,60,23,0,0 // addps 0x173c(%rip),%xmm1 # 75c0 <_sk_callback_sse41+0x1714>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,122,22,0,0 // mulps 0x167a(%rip),%xmm8 # 7350 <_sk_callback_sse41+0x1662>
- .byte 68,15,88,5,130,22,0,0 // addps 0x1682(%rip),%xmm8 # 7360 <_sk_callback_sse41+0x1672>
+ .byte 68,15,89,5,60,23,0,0 // mulps 0x173c(%rip),%xmm8 # 75d0 <_sk_callback_sse41+0x1724>
+ .byte 68,15,88,5,68,23,0,0 // addps 0x1744(%rip),%xmm8 # 75e0 <_sk_callback_sse41+0x1734>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34376,9 +34980,9 @@ BALIGN16
.byte 128,191,0,0,224,64,0 // cmpb $0x0,0x40e00000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 5fdc <.literal16+0x1fc>
+ .byte 224,64 // loopne 619c <.literal16+0x1fc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 5fe0 <.literal16+0x200>
+ .byte 224,64 // loopne 61a0 <.literal16+0x200>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -34398,13 +35002,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6001 <.literal16+0x221>
+ .byte 71,225,61 // rex.RXB loope 61c1 <.literal16+0x221>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6005 <.literal16+0x225>
+ .byte 71,225,61 // rex.RXB loope 61c5 <.literal16+0x225>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6009 <.literal16+0x229>
+ .byte 71,225,61 // rex.RXB loope 61c9 <.literal16+0x229>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 600d <.literal16+0x22d>
+ .byte 71,225,61 // rex.RXB loope 61cd <.literal16+0x22d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34429,13 +35033,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6041 <.literal16+0x261>
+ .byte 71,225,61 // rex.RXB loope 6201 <.literal16+0x261>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6045 <.literal16+0x265>
+ .byte 71,225,61 // rex.RXB loope 6205 <.literal16+0x265>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6049 <.literal16+0x269>
+ .byte 71,225,61 // rex.RXB loope 6209 <.literal16+0x269>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 604d <.literal16+0x26d>
+ .byte 71,225,61 // rex.RXB loope 620d <.literal16+0x26d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34460,13 +35064,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6081 <.literal16+0x2a1>
+ .byte 71,225,61 // rex.RXB loope 6241 <.literal16+0x2a1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6085 <.literal16+0x2a5>
+ .byte 71,225,61 // rex.RXB loope 6245 <.literal16+0x2a5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6089 <.literal16+0x2a9>
+ .byte 71,225,61 // rex.RXB loope 6249 <.literal16+0x2a9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 608d <.literal16+0x2ad>
+ .byte 71,225,61 // rex.RXB loope 624d <.literal16+0x2ad>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34491,13 +35095,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 60c1 <.literal16+0x2e1>
+ .byte 71,225,61 // rex.RXB loope 6281 <.literal16+0x2e1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 60c5 <.literal16+0x2e5>
+ .byte 71,225,61 // rex.RXB loope 6285 <.literal16+0x2e5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 60c9 <.literal16+0x2e9>
+ .byte 71,225,61 // rex.RXB loope 6289 <.literal16+0x2e9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 60cd <.literal16+0x2ed>
+ .byte 71,225,61 // rex.RXB loope 628d <.literal16+0x2ed>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34514,10 +35118,10 @@ BALIGN16
.byte 0,1 // add %al,(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0060b8 <_sk_callback_sse41+0xa0003ca>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006278 <_sk_callback_sse41+0xa0003cc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30060c0 <_sk_callback_sse41+0x30003d2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006280 <_sk_callback_sse41+0x30003d4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -34536,11 +35140,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
.byte 67,0,0 // rex.XB add %al,(%r8)
- .byte 127,67 // jg 612b <.literal16+0x34b>
+ .byte 127,67 // jg 62eb <.literal16+0x34b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 612f <.literal16+0x34f>
+ .byte 127,67 // jg 62ef <.literal16+0x34f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6133 <.literal16+0x353>
+ .byte 127,67 // jg 62f3 <.literal16+0x353>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34827,13 +35431,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6379 <.literal16+0x599>
+ .byte 224,7 // loopne 6539 <.literal16+0x599>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 637d <.literal16+0x59d>
+ .byte 224,7 // loopne 653d <.literal16+0x59d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6381 <.literal16+0x5a1>
+ .byte 224,7 // loopne 6541 <.literal16+0x5a1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6385 <.literal16+0x5a5>
+ .byte 224,7 // loopne 6545 <.literal16+0x5a5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -34867,10 +35471,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0063c8 <_sk_callback_sse41+0xa0006da>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006588 <_sk_callback_sse41+0xa0006dc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30063d0 <_sk_callback_sse41+0x30006e2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006590 <_sk_callback_sse41+0x30006e4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -34925,11 +35529,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 649b <.literal16+0x6bb>
+ .byte 127,67 // jg 665b <.literal16+0x6bb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 649f <.literal16+0x6bf>
+ .byte 127,67 // jg 665f <.literal16+0x6bf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 64a3 <.literal16+0x6c3>
+ .byte 127,67 // jg 6663 <.literal16+0x6c3>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -34944,16 +35548,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6494 <.literal16+0x6b4>
+ .byte 127,0 // jg 6654 <.literal16+0x6b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6498 <.literal16+0x6b8>
+ .byte 127,0 // jg 6658 <.literal16+0x6b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 649c <.literal16+0x6bc>
+ .byte 127,0 // jg 665c <.literal16+0x6bc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 64a0 <.literal16+0x6c0>
+ .byte 127,0 // jg 6660 <.literal16+0x6c0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -34962,7 +35566,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6525 <.literal16+0x745>
+ .byte 119,115 // ja 66e5 <.literal16+0x745>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -34973,7 +35577,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6489 <.literal16+0x6a9>
+ .byte 117,191 // jne 6649 <.literal16+0x6a9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -34985,7 +35589,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a4ca <_sk_callback_sse41+0xffffffffe9a347dc>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a68a <_sk_callback_sse41+0xffffffffe9a347de>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35040,16 +35644,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6564 <.literal16+0x784>
+ .byte 127,0 // jg 6724 <.literal16+0x784>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6568 <.literal16+0x788>
+ .byte 127,0 // jg 6728 <.literal16+0x788>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 656c <.literal16+0x78c>
+ .byte 127,0 // jg 672c <.literal16+0x78c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6570 <.literal16+0x790>
+ .byte 127,0 // jg 6730 <.literal16+0x790>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35058,7 +35662,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 65f5 <.literal16+0x815>
+ .byte 119,115 // ja 67b5 <.literal16+0x815>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35069,7 +35673,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6559 <.literal16+0x779>
+ .byte 117,191 // jne 6719 <.literal16+0x779>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35081,7 +35685,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a59a <_sk_callback_sse41+0xffffffffe9a348ac>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a75a <_sk_callback_sse41+0xffffffffe9a348ae>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35136,16 +35740,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6634 <.literal16+0x854>
+ .byte 127,0 // jg 67f4 <.literal16+0x854>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6638 <.literal16+0x858>
+ .byte 127,0 // jg 67f8 <.literal16+0x858>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 663c <.literal16+0x85c>
+ .byte 127,0 // jg 67fc <.literal16+0x85c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6640 <.literal16+0x860>
+ .byte 127,0 // jg 6800 <.literal16+0x860>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35154,7 +35758,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 66c5 <.literal16+0x8e5>
+ .byte 119,115 // ja 6885 <.literal16+0x8e5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35165,7 +35769,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6629 <.literal16+0x849>
+ .byte 117,191 // jne 67e9 <.literal16+0x849>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35177,7 +35781,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a66a <_sk_callback_sse41+0xffffffffe9a3497c>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a82a <_sk_callback_sse41+0xffffffffe9a3497e>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35232,16 +35836,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6704 <.literal16+0x924>
+ .byte 127,0 // jg 68c4 <.literal16+0x924>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6708 <.literal16+0x928>
+ .byte 127,0 // jg 68c8 <.literal16+0x928>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 670c <.literal16+0x92c>
+ .byte 127,0 // jg 68cc <.literal16+0x92c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6710 <.literal16+0x930>
+ .byte 127,0 // jg 68d0 <.literal16+0x930>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35250,7 +35854,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6795 <.literal16+0x9b5>
+ .byte 119,115 // ja 6955 <.literal16+0x9b5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35261,7 +35865,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 66f9 <.literal16+0x919>
+ .byte 117,191 // jne 68b9 <.literal16+0x919>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35273,7 +35877,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a73a <_sk_callback_sse41+0xffffffffe9a34a4c>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a8fa <_sk_callback_sse41+0xffffffffe9a34a4e>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35319,18 +35923,108 @@ BALIGN16
.byte 63 // (bad)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
- .byte 0,200 // add %cl,%al
- .byte 66,0,0 // rex.X add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6994 <.literal16+0x9f4>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6998 <.literal16+0x9f8>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 699c <.literal16+0x9fc>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 69a0 <.literal16+0xa00>
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 119,115 // ja 6a25 <.literal16+0xa85>
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,117,191 // retq $0xbf75
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // (bad)
+ .byte 117,191 // jne 6989 <.literal16+0x9e9>
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // (bad)
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a9ca <_sk_callback_sse41+0xffffffffe9a34b1e>
+ .byte 220,63 // fdivrl (%rdi)
+ .byte 81 // push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,141,188,190,63,141,188,190 // lea -0x414372c1(%rsi,%r15,4),%edi
+ .byte 63 // (bad)
+ .byte 141,188,190,63,141,188,190 // lea -0x414372c1(%rsi,%rdi,4),%edi
+ .byte 63 // (bad)
+ .byte 248 // clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,254 // rex (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 75,0,0 // rex.WXB add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 75,0,0 // rex.WXB add %al,(%r8)
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 6817 <.literal16+0xa37>
+ .byte 200,66,0,0 // enterq $0x42,$0x0
+ .byte 127,67 // jg 6a97 <.literal16+0xaf7>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 681b <.literal16+0xa3b>
+ .byte 127,67 // jg 6a9b <.literal16+0xafb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 681f <.literal16+0xa3f>
+ .byte 127,67 // jg 6a9f <.literal16+0xaff>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6823 <.literal16+0xa43>
+ .byte 127,67 // jg 6aa3 <.literal16+0xb03>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -35377,16 +36071,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 68a3 <.literal16+0xac3>
+ .byte 118,63 // jbe 6b23 <.literal16+0xb83>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 68a7 <.literal16+0xac7>
+ .byte 118,63 // jbe 6b27 <.literal16+0xb87>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 68ab <.literal16+0xacb>
+ .byte 118,63 // jbe 6b2b <.literal16+0xb8b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 68af <.literal16+0xacf>
+ .byte 118,63 // jbe 6b2f <.literal16+0xb8f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -35415,11 +36109,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 691b <.literal16+0xb3b>
+ .byte 127,67 // jg 6b9b <.literal16+0xbfb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 691f <.literal16+0xb3f>
+ .byte 127,67 // jg 6b9f <.literal16+0xbff>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6923 <.literal16+0xb43>
+ .byte 127,67 // jg 6ba3 <.literal16+0xc03>
.byte 0,4,0 // add %al,(%rax,%rax,1)
.byte 0,0 // add %al,(%rax)
.byte 0,0 // add %al,(%rax)
@@ -35479,13 +36173,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6999 <.literal16+0xbb9>
+ .byte 224,7 // loopne 6c19 <.literal16+0xc79>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 699d <.literal16+0xbbd>
+ .byte 224,7 // loopne 6c1d <.literal16+0xc7d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 69a1 <.literal16+0xbc1>
+ .byte 224,7 // loopne 6c21 <.literal16+0xc81>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 69a5 <.literal16+0xbc5>
+ .byte 224,7 // loopne 6c25 <.literal16+0xc85>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -35531,13 +36225,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6a09 <.literal16+0xc29>
+ .byte 224,7 // loopne 6c89 <.literal16+0xce9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a0d <.literal16+0xc2d>
+ .byte 224,7 // loopne 6c8d <.literal16+0xced>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a11 <.literal16+0xc31>
+ .byte 224,7 // loopne 6c91 <.literal16+0xcf1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a15 <.literal16+0xc35>
+ .byte 224,7 // loopne 6c95 <.literal16+0xcf5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -35583,13 +36277,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6a79 <.literal16+0xc99>
+ .byte 224,7 // loopne 6cf9 <.literal16+0xd59>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a7d <.literal16+0xc9d>
+ .byte 224,7 // loopne 6cfd <.literal16+0xd5d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a81 <.literal16+0xca1>
+ .byte 224,7 // loopne 6d01 <.literal16+0xd61>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a85 <.literal16+0xca5>
+ .byte 224,7 // loopne 6d05 <.literal16+0xd65>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -35627,13 +36321,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 6b16 <.literal16+0xd36>
+ .byte 124,66 // jl 6d96 <.literal16+0xdf6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6b1a <.literal16+0xd3a>
+ .byte 124,66 // jl 6d9a <.literal16+0xdfa>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6b1e <.literal16+0xd3e>
+ .byte 124,66 // jl 6d9e <.literal16+0xdfe>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6b22 <.literal16+0xd42>
+ .byte 124,66 // jl 6da2 <.literal16+0xe02>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -35767,13 +36461,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6ca5 <.literal16+0xec5>
+ .byte 112,65 // jo 6f25 <.literal16+0xf85>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6ca9 <.literal16+0xec9>
+ .byte 112,65 // jo 6f29 <.literal16+0xf89>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6cad <.literal16+0xecd>
+ .byte 112,65 // jo 6f2d <.literal16+0xf8d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6cb1 <.literal16+0xed1>
+ .byte 112,65 // jo 6f31 <.literal16+0xf91>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -35788,7 +36482,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006ca0 <_sk_callback_sse41+0x3000fb2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006f20 <_sk_callback_sse41+0x3001074>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35815,7 +36509,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006ce0 <_sk_callback_sse41+0x3000ff2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006f60 <_sk_callback_sse41+0x30010b4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35842,7 +36536,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006d20 <_sk_callback_sse41+0x3001032>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006fa0 <_sk_callback_sse41+0x30010f4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35857,11 +36551,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6d7b <.literal16+0xf9b>
+ .byte 127,67 // jg 6ffb <.literal16+0x105b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6d7f <.literal16+0xf9f>
+ .byte 127,67 // jg 6fff <.literal16+0x105f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6d83 <.literal16+0xfa3>
+ .byte 127,67 // jg 7003 <.literal16+0x1063>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -35876,7 +36570,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006d70 <_sk_callback_sse41+0x3001082>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006ff0 <_sk_callback_sse41+0x3001144>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35903,7 +36597,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006db0 <_sk_callback_sse41+0x30010c2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3007030 <_sk_callback_sse41+0x3001184>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35930,7 +36624,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006df0 <_sk_callback_sse41+0x3001102>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3007070 <_sk_callback_sse41+0x30011c4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35945,11 +36639,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6e4b <.literal16+0x106b>
+ .byte 127,67 // jg 70cb <.literal16+0x112b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6e4f <.literal16+0x106f>
+ .byte 127,67 // jg 70cf <.literal16+0x112f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6e53 <.literal16+0x1073>
+ .byte 127,67 // jg 70d3 <.literal16+0x1133>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -36044,13 +36738,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 6f4b <.literal16+0x116b>
+ .byte 127,71 // jg 71cb <.literal16+0x122b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 6f4f <.literal16+0x116f>
+ .byte 127,71 // jg 71cf <.literal16+0x122f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 6f53 <.literal16+0x1173>
+ .byte 127,71 // jg 71d3 <.literal16+0x1233>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 6f57 <.literal16+0x1177>
+ .byte 127,71 // jg 71d7 <.literal16+0x1237>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -36096,10 +36790,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0808a <_sk_callback_sse41+0x2dc0239c>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0830a <_sk_callback_sse41+0x2dc0245e>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 6fbc <.literal16+0x11dc>
+ .byte 120,57 // js 723c <.literal16+0x129c>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -36280,11 +36974,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 7192 <.literal16+0x13b2>
+ .byte 62,114,28 // jb,pt 7412 <.literal16+0x1472>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7196 <.literal16+0x13b6>
+ .byte 62,114,28 // jb,pt 7416 <.literal16+0x1476>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 719a <.literal16+0x13ba>
+ .byte 62,114,28 // jb,pt 741a <.literal16+0x147a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -36328,7 +37022,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640025 <_sk_callback_sse41+0x3d63a337>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6402a5 <_sk_callback_sse41+0x3d63a3f9>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -36354,7 +37048,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640065 <_sk_callback_sse41+0x3d63a377>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6402e5 <_sk_callback_sse41+0x3d63a439>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -36363,13 +37057,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 725e <.literal16+0x147e>
+ .byte 114,28 // jb 74de <.literal16+0x153e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7262 <.literal16+0x1482>
+ .byte 62,114,28 // jb,pt 74e2 <.literal16+0x1542>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7266 <.literal16+0x1486>
+ .byte 62,114,28 // jb,pt 74e6 <.literal16+0x1546>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 726a <.literal16+0x148a>
+ .byte 62,114,28 // jb,pt 74ea <.literal16+0x154a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -36390,11 +37084,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 72a2 <.literal16+0x14c2>
+ .byte 62,114,28 // jb,pt 7522 <.literal16+0x1582>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 72a6 <.literal16+0x14c6>
+ .byte 62,114,28 // jb,pt 7526 <.literal16+0x1586>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 72aa <.literal16+0x14ca>
+ .byte 62,114,28 // jb,pt 752a <.literal16+0x158a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -36438,7 +37132,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640135 <_sk_callback_sse41+0x3d63a447>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6403b5 <_sk_callback_sse41+0x3d63a509>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -36464,7 +37158,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640175 <_sk_callback_sse41+0x3d63a487>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6403f5 <_sk_callback_sse41+0x3d63a549>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -36473,13 +37167,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 736e <.literal16+0x158e>
+ .byte 114,28 // jb 75ee <.literal16+0x164e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7372 <_sk_callback_sse41+0x1684>
+ .byte 62,114,28 // jb,pt 75f2 <_sk_callback_sse41+0x1746>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7376 <_sk_callback_sse41+0x1688>
+ .byte 62,114,28 // jb,pt 75f6 <_sk_callback_sse41+0x174a>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 737a <_sk_callback_sse41+0x168c>
+ .byte 62,114,28 // jb,pt 75fa <_sk_callback_sse41+0x174e>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -36576,7 +37270,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,252,97,0,0 // movaps 0x61fc(%rip),%xmm2 # 62c0 <_sk_callback_sse2+0xf7>
+ .byte 15,40,21,236,99,0,0 // movaps 0x63ec(%rip),%xmm2 # 64b0 <_sk_callback_sse2+0xf3>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -36585,7 +37279,7 @@ _sk_seed_shader_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,235,97,0,0 // movaps 0x61eb(%rip),%xmm2 # 62d0 <_sk_callback_sse2+0x107>
+ .byte 15,40,21,219,99,0,0 // movaps 0x63db(%rip),%xmm2 # 64c0 <_sk_callback_sse2+0x103>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -36605,14 +37299,14 @@ _sk_dither_sse2:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,185,97,0,0 // movdqa 0x61b9(%rip),%xmm10 # 62e0 <_sk_callback_sse2+0x117>
+ .byte 102,68,15,111,21,169,99,0,0 // movdqa 0x63a9(%rip),%xmm10 # 64d0 <_sk_callback_sse2+0x113>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,165,97,0,0 // movdqa 0x61a5(%rip),%xmm12 # 62f0 <_sk_callback_sse2+0x127>
- .byte 102,68,15,111,45,172,97,0,0 // movdqa 0x61ac(%rip),%xmm13 # 6300 <_sk_callback_sse2+0x137>
+ .byte 102,68,15,111,37,149,99,0,0 // movdqa 0x6395(%rip),%xmm12 # 64e0 <_sk_callback_sse2+0x123>
+ .byte 102,68,15,111,45,156,99,0,0 // movdqa 0x639c(%rip),%xmm13 # 64f0 <_sk_callback_sse2+0x133>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -36628,8 +37322,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,103,97,0,0 // mulps 0x6167(%rip),%xmm8 # 6310 <_sk_callback_sse2+0x147>
- .byte 68,15,88,5,111,97,0,0 // addps 0x616f(%rip),%xmm8 # 6320 <_sk_callback_sse2+0x157>
+ .byte 68,15,89,5,87,99,0,0 // mulps 0x6357(%rip),%xmm8 # 6500 <_sk_callback_sse2+0x143>
+ .byte 68,15,88,5,95,99,0,0 // addps 0x635f(%rip),%xmm8 # 6510 <_sk_callback_sse2+0x153>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -36671,7 +37365,7 @@ HIDDEN _sk_black_color_sse2
FUNCTION(_sk_black_color_sse2)
_sk_black_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,5,97,0,0 // movaps 0x6105(%rip),%xmm3 # 6330 <_sk_callback_sse2+0x167>
+ .byte 15,40,29,245,98,0,0 // movaps 0x62f5(%rip),%xmm3 # 6520 <_sk_callback_sse2+0x163>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -36682,7 +37376,7 @@ HIDDEN _sk_white_color_sse2
FUNCTION(_sk_white_color_sse2)
_sk_white_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,1,97,0,0 // movaps 0x6101(%rip),%xmm0 # 6340 <_sk_callback_sse2+0x177>
+ .byte 15,40,5,241,98,0,0 // movaps 0x62f1(%rip),%xmm0 # 6530 <_sk_callback_sse2+0x173>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -36728,7 +37422,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,193,96,0,0 // movaps 0x60c1(%rip),%xmm8 # 6350 <_sk_callback_sse2+0x187>
+ .byte 68,15,40,5,177,98,0,0 // movaps 0x62b1(%rip),%xmm8 # 6540 <_sk_callback_sse2+0x183>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -36753,7 +37447,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,132,96,0,0 // movaps 0x6084(%rip),%xmm9 # 6360 <_sk_callback_sse2+0x197>
+ .byte 68,15,40,13,116,98,0,0 // movaps 0x6274(%rip),%xmm9 # 6550 <_sk_callback_sse2+0x193>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -36800,7 +37494,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,40,96,0,0 // movaps 0x6028(%rip),%xmm8 # 6370 <_sk_callback_sse2+0x1a7>
+ .byte 68,15,40,5,24,98,0,0 // movaps 0x6218(%rip),%xmm8 # 6560 <_sk_callback_sse2+0x1a3>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -36813,7 +37507,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,24,96,0,0 // movaps 0x6018(%rip),%xmm8 # 6380 <_sk_callback_sse2+0x1b7>
+ .byte 68,15,40,5,8,98,0,0 // movaps 0x6208(%rip),%xmm8 # 6570 <_sk_callback_sse2+0x1b3>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -36830,7 +37524,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,251,95,0,0 // movaps 0x5ffb(%rip),%xmm8 # 6390 <_sk_callback_sse2+0x1c7>
+ .byte 68,15,40,5,235,97,0,0 // movaps 0x61eb(%rip),%xmm8 # 6580 <_sk_callback_sse2+0x1c3>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -36850,7 +37544,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,207,95,0,0 // movaps 0x5fcf(%rip),%xmm8 # 63a0 <_sk_callback_sse2+0x1d7>
+ .byte 68,15,40,5,191,97,0,0 // movaps 0x61bf(%rip),%xmm8 # 6590 <_sk_callback_sse2+0x1d3>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -36878,7 +37572,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,163,95,0,0 // movaps 0x5fa3(%rip),%xmm8 # 63b0 <_sk_callback_sse2+0x1e7>
+ .byte 68,15,40,5,147,97,0,0 // movaps 0x6193(%rip),%xmm8 # 65a0 <_sk_callback_sse2+0x1e3>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -36953,7 +37647,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,216,94,0,0 // movaps 0x5ed8(%rip),%xmm3 # 63c0 <_sk_callback_sse2+0x1f7>
+ .byte 15,40,29,200,96,0,0 // movaps 0x60c8(%rip),%xmm3 # 65b0 <_sk_callback_sse2+0x1f3>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -37001,7 +37695,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,67,94,0,0 // movaps 0x5e43(%rip),%xmm2 # 63d0 <_sk_callback_sse2+0x207>
+ .byte 15,40,21,51,96,0,0 // movaps 0x6033(%rip),%xmm2 # 65c0 <_sk_callback_sse2+0x203>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37035,7 +37729,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,232,93,0,0 // movaps 0x5de8(%rip),%xmm2 # 63e0 <_sk_callback_sse2+0x217>
+ .byte 15,40,21,216,95,0,0 // movaps 0x5fd8(%rip),%xmm2 # 65d0 <_sk_callback_sse2+0x213>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37072,7 +37766,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,130,93,0,0 // movaps 0x5d82(%rip),%xmm2 # 63f0 <_sk_callback_sse2+0x227>
+ .byte 15,40,21,114,95,0,0 // movaps 0x5f72(%rip),%xmm2 # 65e0 <_sk_callback_sse2+0x223>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37100,7 +37794,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,66,93,0,0 // movaps 0x5d42(%rip),%xmm2 # 6400 <_sk_callback_sse2+0x237>
+ .byte 15,40,21,50,95,0,0 // movaps 0x5f32(%rip),%xmm2 # 65f0 <_sk_callback_sse2+0x233>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37113,7 +37807,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,53,93,0,0 // movaps 0x5d35(%rip),%xmm10 # 6410 <_sk_callback_sse2+0x247>
+ .byte 68,15,40,21,37,95,0,0 // movaps 0x5f25(%rip),%xmm10 # 6600 <_sk_callback_sse2+0x243>
.byte 69,15,40,202 // movaps %xmm10,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,217 // movaps %xmm9,%xmm11
@@ -37207,7 +37901,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,235,91,0,0 // movaps 0x5beb(%rip),%xmm10 # 6420 <_sk_callback_sse2+0x257>
+ .byte 68,15,40,21,219,93,0,0 // movaps 0x5ddb(%rip),%xmm10 # 6610 <_sk_callback_sse2+0x253>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -37301,7 +37995,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,160,90,0,0 // movaps 0x5aa0(%rip),%xmm11 # 6430 <_sk_callback_sse2+0x267>
+ .byte 68,15,40,29,144,92,0,0 // movaps 0x5c90(%rip),%xmm11 # 6620 <_sk_callback_sse2+0x263>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -37389,7 +38083,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,110,89,0,0 // movaps 0x596e(%rip),%xmm9 # 6440 <_sk_callback_sse2+0x277>
+ .byte 68,15,40,13,94,91,0,0 // movaps 0x5b5e(%rip),%xmm9 # 6630 <_sk_callback_sse2+0x273>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -37480,7 +38174,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,43,88,0,0 // movaps 0x582b(%rip),%xmm9 # 6450 <_sk_callback_sse2+0x287>
+ .byte 68,15,40,13,27,90,0,0 // movaps 0x5a1b(%rip),%xmm9 # 6640 <_sk_callback_sse2+0x283>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -37493,10 +38187,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,5,88,0,0 // movaps 0x5805(%rip),%xmm14 # 6460 <_sk_callback_sse2+0x297>
+ .byte 68,15,40,53,245,89,0,0 // movaps 0x59f5(%rip),%xmm14 # 6650 <_sk_callback_sse2+0x293>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,5,88,0,0 // movaps 0x5805(%rip),%xmm10 # 6470 <_sk_callback_sse2+0x2a7>
+ .byte 68,15,40,21,245,89,0,0 // movaps 0x59f5(%rip),%xmm10 # 6660 <_sk_callback_sse2+0x2a3>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -37641,7 +38335,7 @@ _sk_hue_sse2:
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,40,5,72,86,0,0 // movaps 0x5648(%rip),%xmm8 # 64b0 <_sk_callback_sse2+0x2e7>
+ .byte 68,15,40,5,56,88,0,0 // movaps 0x5838(%rip),%xmm8 # 66a0 <_sk_callback_sse2+0x2e3>
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 15,40,207 // movaps %xmm7,%xmm1
.byte 68,15,92,217 // subps %xmm1,%xmm11
@@ -37689,12 +38383,12 @@ _sk_hue_sse2:
.byte 69,15,84,206 // andps %xmm14,%xmm9
.byte 69,15,84,214 // andps %xmm14,%xmm10
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,61,85,85,0,0 // movaps 0x5555(%rip),%xmm15 # 6480 <_sk_callback_sse2+0x2b7>
+ .byte 68,15,40,61,69,87,0,0 // movaps 0x5745(%rip),%xmm15 # 6670 <_sk_callback_sse2+0x2b3>
.byte 65,15,89,231 // mulps %xmm15,%xmm4
- .byte 15,40,5,90,85,0,0 // movaps 0x555a(%rip),%xmm0 # 6490 <_sk_callback_sse2+0x2c7>
+ .byte 15,40,5,74,87,0,0 // movaps 0x574a(%rip),%xmm0 # 6680 <_sk_callback_sse2+0x2c3>
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
- .byte 68,15,40,53,92,85,0,0 // movaps 0x555c(%rip),%xmm14 # 64a0 <_sk_callback_sse2+0x2d7>
+ .byte 68,15,40,53,76,87,0,0 // movaps 0x574c(%rip),%xmm14 # 6690 <_sk_callback_sse2+0x2d3>
.byte 68,15,40,239 // movaps %xmm7,%xmm13
.byte 69,15,89,238 // mulps %xmm14,%xmm13
.byte 68,15,88,238 // addps %xmm6,%xmm13
@@ -37872,14 +38566,14 @@ _sk_saturation_sse2:
.byte 68,15,84,211 // andps %xmm3,%xmm10
.byte 68,15,84,203 // andps %xmm3,%xmm9
.byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,40,5,238,82,0,0 // movaps 0x52ee(%rip),%xmm8 # 64c0 <_sk_callback_sse2+0x2f7>
+ .byte 68,15,40,5,222,84,0,0 // movaps 0x54de(%rip),%xmm8 # 66b0 <_sk_callback_sse2+0x2f3>
.byte 15,40,214 // movaps %xmm6,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,40,13,240,82,0,0 // movaps 0x52f0(%rip),%xmm1 # 64d0 <_sk_callback_sse2+0x307>
+ .byte 15,40,13,224,84,0,0 // movaps 0x54e0(%rip),%xmm1 # 66c0 <_sk_callback_sse2+0x303>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,217 // mulps %xmm1,%xmm3
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,37,239,82,0,0 // movaps 0x52ef(%rip),%xmm12 # 64e0 <_sk_callback_sse2+0x317>
+ .byte 68,15,40,37,223,84,0,0 // movaps 0x54df(%rip),%xmm12 # 66d0 <_sk_callback_sse2+0x313>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
.byte 65,15,40,210 // movaps %xmm10,%xmm2
@@ -37924,7 +38618,7 @@ _sk_saturation_sse2:
.byte 15,40,223 // movaps %xmm7,%xmm3
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 68,15,40,5,84,82,0,0 // movaps 0x5254(%rip),%xmm8 # 64f0 <_sk_callback_sse2+0x327>
+ .byte 68,15,40,5,68,84,0,0 // movaps 0x5444(%rip),%xmm8 # 66e0 <_sk_callback_sse2+0x323>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 15,88,253 // addps %xmm5,%xmm7
@@ -38025,14 +38719,14 @@ _sk_color_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 68,15,40,45,242,80,0,0 // movaps 0x50f2(%rip),%xmm13 # 6500 <_sk_callback_sse2+0x337>
+ .byte 68,15,40,45,226,82,0,0 // movaps 0x52e2(%rip),%xmm13 # 66f0 <_sk_callback_sse2+0x333>
.byte 68,15,40,198 // movaps %xmm6,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,242,80,0,0 // movaps 0x50f2(%rip),%xmm14 # 6510 <_sk_callback_sse2+0x347>
+ .byte 68,15,40,53,226,82,0,0 // movaps 0x52e2(%rip),%xmm14 # 6700 <_sk_callback_sse2+0x343>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,29,238,80,0,0 // movaps 0x50ee(%rip),%xmm11 # 6520 <_sk_callback_sse2+0x357>
+ .byte 68,15,40,29,222,82,0,0 // movaps 0x52de(%rip),%xmm11 # 6710 <_sk_callback_sse2+0x353>
.byte 69,15,89,227 // mulps %xmm11,%xmm12
.byte 68,15,88,224 // addps %xmm0,%xmm12
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -38040,7 +38734,7 @@ _sk_color_sse2:
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 68,15,40,5,218,80,0,0 // movaps 0x50da(%rip),%xmm8 # 6530 <_sk_callback_sse2+0x367>
+ .byte 68,15,40,5,202,82,0,0 // movaps 0x52ca(%rip),%xmm8 # 6720 <_sk_callback_sse2+0x363>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,89,252 // mulps %xmm4,%xmm7
@@ -38176,15 +38870,15 @@ _sk_luminosity_sse2:
.byte 68,15,40,205 // movaps %xmm5,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 68,15,40,37,241,78,0,0 // movaps 0x4ef1(%rip),%xmm12 # 6540 <_sk_callback_sse2+0x377>
+ .byte 68,15,40,37,225,80,0,0 // movaps 0x50e1(%rip),%xmm12 # 6730 <_sk_callback_sse2+0x373>
.byte 68,15,40,199 // movaps %xmm7,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,241,78,0,0 // movaps 0x4ef1(%rip),%xmm13 # 6550 <_sk_callback_sse2+0x387>
+ .byte 68,15,40,45,225,80,0,0 // movaps 0x50e1(%rip),%xmm13 # 6740 <_sk_callback_sse2+0x383>
.byte 68,15,40,241 // movaps %xmm1,%xmm14
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 69,15,88,240 // addps %xmm8,%xmm14
- .byte 68,15,40,29,237,78,0,0 // movaps 0x4eed(%rip),%xmm11 # 6560 <_sk_callback_sse2+0x397>
- .byte 68,15,40,5,245,78,0,0 // movaps 0x4ef5(%rip),%xmm8 # 6570 <_sk_callback_sse2+0x3a7>
+ .byte 68,15,40,29,221,80,0,0 // movaps 0x50dd(%rip),%xmm11 # 6750 <_sk_callback_sse2+0x393>
+ .byte 68,15,40,5,229,80,0,0 // movaps 0x50e5(%rip),%xmm8 # 6760 <_sk_callback_sse2+0x3a3>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 68,15,92,248 // subps %xmm0,%xmm15
@@ -38328,7 +39022,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,133,228,0,0,0 // jne 1966 <_sk_srcover_rgba_8888_sse2+0x104>
.byte 243,69,15,111,4,129 // movdqu (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,53,237,76,0,0 // movdqa 0x4ced(%rip),%xmm6 # 6580 <_sk_callback_sse2+0x3b7>
+ .byte 102,15,111,53,221,78,0,0 // movdqa 0x4edd(%rip),%xmm6 # 6770 <_sk_callback_sse2+0x3b3>
.byte 102,65,15,111,224 // movdqa %xmm8,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
@@ -38342,9 +39036,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,91,247 // cvtdq2ps %xmm7,%xmm6
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7
- .byte 68,15,40,5,189,76,0,0 // movaps 0x4cbd(%rip),%xmm8 # 6590 <_sk_callback_sse2+0x3c7>
+ .byte 68,15,40,5,173,78,0,0 // movaps 0x4ead(%rip),%xmm8 # 6780 <_sk_callback_sse2+0x3c3>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,193,76,0,0 // movaps 0x4cc1(%rip),%xmm12 # 65a0 <_sk_callback_sse2+0x3d7>
+ .byte 68,15,40,37,177,78,0,0 // movaps 0x4eb1(%rip),%xmm12 # 6790 <_sk_callback_sse2+0x3d3>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -38424,7 +39118,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,173,75,0,0 // movaps 0x4bad(%rip),%xmm8 # 65b0 <_sk_callback_sse2+0x3e7>
+ .byte 68,15,40,5,157,77,0,0 // movaps 0x4d9d(%rip),%xmm8 # 67a0 <_sk_callback_sse2+0x3e3>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -38436,7 +39130,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,162,75,0,0 // minps 0x4ba2(%rip),%xmm3 # 65c0 <_sk_callback_sse2+0x3f7>
+ .byte 15,93,29,146,77,0,0 // minps 0x4d92(%rip),%xmm3 # 67b0 <_sk_callback_sse2+0x3f3>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -38447,7 +39141,7 @@ HIDDEN _sk_clamp_a_dst_sse2
.globl _sk_clamp_a_dst_sse2
FUNCTION(_sk_clamp_a_dst_sse2)
_sk_clamp_a_dst_sse2:
- .byte 15,93,61,158,75,0,0 // minps 0x4b9e(%rip),%xmm7 # 65d0 <_sk_callback_sse2+0x407>
+ .byte 15,93,61,142,77,0,0 // minps 0x4d8e(%rip),%xmm7 # 67c0 <_sk_callback_sse2+0x403>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -38482,7 +39176,7 @@ HIDDEN _sk_invert_sse2
.globl _sk_invert_sse2
FUNCTION(_sk_invert_sse2)
_sk_invert_sse2:
- .byte 68,15,40,5,106,75,0,0 // movaps 0x4b6a(%rip),%xmm8 # 65e0 <_sk_callback_sse2+0x417>
+ .byte 68,15,40,5,90,77,0,0 // movaps 0x4d5a(%rip),%xmm8 # 67d0 <_sk_callback_sse2+0x413>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -38544,7 +39238,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,4,75,0,0 // movaps 0x4b04(%rip),%xmm9 # 65f0 <_sk_callback_sse2+0x427>
+ .byte 68,15,40,13,244,76,0,0 // movaps 0x4cf4(%rip),%xmm9 # 67e0 <_sk_callback_sse2+0x423>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -38558,20 +39252,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,239,74,0,0 // movaps 0x4aef(%rip),%xmm8 # 6600 <_sk_callback_sse2+0x437>
+ .byte 68,15,40,5,223,76,0,0 // movaps 0x4cdf(%rip),%xmm8 # 67f0 <_sk_callback_sse2+0x433>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,231,74,0,0 // movaps 0x4ae7(%rip),%xmm9 # 6610 <_sk_callback_sse2+0x447>
+ .byte 68,15,40,13,215,76,0,0 // movaps 0x4cd7(%rip),%xmm9 # 6800 <_sk_callback_sse2+0x443>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,231,74,0,0 // movaps 0x4ae7(%rip),%xmm10 # 6620 <_sk_callback_sse2+0x457>
+ .byte 68,15,40,21,215,76,0,0 // movaps 0x4cd7(%rip),%xmm10 # 6810 <_sk_callback_sse2+0x453>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,231,74,0,0 // movaps 0x4ae7(%rip),%xmm11 # 6630 <_sk_callback_sse2+0x467>
+ .byte 68,15,40,29,215,76,0,0 // movaps 0x4cd7(%rip),%xmm11 # 6820 <_sk_callback_sse2+0x463>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,235,74,0,0 // movaps 0x4aeb(%rip),%xmm12 # 6640 <_sk_callback_sse2+0x477>
+ .byte 68,15,40,37,219,76,0,0 // movaps 0x4cdb(%rip),%xmm12 # 6830 <_sk_callback_sse2+0x473>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -38607,20 +39301,20 @@ HIDDEN _sk_from_srgb_dst_sse2
.globl _sk_from_srgb_dst_sse2
FUNCTION(_sk_from_srgb_dst_sse2)
_sk_from_srgb_dst_sse2:
- .byte 68,15,40,5,124,74,0,0 // movaps 0x4a7c(%rip),%xmm8 # 6650 <_sk_callback_sse2+0x487>
+ .byte 68,15,40,5,108,76,0,0 // movaps 0x4c6c(%rip),%xmm8 # 6840 <_sk_callback_sse2+0x483>
.byte 68,15,40,236 // movaps %xmm4,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,220 // movaps %xmm4,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,116,74,0,0 // movaps 0x4a74(%rip),%xmm9 # 6660 <_sk_callback_sse2+0x497>
+ .byte 68,15,40,13,100,76,0,0 // movaps 0x4c64(%rip),%xmm9 # 6850 <_sk_callback_sse2+0x493>
.byte 68,15,40,244 // movaps %xmm4,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,116,74,0,0 // movaps 0x4a74(%rip),%xmm10 # 6670 <_sk_callback_sse2+0x4a7>
+ .byte 68,15,40,21,100,76,0,0 // movaps 0x4c64(%rip),%xmm10 # 6860 <_sk_callback_sse2+0x4a3>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,116,74,0,0 // movaps 0x4a74(%rip),%xmm11 # 6680 <_sk_callback_sse2+0x4b7>
+ .byte 68,15,40,29,100,76,0,0 // movaps 0x4c64(%rip),%xmm11 # 6870 <_sk_callback_sse2+0x4b3>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,120,74,0,0 // movaps 0x4a78(%rip),%xmm12 # 6690 <_sk_callback_sse2+0x4c7>
+ .byte 68,15,40,37,104,76,0,0 // movaps 0x4c68(%rip),%xmm12 # 6880 <_sk_callback_sse2+0x4c3>
.byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4
.byte 68,15,84,236 // andps %xmm4,%xmm13
.byte 65,15,85,230 // andnps %xmm14,%xmm4
@@ -38657,22 +39351,22 @@ HIDDEN _sk_to_srgb_sse2
FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 68,15,82,232 // rsqrtps %xmm0,%xmm13
- .byte 68,15,40,5,5,74,0,0 // movaps 0x4a05(%rip),%xmm8 # 66a0 <_sk_callback_sse2+0x4d7>
+ .byte 68,15,40,5,245,75,0,0 // movaps 0x4bf5(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x4d3>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,13,5,74,0,0 // movaps 0x4a05(%rip),%xmm9 # 66b0 <_sk_callback_sse2+0x4e7>
+ .byte 68,15,40,13,245,75,0,0 // movaps 0x4bf5(%rip),%xmm9 # 68a0 <_sk_callback_sse2+0x4e3>
.byte 69,15,40,253 // movaps %xmm13,%xmm15
.byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,40,21,5,74,0,0 // movaps 0x4a05(%rip),%xmm10 # 66c0 <_sk_callback_sse2+0x4f7>
+ .byte 68,15,40,21,245,75,0,0 // movaps 0x4bf5(%rip),%xmm10 # 68b0 <_sk_callback_sse2+0x4f3>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,40,29,5,74,0,0 // movaps 0x4a05(%rip),%xmm11 # 66d0 <_sk_callback_sse2+0x507>
+ .byte 68,15,40,29,245,75,0,0 // movaps 0x4bf5(%rip),%xmm11 # 68c0 <_sk_callback_sse2+0x503>
.byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 68,15,40,37,9,74,0,0 // movaps 0x4a09(%rip),%xmm12 # 66e0 <_sk_callback_sse2+0x517>
+ .byte 68,15,40,37,249,75,0,0 // movaps 0x4bf9(%rip),%xmm12 # 68d0 <_sk_callback_sse2+0x513>
.byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 69,15,83,237 // rcpps %xmm13,%xmm13
.byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,61,5,74,0,0 // movaps 0x4a05(%rip),%xmm15 # 66f0 <_sk_callback_sse2+0x527>
+ .byte 68,15,40,61,245,75,0,0 // movaps 0x4bf5(%rip),%xmm15 # 68e0 <_sk_callback_sse2+0x523>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,197 // andnps %xmm13,%xmm0
@@ -38722,7 +39416,7 @@ _sk_rgb_to_hsl_sse2:
.byte 68,15,93,218 // minps %xmm2,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,94,73,0,0 // movaps 0x495e(%rip),%xmm13 # 6700 <_sk_callback_sse2+0x537>
+ .byte 68,15,40,45,78,75,0,0 // movaps 0x4b4e(%rip),%xmm13 # 68f0 <_sk_callback_sse2+0x533>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -38731,30 +39425,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,68,73,0,0 // andps 0x4944(%rip),%xmm14 # 6710 <_sk_callback_sse2+0x547>
+ .byte 68,15,84,53,52,75,0,0 // andps 0x4b34(%rip),%xmm14 # 6900 <_sk_callback_sse2+0x543>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,55,73,0,0 // movaps 0x4937(%rip),%xmm12 # 6720 <_sk_callback_sse2+0x557>
+ .byte 68,15,40,37,39,75,0,0 // movaps 0x4b27(%rip),%xmm12 # 6910 <_sk_callback_sse2+0x553>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,51,73,0,0 // addps 0x4933(%rip),%xmm8 # 6730 <_sk_callback_sse2+0x567>
+ .byte 68,15,88,5,35,75,0,0 // addps 0x4b23(%rip),%xmm8 # 6920 <_sk_callback_sse2+0x563>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,36,73,0,0 // mulps 0x4924(%rip),%xmm0 # 6740 <_sk_callback_sse2+0x577>
+ .byte 15,89,5,20,75,0,0 // mulps 0x4b14(%rip),%xmm0 # 6930 <_sk_callback_sse2+0x573>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,23,73,0,0 // movaps 0x4917(%rip),%xmm9 # 6750 <_sk_callback_sse2+0x587>
+ .byte 68,15,40,13,7,75,0,0 // movaps 0x4b07(%rip),%xmm9 # 6940 <_sk_callback_sse2+0x583>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -38778,7 +39472,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,214,72,0,0 // movaps 0x48d6(%rip),%xmm9 # 6760 <_sk_callback_sse2+0x597>
+ .byte 68,15,40,13,198,74,0,0 // movaps 0x4ac6(%rip),%xmm9 # 6950 <_sk_callback_sse2+0x593>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -38795,28 +39489,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,159,72,0,0 // movaps 0x489f(%rip),%xmm0 # 6770 <_sk_callback_sse2+0x5a7>
+ .byte 15,40,5,143,74,0,0 // movaps 0x4a8f(%rip),%xmm0 # 6960 <_sk_callback_sse2+0x5a3>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,151,72,0,0 // andps 0x4897(%rip),%xmm3 # 6780 <_sk_callback_sse2+0x5b7>
+ .byte 15,84,29,135,74,0,0 // andps 0x4a87(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x5b3>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,153,72,0,0 // movaps 0x4899(%rip),%xmm13 # 6790 <_sk_callback_sse2+0x5c7>
+ .byte 68,15,40,45,137,74,0,0 // movaps 0x4a89(%rip),%xmm13 # 6980 <_sk_callback_sse2+0x5c3>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,169,72,0,0 // movaps 0x48a9(%rip),%xmm2 # 67c0 <_sk_callback_sse2+0x5f7>
+ .byte 15,40,21,153,74,0,0 // movaps 0x4a99(%rip),%xmm2 # 69b0 <_sk_callback_sse2+0x5f3>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,121,72,0,0 // movaps 0x4879(%rip),%xmm1 # 67a0 <_sk_callback_sse2+0x5d7>
+ .byte 15,40,13,105,74,0,0 // movaps 0x4a69(%rip),%xmm1 # 6990 <_sk_callback_sse2+0x5d3>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,127,72,0,0 // movaps 0x487f(%rip),%xmm5 # 67b0 <_sk_callback_sse2+0x5e7>
+ .byte 15,40,45,111,74,0,0 // movaps 0x4a6f(%rip),%xmm5 # 69a0 <_sk_callback_sse2+0x5e3>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -38839,7 +39533,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,244,71,0,0 // andps 0x47f4(%rip),%xmm3 # 6780 <_sk_callback_sse2+0x5b7>
+ .byte 15,84,29,228,73,0,0 // andps 0x49e4(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x5b3>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -38869,12 +39563,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,204,71,0,0 // addps 0x47cc(%rip),%xmm6 # 67d0 <_sk_callback_sse2+0x607>
+ .byte 15,88,53,188,73,0,0 // addps 0x49bc(%rip),%xmm6 # 69c0 <_sk_callback_sse2+0x603>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,103,71,0,0 // andps 0x4767(%rip),%xmm3 # 6780 <_sk_callback_sse2+0x5b7>
+ .byte 15,84,29,87,73,0,0 // andps 0x4957(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x5b3>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -38942,9 +39636,9 @@ _sk_scale_u8_sse2:
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,234,70,0,0 // pand 0x46ea(%rip),%xmm8 # 67e0 <_sk_callback_sse2+0x617>
+ .byte 102,68,15,219,5,218,72,0,0 // pand 0x48da(%rip),%xmm8 # 69d0 <_sk_callback_sse2+0x613>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,238,70,0,0 // mulps 0x46ee(%rip),%xmm8 # 67f0 <_sk_callback_sse2+0x627>
+ .byte 68,15,89,5,222,72,0,0 // mulps 0x48de(%rip),%xmm8 # 69e0 <_sk_callback_sse2+0x623>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -39011,9 +39705,9 @@ _sk_lerp_u8_sse2:
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,36,70,0,0 // pand 0x4624(%rip),%xmm8 # 6800 <_sk_callback_sse2+0x637>
+ .byte 102,68,15,219,5,20,72,0,0 // pand 0x4814(%rip),%xmm8 # 69f0 <_sk_callback_sse2+0x633>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,40,70,0,0 // mulps 0x4628(%rip),%xmm8 # 6810 <_sk_callback_sse2+0x647>
+ .byte 68,15,89,5,24,72,0,0 // mulps 0x4818(%rip),%xmm8 # 6a00 <_sk_callback_sse2+0x643>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -39065,17 +39759,17 @@ _sk_lerp_565_sse2:
.byte 15,133,156,0,0,0 // jne 232b <_sk_lerp_565_sse2+0xbb>
.byte 243,71,15,126,12,89 // movq (%r9,%r11,2),%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
- .byte 102,68,15,111,5,125,69,0,0 // movdqa 0x457d(%rip),%xmm8 # 6820 <_sk_callback_sse2+0x657>
+ .byte 102,68,15,111,5,109,71,0,0 // movdqa 0x476d(%rip),%xmm8 # 6a10 <_sk_callback_sse2+0x653>
.byte 102,69,15,219,193 // pand %xmm9,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,124,69,0,0 // mulps 0x457c(%rip),%xmm8 # 6830 <_sk_callback_sse2+0x667>
- .byte 102,68,15,111,21,131,69,0,0 // movdqa 0x4583(%rip),%xmm10 # 6840 <_sk_callback_sse2+0x677>
+ .byte 68,15,89,5,108,71,0,0 // mulps 0x476c(%rip),%xmm8 # 6a20 <_sk_callback_sse2+0x663>
+ .byte 102,68,15,111,21,115,71,0,0 // movdqa 0x4773(%rip),%xmm10 # 6a30 <_sk_callback_sse2+0x673>
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,130,69,0,0 // mulps 0x4582(%rip),%xmm10 # 6850 <_sk_callback_sse2+0x687>
- .byte 102,68,15,219,13,137,69,0,0 // pand 0x4589(%rip),%xmm9 # 6860 <_sk_callback_sse2+0x697>
+ .byte 68,15,89,21,114,71,0,0 // mulps 0x4772(%rip),%xmm10 # 6a40 <_sk_callback_sse2+0x683>
+ .byte 102,68,15,219,13,121,71,0,0 // pand 0x4779(%rip),%xmm9 # 6a50 <_sk_callback_sse2+0x693>
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,141,69,0,0 // mulps 0x458d(%rip),%xmm9 # 6870 <_sk_callback_sse2+0x6a7>
+ .byte 68,15,89,13,125,71,0,0 // mulps 0x477d(%rip),%xmm9 # 6a60 <_sk_callback_sse2+0x6a3>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -39129,7 +39823,7 @@ _sk_load_tables_sse2:
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,68,15,111,5,220,68,0,0 // movdqa 0x44dc(%rip),%xmm8 # 6880 <_sk_callback_sse2+0x6b7>
+ .byte 102,68,15,111,5,204,70,0,0 // movdqa 0x46cc(%rip),%xmm8 # 6a70 <_sk_callback_sse2+0x6b3>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -39185,7 +39879,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,229,67,0,0 // mulps 0x43e5(%rip),%xmm3 # 6890 <_sk_callback_sse2+0x6c7>
+ .byte 15,89,29,213,69,0,0 // mulps 0x45d5(%rip),%xmm3 # 6a80 <_sk_callback_sse2+0x6c3>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -39227,7 +39921,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,90,67,0,0 // movdqa 0x435a(%rip),%xmm10 # 68a0 <_sk_callback_sse2+0x6d7>
+ .byte 102,68,15,111,21,74,69,0,0 // movdqa 0x454a(%rip),%xmm10 # 6a90 <_sk_callback_sse2+0x6d3>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -39289,7 +39983,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,69,66,0,0 // mulps 0x4245(%rip),%xmm3 # 68b0 <_sk_callback_sse2+0x6e7>
+ .byte 15,89,29,53,68,0,0 // mulps 0x4435(%rip),%xmm3 # 6aa0 <_sk_callback_sse2+0x6e3>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -39332,7 +40026,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,180,65,0,0 // movdqa 0x41b4(%rip),%xmm8 # 68c0 <_sk_callback_sse2+0x6f7>
+ .byte 102,68,15,111,5,164,67,0,0 // movdqa 0x43a4(%rip),%xmm8 # 6ab0 <_sk_callback_sse2+0x6f3>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -39388,7 +40082,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,191,64,0,0 // movaps 0x40bf(%rip),%xmm3 # 68d0 <_sk_callback_sse2+0x707>
+ .byte 15,40,29,175,66,0,0 // movaps 0x42af(%rip),%xmm3 # 6ac0 <_sk_callback_sse2+0x703>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -39422,7 +40116,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,88,64,0,0 // movaps 0x4058(%rip),%xmm8 # 68e0 <_sk_callback_sse2+0x717>
+ .byte 68,15,40,5,72,66,0,0 // movaps 0x4248(%rip),%xmm8 # 6ad0 <_sk_callback_sse2+0x713>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -39450,7 +40144,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,242,63,0,0 // movaps 0x3ff2(%rip),%xmm10 # 68f0 <_sk_callback_sse2+0x727>
+ .byte 68,15,40,21,226,65,0,0 // movaps 0x41e2(%rip),%xmm10 # 6ae0 <_sk_callback_sse2+0x723>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -39571,7 +40265,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,58,62,0,0 // movaps 0x3e3a(%rip),%xmm10 # 6900 <_sk_callback_sse2+0x737>
+ .byte 68,15,40,21,42,64,0,0 // movaps 0x402a(%rip),%xmm10 # 6af0 <_sk_callback_sse2+0x733>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -39778,15 +40472,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,110,59,0,0 // mulps 0x3b6e(%rip),%xmm9 # 6910 <_sk_callback_sse2+0x747>
- .byte 68,15,84,21,118,59,0,0 // andps 0x3b76(%rip),%xmm10 # 6920 <_sk_callback_sse2+0x757>
- .byte 68,15,86,21,126,59,0,0 // orps 0x3b7e(%rip),%xmm10 # 6930 <_sk_callback_sse2+0x767>
- .byte 68,15,88,13,134,59,0,0 // addps 0x3b86(%rip),%xmm9 # 6940 <_sk_callback_sse2+0x777>
- .byte 68,15,40,37,142,59,0,0 // movaps 0x3b8e(%rip),%xmm12 # 6950 <_sk_callback_sse2+0x787>
+ .byte 68,15,89,13,94,61,0,0 // mulps 0x3d5e(%rip),%xmm9 # 6b00 <_sk_callback_sse2+0x743>
+ .byte 68,15,84,21,102,61,0,0 // andps 0x3d66(%rip),%xmm10 # 6b10 <_sk_callback_sse2+0x753>
+ .byte 68,15,86,21,110,61,0,0 // orps 0x3d6e(%rip),%xmm10 # 6b20 <_sk_callback_sse2+0x763>
+ .byte 68,15,88,13,118,61,0,0 // addps 0x3d76(%rip),%xmm9 # 6b30 <_sk_callback_sse2+0x773>
+ .byte 68,15,40,37,126,61,0,0 // movaps 0x3d7e(%rip),%xmm12 # 6b40 <_sk_callback_sse2+0x783>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,142,59,0,0 // addps 0x3b8e(%rip),%xmm10 # 6960 <_sk_callback_sse2+0x797>
- .byte 68,15,40,37,150,59,0,0 // movaps 0x3b96(%rip),%xmm12 # 6970 <_sk_callback_sse2+0x7a7>
+ .byte 68,15,88,21,126,61,0,0 // addps 0x3d7e(%rip),%xmm10 # 6b50 <_sk_callback_sse2+0x793>
+ .byte 68,15,40,37,134,61,0,0 // movaps 0x3d86(%rip),%xmm12 # 6b60 <_sk_callback_sse2+0x7a3>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -39794,22 +40488,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,128,59,0,0 // movaps 0x3b80(%rip),%xmm10 # 6980 <_sk_callback_sse2+0x7b7>
+ .byte 68,15,40,21,112,61,0,0 // movaps 0x3d70(%rip),%xmm10 # 6b70 <_sk_callback_sse2+0x7b3>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,116,59,0,0 // addps 0x3b74(%rip),%xmm9 # 6990 <_sk_callback_sse2+0x7c7>
- .byte 68,15,40,37,124,59,0,0 // movaps 0x3b7c(%rip),%xmm12 # 69a0 <_sk_callback_sse2+0x7d7>
+ .byte 68,15,88,13,100,61,0,0 // addps 0x3d64(%rip),%xmm9 # 6b80 <_sk_callback_sse2+0x7c3>
+ .byte 68,15,40,37,108,61,0,0 // movaps 0x3d6c(%rip),%xmm12 # 6b90 <_sk_callback_sse2+0x7d3>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,124,59,0,0 // movaps 0x3b7c(%rip),%xmm12 # 69b0 <_sk_callback_sse2+0x7e7>
+ .byte 68,15,40,37,108,61,0,0 // movaps 0x3d6c(%rip),%xmm12 # 6ba0 <_sk_callback_sse2+0x7e3>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,128,59,0,0 // movaps 0x3b80(%rip),%xmm13 # 69c0 <_sk_callback_sse2+0x7f7>
+ .byte 68,15,40,45,112,61,0,0 // movaps 0x3d70(%rip),%xmm13 # 6bb0 <_sk_callback_sse2+0x7f3>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,128,59,0,0 // mulps 0x3b80(%rip),%xmm13 # 69d0 <_sk_callback_sse2+0x807>
+ .byte 68,15,89,45,112,61,0,0 // mulps 0x3d70(%rip),%xmm13 # 6bc0 <_sk_callback_sse2+0x803>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -39845,15 +40539,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,0,59,0,0 // mulps 0x3b00(%rip),%xmm9 # 69e0 <_sk_callback_sse2+0x817>
- .byte 68,15,84,21,8,59,0,0 // andps 0x3b08(%rip),%xmm10 # 69f0 <_sk_callback_sse2+0x827>
- .byte 68,15,86,21,16,59,0,0 // orps 0x3b10(%rip),%xmm10 # 6a00 <_sk_callback_sse2+0x837>
- .byte 68,15,88,13,24,59,0,0 // addps 0x3b18(%rip),%xmm9 # 6a10 <_sk_callback_sse2+0x847>
- .byte 68,15,40,37,32,59,0,0 // movaps 0x3b20(%rip),%xmm12 # 6a20 <_sk_callback_sse2+0x857>
+ .byte 68,15,89,13,240,60,0,0 // mulps 0x3cf0(%rip),%xmm9 # 6bd0 <_sk_callback_sse2+0x813>
+ .byte 68,15,84,21,248,60,0,0 // andps 0x3cf8(%rip),%xmm10 # 6be0 <_sk_callback_sse2+0x823>
+ .byte 68,15,86,21,0,61,0,0 // orps 0x3d00(%rip),%xmm10 # 6bf0 <_sk_callback_sse2+0x833>
+ .byte 68,15,88,13,8,61,0,0 // addps 0x3d08(%rip),%xmm9 # 6c00 <_sk_callback_sse2+0x843>
+ .byte 68,15,40,37,16,61,0,0 // movaps 0x3d10(%rip),%xmm12 # 6c10 <_sk_callback_sse2+0x853>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,32,59,0,0 // addps 0x3b20(%rip),%xmm10 # 6a30 <_sk_callback_sse2+0x867>
- .byte 68,15,40,37,40,59,0,0 // movaps 0x3b28(%rip),%xmm12 # 6a40 <_sk_callback_sse2+0x877>
+ .byte 68,15,88,21,16,61,0,0 // addps 0x3d10(%rip),%xmm10 # 6c20 <_sk_callback_sse2+0x863>
+ .byte 68,15,40,37,24,61,0,0 // movaps 0x3d18(%rip),%xmm12 # 6c30 <_sk_callback_sse2+0x873>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -39861,22 +40555,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,18,59,0,0 // movaps 0x3b12(%rip),%xmm10 # 6a50 <_sk_callback_sse2+0x887>
+ .byte 68,15,40,21,2,61,0,0 // movaps 0x3d02(%rip),%xmm10 # 6c40 <_sk_callback_sse2+0x883>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,6,59,0,0 // addps 0x3b06(%rip),%xmm9 # 6a60 <_sk_callback_sse2+0x897>
- .byte 68,15,40,37,14,59,0,0 // movaps 0x3b0e(%rip),%xmm12 # 6a70 <_sk_callback_sse2+0x8a7>
+ .byte 68,15,88,13,246,60,0,0 // addps 0x3cf6(%rip),%xmm9 # 6c50 <_sk_callback_sse2+0x893>
+ .byte 68,15,40,37,254,60,0,0 // movaps 0x3cfe(%rip),%xmm12 # 6c60 <_sk_callback_sse2+0x8a3>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,14,59,0,0 // movaps 0x3b0e(%rip),%xmm12 # 6a80 <_sk_callback_sse2+0x8b7>
+ .byte 68,15,40,37,254,60,0,0 // movaps 0x3cfe(%rip),%xmm12 # 6c70 <_sk_callback_sse2+0x8b3>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,18,59,0,0 // movaps 0x3b12(%rip),%xmm13 # 6a90 <_sk_callback_sse2+0x8c7>
+ .byte 68,15,40,45,2,61,0,0 // movaps 0x3d02(%rip),%xmm13 # 6c80 <_sk_callback_sse2+0x8c3>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,18,59,0,0 // mulps 0x3b12(%rip),%xmm13 # 6aa0 <_sk_callback_sse2+0x8d7>
+ .byte 68,15,89,45,2,61,0,0 // mulps 0x3d02(%rip),%xmm13 # 6c90 <_sk_callback_sse2+0x8d3>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -39912,15 +40606,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,146,58,0,0 // mulps 0x3a92(%rip),%xmm9 # 6ab0 <_sk_callback_sse2+0x8e7>
- .byte 68,15,84,21,154,58,0,0 // andps 0x3a9a(%rip),%xmm10 # 6ac0 <_sk_callback_sse2+0x8f7>
- .byte 68,15,86,21,162,58,0,0 // orps 0x3aa2(%rip),%xmm10 # 6ad0 <_sk_callback_sse2+0x907>
- .byte 68,15,88,13,170,58,0,0 // addps 0x3aaa(%rip),%xmm9 # 6ae0 <_sk_callback_sse2+0x917>
- .byte 68,15,40,37,178,58,0,0 // movaps 0x3ab2(%rip),%xmm12 # 6af0 <_sk_callback_sse2+0x927>
+ .byte 68,15,89,13,130,60,0,0 // mulps 0x3c82(%rip),%xmm9 # 6ca0 <_sk_callback_sse2+0x8e3>
+ .byte 68,15,84,21,138,60,0,0 // andps 0x3c8a(%rip),%xmm10 # 6cb0 <_sk_callback_sse2+0x8f3>
+ .byte 68,15,86,21,146,60,0,0 // orps 0x3c92(%rip),%xmm10 # 6cc0 <_sk_callback_sse2+0x903>
+ .byte 68,15,88,13,154,60,0,0 // addps 0x3c9a(%rip),%xmm9 # 6cd0 <_sk_callback_sse2+0x913>
+ .byte 68,15,40,37,162,60,0,0 // movaps 0x3ca2(%rip),%xmm12 # 6ce0 <_sk_callback_sse2+0x923>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,178,58,0,0 // addps 0x3ab2(%rip),%xmm10 # 6b00 <_sk_callback_sse2+0x937>
- .byte 68,15,40,37,186,58,0,0 // movaps 0x3aba(%rip),%xmm12 # 6b10 <_sk_callback_sse2+0x947>
+ .byte 68,15,88,21,162,60,0,0 // addps 0x3ca2(%rip),%xmm10 # 6cf0 <_sk_callback_sse2+0x933>
+ .byte 68,15,40,37,170,60,0,0 // movaps 0x3caa(%rip),%xmm12 # 6d00 <_sk_callback_sse2+0x943>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -39928,22 +40622,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,164,58,0,0 // movaps 0x3aa4(%rip),%xmm10 # 6b20 <_sk_callback_sse2+0x957>
+ .byte 68,15,40,21,148,60,0,0 // movaps 0x3c94(%rip),%xmm10 # 6d10 <_sk_callback_sse2+0x953>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,152,58,0,0 // addps 0x3a98(%rip),%xmm9 # 6b30 <_sk_callback_sse2+0x967>
- .byte 68,15,40,37,160,58,0,0 // movaps 0x3aa0(%rip),%xmm12 # 6b40 <_sk_callback_sse2+0x977>
+ .byte 68,15,88,13,136,60,0,0 // addps 0x3c88(%rip),%xmm9 # 6d20 <_sk_callback_sse2+0x963>
+ .byte 68,15,40,37,144,60,0,0 // movaps 0x3c90(%rip),%xmm12 # 6d30 <_sk_callback_sse2+0x973>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,160,58,0,0 // movaps 0x3aa0(%rip),%xmm12 # 6b50 <_sk_callback_sse2+0x987>
+ .byte 68,15,40,37,144,60,0,0 // movaps 0x3c90(%rip),%xmm12 # 6d40 <_sk_callback_sse2+0x983>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,164,58,0,0 // movaps 0x3aa4(%rip),%xmm13 # 6b60 <_sk_callback_sse2+0x997>
+ .byte 68,15,40,45,148,60,0,0 // movaps 0x3c94(%rip),%xmm13 # 6d50 <_sk_callback_sse2+0x993>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,164,58,0,0 // mulps 0x3aa4(%rip),%xmm13 # 6b70 <_sk_callback_sse2+0x9a7>
+ .byte 68,15,89,45,148,60,0,0 // mulps 0x3c94(%rip),%xmm13 # 6d60 <_sk_callback_sse2+0x9a3>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -39979,15 +40673,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,36,58,0,0 // mulps 0x3a24(%rip),%xmm9 # 6b80 <_sk_callback_sse2+0x9b7>
- .byte 68,15,84,21,44,58,0,0 // andps 0x3a2c(%rip),%xmm10 # 6b90 <_sk_callback_sse2+0x9c7>
- .byte 68,15,86,21,52,58,0,0 // orps 0x3a34(%rip),%xmm10 # 6ba0 <_sk_callback_sse2+0x9d7>
- .byte 68,15,88,13,60,58,0,0 // addps 0x3a3c(%rip),%xmm9 # 6bb0 <_sk_callback_sse2+0x9e7>
- .byte 68,15,40,37,68,58,0,0 // movaps 0x3a44(%rip),%xmm12 # 6bc0 <_sk_callback_sse2+0x9f7>
+ .byte 68,15,89,13,20,60,0,0 // mulps 0x3c14(%rip),%xmm9 # 6d70 <_sk_callback_sse2+0x9b3>
+ .byte 68,15,84,21,28,60,0,0 // andps 0x3c1c(%rip),%xmm10 # 6d80 <_sk_callback_sse2+0x9c3>
+ .byte 68,15,86,21,36,60,0,0 // orps 0x3c24(%rip),%xmm10 # 6d90 <_sk_callback_sse2+0x9d3>
+ .byte 68,15,88,13,44,60,0,0 // addps 0x3c2c(%rip),%xmm9 # 6da0 <_sk_callback_sse2+0x9e3>
+ .byte 68,15,40,37,52,60,0,0 // movaps 0x3c34(%rip),%xmm12 # 6db0 <_sk_callback_sse2+0x9f3>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,68,58,0,0 // addps 0x3a44(%rip),%xmm10 # 6bd0 <_sk_callback_sse2+0xa07>
- .byte 68,15,40,37,76,58,0,0 // movaps 0x3a4c(%rip),%xmm12 # 6be0 <_sk_callback_sse2+0xa17>
+ .byte 68,15,88,21,52,60,0,0 // addps 0x3c34(%rip),%xmm10 # 6dc0 <_sk_callback_sse2+0xa03>
+ .byte 68,15,40,37,60,60,0,0 // movaps 0x3c3c(%rip),%xmm12 # 6dd0 <_sk_callback_sse2+0xa13>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -39995,22 +40689,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,54,58,0,0 // movaps 0x3a36(%rip),%xmm10 # 6bf0 <_sk_callback_sse2+0xa27>
+ .byte 68,15,40,21,38,60,0,0 // movaps 0x3c26(%rip),%xmm10 # 6de0 <_sk_callback_sse2+0xa23>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,42,58,0,0 // addps 0x3a2a(%rip),%xmm9 # 6c00 <_sk_callback_sse2+0xa37>
- .byte 68,15,40,37,50,58,0,0 // movaps 0x3a32(%rip),%xmm12 # 6c10 <_sk_callback_sse2+0xa47>
+ .byte 68,15,88,13,26,60,0,0 // addps 0x3c1a(%rip),%xmm9 # 6df0 <_sk_callback_sse2+0xa33>
+ .byte 68,15,40,37,34,60,0,0 // movaps 0x3c22(%rip),%xmm12 # 6e00 <_sk_callback_sse2+0xa43>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,50,58,0,0 // movaps 0x3a32(%rip),%xmm12 # 6c20 <_sk_callback_sse2+0xa57>
+ .byte 68,15,40,37,34,60,0,0 // movaps 0x3c22(%rip),%xmm12 # 6e10 <_sk_callback_sse2+0xa53>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,54,58,0,0 // movaps 0x3a36(%rip),%xmm13 # 6c30 <_sk_callback_sse2+0xa67>
+ .byte 68,15,40,45,38,60,0,0 // movaps 0x3c26(%rip),%xmm13 # 6e20 <_sk_callback_sse2+0xa63>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,54,58,0,0 // mulps 0x3a36(%rip),%xmm13 # 6c40 <_sk_callback_sse2+0xa77>
+ .byte 68,15,89,45,38,60,0,0 // mulps 0x3c26(%rip),%xmm13 # 6e30 <_sk_callback_sse2+0xa73>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -40023,33 +40717,158 @@ _sk_parametric_a_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_gamma_sse2
+.globl _sk_gamma_sse2
+FUNCTION(_sk_gamma_sse2)
+_sk_gamma_sse2:
+ .byte 15,41,124,36,232 // movaps %xmm7,-0x18(%rsp)
+ .byte 15,41,116,36,216 // movaps %xmm6,-0x28(%rsp)
+ .byte 15,41,108,36,200 // movaps %xmm5,-0x38(%rsp)
+ .byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
+ .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
+ .byte 15,89,5,225,59,0,0 // mulps 0x3be1(%rip),%xmm0 # 6e40 <_sk_callback_sse2+0xa83>
+ .byte 15,84,21,234,59,0,0 // andps 0x3bea(%rip),%xmm2 # 6e50 <_sk_callback_sse2+0xa93>
+ .byte 68,15,40,53,242,59,0,0 // movaps 0x3bf2(%rip),%xmm14 # 6e60 <_sk_callback_sse2+0xaa3>
+ .byte 65,15,86,214 // orps %xmm14,%xmm2
+ .byte 68,15,40,37,246,59,0,0 // movaps 0x3bf6(%rip),%xmm12 # 6e70 <_sk_callback_sse2+0xab3>
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 68,15,40,29,250,59,0,0 // movaps 0x3bfa(%rip),%xmm11 # 6e80 <_sk_callback_sse2+0xac3>
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 65,15,89,227 // mulps %xmm11,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 68,15,40,21,248,59,0,0 // movaps 0x3bf8(%rip),%xmm10 # 6e90 <_sk_callback_sse2+0xad3>
+ .byte 65,15,88,210 // addps %xmm10,%xmm2
+ .byte 68,15,40,45,252,59,0,0 // movaps 0x3bfc(%rip),%xmm13 # 6ea0 <_sk_callback_sse2+0xae3>
+ .byte 65,15,40,229 // movaps %xmm13,%xmm4
+ .byte 15,94,226 // divps %xmm2,%xmm4
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 243,68,15,16,0 // movss (%rax),%xmm8
+ .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 243,15,91,208 // cvttps2dq %xmm0,%xmm2
+ .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,194,226,1 // cmpltps %xmm2,%xmm4
+ .byte 68,15,40,13,220,59,0,0 // movaps 0x3bdc(%rip),%xmm9 # 6eb0 <_sk_callback_sse2+0xaf3>
+ .byte 65,15,84,225 // andps %xmm9,%xmm4
+ .byte 15,92,212 // subps %xmm4,%xmm2
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,92,226 // subps %xmm2,%xmm4
+ .byte 15,40,53,216,59,0,0 // movaps 0x3bd8(%rip),%xmm6 # 6ec0 <_sk_callback_sse2+0xb03>
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,40,61,238,59,0,0 // movaps 0x3bee(%rip),%xmm7 # 6ee0 <_sk_callback_sse2+0xb23>
+ .byte 15,40,239 // movaps %xmm7,%xmm5
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 15,40,212 // movaps %xmm4,%xmm2
+ .byte 15,40,37,206,59,0,0 // movaps 0x3bce(%rip),%xmm4 # 6ed0 <_sk_callback_sse2+0xb13>
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,92,194 // subps %xmm2,%xmm0
+ .byte 68,15,40,61,224,59,0,0 // movaps 0x3be0(%rip),%xmm15 # 6ef0 <_sk_callback_sse2+0xb33>
+ .byte 65,15,40,215 // movaps %xmm15,%xmm2
+ .byte 15,94,213 // divps %xmm5,%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
+ .byte 15,89,5,28,59,0,0 // mulps 0x3b1c(%rip),%xmm0 # 6e40 <_sk_callback_sse2+0xa83>
+ .byte 15,84,13,37,59,0,0 // andps 0x3b25(%rip),%xmm1 # 6e50 <_sk_callback_sse2+0xa93>
+ .byte 65,15,86,206 // orps %xmm14,%xmm1
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 65,15,89,235 // mulps %xmm11,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,88,202 // addps %xmm10,%xmm1
+ .byte 69,15,40,242 // movaps %xmm10,%xmm14
+ .byte 65,15,40,237 // movaps %xmm13,%xmm5
+ .byte 15,94,233 // divps %xmm1,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
+ .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,194,233,1 // cmpltps %xmm1,%xmm5
+ .byte 65,15,84,233 // andps %xmm9,%xmm5
+ .byte 15,92,205 // subps %xmm5,%xmm1
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 68,15,40,214 // movaps %xmm6,%xmm10
+ .byte 15,40,247 // movaps %xmm7,%xmm6
+ .byte 15,92,245 // subps %xmm5,%xmm6
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,40,207 // movaps %xmm15,%xmm1
+ .byte 15,94,206 // divps %xmm6,%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
+ .byte 15,89,5,171,58,0,0 // mulps 0x3aab(%rip),%xmm0 # 6e40 <_sk_callback_sse2+0xa83>
+ .byte 15,84,29,180,58,0,0 // andps 0x3ab4(%rip),%xmm3 # 6e50 <_sk_callback_sse2+0xa93>
+ .byte 15,86,29,189,58,0,0 // orps 0x3abd(%rip),%xmm3 # 6e60 <_sk_callback_sse2+0xaa3>
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 68,15,89,219 // mulps %xmm3,%xmm11
+ .byte 65,15,92,195 // subps %xmm11,%xmm0
+ .byte 65,15,88,222 // addps %xmm14,%xmm3
+ .byte 68,15,94,235 // divps %xmm3,%xmm13
+ .byte 65,15,92,197 // subps %xmm13,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 243,15,91,216 // cvttps2dq %xmm0,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,194,235,1 // cmpltps %xmm3,%xmm5
+ .byte 65,15,84,233 // andps %xmm9,%xmm5
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,92,235 // subps %xmm3,%xmm5
+ .byte 65,15,88,194 // addps %xmm10,%xmm0
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,92,253 // subps %xmm5,%xmm7
+ .byte 68,15,94,255 // divps %xmm7,%xmm15
+ .byte 68,15,88,248 // addps %xmm0,%xmm15
+ .byte 15,40,5,10,59,0,0 // movaps 0x3b0a(%rip),%xmm0 # 6f00 <_sk_callback_sse2+0xb43>
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 68,15,89,248 // mulps %xmm0,%xmm15
+ .byte 102,15,91,194 // cvtps2dq %xmm2,%xmm0
+ .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
+ .byte 102,65,15,91,215 // cvtps2dq %xmm15,%xmm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,92,36,168 // movaps -0x58(%rsp),%xmm3
+ .byte 15,40,100,36,184 // movaps -0x48(%rsp),%xmm4
+ .byte 15,40,108,36,200 // movaps -0x38(%rsp),%xmm5
+ .byte 15,40,116,36,216 // movaps -0x28(%rsp),%xmm6
+ .byte 15,40,124,36,232 // movaps -0x18(%rsp),%xmm7
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,19,58,0,0 // mulps 0x3a13(%rip),%xmm0 # 6c50 <_sk_callback_sse2+0xa87>
- .byte 68,15,40,5,27,58,0,0 // movaps 0x3a1b(%rip),%xmm8 # 6c60 <_sk_callback_sse2+0xa97>
+ .byte 15,89,5,223,58,0,0 // mulps 0x3adf(%rip),%xmm0 # 6f10 <_sk_callback_sse2+0xb53>
+ .byte 68,15,40,5,231,58,0,0 // movaps 0x3ae7(%rip),%xmm8 # 6f20 <_sk_callback_sse2+0xb63>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,31,58,0,0 // movaps 0x3a1f(%rip),%xmm9 # 6c70 <_sk_callback_sse2+0xaa7>
+ .byte 68,15,40,13,235,58,0,0 // movaps 0x3aeb(%rip),%xmm9 # 6f30 <_sk_callback_sse2+0xb73>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,28,58,0,0 // addps 0x3a1c(%rip),%xmm0 # 6c80 <_sk_callback_sse2+0xab7>
- .byte 15,89,5,37,58,0,0 // mulps 0x3a25(%rip),%xmm0 # 6c90 <_sk_callback_sse2+0xac7>
- .byte 15,89,13,46,58,0,0 // mulps 0x3a2e(%rip),%xmm1 # 6ca0 <_sk_callback_sse2+0xad7>
+ .byte 15,88,5,232,58,0,0 // addps 0x3ae8(%rip),%xmm0 # 6f40 <_sk_callback_sse2+0xb83>
+ .byte 15,89,5,241,58,0,0 // mulps 0x3af1(%rip),%xmm0 # 6f50 <_sk_callback_sse2+0xb93>
+ .byte 15,89,13,250,58,0,0 // mulps 0x3afa(%rip),%xmm1 # 6f60 <_sk_callback_sse2+0xba3>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,52,58,0,0 // mulps 0x3a34(%rip),%xmm2 # 6cb0 <_sk_callback_sse2+0xae7>
+ .byte 15,89,21,0,59,0,0 // mulps 0x3b00(%rip),%xmm2 # 6f70 <_sk_callback_sse2+0xbb3>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,41,58,0,0 // movaps 0x3a29(%rip),%xmm2 # 6cc0 <_sk_callback_sse2+0xaf7>
+ .byte 15,40,21,245,58,0,0 // movaps 0x3af5(%rip),%xmm2 # 6f80 <_sk_callback_sse2+0xbc3>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,40,58,0,0 // movaps 0x3a28(%rip),%xmm10 # 6cd0 <_sk_callback_sse2+0xb07>
+ .byte 68,15,40,21,244,58,0,0 // movaps 0x3af4(%rip),%xmm10 # 6f90 <_sk_callback_sse2+0xbd3>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,44,58,0,0 // movaps 0x3a2c(%rip),%xmm11 # 6ce0 <_sk_callback_sse2+0xb17>
+ .byte 68,15,40,29,248,58,0,0 // movaps 0x3af8(%rip),%xmm11 # 6fa0 <_sk_callback_sse2+0xbe3>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -40073,8 +40892,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,220,57,0,0 // mulps 0x39dc(%rip),%xmm8 # 6cf0 <_sk_callback_sse2+0xb27>
- .byte 15,89,21,229,57,0,0 // mulps 0x39e5(%rip),%xmm2 # 6d00 <_sk_callback_sse2+0xb37>
+ .byte 68,15,89,5,168,58,0,0 // mulps 0x3aa8(%rip),%xmm8 # 6fb0 <_sk_callback_sse2+0xbf3>
+ .byte 15,89,21,177,58,0,0 // mulps 0x3ab1(%rip),%xmm2 # 6fc0 <_sk_callback_sse2+0xc03>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -40090,13 +40909,13 @@ _sk_load_a8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 3369 <_sk_load_a8_sse2+0x46>
+ .byte 117,46 // jne 355d <_sk_load_a8_sse2+0x46>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,191,57,0,0 // pand 0x39bf(%rip),%xmm0 # 6d10 <_sk_callback_sse2+0xb47>
+ .byte 102,15,219,5,139,58,0,0 // pand 0x3a8b(%rip),%xmm0 # 6fd0 <_sk_callback_sse2+0xc13>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,197,57,0,0 // mulps 0x39c5(%rip),%xmm3 # 6d20 <_sk_callback_sse2+0xb57>
+ .byte 15,89,29,145,58,0,0 // mulps 0x3a91(%rip),%xmm3 # 6fe0 <_sk_callback_sse2+0xc23>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
@@ -40105,12 +40924,12 @@ _sk_load_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 33ac <_sk_load_a8_sse2+0x89>
+ .byte 116,54 // je 35a0 <_sk_load_a8_sse2+0x89>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3395 <_sk_load_a8_sse2+0x72>
+ .byte 116,21 // je 3589 <_sk_load_a8_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 3349 <_sk_load_a8_sse2+0x26>
+ .byte 117,195 // jne 353d <_sk_load_a8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -40119,10 +40938,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,157 // jmp 3349 <_sk_load_a8_sse2+0x26>
+ .byte 235,157 // jmp 353d <_sk_load_a8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,146 // jmp 3349 <_sk_load_a8_sse2+0x26>
+ .byte 235,146 // jmp 353d <_sk_load_a8_sse2+0x26>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -40135,13 +40954,13 @@ _sk_load_a8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 33fd <_sk_load_a8_dst_sse2+0x46>
+ .byte 117,46 // jne 35f1 <_sk_load_a8_dst_sse2+0x46>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,75,57,0,0 // pand 0x394b(%rip),%xmm4 # 6d30 <_sk_callback_sse2+0xb67>
+ .byte 102,15,219,37,23,58,0,0 // pand 0x3a17(%rip),%xmm4 # 6ff0 <_sk_callback_sse2+0xc33>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,81,57,0,0 // mulps 0x3951(%rip),%xmm7 # 6d40 <_sk_callback_sse2+0xb77>
+ .byte 15,89,61,29,58,0,0 // mulps 0x3a1d(%rip),%xmm7 # 7000 <_sk_callback_sse2+0xc43>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
@@ -40150,12 +40969,12 @@ _sk_load_a8_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 3440 <_sk_load_a8_dst_sse2+0x89>
+ .byte 116,54 // je 3634 <_sk_load_a8_dst_sse2+0x89>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3429 <_sk_load_a8_dst_sse2+0x72>
+ .byte 116,21 // je 361d <_sk_load_a8_dst_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 33dd <_sk_load_a8_dst_sse2+0x26>
+ .byte 117,195 // jne 35d1 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -40164,10 +40983,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,157 // jmp 33dd <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,157 // jmp 35d1 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,146 // jmp 33dd <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,146 // jmp 35d1 <_sk_load_a8_dst_sse2+0x26>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -40209,7 +41028,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,114,56,0,0 // mulps 0x3872(%rip),%xmm3 # 6d50 <_sk_callback_sse2+0xb87>
+ .byte 15,89,29,62,57,0,0 // mulps 0x393e(%rip),%xmm3 # 7010 <_sk_callback_sse2+0xc53>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -40228,7 +41047,7 @@ _sk_store_a8_sse2:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,86,56,0,0 // movaps 0x3856(%rip),%xmm8 # 6d60 <_sk_callback_sse2+0xb97>
+ .byte 68,15,40,5,34,57,0,0 // movaps 0x3922(%rip),%xmm8 # 7020 <_sk_callback_sse2+0xc63>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -40236,7 +41055,7 @@ _sk_store_a8_sse2:
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 353b <_sk_store_a8_sse2+0x4c>
+ .byte 117,13 // jne 372f <_sk_store_a8_sse2+0x4c>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -40246,24 +41065,24 @@ _sk_store_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 358d <_sk_store_a8_sse2+0x9e>
+ .byte 116,59 // je 3781 <_sk_store_a8_sse2+0x9e>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,22 // je 356e <_sk_store_a8_sse2+0x7f>
+ .byte 116,22 // je 3762 <_sk_store_a8_sse2+0x7f>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,217 // jne 3537 <_sk_store_a8_sse2+0x48>
+ .byte 117,217 // jne 372b <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 67,136,68,25,2 // mov %al,0x2(%r9,%r11,1)
- .byte 102,68,15,219,5,249,55,0,0 // pand 0x37f9(%rip),%xmm8 # 6d70 <_sk_callback_sse2+0xba7>
+ .byte 102,68,15,219,5,197,56,0,0 // pand 0x38c5(%rip),%xmm8 # 7030 <_sk_callback_sse2+0xc73>
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,25 // mov %ax,(%r9,%r11,1)
- .byte 235,170 // jmp 3537 <_sk_store_a8_sse2+0x48>
+ .byte 235,170 // jmp 372b <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp)
.byte 138,68,36,216 // mov -0x28(%rsp),%al
.byte 67,136,4,25 // mov %al,(%r9,%r11,1)
- .byte 235,153 // jmp 3537 <_sk_store_a8_sse2+0x48>
+ .byte 235,153 // jmp 372b <_sk_store_a8_sse2+0x48>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -40276,27 +41095,27 @@ _sk_load_g8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 35e7 <_sk_load_g8_sse2+0x49>
+ .byte 117,49 // jne 37db <_sk_load_g8_sse2+0x49>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,180,55,0,0 // pand 0x37b4(%rip),%xmm0 # 6d80 <_sk_callback_sse2+0xbb7>
+ .byte 102,15,219,5,128,56,0,0 // pand 0x3880(%rip),%xmm0 # 7040 <_sk_callback_sse2+0xc83>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,186,55,0,0 // mulps 0x37ba(%rip),%xmm0 # 6d90 <_sk_callback_sse2+0xbc7>
+ .byte 15,89,5,134,56,0,0 // mulps 0x3886(%rip),%xmm0 # 7050 <_sk_callback_sse2+0xc93>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,193,55,0,0 // movaps 0x37c1(%rip),%xmm3 # 6da0 <_sk_callback_sse2+0xbd7>
+ .byte 15,40,29,141,56,0,0 // movaps 0x388d(%rip),%xmm3 # 7060 <_sk_callback_sse2+0xca3>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 362a <_sk_load_g8_sse2+0x8c>
+ .byte 116,54 // je 381e <_sk_load_g8_sse2+0x8c>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3613 <_sk_load_g8_sse2+0x75>
+ .byte 116,21 // je 3807 <_sk_load_g8_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 35c4 <_sk_load_g8_sse2+0x26>
+ .byte 117,192 // jne 37b8 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -40305,10 +41124,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,154 // jmp 35c4 <_sk_load_g8_sse2+0x26>
+ .byte 235,154 // jmp 37b8 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,143 // jmp 35c4 <_sk_load_g8_sse2+0x26>
+ .byte 235,143 // jmp 37b8 <_sk_load_g8_sse2+0x26>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -40321,27 +41140,27 @@ _sk_load_g8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 367e <_sk_load_g8_dst_sse2+0x49>
+ .byte 117,49 // jne 3872 <_sk_load_g8_dst_sse2+0x49>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,77,55,0,0 // pand 0x374d(%rip),%xmm4 # 6db0 <_sk_callback_sse2+0xbe7>
+ .byte 102,15,219,37,25,56,0,0 // pand 0x3819(%rip),%xmm4 # 7070 <_sk_callback_sse2+0xcb3>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,83,55,0,0 // mulps 0x3753(%rip),%xmm4 # 6dc0 <_sk_callback_sse2+0xbf7>
+ .byte 15,89,37,31,56,0,0 // mulps 0x381f(%rip),%xmm4 # 7080 <_sk_callback_sse2+0xcc3>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,90,55,0,0 // movaps 0x375a(%rip),%xmm7 # 6dd0 <_sk_callback_sse2+0xc07>
+ .byte 15,40,61,38,56,0,0 // movaps 0x3826(%rip),%xmm7 # 7090 <_sk_callback_sse2+0xcd3>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 36c1 <_sk_load_g8_dst_sse2+0x8c>
+ .byte 116,54 // je 38b5 <_sk_load_g8_dst_sse2+0x8c>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 36aa <_sk_load_g8_dst_sse2+0x75>
+ .byte 116,21 // je 389e <_sk_load_g8_dst_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 365b <_sk_load_g8_dst_sse2+0x26>
+ .byte 117,192 // jne 384f <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -40350,10 +41169,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,154 // jmp 365b <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,154 // jmp 384f <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,143 // jmp 365b <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,143 // jmp 384f <_sk_load_g8_dst_sse2+0x26>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -40395,9 +41214,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,129,54,0,0 // mulps 0x3681(%rip),%xmm0 # 6de0 <_sk_callback_sse2+0xc17>
+ .byte 15,89,5,77,55,0,0 // mulps 0x374d(%rip),%xmm0 # 70a0 <_sk_callback_sse2+0xce3>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,136,54,0,0 // movaps 0x3688(%rip),%xmm3 # 6df0 <_sk_callback_sse2+0xc27>
+ .byte 15,40,29,84,55,0,0 // movaps 0x3754(%rip),%xmm3 # 70b0 <_sk_callback_sse2+0xcf3>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -40416,42 +41235,42 @@ _sk_load_565_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 37e0 <_sk_load_565_sse2+0x6e>
+ .byte 117,83 // jne 39d4 <_sk_load_565_sse2+0x6e>
.byte 243,67,15,126,20,89 // movq (%r9,%r11,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,97,54,0,0 // movdqa 0x3661(%rip),%xmm0 # 6e00 <_sk_callback_sse2+0xc37>
+ .byte 102,15,111,5,45,55,0,0 // movdqa 0x372d(%rip),%xmm0 # 70c0 <_sk_callback_sse2+0xd03>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,99,54,0,0 // mulps 0x3663(%rip),%xmm0 # 6e10 <_sk_callback_sse2+0xc47>
- .byte 102,15,111,13,107,54,0,0 // movdqa 0x366b(%rip),%xmm1 # 6e20 <_sk_callback_sse2+0xc57>
+ .byte 15,89,5,47,55,0,0 // mulps 0x372f(%rip),%xmm0 # 70d0 <_sk_callback_sse2+0xd13>
+ .byte 102,15,111,13,55,55,0,0 // movdqa 0x3737(%rip),%xmm1 # 70e0 <_sk_callback_sse2+0xd23>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,109,54,0,0 // mulps 0x366d(%rip),%xmm1 # 6e30 <_sk_callback_sse2+0xc67>
- .byte 102,15,219,21,117,54,0,0 // pand 0x3675(%rip),%xmm2 # 6e40 <_sk_callback_sse2+0xc77>
+ .byte 15,89,13,57,55,0,0 // mulps 0x3739(%rip),%xmm1 # 70f0 <_sk_callback_sse2+0xd33>
+ .byte 102,15,219,21,65,55,0,0 // pand 0x3741(%rip),%xmm2 # 7100 <_sk_callback_sse2+0xd43>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,123,54,0,0 // mulps 0x367b(%rip),%xmm2 # 6e50 <_sk_callback_sse2+0xc87>
+ .byte 15,89,21,71,55,0,0 // mulps 0x3747(%rip),%xmm2 # 7110 <_sk_callback_sse2+0xd53>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,130,54,0,0 // movaps 0x3682(%rip),%xmm3 # 6e60 <_sk_callback_sse2+0xc97>
+ .byte 15,40,29,78,55,0,0 // movaps 0x374e(%rip),%xmm3 # 7120 <_sk_callback_sse2+0xd63>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 381f <_sk_load_565_sse2+0xad>
+ .byte 116,50 // je 3a13 <_sk_load_565_sse2+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 380c <_sk_load_565_sse2+0x9a>
+ .byte 116,21 // je 3a00 <_sk_load_565_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 3797 <_sk_load_565_sse2+0x25>
+ .byte 117,154 // jne 398b <_sk_load_565_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,120,255,255,255 // jmpq 3797 <_sk_load_565_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 398b <_sk_load_565_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,106,255,255,255 // jmpq 3797 <_sk_load_565_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 398b <_sk_load_565_sse2+0x25>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -40465,42 +41284,42 @@ _sk_load_565_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 389b <_sk_load_565_dst_sse2+0x6e>
+ .byte 117,83 // jne 3a8f <_sk_load_565_dst_sse2+0x6e>
.byte 243,67,15,126,52,89 // movq (%r9,%r11,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,37,22,54,0,0 // movdqa 0x3616(%rip),%xmm4 # 6e70 <_sk_callback_sse2+0xca7>
+ .byte 102,15,111,37,226,54,0,0 // movdqa 0x36e2(%rip),%xmm4 # 7130 <_sk_callback_sse2+0xd73>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,24,54,0,0 // mulps 0x3618(%rip),%xmm4 # 6e80 <_sk_callback_sse2+0xcb7>
- .byte 102,15,111,45,32,54,0,0 // movdqa 0x3620(%rip),%xmm5 # 6e90 <_sk_callback_sse2+0xcc7>
+ .byte 15,89,37,228,54,0,0 // mulps 0x36e4(%rip),%xmm4 # 7140 <_sk_callback_sse2+0xd83>
+ .byte 102,15,111,45,236,54,0,0 // movdqa 0x36ec(%rip),%xmm5 # 7150 <_sk_callback_sse2+0xd93>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,34,54,0,0 // mulps 0x3622(%rip),%xmm5 # 6ea0 <_sk_callback_sse2+0xcd7>
- .byte 102,15,219,53,42,54,0,0 // pand 0x362a(%rip),%xmm6 # 6eb0 <_sk_callback_sse2+0xce7>
+ .byte 15,89,45,238,54,0,0 // mulps 0x36ee(%rip),%xmm5 # 7160 <_sk_callback_sse2+0xda3>
+ .byte 102,15,219,53,246,54,0,0 // pand 0x36f6(%rip),%xmm6 # 7170 <_sk_callback_sse2+0xdb3>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,48,54,0,0 // mulps 0x3630(%rip),%xmm6 # 6ec0 <_sk_callback_sse2+0xcf7>
+ .byte 15,89,53,252,54,0,0 // mulps 0x36fc(%rip),%xmm6 # 7180 <_sk_callback_sse2+0xdc3>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,55,54,0,0 // movaps 0x3637(%rip),%xmm7 # 6ed0 <_sk_callback_sse2+0xd07>
+ .byte 15,40,61,3,55,0,0 // movaps 0x3703(%rip),%xmm7 # 7190 <_sk_callback_sse2+0xdd3>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 38da <_sk_load_565_dst_sse2+0xad>
+ .byte 116,50 // je 3ace <_sk_load_565_dst_sse2+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 38c7 <_sk_load_565_dst_sse2+0x9a>
+ .byte 116,21 // je 3abb <_sk_load_565_dst_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 3852 <_sk_load_565_dst_sse2+0x25>
+ .byte 117,154 // jne 3a46 <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,120,255,255,255 // jmpq 3852 <_sk_load_565_dst_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 3a46 <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,106,255,255,255 // jmpq 3852 <_sk_load_565_dst_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 3a46 <_sk_load_565_dst_sse2+0x25>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -40535,19 +41354,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,114,53,0,0 // movdqa 0x3572(%rip),%xmm0 # 6ee0 <_sk_callback_sse2+0xd17>
+ .byte 102,15,111,5,62,54,0,0 // movdqa 0x363e(%rip),%xmm0 # 71a0 <_sk_callback_sse2+0xde3>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,116,53,0,0 // mulps 0x3574(%rip),%xmm0 # 6ef0 <_sk_callback_sse2+0xd27>
- .byte 102,15,111,13,124,53,0,0 // movdqa 0x357c(%rip),%xmm1 # 6f00 <_sk_callback_sse2+0xd37>
+ .byte 15,89,5,64,54,0,0 // mulps 0x3640(%rip),%xmm0 # 71b0 <_sk_callback_sse2+0xdf3>
+ .byte 102,15,111,13,72,54,0,0 // movdqa 0x3648(%rip),%xmm1 # 71c0 <_sk_callback_sse2+0xe03>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,126,53,0,0 // mulps 0x357e(%rip),%xmm1 # 6f10 <_sk_callback_sse2+0xd47>
- .byte 102,15,219,21,134,53,0,0 // pand 0x3586(%rip),%xmm2 # 6f20 <_sk_callback_sse2+0xd57>
+ .byte 15,89,13,74,54,0,0 // mulps 0x364a(%rip),%xmm1 # 71d0 <_sk_callback_sse2+0xe13>
+ .byte 102,15,219,21,82,54,0,0 // pand 0x3652(%rip),%xmm2 # 71e0 <_sk_callback_sse2+0xe23>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,140,53,0,0 // mulps 0x358c(%rip),%xmm2 # 6f30 <_sk_callback_sse2+0xd67>
+ .byte 15,89,21,88,54,0,0 // mulps 0x3658(%rip),%xmm2 # 71f0 <_sk_callback_sse2+0xe33>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,147,53,0,0 // movaps 0x3593(%rip),%xmm3 # 6f40 <_sk_callback_sse2+0xd77>
+ .byte 15,40,29,95,54,0,0 // movaps 0x365f(%rip),%xmm3 # 7200 <_sk_callback_sse2+0xe43>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -40562,12 +41381,12 @@ _sk_store_565_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,130,53,0,0 // movaps 0x3582(%rip),%xmm8 # 6f50 <_sk_callback_sse2+0xd87>
+ .byte 68,15,40,5,78,54,0,0 // movaps 0x364e(%rip),%xmm8 # 7210 <_sk_callback_sse2+0xe53>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,119,53,0,0 // movaps 0x3577(%rip),%xmm10 # 6f60 <_sk_callback_sse2+0xd97>
+ .byte 68,15,40,21,67,54,0,0 // movaps 0x3643(%rip),%xmm10 # 7220 <_sk_callback_sse2+0xe63>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -40579,7 +41398,7 @@ _sk_store_565_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3a2b <_sk_store_565_sse2+0x7b>
+ .byte 117,10 // jne 3c1f <_sk_store_565_sse2+0x7b>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -40587,19 +41406,19 @@ _sk_store_565_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 3a63 <_sk_store_565_sse2+0xb3>
+ .byte 116,38 // je 3c57 <_sk_store_565_sse2+0xb3>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3a55 <_sk_store_565_sse2+0xa5>
+ .byte 116,18 // je 3c49 <_sk_store_565_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 3a27 <_sk_store_565_sse2+0x77>
+ .byte 117,222 // jne 3c1b <_sk_store_565_sse2+0x77>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 3a27 <_sk_store_565_sse2+0x77>
+ .byte 235,196 // jmp 3c1b <_sk_store_565_sse2+0x77>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 3a27 <_sk_store_565_sse2+0x77>
+ .byte 235,184 // jmp 3c1b <_sk_store_565_sse2+0x77>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -40613,45 +41432,45 @@ _sk_load_4444_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 3aec <_sk_load_4444_sse2+0x7d>
+ .byte 117,98 // jne 3ce0 <_sk_load_4444_sse2+0x7d>
.byte 243,67,15,126,28,89 // movq (%r9,%r11,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,212,52,0,0 // movdqa 0x34d4(%rip),%xmm0 # 6f70 <_sk_callback_sse2+0xda7>
+ .byte 102,15,111,5,160,53,0,0 // movdqa 0x35a0(%rip),%xmm0 # 7230 <_sk_callback_sse2+0xe73>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,214,52,0,0 // mulps 0x34d6(%rip),%xmm0 # 6f80 <_sk_callback_sse2+0xdb7>
- .byte 102,15,111,13,222,52,0,0 // movdqa 0x34de(%rip),%xmm1 # 6f90 <_sk_callback_sse2+0xdc7>
+ .byte 15,89,5,162,53,0,0 // mulps 0x35a2(%rip),%xmm0 # 7240 <_sk_callback_sse2+0xe83>
+ .byte 102,15,111,13,170,53,0,0 // movdqa 0x35aa(%rip),%xmm1 # 7250 <_sk_callback_sse2+0xe93>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,224,52,0,0 // mulps 0x34e0(%rip),%xmm1 # 6fa0 <_sk_callback_sse2+0xdd7>
- .byte 102,15,111,21,232,52,0,0 // movdqa 0x34e8(%rip),%xmm2 # 6fb0 <_sk_callback_sse2+0xde7>
+ .byte 15,89,13,172,53,0,0 // mulps 0x35ac(%rip),%xmm1 # 7260 <_sk_callback_sse2+0xea3>
+ .byte 102,15,111,21,180,53,0,0 // movdqa 0x35b4(%rip),%xmm2 # 7270 <_sk_callback_sse2+0xeb3>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,234,52,0,0 // mulps 0x34ea(%rip),%xmm2 # 6fc0 <_sk_callback_sse2+0xdf7>
- .byte 102,15,219,29,242,52,0,0 // pand 0x34f2(%rip),%xmm3 # 6fd0 <_sk_callback_sse2+0xe07>
+ .byte 15,89,21,182,53,0,0 // mulps 0x35b6(%rip),%xmm2 # 7280 <_sk_callback_sse2+0xec3>
+ .byte 102,15,219,29,190,53,0,0 // pand 0x35be(%rip),%xmm3 # 7290 <_sk_callback_sse2+0xed3>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,248,52,0,0 // mulps 0x34f8(%rip),%xmm3 # 6fe0 <_sk_callback_sse2+0xe17>
+ .byte 15,89,29,196,53,0,0 // mulps 0x35c4(%rip),%xmm3 # 72a0 <_sk_callback_sse2+0xee3>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 3b2b <_sk_load_4444_sse2+0xbc>
+ .byte 116,50 // je 3d1f <_sk_load_4444_sse2+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3b18 <_sk_load_4444_sse2+0xa9>
+ .byte 116,21 // je 3d0c <_sk_load_4444_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 3a94 <_sk_load_4444_sse2+0x25>
+ .byte 117,139 // jne 3c88 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,105,255,255,255 // jmpq 3a94 <_sk_load_4444_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 3c88 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,91,255,255,255 // jmpq 3a94 <_sk_load_4444_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 3c88 <_sk_load_4444_sse2+0x25>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -40665,45 +41484,45 @@ _sk_load_4444_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 3bb6 <_sk_load_4444_dst_sse2+0x7d>
+ .byte 117,98 // jne 3daa <_sk_load_4444_dst_sse2+0x7d>
.byte 243,67,15,126,60,89 // movq (%r9,%r11,2),%xmm7
.byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
- .byte 102,15,111,37,138,52,0,0 // movdqa 0x348a(%rip),%xmm4 # 6ff0 <_sk_callback_sse2+0xe27>
+ .byte 102,15,111,37,86,53,0,0 // movdqa 0x3556(%rip),%xmm4 # 72b0 <_sk_callback_sse2+0xef3>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,140,52,0,0 // mulps 0x348c(%rip),%xmm4 # 7000 <_sk_callback_sse2+0xe37>
- .byte 102,15,111,45,148,52,0,0 // movdqa 0x3494(%rip),%xmm5 # 7010 <_sk_callback_sse2+0xe47>
+ .byte 15,89,37,88,53,0,0 // mulps 0x3558(%rip),%xmm4 # 72c0 <_sk_callback_sse2+0xf03>
+ .byte 102,15,111,45,96,53,0,0 // movdqa 0x3560(%rip),%xmm5 # 72d0 <_sk_callback_sse2+0xf13>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,150,52,0,0 // mulps 0x3496(%rip),%xmm5 # 7020 <_sk_callback_sse2+0xe57>
- .byte 102,15,111,53,158,52,0,0 // movdqa 0x349e(%rip),%xmm6 # 7030 <_sk_callback_sse2+0xe67>
+ .byte 15,89,45,98,53,0,0 // mulps 0x3562(%rip),%xmm5 # 72e0 <_sk_callback_sse2+0xf23>
+ .byte 102,15,111,53,106,53,0,0 // movdqa 0x356a(%rip),%xmm6 # 72f0 <_sk_callback_sse2+0xf33>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,160,52,0,0 // mulps 0x34a0(%rip),%xmm6 # 7040 <_sk_callback_sse2+0xe77>
- .byte 102,15,219,61,168,52,0,0 // pand 0x34a8(%rip),%xmm7 # 7050 <_sk_callback_sse2+0xe87>
+ .byte 15,89,53,108,53,0,0 // mulps 0x356c(%rip),%xmm6 # 7300 <_sk_callback_sse2+0xf43>
+ .byte 102,15,219,61,116,53,0,0 // pand 0x3574(%rip),%xmm7 # 7310 <_sk_callback_sse2+0xf53>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,174,52,0,0 // mulps 0x34ae(%rip),%xmm7 # 7060 <_sk_callback_sse2+0xe97>
+ .byte 15,89,61,122,53,0,0 // mulps 0x357a(%rip),%xmm7 # 7320 <_sk_callback_sse2+0xf63>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 3bf5 <_sk_load_4444_dst_sse2+0xbc>
+ .byte 116,50 // je 3de9 <_sk_load_4444_dst_sse2+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3be2 <_sk_load_4444_dst_sse2+0xa9>
+ .byte 116,21 // je 3dd6 <_sk_load_4444_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 3b5e <_sk_load_4444_dst_sse2+0x25>
+ .byte 117,139 // jne 3d52 <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,252 // movsd %xmm4,%xmm7
- .byte 233,105,255,255,255 // jmpq 3b5e <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 3d52 <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,91,255,255,255 // jmpq 3b5e <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 3d52 <_sk_load_4444_dst_sse2+0x25>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -40738,21 +41557,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,231,51,0,0 // movdqa 0x33e7(%rip),%xmm0 # 7070 <_sk_callback_sse2+0xea7>
+ .byte 102,15,111,5,179,52,0,0 // movdqa 0x34b3(%rip),%xmm0 # 7330 <_sk_callback_sse2+0xf73>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,233,51,0,0 // mulps 0x33e9(%rip),%xmm0 # 7080 <_sk_callback_sse2+0xeb7>
- .byte 102,15,111,13,241,51,0,0 // movdqa 0x33f1(%rip),%xmm1 # 7090 <_sk_callback_sse2+0xec7>
+ .byte 15,89,5,181,52,0,0 // mulps 0x34b5(%rip),%xmm0 # 7340 <_sk_callback_sse2+0xf83>
+ .byte 102,15,111,13,189,52,0,0 // movdqa 0x34bd(%rip),%xmm1 # 7350 <_sk_callback_sse2+0xf93>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,243,51,0,0 // mulps 0x33f3(%rip),%xmm1 # 70a0 <_sk_callback_sse2+0xed7>
- .byte 102,15,111,21,251,51,0,0 // movdqa 0x33fb(%rip),%xmm2 # 70b0 <_sk_callback_sse2+0xee7>
+ .byte 15,89,13,191,52,0,0 // mulps 0x34bf(%rip),%xmm1 # 7360 <_sk_callback_sse2+0xfa3>
+ .byte 102,15,111,21,199,52,0,0 // movdqa 0x34c7(%rip),%xmm2 # 7370 <_sk_callback_sse2+0xfb3>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,253,51,0,0 // mulps 0x33fd(%rip),%xmm2 # 70c0 <_sk_callback_sse2+0xef7>
- .byte 102,15,219,29,5,52,0,0 // pand 0x3405(%rip),%xmm3 # 70d0 <_sk_callback_sse2+0xf07>
+ .byte 15,89,21,201,52,0,0 // mulps 0x34c9(%rip),%xmm2 # 7380 <_sk_callback_sse2+0xfc3>
+ .byte 102,15,219,29,209,52,0,0 // pand 0x34d1(%rip),%xmm3 # 7390 <_sk_callback_sse2+0xfd3>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,11,52,0,0 // mulps 0x340b(%rip),%xmm3 # 70e0 <_sk_callback_sse2+0xf17>
+ .byte 15,89,29,215,52,0,0 // mulps 0x34d7(%rip),%xmm3 # 73a0 <_sk_callback_sse2+0xfe3>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -40768,7 +41587,7 @@ _sk_store_4444_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,248,51,0,0 // movaps 0x33f8(%rip),%xmm8 # 70f0 <_sk_callback_sse2+0xf27>
+ .byte 68,15,40,5,196,52,0,0 // movaps 0x34c4(%rip),%xmm8 # 73b0 <_sk_callback_sse2+0xff3>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -40790,7 +41609,7 @@ _sk_store_4444_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3d69 <_sk_store_4444_sse2+0x8f>
+ .byte 117,10 // jne 3f5d <_sk_store_4444_sse2+0x8f>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -40798,19 +41617,19 @@ _sk_store_4444_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 3da1 <_sk_store_4444_sse2+0xc7>
+ .byte 116,38 // je 3f95 <_sk_store_4444_sse2+0xc7>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3d93 <_sk_store_4444_sse2+0xb9>
+ .byte 116,18 // je 3f87 <_sk_store_4444_sse2+0xb9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 3d65 <_sk_store_4444_sse2+0x8b>
+ .byte 117,222 // jne 3f59 <_sk_store_4444_sse2+0x8b>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 3d65 <_sk_store_4444_sse2+0x8b>
+ .byte 235,196 // jmp 3f59 <_sk_store_4444_sse2+0x8b>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 3d65 <_sk_store_4444_sse2+0x8b>
+ .byte 235,184 // jmp 3f59 <_sk_store_4444_sse2+0x8b>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -40824,13 +41643,13 @@ _sk_load_8888_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 3e2b <_sk_load_8888_sse2+0x7e>
+ .byte 117,98 // jne 401f <_sk_load_8888_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,21,41,51,0,0 // movdqa 0x3329(%rip),%xmm2 # 7100 <_sk_callback_sse2+0xf37>
+ .byte 102,15,111,21,245,51,0,0 // movdqa 0x33f5(%rip),%xmm2 # 73c0 <_sk_callback_sse2+0x1003>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,37,51,0,0 // movaps 0x3325(%rip),%xmm8 # 7110 <_sk_callback_sse2+0xf47>
+ .byte 68,15,40,5,241,51,0,0 // movaps 0x33f1(%rip),%xmm8 # 73d0 <_sk_callback_sse2+0x1013>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -40850,18 +41669,18 @@ _sk_load_8888_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 3e61 <_sk_load_8888_sse2+0xb4>
+ .byte 116,41 // je 4055 <_sk_load_8888_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 3e56 <_sk_load_8888_sse2+0xa9>
+ .byte 116,19 // je 404a <_sk_load_8888_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 3dcf <_sk_load_8888_sse2+0x22>
+ .byte 117,134 // jne 3fc3 <_sk_load_8888_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 3dcf <_sk_load_8888_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 3fc3 <_sk_load_8888_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 3dcf <_sk_load_8888_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 3fc3 <_sk_load_8888_sse2+0x22>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -40875,13 +41694,13 @@ _sk_load_8888_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 3eea <_sk_load_8888_dst_sse2+0x7e>
+ .byte 117,98 // jne 40de <_sk_load_8888_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,53,138,50,0,0 // movdqa 0x328a(%rip),%xmm6 # 7120 <_sk_callback_sse2+0xf57>
+ .byte 102,15,111,53,86,51,0,0 // movdqa 0x3356(%rip),%xmm6 # 73e0 <_sk_callback_sse2+0x1023>
.byte 102,65,15,111,225 // movdqa %xmm9,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,134,50,0,0 // movaps 0x3286(%rip),%xmm8 # 7130 <_sk_callback_sse2+0xf67>
+ .byte 68,15,40,5,82,51,0,0 // movaps 0x3352(%rip),%xmm8 # 73f0 <_sk_callback_sse2+0x1033>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -40901,18 +41720,18 @@ _sk_load_8888_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 3f20 <_sk_load_8888_dst_sse2+0xb4>
+ .byte 116,41 // je 4114 <_sk_load_8888_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 3f15 <_sk_load_8888_dst_sse2+0xa9>
+ .byte 116,19 // je 4109 <_sk_load_8888_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 3e8e <_sk_load_8888_dst_sse2+0x22>
+ .byte 117,134 // jne 4082 <_sk_load_8888_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 3e8e <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 4082 <_sk_load_8888_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 3e8e <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 4082 <_sk_load_8888_dst_sse2+0x22>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -40946,11 +41765,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,147,49,0,0 // movdqa 0x3193(%rip),%xmm2 # 7140 <_sk_callback_sse2+0xf77>
+ .byte 102,15,111,21,95,50,0,0 // movdqa 0x325f(%rip),%xmm2 # 7400 <_sk_callback_sse2+0x1043>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,143,49,0,0 // movaps 0x318f(%rip),%xmm8 # 7150 <_sk_callback_sse2+0xf87>
+ .byte 68,15,40,5,91,50,0,0 // movaps 0x325b(%rip),%xmm8 # 7410 <_sk_callback_sse2+0x1053>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -40980,7 +41799,7 @@ _sk_store_8888_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,63,49,0,0 // movaps 0x313f(%rip),%xmm8 # 7160 <_sk_callback_sse2+0xf97>
+ .byte 68,15,40,5,11,50,0,0 // movaps 0x320b(%rip),%xmm8 # 7420 <_sk_callback_sse2+0x1063>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -40999,24 +41818,24 @@ _sk_store_8888_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 4081 <_sk_store_8888_sse2+0x7f>
+ .byte 117,10 // jne 4275 <_sk_store_8888_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 40af <_sk_store_8888_sse2+0xad>
+ .byte 116,33 // je 42a3 <_sk_store_8888_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 40a7 <_sk_store_8888_sse2+0xa5>
+ .byte 116,19 // je 429b <_sk_store_8888_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 407d <_sk_store_8888_sse2+0x7b>
+ .byte 117,227 // jne 4271 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 407d <_sk_store_8888_sse2+0x7b>
+ .byte 235,206 // jmp 4271 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 407d <_sk_store_8888_sse2+0x7b>
+ .byte 235,198 // jmp 4271 <_sk_store_8888_sse2+0x7b>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -41030,13 +41849,13 @@ _sk_load_bgra_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 4135 <_sk_load_bgra_sse2+0x7e>
+ .byte 117,98 // jne 4329 <_sk_load_bgra_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,5,143,48,0,0 // movdqa 0x308f(%rip),%xmm0 # 7170 <_sk_callback_sse2+0xfa7>
+ .byte 102,15,111,5,91,49,0,0 // movdqa 0x315b(%rip),%xmm0 # 7430 <_sk_callback_sse2+0x1073>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,139,48,0,0 // movaps 0x308b(%rip),%xmm8 # 7180 <_sk_callback_sse2+0xfb7>
+ .byte 68,15,40,5,87,49,0,0 // movaps 0x3157(%rip),%xmm8 # 7440 <_sk_callback_sse2+0x1083>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -41056,18 +41875,18 @@ _sk_load_bgra_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 416b <_sk_load_bgra_sse2+0xb4>
+ .byte 116,41 // je 435f <_sk_load_bgra_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 4160 <_sk_load_bgra_sse2+0xa9>
+ .byte 116,19 // je 4354 <_sk_load_bgra_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 40d9 <_sk_load_bgra_sse2+0x22>
+ .byte 117,134 // jne 42cd <_sk_load_bgra_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 40d9 <_sk_load_bgra_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 42cd <_sk_load_bgra_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 40d9 <_sk_load_bgra_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 42cd <_sk_load_bgra_sse2+0x22>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -41081,13 +41900,13 @@ _sk_load_bgra_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 41f4 <_sk_load_bgra_dst_sse2+0x7e>
+ .byte 117,98 // jne 43e8 <_sk_load_bgra_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,37,240,47,0,0 // movdqa 0x2ff0(%rip),%xmm4 # 7190 <_sk_callback_sse2+0xfc7>
+ .byte 102,15,111,37,188,48,0,0 // movdqa 0x30bc(%rip),%xmm4 # 7450 <_sk_callback_sse2+0x1093>
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 68,15,40,5,236,47,0,0 // movaps 0x2fec(%rip),%xmm8 # 71a0 <_sk_callback_sse2+0xfd7>
+ .byte 68,15,40,5,184,48,0,0 // movaps 0x30b8(%rip),%xmm8 # 7460 <_sk_callback_sse2+0x10a3>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -41107,18 +41926,18 @@ _sk_load_bgra_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 422a <_sk_load_bgra_dst_sse2+0xb4>
+ .byte 116,41 // je 441e <_sk_load_bgra_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 421f <_sk_load_bgra_dst_sse2+0xa9>
+ .byte 116,19 // je 4413 <_sk_load_bgra_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 4198 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 117,134 // jne 438c <_sk_load_bgra_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 4198 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 438c <_sk_load_bgra_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 4198 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 438c <_sk_load_bgra_dst_sse2+0x22>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -41152,11 +41971,11 @@ _sk_gather_bgra_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,5,249,46,0,0 // movdqa 0x2ef9(%rip),%xmm0 # 71b0 <_sk_callback_sse2+0xfe7>
+ .byte 102,15,111,5,197,47,0,0 // movdqa 0x2fc5(%rip),%xmm0 # 7470 <_sk_callback_sse2+0x10b3>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,245,46,0,0 // movaps 0x2ef5(%rip),%xmm8 # 71c0 <_sk_callback_sse2+0xff7>
+ .byte 68,15,40,5,193,47,0,0 // movaps 0x2fc1(%rip),%xmm8 # 7480 <_sk_callback_sse2+0x10c3>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -41186,7 +42005,7 @@ _sk_store_bgra_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,165,46,0,0 // movaps 0x2ea5(%rip),%xmm8 # 71d0 <_sk_callback_sse2+0x1007>
+ .byte 68,15,40,5,113,47,0,0 // movaps 0x2f71(%rip),%xmm8 # 7490 <_sk_callback_sse2+0x10d3>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -41205,24 +42024,24 @@ _sk_store_bgra_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 438b <_sk_store_bgra_sse2+0x7f>
+ .byte 117,10 // jne 457f <_sk_store_bgra_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 43b9 <_sk_store_bgra_sse2+0xad>
+ .byte 116,33 // je 45ad <_sk_store_bgra_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 43b1 <_sk_store_bgra_sse2+0xa5>
+ .byte 116,19 // je 45a5 <_sk_store_bgra_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 4387 <_sk_store_bgra_sse2+0x7b>
+ .byte 117,227 // jne 457b <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 4387 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,206 // jmp 457b <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 4387 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,198 // jmp 457b <_sk_store_bgra_sse2+0x7b>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -41236,7 +42055,7 @@ _sk_load_f16_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 4543 <_sk_load_f16_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 4737 <_sk_load_f16_sse2+0x182>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 102,65,15,16,76,193,16 // movupd 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,192 // movapd %xmm0,%xmm8
@@ -41248,7 +42067,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,189,45,0,0 // movdqa 0x2dbd(%rip),%xmm9 # 71e0 <_sk_callback_sse2+0x1017>
+ .byte 102,68,15,111,13,137,46,0,0 // movdqa 0x2e89(%rip),%xmm9 # 74a0 <_sk_callback_sse2+0x10e3>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -41256,11 +42075,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,162,45,0,0 // movdqa 0x2da2(%rip),%xmm11 # 71f0 <_sk_callback_sse2+0x1027>
+ .byte 102,68,15,111,29,110,46,0,0 // movdqa 0x2e6e(%rip),%xmm11 # 74b0 <_sk_callback_sse2+0x10f3>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,164,45,0,0 // movdqa 0x2da4(%rip),%xmm12 # 7200 <_sk_callback_sse2+0x1037>
+ .byte 102,68,15,111,37,112,46,0,0 // movdqa 0x2e70(%rip),%xmm12 # 74c0 <_sk_callback_sse2+0x1103>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,167,45,0,0 // movdqa 0x2da7(%rip),%xmm3 # 7210 <_sk_callback_sse2+0x1047>
+ .byte 102,15,111,29,115,46,0,0 // movdqa 0x2e73(%rip),%xmm3 # 74d0 <_sk_callback_sse2+0x1113>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -41308,17 +42127,17 @@ _sk_load_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 4560 <_sk_load_f16_sse2+0x19f>
+ .byte 117,17 // jne 4754 <_sk_load_f16_sse2+0x19f>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,142,254,255,255 // jmpq 43ee <_sk_load_f16_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 45e2 <_sk_load_f16_sse2+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 43ee <_sk_load_f16_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 45e2 <_sk_load_f16_sse2+0x2d>
.byte 242,65,15,16,76,193,16 // movsd 0x10(%r9,%rax,8),%xmm1
- .byte 233,109,254,255,255 // jmpq 43ee <_sk_load_f16_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 45e2 <_sk_load_f16_sse2+0x2d>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -41332,7 +42151,7 @@ _sk_load_f16_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 4703 <_sk_load_f16_dst_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 48f7 <_sk_load_f16_dst_sse2+0x182>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 102,65,15,16,108,193,16 // movupd 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,196 // movapd %xmm4,%xmm8
@@ -41344,7 +42163,7 @@ _sk_load_f16_dst_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,238 // movdqa %xmm14,%xmm5
.byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5
- .byte 102,68,15,111,13,61,44,0,0 // movdqa 0x2c3d(%rip),%xmm9 # 7220 <_sk_callback_sse2+0x1057>
+ .byte 102,68,15,111,13,9,45,0,0 // movdqa 0x2d09(%rip),%xmm9 # 74e0 <_sk_callback_sse2+0x1123>
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,219,225 // pand %xmm9,%xmm4
.byte 102,15,239,236 // pxor %xmm4,%xmm5
@@ -41352,11 +42171,11 @@ _sk_load_f16_dst_sse2:
.byte 102,68,15,111,237 // movdqa %xmm5,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,236 // por %xmm4,%xmm13
- .byte 102,68,15,111,29,34,44,0,0 // movdqa 0x2c22(%rip),%xmm11 # 7230 <_sk_callback_sse2+0x1067>
+ .byte 102,68,15,111,29,238,44,0,0 // movdqa 0x2cee(%rip),%xmm11 # 74f0 <_sk_callback_sse2+0x1133>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,36,44,0,0 // movdqa 0x2c24(%rip),%xmm12 # 7240 <_sk_callback_sse2+0x1077>
+ .byte 102,68,15,111,37,240,44,0,0 // movdqa 0x2cf0(%rip),%xmm12 # 7500 <_sk_callback_sse2+0x1143>
.byte 102,65,15,239,236 // pxor %xmm12,%xmm5
- .byte 102,15,111,61,39,44,0,0 // movdqa 0x2c27(%rip),%xmm7 # 7250 <_sk_callback_sse2+0x1087>
+ .byte 102,15,111,61,243,44,0,0 // movdqa 0x2cf3(%rip),%xmm7 # 7510 <_sk_callback_sse2+0x1153>
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4
.byte 102,65,15,223,229 // pandn %xmm13,%xmm4
@@ -41404,17 +42223,17 @@ _sk_load_f16_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 4720 <_sk_load_f16_dst_sse2+0x19f>
+ .byte 117,17 // jne 4914 <_sk_load_f16_dst_sse2+0x19f>
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 102,15,20,229 // unpcklpd %xmm5,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
- .byte 233,142,254,255,255 // jmpq 45ae <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 47a2 <_sk_load_f16_dst_sse2+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 45ae <_sk_load_f16_dst_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 47a2 <_sk_load_f16_dst_sse2+0x2d>
.byte 242,65,15,16,108,193,16 // movsd 0x10(%r9,%rax,8),%xmm5
- .byte 233,109,254,255,255 // jmpq 45ae <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 47a2 <_sk_load_f16_dst_sse2+0x2d>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -41456,7 +42275,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,118,42,0,0 // movdqa 0x2a76(%rip),%xmm9 # 7260 <_sk_callback_sse2+0x1097>
+ .byte 102,68,15,111,13,66,43,0,0 // movdqa 0x2b42(%rip),%xmm9 # 7520 <_sk_callback_sse2+0x1163>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -41464,11 +42283,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,91,42,0,0 // movdqa 0x2a5b(%rip),%xmm11 # 7270 <_sk_callback_sse2+0x10a7>
+ .byte 102,68,15,111,29,39,43,0,0 // movdqa 0x2b27(%rip),%xmm11 # 7530 <_sk_callback_sse2+0x1173>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,93,42,0,0 // movdqa 0x2a5d(%rip),%xmm12 # 7280 <_sk_callback_sse2+0x10b7>
+ .byte 102,68,15,111,37,41,43,0,0 // movdqa 0x2b29(%rip),%xmm12 # 7540 <_sk_callback_sse2+0x1183>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,96,42,0,0 // movdqa 0x2a60(%rip),%xmm3 # 7290 <_sk_callback_sse2+0x10c7>
+ .byte 102,15,111,29,44,43,0,0 // movdqa 0x2b2c(%rip),%xmm3 # 7550 <_sk_callback_sse2+0x1193>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -41527,17 +42346,17 @@ _sk_store_f16_sse2:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,117,41,0,0 // movdqa 0x2975(%rip),%xmm10 # 72a0 <_sk_callback_sse2+0x10d7>
+ .byte 102,68,15,111,21,65,42,0,0 // movdqa 0x2a41(%rip),%xmm10 # 7560 <_sk_callback_sse2+0x11a3>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,69,15,219,226 // pand %xmm10,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,236 // pxor %xmm12,%xmm13
- .byte 102,68,15,111,13,104,41,0,0 // movdqa 0x2968(%rip),%xmm9 # 72b0 <_sk_callback_sse2+0x10e7>
+ .byte 102,68,15,111,13,52,42,0,0 // movdqa 0x2a34(%rip),%xmm9 # 7570 <_sk_callback_sse2+0x11b3>
.byte 102,65,15,114,212,16 // psrld $0x10,%xmm12
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,29,89,41,0,0 // movdqa 0x2959(%rip),%xmm11 # 72c0 <_sk_callback_sse2+0x10f7>
+ .byte 102,68,15,111,29,37,42,0,0 // movdqa 0x2a25(%rip),%xmm11 # 7580 <_sk_callback_sse2+0x11c3>
.byte 102,69,15,235,227 // por %xmm11,%xmm12
.byte 102,69,15,254,229 // paddd %xmm13,%xmm12
.byte 102,65,15,114,244,16 // pslld $0x10,%xmm12
@@ -41589,7 +42408,7 @@ _sk_store_f16_sse2:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,204 // punpckldq %xmm12,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 4a89 <_sk_store_f16_sse2+0x17e>
+ .byte 117,21 // jne 4c7d <_sk_store_f16_sse2+0x17e>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -41597,13 +42416,13 @@ _sk_store_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4a85 <_sk_store_f16_sse2+0x17a>
+ .byte 116,240 // je 4c79 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4a85 <_sk_store_f16_sse2+0x17a>
+ .byte 114,227 // jb 4c79 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 4a85 <_sk_store_f16_sse2+0x17a>
+ .byte 235,213 // jmp 4c79 <_sk_store_f16_sse2+0x17a>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -41618,7 +42437,7 @@ _sk_load_u16_be_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,190,0,0,0 // jne 4b95 <_sk_load_u16_be_sse2+0xe5>
+ .byte 15,133,190,0,0,0 // jne 4d89 <_sk_load_u16_be_sse2+0xe5>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 102,65,15,16,76,65,16 // movupd 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -41635,7 +42454,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,168,39,0,0 // movaps 0x27a8(%rip),%xmm8 # 72d0 <_sk_callback_sse2+0x1107>
+ .byte 68,15,40,5,116,40,0,0 // movaps 0x2874(%rip),%xmm8 # 7590 <_sk_callback_sse2+0x11d3>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -41663,17 +42482,17 @@ _sk_load_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 4bb2 <_sk_load_u16_be_sse2+0x102>
+ .byte 117,17 // jne 4da6 <_sk_load_u16_be_sse2+0x102>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,50,255,255,255 // jmpq 4ae4 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,50,255,255,255 // jmpq 4cd8 <_sk_load_u16_be_sse2+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,29,255,255,255 // jb 4ae4 <_sk_load_u16_be_sse2+0x34>
+ .byte 15,130,29,255,255,255 // jb 4cd8 <_sk_load_u16_be_sse2+0x34>
.byte 242,65,15,16,76,65,16 // movsd 0x10(%r9,%rax,2),%xmm1
- .byte 233,17,255,255,255 // jmpq 4ae4 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,17,255,255,255 // jmpq 4cd8 <_sk_load_u16_be_sse2+0x34>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -41690,7 +42509,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,175,0,0,0 // jne 4cad <_sk_load_rgb_u16_be_sse2+0xda>
+ .byte 15,133,175,0,0,0 // jne 4ea1 <_sk_load_rgb_u16_be_sse2+0xda>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -41711,7 +42530,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,13,126,38,0,0 // movaps 0x267e(%rip),%xmm9 # 72e0 <_sk_callback_sse2+0x1117>
+ .byte 68,15,40,13,74,39,0,0 // movaps 0x274a(%rip),%xmm9 # 75a0 <_sk_callback_sse2+0x11e3>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -41728,27 +42547,27 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,69,38,0,0 // movaps 0x2645(%rip),%xmm3 # 72f0 <_sk_callback_sse2+0x1127>
+ .byte 15,40,29,17,39,0,0 // movaps 0x2711(%rip),%xmm3 # 75b0 <_sk_callback_sse2+0x11f3>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 4cd2 <_sk_load_rgb_u16_be_sse2+0xff>
+ .byte 117,13 // jne 4ec6 <_sk_load_rgb_u16_be_sse2+0xff>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,80,255,255,255 // jmpq 4c22 <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,80,255,255,255 // jmpq 4e16 <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 4d03 <_sk_load_rgb_u16_be_sse2+0x130>
+ .byte 114,24 // jb 4ef7 <_sk_load_rgb_u16_be_sse2+0x130>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,31,255,255,255 // jmpq 4c22 <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,31,255,255,255 // jmpq 4e16 <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,22,255,255,255 // jmpq 4c22 <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,22,255,255,255 // jmpq 4e16 <_sk_load_rgb_u16_be_sse2+0x4f>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -41762,7 +42581,7 @@ _sk_store_u16_be_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,206,37,0,0 // movaps 0x25ce(%rip),%xmm10 # 7300 <_sk_callback_sse2+0x1137>
+ .byte 68,15,40,21,154,38,0,0 // movaps 0x269a(%rip),%xmm10 # 75c0 <_sk_callback_sse2+0x1203>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -41807,7 +42626,7 @@ _sk_store_u16_be_sse2:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 4e2c <_sk_store_u16_be_sse2+0x120>
+ .byte 117,21 // jne 5020 <_sk_store_u16_be_sse2+0x120>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -41815,13 +42634,13 @@ _sk_store_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4e28 <_sk_store_u16_be_sse2+0x11c>
+ .byte 116,240 // je 501c <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4e28 <_sk_store_u16_be_sse2+0x11c>
+ .byte 114,227 // jb 501c <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 4e28 <_sk_store_u16_be_sse2+0x11c>
+ .byte 235,213 // jmp 501c <_sk_store_u16_be_sse2+0x11c>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -41837,7 +42656,7 @@ _sk_load_f32_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 4ebe <_sk_load_f32_sse2+0x6b>
+ .byte 117,66 // jne 50b2 <_sk_load_f32_sse2+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -41857,17 +42676,17 @@ _sk_load_f32_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 4ed0 <_sk_load_f32_sse2+0x7d>
+ .byte 117,8 // jne 50c4 <_sk_load_f32_sse2+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 4e8e <_sk_load_f32_sse2+0x3b>
+ .byte 235,190 // jmp 5082 <_sk_load_f32_sse2+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 4ee4 <_sk_load_f32_sse2+0x91>
+ .byte 114,8 // jb 50d8 <_sk_load_f32_sse2+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 4e8e <_sk_load_f32_sse2+0x3b>
+ .byte 235,170 // jmp 5082 <_sk_load_f32_sse2+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 4e8e <_sk_load_f32_sse2+0x3b>
+ .byte 235,165 // jmp 5082 <_sk_load_f32_sse2+0x3b>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -41883,7 +42702,7 @@ _sk_load_f32_dst_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 4f54 <_sk_load_f32_dst_sse2+0x6b>
+ .byte 117,66 // jne 5148 <_sk_load_f32_dst_sse2+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -41903,17 +42722,17 @@ _sk_load_f32_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 4f66 <_sk_load_f32_dst_sse2+0x7d>
+ .byte 117,8 // jne 515a <_sk_load_f32_dst_sse2+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 4f24 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,190 // jmp 5118 <_sk_load_f32_dst_sse2+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 4f7a <_sk_load_f32_dst_sse2+0x91>
+ .byte 114,8 // jb 516e <_sk_load_f32_dst_sse2+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 4f24 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,170 // jmp 5118 <_sk_load_f32_dst_sse2+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 4f24 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,165 // jmp 5118 <_sk_load_f32_dst_sse2+0x3b>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -41942,7 +42761,7 @@ _sk_store_f32_sse2:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 4ffc <_sk_store_f32_sse2+0x7d>
+ .byte 117,29 // jne 51f0 <_sk_store_f32_sse2+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -41950,12 +42769,12 @@ _sk_store_f32_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 4ff8 <_sk_store_f32_sse2+0x79>
+ .byte 116,246 // je 51ec <_sk_store_f32_sse2+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 4ff8 <_sk_store_f32_sse2+0x79>
+ .byte 114,234 // jb 51ec <_sk_store_f32_sse2+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 4ff8 <_sk_store_f32_sse2+0x79>
+ .byte 235,225 // jmp 51ec <_sk_store_f32_sse2+0x79>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -42001,7 +42820,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,123,34,0,0 // andps 0x227b(%rip),%xmm10 # 7310 <_sk_callback_sse2+0x1147>
+ .byte 68,15,84,21,71,35,0,0 // andps 0x2347(%rip),%xmm10 # 75d0 <_sk_callback_sse2+0x1213>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -42027,7 +42846,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,49,34,0,0 // andps 0x2231(%rip),%xmm10 # 7320 <_sk_callback_sse2+0x1157>
+ .byte 68,15,84,21,253,34,0,0 // andps 0x22fd(%rip),%xmm10 # 75e0 <_sk_callback_sse2+0x1223>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -42053,13 +42872,13 @@ _sk_mirror_x_sse2:
.byte 65,15,92,193 // subps %xmm9,%xmm0
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,150,38,0,0 // mulss 0x2696(%rip),%xmm11 # 77e0 <_sk_callback_sse2+0x1617>
+ .byte 243,68,15,89,29,98,39,0,0 // mulss 0x2762(%rip),%xmm11 # 7aa0 <_sk_callback_sse2+0x16e3>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,199,33,0,0 // andps 0x21c7(%rip),%xmm11 # 7330 <_sk_callback_sse2+0x1167>
+ .byte 68,15,84,29,147,34,0,0 // andps 0x2293(%rip),%xmm11 # 75f0 <_sk_callback_sse2+0x1233>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -42088,13 +42907,13 @@ _sk_mirror_y_sse2:
.byte 65,15,92,201 // subps %xmm9,%xmm1
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,21,38,0,0 // mulss 0x2615(%rip),%xmm11 # 77e4 <_sk_callback_sse2+0x161b>
+ .byte 243,68,15,89,29,225,38,0,0 // mulss 0x26e1(%rip),%xmm11 # 7aa4 <_sk_callback_sse2+0x16e7>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,82,33,0,0 // andps 0x2152(%rip),%xmm11 # 7340 <_sk_callback_sse2+0x1177>
+ .byte 68,15,84,29,30,34,0,0 // andps 0x221e(%rip),%xmm11 # 7600 <_sk_callback_sse2+0x1243>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -42117,7 +42936,7 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,25,33,0,0 // minps 0x2119(%rip),%xmm8 # 7350 <_sk_callback_sse2+0x1187>
+ .byte 68,15,93,5,229,33,0,0 // minps 0x21e5(%rip),%xmm8 # 7610 <_sk_callback_sse2+0x1253>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -42130,7 +42949,7 @@ _sk_repeat_x_1_sse2:
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,84,13,7,33,0,0 // andps 0x2107(%rip),%xmm9 # 7360 <_sk_callback_sse2+0x1197>
+ .byte 68,15,84,13,211,33,0,0 // andps 0x21d3(%rip),%xmm9 # 7620 <_sk_callback_sse2+0x1263>
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -42140,14 +42959,14 @@ HIDDEN _sk_mirror_x_1_sse2
.globl _sk_mirror_x_1_sse2
FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
- .byte 68,15,40,5,3,33,0,0 // movaps 0x2103(%rip),%xmm8 # 7370 <_sk_callback_sse2+0x11a7>
+ .byte 68,15,40,5,207,33,0,0 // movaps 0x21cf(%rip),%xmm8 # 7630 <_sk_callback_sse2+0x1273>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,7,33,0,0 // movaps 0x2107(%rip),%xmm9 # 7380 <_sk_callback_sse2+0x11b7>
+ .byte 68,15,40,13,211,33,0,0 // movaps 0x21d3(%rip),%xmm9 # 7640 <_sk_callback_sse2+0x1283>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,253,32,0,0 // andps 0x20fd(%rip),%xmm9 # 7390 <_sk_callback_sse2+0x11c7>
+ .byte 68,15,84,13,201,33,0,0 // andps 0x21c9(%rip),%xmm9 # 7650 <_sk_callback_sse2+0x1293>
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,88,210 // addps %xmm10,%xmm10
@@ -42163,10 +42982,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,227,32,0,0 // mulps 0x20e3(%rip),%xmm0 # 73a0 <_sk_callback_sse2+0x11d7>
- .byte 15,89,13,236,32,0,0 // mulps 0x20ec(%rip),%xmm1 # 73b0 <_sk_callback_sse2+0x11e7>
+ .byte 15,89,5,175,33,0,0 // mulps 0x21af(%rip),%xmm0 # 7660 <_sk_callback_sse2+0x12a3>
+ .byte 15,89,13,184,33,0,0 // mulps 0x21b8(%rip),%xmm1 # 7670 <_sk_callback_sse2+0x12b3>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,242,32,0,0 // mulps 0x20f2(%rip),%xmm3 # 73c0 <_sk_callback_sse2+0x11f7>
+ .byte 15,89,29,190,33,0,0 // mulps 0x21be(%rip),%xmm3 # 7680 <_sk_callback_sse2+0x12c3>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -42478,9 +43297,9 @@ _sk_evenly_spaced_gradient_sse2:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 576e <_sk_evenly_spaced_gradient_sse2+0x18>
+ .byte 120,7 // js 5962 <_sk_evenly_spaced_gradient_sse2+0x18>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 5783 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ .byte 235,21 // jmp 5977 <_sk_evenly_spaced_gradient_sse2+0x2d>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -42578,15 +43397,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2
.globl _sk_gauss_a_to_rgba_sse2
FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
- .byte 15,40,5,193,26,0,0 // movaps 0x1ac1(%rip),%xmm0 # 73d0 <_sk_callback_sse2+0x1207>
+ .byte 15,40,5,141,27,0,0 // movaps 0x1b8d(%rip),%xmm0 # 7690 <_sk_callback_sse2+0x12d3>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,199,26,0,0 // addps 0x1ac7(%rip),%xmm0 # 73e0 <_sk_callback_sse2+0x1217>
+ .byte 15,88,5,147,27,0,0 // addps 0x1b93(%rip),%xmm0 # 76a0 <_sk_callback_sse2+0x12e3>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,205,26,0,0 // addps 0x1acd(%rip),%xmm0 # 73f0 <_sk_callback_sse2+0x1227>
+ .byte 15,88,5,153,27,0,0 // addps 0x1b99(%rip),%xmm0 # 76b0 <_sk_callback_sse2+0x12f3>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,211,26,0,0 // addps 0x1ad3(%rip),%xmm0 # 7400 <_sk_callback_sse2+0x1237>
+ .byte 15,88,5,159,27,0,0 // addps 0x1b9f(%rip),%xmm0 # 76c0 <_sk_callback_sse2+0x1303>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,217,26,0,0 // addps 0x1ad9(%rip),%xmm0 # 7410 <_sk_callback_sse2+0x1247>
+ .byte 15,88,5,165,27,0,0 // addps 0x1ba5(%rip),%xmm0 # 76d0 <_sk_callback_sse2+0x1313>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -42604,12 +43423,12 @@ _sk_gradient_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 598a <_sk_gradient_sse2+0x46>
+ .byte 114,50 // jb 5b7e <_sk_gradient_sse2+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,178,26,0,0 // movaps 0x1ab2(%rip),%xmm2 # 7420 <_sk_callback_sse2+0x1257>
+ .byte 15,40,21,126,27,0,0 // movaps 0x1b7e(%rip),%xmm2 # 76e0 <_sk_callback_sse2+0x1323>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -42617,7 +43436,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 596e <_sk_gradient_sse2+0x2a>
+ .byte 117,228 // jne 5b62 <_sk_gradient_sse2+0x2a>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,211 // movq %xmm2,%r11
.byte 69,137,217 // mov %r11d,%r9d
@@ -42756,29 +43575,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,115,24,0,0 // movaps 0x1873(%rip),%xmm13 # 7430 <_sk_callback_sse2+0x1267>
+ .byte 68,15,40,45,63,25,0,0 // movaps 0x193f(%rip),%xmm13 # 76f0 <_sk_callback_sse2+0x1333>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,119,24,0,0 // addps 0x1877(%rip),%xmm13 # 7440 <_sk_callback_sse2+0x1277>
+ .byte 68,15,88,45,67,25,0,0 // addps 0x1943(%rip),%xmm13 # 7700 <_sk_callback_sse2+0x1343>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,123,24,0,0 // addps 0x187b(%rip),%xmm13 # 7450 <_sk_callback_sse2+0x1287>
+ .byte 68,15,88,45,71,25,0,0 // addps 0x1947(%rip),%xmm13 # 7710 <_sk_callback_sse2+0x1353>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,127,24,0,0 // addps 0x187f(%rip),%xmm13 # 7460 <_sk_callback_sse2+0x1297>
+ .byte 68,15,88,45,75,25,0,0 // addps 0x194b(%rip),%xmm13 # 7720 <_sk_callback_sse2+0x1363>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,126,24,0,0 // movaps 0x187e(%rip),%xmm10 # 7470 <_sk_callback_sse2+0x12a7>
+ .byte 68,15,40,21,74,25,0,0 // movaps 0x194a(%rip),%xmm10 # 7730 <_sk_callback_sse2+0x1373>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,113,24,0,0 // movaps 0x1871(%rip),%xmm10 # 7480 <_sk_callback_sse2+0x12b7>
+ .byte 68,15,40,21,61,25,0,0 // movaps 0x193d(%rip),%xmm10 # 7740 <_sk_callback_sse2+0x1383>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,96,24,0,0 // movaps 0x1860(%rip),%xmm10 # 7490 <_sk_callback_sse2+0x12c7>
+ .byte 68,15,40,21,44,25,0,0 // movaps 0x192c(%rip),%xmm10 # 7750 <_sk_callback_sse2+0x1393>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -42813,7 +43632,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,7,24,0,0 // mulps 0x1807(%rip),%xmm9 # 74a0 <_sk_callback_sse2+0x12d7>
+ .byte 68,15,89,13,211,24,0,0 // mulps 0x18d3(%rip),%xmm9 # 7760 <_sk_callback_sse2+0x13a3>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -42821,7 +43640,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,242,23,0,0 // mulps 0x17f2(%rip),%xmm10 # 74b0 <_sk_callback_sse2+0x12e7>
+ .byte 68,15,89,21,190,24,0,0 // mulps 0x18be(%rip),%xmm10 # 7770 <_sk_callback_sse2+0x13b3>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -42830,8 +43649,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,218,23,0,0 // xorps 0x17da(%rip),%xmm9 # 74c0 <_sk_callback_sse2+0x12f7>
- .byte 68,15,89,5,226,23,0,0 // mulps 0x17e2(%rip),%xmm8 # 74d0 <_sk_callback_sse2+0x1307>
+ .byte 68,15,87,13,166,24,0,0 // xorps 0x18a6(%rip),%xmm9 # 7780 <_sk_callback_sse2+0x13c3>
+ .byte 68,15,89,5,174,24,0,0 // mulps 0x18ae(%rip),%xmm8 # 7790 <_sk_callback_sse2+0x13d3>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -42852,7 +43671,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,169,23,0,0 // mulps 0x17a9(%rip),%xmm9 # 74e0 <_sk_callback_sse2+0x1317>
+ .byte 68,15,89,13,117,24,0,0 // mulps 0x1875(%rip),%xmm9 # 77a0 <_sk_callback_sse2+0x13e3>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -42860,7 +43679,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,148,23,0,0 // mulps 0x1794(%rip),%xmm10 # 74f0 <_sk_callback_sse2+0x1327>
+ .byte 68,15,89,21,96,24,0,0 // mulps 0x1860(%rip),%xmm10 # 77b0 <_sk_callback_sse2+0x13f3>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -42869,8 +43688,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,124,23,0,0 // xorps 0x177c(%rip),%xmm9 # 7500 <_sk_callback_sse2+0x1337>
- .byte 68,15,89,5,132,23,0,0 // mulps 0x1784(%rip),%xmm8 # 7510 <_sk_callback_sse2+0x1347>
+ .byte 68,15,87,13,72,24,0,0 // xorps 0x1848(%rip),%xmm9 # 77c0 <_sk_callback_sse2+0x1403>
+ .byte 68,15,89,5,80,24,0,0 // mulps 0x1850(%rip),%xmm8 # 77d0 <_sk_callback_sse2+0x1413>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -42888,7 +43707,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,92,23,0,0 // mulps 0x175c(%rip),%xmm9 # 7520 <_sk_callback_sse2+0x1357>
+ .byte 68,15,89,13,40,24,0,0 // mulps 0x1828(%rip),%xmm9 # 77e0 <_sk_callback_sse2+0x1423>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -42896,7 +43715,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,72,23,0,0 // xorps 0x1748(%rip),%xmm0 # 7530 <_sk_callback_sse2+0x1367>
+ .byte 15,87,5,20,24,0,0 // xorps 0x1814(%rip),%xmm0 # 77f0 <_sk_callback_sse2+0x1433>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -42939,7 +43758,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,238,22,0,0 // movaps 0x16ee(%rip),%xmm8 # 7540 <_sk_callback_sse2+0x1377>
+ .byte 68,15,40,5,186,23,0,0 // movaps 0x17ba(%rip),%xmm8 # 7800 <_sk_callback_sse2+0x1443>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -42947,7 +43766,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,217,22,0,0 // movaps 0x16d9(%rip),%xmm12 # 7550 <_sk_callback_sse2+0x1387>
+ .byte 68,15,40,37,165,23,0,0 // movaps 0x17a5(%rip),%xmm12 # 7810 <_sk_callback_sse2+0x1453>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -42994,8 +43813,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,82,22,0,0 // addps 0x1652(%rip),%xmm0 # 7560 <_sk_callback_sse2+0x1397>
- .byte 68,15,40,13,90,22,0,0 // movaps 0x165a(%rip),%xmm9 # 7570 <_sk_callback_sse2+0x13a7>
+ .byte 15,88,5,30,23,0,0 // addps 0x171e(%rip),%xmm0 # 7820 <_sk_callback_sse2+0x1463>
+ .byte 68,15,40,13,38,23,0,0 // movaps 0x1726(%rip),%xmm9 # 7830 <_sk_callback_sse2+0x1473>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43008,7 +43827,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,73,22,0,0 // addps 0x1649(%rip),%xmm0 # 7580 <_sk_callback_sse2+0x13b7>
+ .byte 15,88,5,21,23,0,0 // addps 0x1715(%rip),%xmm0 # 7840 <_sk_callback_sse2+0x1483>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43020,8 +43839,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,59,22,0,0 // addps 0x163b(%rip),%xmm1 # 7590 <_sk_callback_sse2+0x13c7>
- .byte 68,15,40,13,67,22,0,0 // movaps 0x1643(%rip),%xmm9 # 75a0 <_sk_callback_sse2+0x13d7>
+ .byte 15,88,13,7,23,0,0 // addps 0x1707(%rip),%xmm1 # 7850 <_sk_callback_sse2+0x1493>
+ .byte 68,15,40,13,15,23,0,0 // movaps 0x170f(%rip),%xmm9 # 7860 <_sk_callback_sse2+0x14a3>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43034,7 +43853,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,49,22,0,0 // addps 0x1631(%rip),%xmm1 # 75b0 <_sk_callback_sse2+0x13e7>
+ .byte 15,88,13,253,22,0,0 // addps 0x16fd(%rip),%xmm1 # 7870 <_sk_callback_sse2+0x14b3>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43046,13 +43865,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,36,22,0,0 // addps 0x1624(%rip),%xmm0 # 75c0 <_sk_callback_sse2+0x13f7>
- .byte 68,15,40,13,44,22,0,0 // movaps 0x162c(%rip),%xmm9 # 75d0 <_sk_callback_sse2+0x1407>
+ .byte 15,88,5,240,22,0,0 // addps 0x16f0(%rip),%xmm0 # 7880 <_sk_callback_sse2+0x14c3>
+ .byte 68,15,40,13,248,22,0,0 // movaps 0x16f8(%rip),%xmm9 # 7890 <_sk_callback_sse2+0x14d3>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,40,22,0,0 // mulps 0x1628(%rip),%xmm9 # 75e0 <_sk_callback_sse2+0x1417>
- .byte 68,15,88,13,48,22,0,0 // addps 0x1630(%rip),%xmm9 # 75f0 <_sk_callback_sse2+0x1427>
+ .byte 68,15,89,13,244,22,0,0 // mulps 0x16f4(%rip),%xmm9 # 78a0 <_sk_callback_sse2+0x14e3>
+ .byte 68,15,88,13,252,22,0,0 // addps 0x16fc(%rip),%xmm9 # 78b0 <_sk_callback_sse2+0x14f3>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43065,16 +43884,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,31,22,0,0 // addps 0x161f(%rip),%xmm0 # 7600 <_sk_callback_sse2+0x1437>
- .byte 68,15,40,13,39,22,0,0 // movaps 0x1627(%rip),%xmm9 # 7610 <_sk_callback_sse2+0x1447>
+ .byte 15,88,5,235,22,0,0 // addps 0x16eb(%rip),%xmm0 # 78c0 <_sk_callback_sse2+0x1503>
+ .byte 68,15,40,13,243,22,0,0 // movaps 0x16f3(%rip),%xmm9 # 78d0 <_sk_callback_sse2+0x1513>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,43,22,0,0 // movaps 0x162b(%rip),%xmm8 # 7620 <_sk_callback_sse2+0x1457>
+ .byte 68,15,40,5,247,22,0,0 // movaps 0x16f7(%rip),%xmm8 # 78e0 <_sk_callback_sse2+0x1523>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,47,22,0,0 // addps 0x162f(%rip),%xmm8 # 7630 <_sk_callback_sse2+0x1467>
+ .byte 68,15,88,5,251,22,0,0 // addps 0x16fb(%rip),%xmm8 # 78f0 <_sk_callback_sse2+0x1533>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,51,22,0,0 // addps 0x1633(%rip),%xmm8 # 7640 <_sk_callback_sse2+0x1477>
+ .byte 68,15,88,5,255,22,0,0 // addps 0x16ff(%rip),%xmm8 # 7900 <_sk_callback_sse2+0x1543>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,55,22,0,0 // addps 0x1637(%rip),%xmm8 # 7650 <_sk_callback_sse2+0x1487>
+ .byte 68,15,88,5,3,23,0,0 // addps 0x1703(%rip),%xmm8 # 7910 <_sk_callback_sse2+0x1553>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43084,17 +43903,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,49,22,0,0 // movaps 0x1631(%rip),%xmm8 # 7660 <_sk_callback_sse2+0x1497>
+ .byte 68,15,40,5,253,22,0,0 // movaps 0x16fd(%rip),%xmm8 # 7920 <_sk_callback_sse2+0x1563>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,45,22,0,0 // movaps 0x162d(%rip),%xmm10 # 7670 <_sk_callback_sse2+0x14a7>
+ .byte 68,15,40,21,249,22,0,0 // movaps 0x16f9(%rip),%xmm10 # 7930 <_sk_callback_sse2+0x1573>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,49,22,0,0 // addps 0x1631(%rip),%xmm10 # 7680 <_sk_callback_sse2+0x14b7>
+ .byte 68,15,88,21,253,22,0,0 // addps 0x16fd(%rip),%xmm10 # 7940 <_sk_callback_sse2+0x1583>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,45,22,0,0 // addps 0x162d(%rip),%xmm10 # 7690 <_sk_callback_sse2+0x14c7>
+ .byte 68,15,88,21,249,22,0,0 // addps 0x16f9(%rip),%xmm10 # 7950 <_sk_callback_sse2+0x1593>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43106,11 +43925,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,32,22,0,0 // addps 0x1620(%rip),%xmm0 # 76a0 <_sk_callback_sse2+0x14d7>
+ .byte 15,88,5,236,22,0,0 // addps 0x16ec(%rip),%xmm0 # 7960 <_sk_callback_sse2+0x15a3>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,32,22,0,0 // mulps 0x1620(%rip),%xmm8 # 76b0 <_sk_callback_sse2+0x14e7>
- .byte 68,15,88,5,40,22,0,0 // addps 0x1628(%rip),%xmm8 # 76c0 <_sk_callback_sse2+0x14f7>
+ .byte 68,15,89,5,236,22,0,0 // mulps 0x16ec(%rip),%xmm8 # 7970 <_sk_callback_sse2+0x15b3>
+ .byte 68,15,88,5,244,22,0,0 // addps 0x16f4(%rip),%xmm8 # 7980 <_sk_callback_sse2+0x15c3>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43123,13 +43942,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,22,22,0,0 // addps 0x1616(%rip),%xmm1 # 76d0 <_sk_callback_sse2+0x1507>
- .byte 68,15,40,13,30,22,0,0 // movaps 0x161e(%rip),%xmm9 # 76e0 <_sk_callback_sse2+0x1517>
+ .byte 15,88,13,226,22,0,0 // addps 0x16e2(%rip),%xmm1 # 7990 <_sk_callback_sse2+0x15d3>
+ .byte 68,15,40,13,234,22,0,0 // movaps 0x16ea(%rip),%xmm9 # 79a0 <_sk_callback_sse2+0x15e3>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,26,22,0,0 // mulps 0x161a(%rip),%xmm9 # 76f0 <_sk_callback_sse2+0x1527>
- .byte 68,15,88,13,34,22,0,0 // addps 0x1622(%rip),%xmm9 # 7700 <_sk_callback_sse2+0x1537>
+ .byte 68,15,89,13,230,22,0,0 // mulps 0x16e6(%rip),%xmm9 # 79b0 <_sk_callback_sse2+0x15f3>
+ .byte 68,15,88,13,238,22,0,0 // addps 0x16ee(%rip),%xmm9 # 79c0 <_sk_callback_sse2+0x1603>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43142,16 +43961,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,16,22,0,0 // addps 0x1610(%rip),%xmm1 # 7710 <_sk_callback_sse2+0x1547>
- .byte 68,15,40,13,24,22,0,0 // movaps 0x1618(%rip),%xmm9 # 7720 <_sk_callback_sse2+0x1557>
+ .byte 15,88,13,220,22,0,0 // addps 0x16dc(%rip),%xmm1 # 79d0 <_sk_callback_sse2+0x1613>
+ .byte 68,15,40,13,228,22,0,0 // movaps 0x16e4(%rip),%xmm9 # 79e0 <_sk_callback_sse2+0x1623>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,28,22,0,0 // movaps 0x161c(%rip),%xmm8 # 7730 <_sk_callback_sse2+0x1567>
+ .byte 68,15,40,5,232,22,0,0 // movaps 0x16e8(%rip),%xmm8 # 79f0 <_sk_callback_sse2+0x1633>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,32,22,0,0 // addps 0x1620(%rip),%xmm8 # 7740 <_sk_callback_sse2+0x1577>
+ .byte 68,15,88,5,236,22,0,0 // addps 0x16ec(%rip),%xmm8 # 7a00 <_sk_callback_sse2+0x1643>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,36,22,0,0 // addps 0x1624(%rip),%xmm8 # 7750 <_sk_callback_sse2+0x1587>
+ .byte 68,15,88,5,240,22,0,0 // addps 0x16f0(%rip),%xmm8 # 7a10 <_sk_callback_sse2+0x1653>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,40,22,0,0 // addps 0x1628(%rip),%xmm8 # 7760 <_sk_callback_sse2+0x1597>
+ .byte 68,15,88,5,244,22,0,0 // addps 0x16f4(%rip),%xmm8 # 7a20 <_sk_callback_sse2+0x1663>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43161,17 +43980,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,34,22,0,0 // movaps 0x1622(%rip),%xmm8 # 7770 <_sk_callback_sse2+0x15a7>
+ .byte 68,15,40,5,238,22,0,0 // movaps 0x16ee(%rip),%xmm8 # 7a30 <_sk_callback_sse2+0x1673>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,29,22,0,0 // movaps 0x161d(%rip),%xmm10 # 7780 <_sk_callback_sse2+0x15b7>
+ .byte 68,15,40,21,233,22,0,0 // movaps 0x16e9(%rip),%xmm10 # 7a40 <_sk_callback_sse2+0x1683>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,33,22,0,0 // addps 0x1621(%rip),%xmm10 # 7790 <_sk_callback_sse2+0x15c7>
+ .byte 68,15,88,21,237,22,0,0 // addps 0x16ed(%rip),%xmm10 # 7a50 <_sk_callback_sse2+0x1693>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,29,22,0,0 // addps 0x161d(%rip),%xmm10 # 77a0 <_sk_callback_sse2+0x15d7>
+ .byte 68,15,88,21,233,22,0,0 // addps 0x16e9(%rip),%xmm10 # 7a60 <_sk_callback_sse2+0x16a3>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43183,11 +44002,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,15,22,0,0 // addps 0x160f(%rip),%xmm1 # 77b0 <_sk_callback_sse2+0x15e7>
+ .byte 15,88,13,219,22,0,0 // addps 0x16db(%rip),%xmm1 # 7a70 <_sk_callback_sse2+0x16b3>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,15,22,0,0 // mulps 0x160f(%rip),%xmm8 # 77c0 <_sk_callback_sse2+0x15f7>
- .byte 68,15,88,5,23,22,0,0 // addps 0x1617(%rip),%xmm8 # 77d0 <_sk_callback_sse2+0x1607>
+ .byte 68,15,89,5,219,22,0,0 // mulps 0x16db(%rip),%xmm8 # 7a80 <_sk_callback_sse2+0x16c3>
+ .byte 68,15,88,5,227,22,0,0 // addps 0x16e3(%rip),%xmm8 # 7a90 <_sk_callback_sse2+0x16d3>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43429,9 +44248,9 @@ BALIGN16
.byte 128,191,0,0,224,64,0 // cmpb $0x0,0x40e00000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 64bc <.literal16+0x1fc>
+ .byte 224,64 // loopne 66ac <.literal16+0x1fc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 64c0 <.literal16+0x200>
+ .byte 224,64 // loopne 66b0 <.literal16+0x200>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -43451,13 +44270,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 64e1 <.literal16+0x221>
+ .byte 71,225,61 // rex.RXB loope 66d1 <.literal16+0x221>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 64e5 <.literal16+0x225>
+ .byte 71,225,61 // rex.RXB loope 66d5 <.literal16+0x225>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 64e9 <.literal16+0x229>
+ .byte 71,225,61 // rex.RXB loope 66d9 <.literal16+0x229>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 64ed <.literal16+0x22d>
+ .byte 71,225,61 // rex.RXB loope 66dd <.literal16+0x22d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43482,13 +44301,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6521 <.literal16+0x261>
+ .byte 71,225,61 // rex.RXB loope 6711 <.literal16+0x261>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6525 <.literal16+0x265>
+ .byte 71,225,61 // rex.RXB loope 6715 <.literal16+0x265>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6529 <.literal16+0x269>
+ .byte 71,225,61 // rex.RXB loope 6719 <.literal16+0x269>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 652d <.literal16+0x26d>
+ .byte 71,225,61 // rex.RXB loope 671d <.literal16+0x26d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43513,13 +44332,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6561 <.literal16+0x2a1>
+ .byte 71,225,61 // rex.RXB loope 6751 <.literal16+0x2a1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6565 <.literal16+0x2a5>
+ .byte 71,225,61 // rex.RXB loope 6755 <.literal16+0x2a5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6569 <.literal16+0x2a9>
+ .byte 71,225,61 // rex.RXB loope 6759 <.literal16+0x2a9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 656d <.literal16+0x2ad>
+ .byte 71,225,61 // rex.RXB loope 675d <.literal16+0x2ad>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43544,13 +44363,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 65a1 <.literal16+0x2e1>
+ .byte 71,225,61 // rex.RXB loope 6791 <.literal16+0x2e1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 65a5 <.literal16+0x2e5>
+ .byte 71,225,61 // rex.RXB loope 6795 <.literal16+0x2e5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 65a9 <.literal16+0x2e9>
+ .byte 71,225,61 // rex.RXB loope 6799 <.literal16+0x2e9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 65ad <.literal16+0x2ed>
+ .byte 71,225,61 // rex.RXB loope 679d <.literal16+0x2ed>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43571,11 +44390,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
.byte 67,0,0 // rex.XB add %al,(%r8)
- .byte 127,67 // jg 65eb <.literal16+0x32b>
+ .byte 127,67 // jg 67db <.literal16+0x32b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 65ef <.literal16+0x32f>
+ .byte 127,67 // jg 67df <.literal16+0x32f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 65f3 <.literal16+0x333>
+ .byte 127,67 // jg 67e3 <.literal16+0x333>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43867,13 +44686,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6849 <.literal16+0x589>
+ .byte 224,7 // loopne 6a39 <.literal16+0x589>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 684d <.literal16+0x58d>
+ .byte 224,7 // loopne 6a3d <.literal16+0x58d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6851 <.literal16+0x591>
+ .byte 224,7 // loopne 6a41 <.literal16+0x591>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6855 <.literal16+0x595>
+ .byte 224,7 // loopne 6a45 <.literal16+0x595>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -43938,11 +44757,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 692b <.literal16+0x66b>
+ .byte 127,67 // jg 6b1b <.literal16+0x66b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 692f <.literal16+0x66f>
+ .byte 127,67 // jg 6b1f <.literal16+0x66f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6933 <.literal16+0x673>
+ .byte 127,67 // jg 6b23 <.literal16+0x673>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -43957,16 +44776,111 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6924 <.literal16+0x664>
+ .byte 127,0 // jg 6b14 <.literal16+0x664>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6b18 <.literal16+0x668>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6b1c <.literal16+0x66c>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6b20 <.literal16+0x670>
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 119,115 // ja 6ba5 <.literal16+0x6f5>
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,117,191 // retq $0xbf75
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // (bad)
+ .byte 117,191 // jne 6b09 <.literal16+0x659>
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // (bad)
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3ab4a <_sk_callback_sse2+0xffffffffe9a3478d>
+ .byte 220,63 // fdivrl (%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,0 // cmpb $0x0,(%rdi)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
+ .byte 63 // (bad)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,81 // cmpb $0x51,(%rdi)
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,141,188,190,63,141,188,190 // lea -0x414372c1(%rsi,%r15,4),%edi
+ .byte 63 // (bad)
+ .byte 141,188,190,63,141,188,190 // lea -0x414372c1(%rsi,%rdi,4),%edi
+ .byte 63 // (bad)
+ .byte 248 // clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,254 // rex (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 75,0,0 // rex.WXB add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 75,0,0 // rex.WXB add %al,(%r8)
+ .byte 0,52,0 // add %dh,(%rax,%rax,1)
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6be4 <.literal16+0x734>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6928 <.literal16+0x668>
+ .byte 127,0 // jg 6be8 <.literal16+0x738>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 692c <.literal16+0x66c>
+ .byte 127,0 // jg 6bec <.literal16+0x73c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6930 <.literal16+0x670>
+ .byte 127,0 // jg 6bf0 <.literal16+0x740>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -43975,7 +44889,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 69b5 <.literal16+0x6f5>
+ .byte 119,115 // ja 6c75 <.literal16+0x7c5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -43986,7 +44900,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6919 <.literal16+0x659>
+ .byte 117,191 // jne 6bd9 <.literal16+0x729>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -43998,7 +44912,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a95a <_sk_callback_sse2+0xffffffffe9a34791>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3ac1a <_sk_callback_sse2+0xffffffffe9a3485d>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44052,16 +44966,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 69f4 <.literal16+0x734>
+ .byte 127,0 // jg 6cb4 <.literal16+0x804>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 69f8 <.literal16+0x738>
+ .byte 127,0 // jg 6cb8 <.literal16+0x808>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 69fc <.literal16+0x73c>
+ .byte 127,0 // jg 6cbc <.literal16+0x80c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6a00 <.literal16+0x740>
+ .byte 127,0 // jg 6cc0 <.literal16+0x810>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -44070,7 +44984,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6a85 <.literal16+0x7c5>
+ .byte 119,115 // ja 6d45 <.literal16+0x895>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -44081,7 +44995,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 69e9 <.literal16+0x729>
+ .byte 117,191 // jne 6ca9 <.literal16+0x7f9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -44093,7 +45007,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3aa2a <_sk_callback_sse2+0xffffffffe9a34861>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3acea <_sk_callback_sse2+0xffffffffe9a3492d>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44147,16 +45061,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6ac4 <.literal16+0x804>
+ .byte 127,0 // jg 6d84 <.literal16+0x8d4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6ac8 <.literal16+0x808>
+ .byte 127,0 // jg 6d88 <.literal16+0x8d8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6acc <.literal16+0x80c>
+ .byte 127,0 // jg 6d8c <.literal16+0x8dc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6ad0 <.literal16+0x810>
+ .byte 127,0 // jg 6d90 <.literal16+0x8e0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -44165,7 +45079,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6b55 <.literal16+0x895>
+ .byte 119,115 // ja 6e15 <.literal16+0x965>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -44176,7 +45090,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6ab9 <.literal16+0x7f9>
+ .byte 117,191 // jne 6d79 <.literal16+0x8c9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -44188,7 +45102,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3aafa <_sk_callback_sse2+0xffffffffe9a34931>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3adba <_sk_callback_sse2+0xffffffffe9a349fd>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44242,16 +45156,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6b94 <.literal16+0x8d4>
+ .byte 127,0 // jg 6e54 <.literal16+0x9a4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6b98 <.literal16+0x8d8>
+ .byte 127,0 // jg 6e58 <.literal16+0x9a8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6b9c <.literal16+0x8dc>
+ .byte 127,0 // jg 6e5c <.literal16+0x9ac>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6ba0 <.literal16+0x8e0>
+ .byte 127,0 // jg 6e60 <.literal16+0x9b0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -44260,7 +45174,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6c25 <.literal16+0x965>
+ .byte 119,115 // ja 6ee5 <.literal16+0xa35>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -44271,7 +45185,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6b89 <.literal16+0x8c9>
+ .byte 117,191 // jne 6e49 <.literal16+0x999>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -44283,7 +45197,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3abca <_sk_callback_sse2+0xffffffffe9a34a01>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3ae8a <_sk_callback_sse2+0xffffffffe9a34acd>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44333,13 +45247,13 @@ BALIGN16
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 6ca7 <.literal16+0x9e7>
+ .byte 127,67 // jg 6f67 <.literal16+0xab7>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6cab <.literal16+0x9eb>
+ .byte 127,67 // jg 6f6b <.literal16+0xabb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6caf <.literal16+0x9ef>
+ .byte 127,67 // jg 6f6f <.literal16+0xabf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6cb3 <.literal16+0x9f3>
+ .byte 127,67 // jg 6f73 <.literal16+0xac3>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -44386,16 +45300,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6d33 <.literal16+0xa73>
+ .byte 118,63 // jbe 6ff3 <.literal16+0xb43>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6d37 <.literal16+0xa77>
+ .byte 118,63 // jbe 6ff7 <.literal16+0xb47>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6d3b <.literal16+0xa7b>
+ .byte 118,63 // jbe 6ffb <.literal16+0xb4b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6d3f <.literal16+0xa7f>
+ .byte 118,63 // jbe 6fff <.literal16+0xb4f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -44424,11 +45338,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6dab <.literal16+0xaeb>
+ .byte 127,67 // jg 706b <.literal16+0xbbb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6daf <.literal16+0xaef>
+ .byte 127,67 // jg 706f <.literal16+0xbbf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6db3 <.literal16+0xaf3>
+ .byte 127,67 // jg 7073 <.literal16+0xbc3>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -44490,13 +45404,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6e29 <.literal16+0xb69>
+ .byte 224,7 // loopne 70e9 <.literal16+0xc39>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6e2d <.literal16+0xb6d>
+ .byte 224,7 // loopne 70ed <.literal16+0xc3d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6e31 <.literal16+0xb71>
+ .byte 224,7 // loopne 70f1 <.literal16+0xc41>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6e35 <.literal16+0xb75>
+ .byte 224,7 // loopne 70f5 <.literal16+0xc45>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -44542,13 +45456,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6e99 <.literal16+0xbd9>
+ .byte 224,7 // loopne 7159 <.literal16+0xca9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6e9d <.literal16+0xbdd>
+ .byte 224,7 // loopne 715d <.literal16+0xcad>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6ea1 <.literal16+0xbe1>
+ .byte 224,7 // loopne 7161 <.literal16+0xcb1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6ea5 <.literal16+0xbe5>
+ .byte 224,7 // loopne 7165 <.literal16+0xcb5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -44594,13 +45508,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6f09 <.literal16+0xc49>
+ .byte 224,7 // loopne 71c9 <.literal16+0xd19>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6f0d <.literal16+0xc4d>
+ .byte 224,7 // loopne 71cd <.literal16+0xd1d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6f11 <.literal16+0xc51>
+ .byte 224,7 // loopne 71d1 <.literal16+0xd21>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6f15 <.literal16+0xc55>
+ .byte 224,7 // loopne 71d5 <.literal16+0xd25>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -44638,13 +45552,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 6fa6 <.literal16+0xce6>
+ .byte 124,66 // jl 7266 <.literal16+0xdb6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6faa <.literal16+0xcea>
+ .byte 124,66 // jl 726a <.literal16+0xdba>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6fae <.literal16+0xcee>
+ .byte 124,66 // jl 726e <.literal16+0xdbe>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6fb2 <.literal16+0xcf2>
+ .byte 124,66 // jl 7272 <.literal16+0xdc2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -44778,13 +45692,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 7135 <.literal16+0xe75>
+ .byte 112,65 // jo 73f5 <.literal16+0xf45>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 7139 <.literal16+0xe79>
+ .byte 112,65 // jo 73f9 <.literal16+0xf49>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 713d <.literal16+0xe7d>
+ .byte 112,65 // jo 73fd <.literal16+0xf4d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 7141 <.literal16+0xe81>
+ .byte 112,65 // jo 7401 <.literal16+0xf51>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -44815,11 +45729,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 71ab <.literal16+0xeeb>
+ .byte 127,67 // jg 746b <.literal16+0xfbb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 71af <.literal16+0xeef>
+ .byte 127,67 // jg 746f <.literal16+0xfbf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 71b3 <.literal16+0xef3>
+ .byte 127,67 // jg 7473 <.literal16+0xfc3>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -44850,11 +45764,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 721b <.literal16+0xf5b>
+ .byte 127,67 // jg 74db <.literal16+0x102b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 721f <.literal16+0xf5f>
+ .byte 127,67 // jg 74df <.literal16+0x102f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 7223 <.literal16+0xf63>
+ .byte 127,67 // jg 74e3 <.literal16+0x1033>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -44950,13 +45864,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 734b <.literal16+0x108b>
+ .byte 127,71 // jg 760b <.literal16+0x115b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 734f <.literal16+0x108f>
+ .byte 127,71 // jg 760f <.literal16+0x115f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7353 <.literal16+0x1093>
+ .byte 127,71 // jg 7613 <.literal16+0x1163>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7357 <.literal16+0x1097>
+ .byte 127,71 // jg 7617 <.literal16+0x1167>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -45033,10 +45947,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc084ea <_sk_callback_sse2+0x2dc02321>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc087aa <_sk_callback_sse2+0x2dc023ed>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 741c <.literal16+0x115c>
+ .byte 120,57 // js 76dc <.literal16+0x122c>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -45223,11 +46137,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 7602 <.literal16+0x1342>
+ .byte 62,114,28 // jb,pt 78c2 <.literal16+0x1412>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7606 <.literal16+0x1346>
+ .byte 62,114,28 // jb,pt 78c6 <.literal16+0x1416>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 760a <.literal16+0x134a>
+ .byte 62,114,28 // jb,pt 78ca <.literal16+0x141a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -45271,7 +46185,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640495 <_sk_callback_sse2+0x3d63a2cc>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640755 <_sk_callback_sse2+0x3d63a398>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -45297,7 +46211,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6404d5 <_sk_callback_sse2+0x3d63a30c>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640795 <_sk_callback_sse2+0x3d63a3d8>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -45306,13 +46220,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 76ce <.literal16+0x140e>
+ .byte 114,28 // jb 798e <.literal16+0x14de>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 76d2 <.literal16+0x1412>
+ .byte 62,114,28 // jb,pt 7992 <.literal16+0x14e2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 76d6 <.literal16+0x1416>
+ .byte 62,114,28 // jb,pt 7996 <.literal16+0x14e6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 76da <.literal16+0x141a>
+ .byte 62,114,28 // jb,pt 799a <.literal16+0x14ea>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -45333,11 +46247,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 7712 <.literal16+0x1452>
+ .byte 62,114,28 // jb,pt 79d2 <.literal16+0x1522>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7716 <.literal16+0x1456>
+ .byte 62,114,28 // jb,pt 79d6 <.literal16+0x1526>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 771a <.literal16+0x145a>
+ .byte 62,114,28 // jb,pt 79da <.literal16+0x152a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -45381,7 +46295,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6405a5 <_sk_callback_sse2+0x3d63a3dc>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640865 <_sk_callback_sse2+0x3d63a4a8>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -45407,7 +46321,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6405e5 <_sk_callback_sse2+0x3d63a41c>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6408a5 <_sk_callback_sse2+0x3d63a4e8>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -45416,13 +46330,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 77de <.literal16+0x151e>
+ .byte 114,28 // jb 7a9e <.literal16+0x15ee>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 77e2 <_sk_callback_sse2+0x1619>
+ .byte 62,114,28 // jb,pt 7aa2 <_sk_callback_sse2+0x16e5>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 77e6 <_sk_callback_sse2+0x161d>
+ .byte 62,114,28 // jb,pt 7aa6 <_sk_callback_sse2+0x16e9>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 77ea <_sk_callback_sse2+0x1621>
+ .byte 62,114,28 // jb,pt 7aaa <_sk_callback_sse2+0x16ed>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -50362,7 +51276,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,2 // movd (%edx),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,144,70,110,0,0 // movaps 0x6e46(%eax),%xmm2
+ .byte 15,40,144,38,112,0,0 // movaps 0x7026(%eax),%xmm2
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -50377,7 +51291,7 @@ _sk_seed_shader_sse2:
.byte 15,41,82,32 // movaps %xmm2,0x20(%edx)
.byte 15,41,82,16 // movaps %xmm2,0x10(%edx)
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,144,86,110,0,0 // movaps 0x6e56(%eax),%xmm2
+ .byte 15,40,144,54,112,0,0 // movaps 0x7036(%eax),%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 86 // push %esi
.byte 82 // push %edx
@@ -50410,16 +51324,16 @@ _sk_dither_sse2:
.byte 102,15,110,96,4 // movd 0x4(%eax),%xmm4
.byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7
.byte 102,15,239,253 // pxor %xmm5,%xmm7
- .byte 102,15,111,177,233,109,0,0 // movdqa 0x6de9(%ecx),%xmm6
+ .byte 102,15,111,177,201,111,0,0 // movdqa 0x6fc9(%ecx),%xmm6
.byte 102,15,111,207 // movdqa %xmm7,%xmm1
.byte 102,15,219,206 // pand %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
- .byte 102,15,111,129,9,110,0,0 // movdqa 0x6e09(%ecx),%xmm0
+ .byte 102,15,111,129,233,111,0,0 // movdqa 0x6fe9(%ecx),%xmm0
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,219,197 // pand %xmm5,%xmm0
- .byte 102,15,219,185,249,109,0,0 // pand 0x6df9(%ecx),%xmm7
- .byte 102,15,219,169,249,109,0,0 // pand 0x6df9(%ecx),%xmm5
+ .byte 102,15,219,185,217,111,0,0 // pand 0x6fd9(%ecx),%xmm7
+ .byte 102,15,219,169,217,111,0,0 // pand 0x6fd9(%ecx),%xmm5
.byte 102,15,114,246,4 // pslld $0x4,%xmm6
.byte 102,15,254,192 // paddd %xmm0,%xmm0
.byte 102,15,235,198 // por %xmm6,%xmm0
@@ -50434,8 +51348,8 @@ _sk_dither_sse2:
.byte 102,15,114,215,1 // psrld $0x1,%xmm7
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 15,91,196 // cvtdq2ps %xmm4,%xmm0
- .byte 15,89,129,25,110,0,0 // mulps 0x6e19(%ecx),%xmm0
- .byte 15,88,129,41,110,0,0 // addps 0x6e29(%ecx),%xmm0
+ .byte 15,89,129,249,111,0,0 // mulps 0x6ff9(%ecx),%xmm0
+ .byte 15,88,129,9,112,0,0 // addps 0x7009(%ecx),%xmm0
.byte 243,15,16,14 // movss (%esi),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -50503,7 +51417,7 @@ _sk_black_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,152,249,108,0,0 // movaps 0x6cf9(%eax),%xmm3
+ .byte 15,40,152,217,110,0,0 // movaps 0x6ed9(%eax),%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -50526,7 +51440,7 @@ _sk_white_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,128,217,108,0,0 // movaps 0x6cd9(%eax),%xmm0
+ .byte 15,40,128,185,110,0,0 // movaps 0x6eb9(%eax),%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -50616,7 +51530,7 @@ _sk_srcatop_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,170,58,108,0,0 // movaps 0x6c3a(%edx),%xmm5
+ .byte 15,40,170,26,110,0,0 // movaps 0x6e1a(%edx),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
@@ -50655,7 +51569,7 @@ _sk_dstatop_sse2:
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,40,162,235,107,0,0 // movaps 0x6beb(%edx),%xmm4
+ .byte 15,40,162,203,109,0,0 // movaps 0x6dcb(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,198 // addps %xmm6,%xmm0
@@ -50739,7 +51653,7 @@ _sk_srcout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,58,107,0,0 // movaps 0x6b3a(%eax),%xmm4
+ .byte 15,40,160,26,109,0,0 // movaps 0x6d1a(%eax),%xmm4
.byte 15,92,98,64 // subps 0x40(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
@@ -50765,7 +51679,7 @@ _sk_dstout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,18,107,0,0 // movaps 0x6b12(%eax),%xmm4
+ .byte 15,40,160,242,108,0,0 // movaps 0x6cf2(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,66,16 // movaps 0x10(%edx),%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -50795,7 +51709,7 @@ _sk_srcover_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,219,106,0,0 // movaps 0x6adb(%eax),%xmm4
+ .byte 15,40,160,187,108,0,0 // movaps 0x6cbb(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -50829,7 +51743,7 @@ _sk_dstover_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,106,64 // movaps 0x40(%edx),%xmm5
- .byte 15,40,160,155,106,0,0 // movaps 0x6a9b(%eax),%xmm4
+ .byte 15,40,160,123,108,0,0 // movaps 0x6c7b(%eax),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,66,16 // addps 0x10(%edx),%xmm0
@@ -50885,7 +51799,7 @@ _sk_multiply_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
- .byte 15,40,129,44,106,0,0 // movaps 0x6a2c(%ecx),%xmm0
+ .byte 15,40,129,12,108,0,0 // movaps 0x6c0c(%ecx),%xmm0
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
@@ -51010,7 +51924,7 @@ _sk_xor__sse2:
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
- .byte 15,40,154,1,105,0,0 // movaps 0x6901(%edx),%xmm3
+ .byte 15,40,154,225,106,0,0 // movaps 0x6ae1(%edx),%xmm3
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,89,198 // mulps %xmm6,%xmm0
@@ -51072,7 +51986,7 @@ _sk_darken_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,95,209 // maxps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,169,104,0,0 // movaps 0x68a9(%edx),%xmm1
+ .byte 15,40,138,137,106,0,0 // movaps 0x6a89(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -51121,7 +52035,7 @@ _sk_lighten_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,93,209 // minps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,57,104,0,0 // movaps 0x6839(%edx),%xmm1
+ .byte 15,40,138,25,106,0,0 // movaps 0x6a19(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -51174,7 +52088,7 @@ _sk_difference_sse2:
.byte 15,93,214 // minps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,146,198,103,0,0 // movaps 0x67c6(%edx),%xmm2
+ .byte 15,40,146,166,105,0,0 // movaps 0x69a6(%edx),%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -51218,7 +52132,7 @@ _sk_exclusion_sse2:
.byte 15,89,202 // mulps %xmm2,%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
.byte 15,92,233 // subps %xmm1,%xmm5
- .byte 15,40,138,80,103,0,0 // movaps 0x6750(%edx),%xmm1
+ .byte 15,40,138,48,105,0,0 // movaps 0x6930(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,73,64 // mulps 0x40(%ecx),%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -51259,7 +52173,7 @@ _sk_colorburn_sse2:
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,92,238 // subps %xmm6,%xmm5
- .byte 15,40,177,221,102,0,0 // movaps 0x66dd(%ecx),%xmm6
+ .byte 15,40,177,189,104,0,0 // movaps 0x68bd(%ecx),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
@@ -51381,7 +52295,7 @@ _sk_colordodge_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
- .byte 15,40,177,87,101,0,0 // movaps 0x6557(%ecx),%xmm6
+ .byte 15,40,177,55,103,0,0 // movaps 0x6737(%ecx),%xmm6
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
@@ -51500,7 +52414,7 @@ _sk_hardlight_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
- .byte 15,40,145,251,99,0,0 // movaps 0x63fb(%ecx),%xmm2
+ .byte 15,40,145,219,101,0,0 // movaps 0x65db(%ecx),%xmm2
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,40,225 // movaps %xmm1,%xmm4
@@ -51610,7 +52524,7 @@ _sk_overlay_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
- .byte 15,40,161,192,98,0,0 // movaps 0x62c0(%ecx),%xmm4
+ .byte 15,40,161,160,100,0,0 // movaps 0x64a0(%ecx),%xmm4
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
@@ -51738,17 +52652,17 @@ _sk_softlight_sse2:
.byte 232,0,0,0,0 // call f30 <_sk_softlight_sse2+0x52>
.byte 89 // pop %ecx
.byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,137,80,97,0,0 // movaps 0x6150(%ecx),%xmm1
+ .byte 15,40,137,48,99,0,0 // movaps 0x6330(%ecx),%xmm1
.byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp)
.byte 15,88,193 // addps %xmm1,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,185,64,97,0,0 // movaps 0x6140(%ecx),%xmm7
+ .byte 15,40,185,32,99,0,0 // movaps 0x6320(%ecx),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,82,242 // rsqrtps %xmm2,%xmm6
.byte 15,83,206 // rcpps %xmm6,%xmm1
.byte 15,92,202 // subps %xmm2,%xmm1
- .byte 15,40,161,96,97,0,0 // movaps 0x6160(%ecx),%xmm4
+ .byte 15,40,161,64,99,0,0 // movaps 0x6340(%ecx),%xmm4
.byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp)
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
@@ -51954,7 +52868,7 @@ _sk_hue_sse2:
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 15,40,169,223,94,0,0 // movaps 0x5edf(%ecx),%xmm5
+ .byte 15,40,169,191,96,0,0 // movaps 0x60bf(%ecx),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
@@ -51987,17 +52901,17 @@ _sk_hue_sse2:
.byte 15,89,233 // mulps %xmm1,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,153,175,94,0,0 // movaps 0x5eaf(%ecx),%xmm3
+ .byte 15,40,153,143,96,0,0 // movaps 0x608f(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,153,191,94,0,0 // movaps 0x5ebf(%ecx),%xmm3
+ .byte 15,40,153,159,96,0,0 // movaps 0x609f(%ecx),%xmm3
.byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,40,137,223,94,0,0 // movaps 0x5edf(%ecx),%xmm1
+ .byte 15,40,137,191,96,0,0 // movaps 0x60bf(%ecx),%xmm1
.byte 15,92,77,184 // subps -0x48(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
@@ -52007,7 +52921,7 @@ _sk_hue_sse2:
.byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
- .byte 15,40,169,207,94,0,0 // movaps 0x5ecf(%ecx),%xmm5
+ .byte 15,40,169,175,96,0,0 // movaps 0x60af(%ecx),%xmm5
.byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,88,207 // addps %xmm7,%xmm1
.byte 15,94,212 // divps %xmm4,%xmm2
@@ -52200,17 +53114,17 @@ _sk_saturation_sse2:
.byte 15,89,253 // mulps %xmm5,%xmm7
.byte 232,0,0,0,0 // call 1545 <_sk_saturation_sse2+0xb0>
.byte 89 // pop %ecx
- .byte 15,40,153,155,91,0,0 // movaps 0x5b9b(%ecx),%xmm3
+ .byte 15,40,153,123,93,0,0 // movaps 0x5d7b(%ecx),%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
.byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,153,171,91,0,0 // movaps 0x5bab(%ecx),%xmm3
+ .byte 15,40,153,139,93,0,0 // movaps 0x5d8b(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,129,203,91,0,0 // movaps 0x5bcb(%ecx),%xmm0
+ .byte 15,40,129,171,93,0,0 // movaps 0x5dab(%ecx),%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 15,92,69,216 // subps -0x28(%ebp),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -52222,7 +53136,7 @@ _sk_saturation_sse2:
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,129,187,91,0,0 // movaps 0x5bbb(%ecx),%xmm0
+ .byte 15,40,129,155,93,0,0 // movaps 0x5d9b(%ecx),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
@@ -52381,16 +53295,16 @@ _sk_color_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,16 // movaps 0x10(%eax),%xmm2
.byte 15,40,72,32 // movaps 0x20(%eax),%xmm1
- .byte 15,40,177,128,89,0,0 // movaps 0x5980(%ecx),%xmm6
+ .byte 15,40,177,96,91,0,0 // movaps 0x5b60(%ecx),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,153,144,89,0,0 // movaps 0x5990(%ecx),%xmm3
+ .byte 15,40,153,112,91,0,0 // movaps 0x5b70(%ecx),%xmm3
.byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 15,40,129,176,89,0,0 // movaps 0x59b0(%ecx),%xmm0
+ .byte 15,40,129,144,91,0,0 // movaps 0x5b90(%ecx),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,69,200 // subps -0x38(%ebp),%xmm0
.byte 15,89,208 // mulps %xmm0,%xmm2
@@ -52400,7 +53314,7 @@ _sk_color_sse2:
.byte 15,40,80,48 // movaps 0x30(%eax),%xmm2
.byte 15,89,194 // mulps %xmm2,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
- .byte 15,40,137,160,89,0,0 // movaps 0x59a0(%ecx),%xmm1
+ .byte 15,40,137,128,91,0,0 // movaps 0x5b80(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,40,88,64 // movaps 0x40(%eax),%xmm3
@@ -52559,18 +53473,18 @@ _sk_luminosity_sse2:
.byte 232,0,0,0,0 // call 1a03 <_sk_luminosity_sse2+0x11>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 15,40,161,93,87,0,0 // movaps 0x575d(%ecx),%xmm4
+ .byte 15,40,161,61,89,0,0 // movaps 0x593d(%ecx),%xmm4
.byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,161,109,87,0,0 // movaps 0x576d(%ecx),%xmm4
+ .byte 15,40,161,77,89,0,0 // movaps 0x594d(%ecx),%xmm4
.byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,161,141,87,0,0 // movaps 0x578d(%ecx),%xmm4
+ .byte 15,40,161,109,89,0,0 // movaps 0x596d(%ecx),%xmm4
.byte 15,40,252 // movaps %xmm4,%xmm7
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -52580,7 +53494,7 @@ _sk_luminosity_sse2:
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,41,189,104,255,255,255 // movaps %xmm7,-0x98(%ebp)
.byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,40,137,125,87,0,0 // movaps 0x577d(%ecx),%xmm1
+ .byte 15,40,137,93,89,0,0 // movaps 0x595d(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,213 // addps %xmm5,%xmm2
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
@@ -52756,7 +53670,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 139,49 // mov (%ecx),%esi
.byte 15,133,224,0,0,0 // jne 1d70 <_sk_srcover_rgba_8888_sse2+0x119>
.byte 243,15,111,20,178 // movdqu (%edx,%esi,4),%xmm2
- .byte 102,15,111,167,50,85,0,0 // movdqa 0x5532(%edi),%xmm4
+ .byte 102,15,111,167,18,87,0,0 // movdqa 0x5712(%edi),%xmm4
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
@@ -52767,9 +53681,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,219,252 // pand %xmm4,%xmm7
.byte 15,91,229 // cvtdq2ps %xmm5,%xmm4
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,175,66,85,0,0 // movaps 0x5542(%edi),%xmm5
+ .byte 15,40,175,34,87,0,0 // movaps 0x5722(%edi),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
- .byte 15,40,143,82,85,0,0 // movaps 0x5552(%edi),%xmm1
+ .byte 15,40,143,50,87,0,0 // movaps 0x5732(%edi),%xmm1
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
@@ -52883,7 +53797,7 @@ _sk_clamp_1_sse2:
.byte 232,0,0,0,0 // call 1e1a <_sk_clamp_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,182,83,0,0 // movaps 0x53b6(%eax),%xmm4
+ .byte 15,40,160,150,85,0,0 // movaps 0x5596(%eax),%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
.byte 15,93,204 // minps %xmm4,%xmm1
.byte 15,93,212 // minps %xmm4,%xmm2
@@ -52907,7 +53821,7 @@ _sk_clamp_a_sse2:
.byte 232,0,0,0,0 // call 1e4d <_sk_clamp_a_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,93,152,147,83,0,0 // minps 0x5393(%eax),%xmm3
+ .byte 15,93,152,115,85,0,0 // minps 0x5573(%eax),%xmm3
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -52932,7 +53846,7 @@ _sk_clamp_a_dst_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,98,64 // movaps 0x40(%edx),%xmm4
- .byte 15,93,160,115,83,0,0 // minps 0x5373(%eax),%xmm4
+ .byte 15,93,160,83,85,0,0 // minps 0x5553(%eax),%xmm4
.byte 15,41,98,64 // movaps %xmm4,0x40(%edx)
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,93,236 // minps %xmm4,%xmm5
@@ -53006,7 +53920,7 @@ _sk_invert_sse2:
.byte 232,0,0,0,0 // call 1f28 <_sk_invert_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,216,82,0,0 // movaps 0x52d8(%eax),%xmm4
+ .byte 15,40,160,184,84,0,0 // movaps 0x54b8(%eax),%xmm4
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
@@ -53129,7 +54043,7 @@ _sk_unpremul_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,40,168,234,81,0,0 // movaps 0x51ea(%eax),%xmm5
+ .byte 15,40,168,202,83,0,0 // movaps 0x53ca(%eax),%xmm5
.byte 15,94,235 // divps %xmm3,%xmm5
.byte 15,194,227,4 // cmpneqps %xmm3,%xmm4
.byte 15,84,229 // andps %xmm5,%xmm4
@@ -53160,19 +54074,19 @@ _sk_from_srgb_sse2:
.byte 88 // pop %eax
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,201 // mulps %xmm1,%xmm1
- .byte 15,40,160,192,81,0,0 // movaps 0x51c0(%eax),%xmm4
+ .byte 15,40,160,160,83,0,0 // movaps 0x53a0(%eax),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,176,208,81,0,0 // movaps 0x51d0(%eax),%xmm6
+ .byte 15,40,176,176,83,0,0 // movaps 0x53b0(%eax),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,176,176,81,0,0 // movaps 0x51b0(%eax),%xmm6
+ .byte 15,40,176,144,83,0,0 // movaps 0x5390(%eax),%xmm6
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,184,224,81,0,0 // movaps 0x51e0(%eax),%xmm7
+ .byte 15,40,184,192,83,0,0 // movaps 0x53c0(%eax),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,184,240,81,0,0 // movaps 0x51f0(%eax),%xmm7
+ .byte 15,40,184,208,83,0,0 // movaps 0x53d0(%eax),%xmm7
.byte 15,194,215,1 // cmpltps %xmm7,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -53232,18 +54146,18 @@ _sk_from_srgb_dst_sse2:
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,40,161,53,81,0,0 // movaps 0x5135(%ecx),%xmm4
+ .byte 15,40,161,21,83,0,0 // movaps 0x5315(%ecx),%xmm4
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,177,69,81,0,0 // movaps 0x5145(%ecx),%xmm6
+ .byte 15,40,177,37,83,0,0 // movaps 0x5325(%ecx),%xmm6
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,169,37,81,0,0 // movaps 0x5125(%ecx),%xmm5
+ .byte 15,40,169,5,83,0,0 // movaps 0x5305(%ecx),%xmm5
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,185,85,81,0,0 // movaps 0x5155(%ecx),%xmm7
+ .byte 15,40,185,53,83,0,0 // movaps 0x5335(%ecx),%xmm7
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,153,101,81,0,0 // movaps 0x5165(%ecx),%xmm3
+ .byte 15,40,153,69,83,0,0 // movaps 0x5345(%ecx),%xmm3
.byte 15,194,203,1 // cmpltps %xmm3,%xmm1
.byte 15,84,209 // andps %xmm1,%xmm2
.byte 15,85,200 // andnps %xmm0,%xmm1
@@ -53305,25 +54219,25 @@ _sk_to_srgb_sse2:
.byte 232,0,0,0,0 // call 2236 <_sk_to_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,82,218 // rsqrtps %xmm2,%xmm3
- .byte 15,40,160,154,80,0,0 // movaps 0x509a(%eax),%xmm4
+ .byte 15,40,160,122,82,0,0 // movaps 0x527a(%eax),%xmm4
.byte 15,40,235 // movaps %xmm3,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,40,128,170,80,0,0 // movaps 0x50aa(%eax),%xmm0
+ .byte 15,40,128,138,82,0,0 // movaps 0x528a(%eax),%xmm0
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,40,128,186,80,0,0 // movaps 0x50ba(%eax),%xmm0
+ .byte 15,40,128,154,82,0,0 // movaps 0x529a(%eax),%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,128,202,80,0,0 // movaps 0x50ca(%eax),%xmm0
+ .byte 15,40,128,170,82,0,0 // movaps 0x52aa(%eax),%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 15,88,216 // addps %xmm0,%xmm3
.byte 15,83,195 // rcpps %xmm3,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,168,138,80,0,0 // movaps 0x508a(%eax),%xmm5
+ .byte 15,40,168,106,82,0,0 // movaps 0x526a(%eax),%xmm5
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,152,218,80,0,0 // movaps 0x50da(%eax),%xmm3
+ .byte 15,40,152,186,82,0,0 // movaps 0x52ba(%eax),%xmm3
.byte 15,194,211,1 // cmpltps %xmm3,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -53392,14 +54306,14 @@ _sk_rgb_to_hsl_sse2:
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
- .byte 15,40,152,243,79,0,0 // movaps 0x4ff3(%eax),%xmm3
+ .byte 15,40,152,211,81,0,0 // movaps 0x51d3(%eax),%xmm3
.byte 15,94,216 // divps %xmm0,%xmm3
.byte 15,40,199 // movaps %xmm7,%xmm0
.byte 15,92,194 // subps %xmm2,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,168,3,80,0,0 // andps 0x5003(%eax),%xmm5
+ .byte 15,84,168,227,81,0,0 // andps 0x51e3(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,194,196,0 // cmpeqps %xmm4,%xmm0
@@ -53409,9 +54323,9 @@ _sk_rgb_to_hsl_sse2:
.byte 15,92,231 // subps %xmm7,%xmm4
.byte 15,89,211 // mulps %xmm3,%xmm2
.byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,40,152,19,80,0,0 // movaps 0x5013(%eax),%xmm3
+ .byte 15,40,152,243,81,0,0 // movaps 0x51f3(%eax),%xmm3
.byte 15,88,211 // addps %xmm3,%xmm2
- .byte 15,88,160,35,80,0,0 // addps 0x5023(%eax),%xmm4
+ .byte 15,88,160,3,82,0,0 // addps 0x5203(%eax),%xmm4
.byte 15,84,214 // andps %xmm6,%xmm2
.byte 15,85,244 // andnps %xmm4,%xmm6
.byte 15,86,242 // orps %xmm2,%xmm6
@@ -53423,7 +54337,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,194,226,4 // cmpneqps %xmm2,%xmm4
.byte 15,92,217 // subps %xmm1,%xmm3
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,40,168,67,80,0,0 // movaps 0x5043(%eax),%xmm5
+ .byte 15,40,168,35,82,0,0 // movaps 0x5223(%eax),%xmm5
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
@@ -53433,7 +54347,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,86,235 // orps %xmm3,%xmm5
.byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
.byte 15,94,205 // divps %xmm5,%xmm1
- .byte 15,89,128,51,80,0,0 // mulps 0x5033(%eax),%xmm0
+ .byte 15,89,128,19,82,0,0 // mulps 0x5213(%eax),%xmm0
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,84,204 // andps %xmm4,%xmm1
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -53458,7 +54372,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
.byte 232,0,0,0,0 // call 2422 <_sk_hsl_to_rgb_sse2+0x19>
.byte 88 // pop %eax
- .byte 15,40,160,94,79,0,0 // movaps 0x4f5e(%eax),%xmm4
+ .byte 15,40,160,62,81,0,0 // movaps 0x513e(%eax),%xmm4
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,194,218,2 // cmpleps %xmm2,%xmm3
@@ -53471,13 +54385,13 @@ _sk_hsl_to_rgb_sse2:
.byte 15,84,243 // andps %xmm3,%xmm6
.byte 15,85,217 // andnps %xmm1,%xmm3
.byte 15,86,222 // orps %xmm6,%xmm3
- .byte 15,40,168,110,79,0,0 // movaps 0x4f6e(%eax),%xmm5
+ .byte 15,40,168,78,81,0,0 // movaps 0x514e(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 243,15,91,205 // cvttps2dq %xmm5,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,193,1 // cmpltps %xmm1,%xmm0
- .byte 15,40,176,126,79,0,0 // movaps 0x4f7e(%eax),%xmm6
+ .byte 15,40,176,94,81,0,0 // movaps 0x515e(%eax),%xmm6
.byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp)
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,200 // subps %xmm0,%xmm1
@@ -53487,19 +54401,19 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,40,184,142,79,0,0 // movaps 0x4f8e(%eax),%xmm7
+ .byte 15,40,184,110,81,0,0 // movaps 0x516e(%eax),%xmm7
.byte 15,41,189,88,255,255,255 // movaps %xmm7,-0xa8(%ebp)
.byte 15,194,253,2 // cmpleps %xmm5,%xmm7
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,204 // movaps %xmm4,%xmm1
.byte 15,194,205,2 // cmpleps %xmm5,%xmm1
- .byte 15,40,160,190,79,0,0 // movaps 0x4fbe(%eax),%xmm4
+ .byte 15,40,160,158,81,0,0 // movaps 0x519e(%eax),%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,194,229,2 // cmpleps %xmm5,%xmm4
- .byte 15,40,176,158,79,0,0 // movaps 0x4f9e(%eax),%xmm6
+ .byte 15,40,176,126,81,0,0 // movaps 0x517e(%eax),%xmm6
.byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,128,174,79,0,0 // movaps 0x4fae(%eax),%xmm0
+ .byte 15,40,128,142,81,0,0 // movaps 0x518e(%eax),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
@@ -53525,18 +54439,18 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,194,200,1 // cmpltps %xmm0,%xmm1
- .byte 15,84,136,126,79,0,0 // andps 0x4f7e(%eax),%xmm1
+ .byte 15,84,136,94,81,0,0 // andps 0x515e(%eax),%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,40,128,142,79,0,0 // movaps 0x4f8e(%eax),%xmm0
+ .byte 15,40,128,110,81,0,0 // movaps 0x516e(%eax),%xmm0
.byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,40,152,94,79,0,0 // movaps 0x4f5e(%eax),%xmm3
+ .byte 15,40,152,62,81,0,0 // movaps 0x513e(%eax),%xmm3
.byte 15,194,217,2 // cmpleps %xmm1,%xmm3
- .byte 15,40,160,190,79,0,0 // movaps 0x4fbe(%eax),%xmm4
+ .byte 15,40,160,158,81,0,0 // movaps 0x519e(%eax),%xmm4
.byte 15,194,225,2 // cmpleps %xmm1,%xmm4
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,168,174,79,0,0 // movaps 0x4fae(%eax),%xmm5
+ .byte 15,40,168,142,81,0,0 // movaps 0x518e(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,239 // mulps %xmm7,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
@@ -53556,7 +54470,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
.byte 15,85,252 // andnps %xmm4,%xmm7
.byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 15,88,152,206,79,0,0 // addps 0x4fce(%eax),%xmm3
+ .byte 15,88,152,174,81,0,0 // addps 0x51ae(%eax),%xmm3
.byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
@@ -53658,9 +54572,9 @@ _sk_scale_u8_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,100,77,0,0 // pand 0x4d64(%edx),%xmm4
+ .byte 102,15,219,162,68,79,0,0 // pand 0x4f44(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,116,77,0,0 // mulps 0x4d74(%edx),%xmm4
+ .byte 15,89,162,84,79,0,0 // mulps 0x4f54(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
@@ -53760,9 +54674,9 @@ _sk_lerp_u8_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,124,76,0,0 // pand 0x4c7c(%edx),%xmm4
+ .byte 102,15,219,162,92,78,0,0 // pand 0x4e5c(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,140,76,0,0 // mulps 0x4c8c(%edx),%xmm4
+ .byte 15,89,162,108,78,0,0 // mulps 0x4e6c(%edx),%xmm4
.byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
.byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
.byte 15,92,197 // subps %xmm5,%xmm0
@@ -53836,17 +54750,17 @@ _sk_lerp_565_sse2:
.byte 15,133,163,0,0,0 // jne 2941 <_sk_lerp_565_sse2+0xd2>
.byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,162,195,75,0,0 // movdqa 0x4bc3(%edx),%xmm4
+ .byte 102,15,111,162,163,77,0,0 // movdqa 0x4da3(%edx),%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,211,75,0,0 // mulps 0x4bd3(%edx),%xmm4
- .byte 102,15,111,170,227,75,0,0 // movdqa 0x4be3(%edx),%xmm5
+ .byte 15,89,162,179,77,0,0 // mulps 0x4db3(%edx),%xmm4
+ .byte 102,15,111,170,195,77,0,0 // movdqa 0x4dc3(%edx),%xmm5
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,243,75,0,0 // mulps 0x4bf3(%edx),%xmm5
- .byte 102,15,219,178,3,76,0,0 // pand 0x4c03(%edx),%xmm6
+ .byte 15,89,170,211,77,0,0 // mulps 0x4dd3(%edx),%xmm5
+ .byte 102,15,219,178,227,77,0,0 // pand 0x4de3(%edx),%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,19,76,0,0 // mulps 0x4c13(%edx),%xmm6
+ .byte 15,89,178,243,77,0,0 // mulps 0x4df3(%edx),%xmm6
.byte 15,40,121,16 // movaps 0x10(%ecx),%xmm7
.byte 15,92,199 // subps %xmm7,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -53921,7 +54835,7 @@ _sk_load_tables_sse2:
.byte 139,30 // mov (%esi),%ebx
.byte 15,133,19,1,0,0 // jne 2ac1 <_sk_load_tables_sse2+0x139>
.byte 243,15,111,28,187 // movdqu (%ebx,%edi,4),%xmm3
- .byte 102,15,111,146,10,75,0,0 // movdqa 0x4b0a(%edx),%xmm2
+ .byte 102,15,111,146,234,76,0,0 // movdqa 0x4cea(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
@@ -53977,7 +54891,7 @@ _sk_load_tables_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,26,75,0,0 // mulps 0x4b1a(%edx),%xmm3
+ .byte 15,89,154,250,76,0,0 // mulps 0x4cfa(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,194 // mov %eax,%edx
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -54124,7 +55038,7 @@ _sk_load_tables_u16_be_sse2:
.byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3
.byte 102,15,97,223 // punpcklwd %xmm7,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,188,73,0,0 // mulps 0x49bc(%edx),%xmm3
+ .byte 15,89,154,156,75,0,0 // mulps 0x4b9c(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,193 // mov %eax,%ecx
.byte 141,65,8 // lea 0x8(%ecx),%eax
@@ -54263,7 +55177,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 141,65,8 // lea 0x8(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 139,85,240 // mov -0x10(%ebp),%edx
- .byte 15,40,162,204,71,0,0 // movaps 0x47cc(%edx),%xmm4
+ .byte 15,40,162,172,73,0,0 // movaps 0x49ac(%edx),%xmm4
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 80 // push %eax
@@ -54308,7 +55222,7 @@ _sk_byte_tables_sse2:
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
- .byte 15,40,162,205,69,0,0 // movaps 0x45cd(%edx),%xmm4
+ .byte 15,40,162,173,71,0,0 // movaps 0x47ad(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
@@ -54330,7 +55244,7 @@ _sk_byte_tables_sse2:
.byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0
.byte 139,65,4 // mov 0x4(%ecx),%eax
.byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0
- .byte 15,40,170,221,69,0,0 // movaps 0x45dd(%edx),%xmm5
+ .byte 15,40,170,189,71,0,0 // movaps 0x47bd(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -54460,7 +55374,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0
.byte 139,121,4 // mov 0x4(%ecx),%edi
.byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0
- .byte 15,40,170,237,67,0,0 // movaps 0x43ed(%edx),%xmm5
+ .byte 15,40,170,205,69,0,0 // movaps 0x45cd(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -54716,15 +55630,15 @@ _sk_parametric_r_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,46,65,0,0 // mulps 0x412e(%edx),%xmm5
- .byte 15,84,178,62,65,0,0 // andps 0x413e(%edx),%xmm6
- .byte 15,86,178,78,65,0,0 // orps 0x414e(%edx),%xmm6
- .byte 15,88,170,94,65,0,0 // addps 0x415e(%edx),%xmm5
- .byte 15,40,186,110,65,0,0 // movaps 0x416e(%edx),%xmm7
+ .byte 15,89,170,14,67,0,0 // mulps 0x430e(%edx),%xmm5
+ .byte 15,84,178,30,67,0,0 // andps 0x431e(%edx),%xmm6
+ .byte 15,86,178,46,67,0,0 // orps 0x432e(%edx),%xmm6
+ .byte 15,88,170,62,67,0,0 // addps 0x433e(%edx),%xmm5
+ .byte 15,40,186,78,67,0,0 // movaps 0x434e(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,126,65,0,0 // addps 0x417e(%edx),%xmm6
- .byte 15,40,186,142,65,0,0 // movaps 0x418e(%edx),%xmm7
+ .byte 15,88,178,94,67,0,0 // addps 0x435e(%edx),%xmm6
+ .byte 15,40,186,110,67,0,0 // movaps 0x436e(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -54734,21 +55648,21 @@ _sk_parametric_r_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,158,65,0,0 // movaps 0x419e(%edx),%xmm6
+ .byte 15,40,178,126,67,0,0 // movaps 0x437e(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,174,65,0,0 // addps 0x41ae(%edx),%xmm5
- .byte 15,40,186,190,65,0,0 // movaps 0x41be(%edx),%xmm7
+ .byte 15,88,170,142,67,0,0 // addps 0x438e(%edx),%xmm5
+ .byte 15,40,186,158,67,0,0 // movaps 0x439e(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,206,65,0,0 // movaps 0x41ce(%edx),%xmm7
+ .byte 15,40,186,174,67,0,0 // movaps 0x43ae(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,222,65,0,0 // movaps 0x41de(%edx),%xmm0
+ .byte 15,40,130,190,67,0,0 // movaps 0x43be(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,238,65,0,0 // mulps 0x41ee(%edx),%xmm0
+ .byte 15,89,130,206,67,0,0 // mulps 0x43ce(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -54802,15 +55716,15 @@ _sk_parametric_g_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,199,64,0,0 // mulps 0x40c7(%edx),%xmm5
- .byte 15,84,178,215,64,0,0 // andps 0x40d7(%edx),%xmm6
- .byte 15,86,178,231,64,0,0 // orps 0x40e7(%edx),%xmm6
- .byte 15,88,170,247,64,0,0 // addps 0x40f7(%edx),%xmm5
- .byte 15,40,186,7,65,0,0 // movaps 0x4107(%edx),%xmm7
+ .byte 15,89,170,167,66,0,0 // mulps 0x42a7(%edx),%xmm5
+ .byte 15,84,178,183,66,0,0 // andps 0x42b7(%edx),%xmm6
+ .byte 15,86,178,199,66,0,0 // orps 0x42c7(%edx),%xmm6
+ .byte 15,88,170,215,66,0,0 // addps 0x42d7(%edx),%xmm5
+ .byte 15,40,186,231,66,0,0 // movaps 0x42e7(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,23,65,0,0 // addps 0x4117(%edx),%xmm6
- .byte 15,40,186,39,65,0,0 // movaps 0x4127(%edx),%xmm7
+ .byte 15,88,178,247,66,0,0 // addps 0x42f7(%edx),%xmm6
+ .byte 15,40,186,7,67,0,0 // movaps 0x4307(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -54820,21 +55734,21 @@ _sk_parametric_g_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,55,65,0,0 // movaps 0x4137(%edx),%xmm6
+ .byte 15,40,178,23,67,0,0 // movaps 0x4317(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,71,65,0,0 // addps 0x4147(%edx),%xmm5
- .byte 15,40,186,87,65,0,0 // movaps 0x4157(%edx),%xmm7
+ .byte 15,88,170,39,67,0,0 // addps 0x4327(%edx),%xmm5
+ .byte 15,40,186,55,67,0,0 // movaps 0x4337(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,103,65,0,0 // movaps 0x4167(%edx),%xmm7
+ .byte 15,40,186,71,67,0,0 // movaps 0x4347(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,119,65,0,0 // movaps 0x4177(%edx),%xmm0
+ .byte 15,40,130,87,67,0,0 // movaps 0x4357(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,135,65,0,0 // mulps 0x4187(%edx),%xmm0
+ .byte 15,89,130,103,67,0,0 // mulps 0x4367(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -54887,15 +55801,15 @@ _sk_parametric_b_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,99,64,0,0 // mulps 0x4063(%edx),%xmm5
- .byte 15,84,178,115,64,0,0 // andps 0x4073(%edx),%xmm6
- .byte 15,86,178,131,64,0,0 // orps 0x4083(%edx),%xmm6
- .byte 15,88,170,147,64,0,0 // addps 0x4093(%edx),%xmm5
- .byte 15,40,186,163,64,0,0 // movaps 0x40a3(%edx),%xmm7
+ .byte 15,89,170,67,66,0,0 // mulps 0x4243(%edx),%xmm5
+ .byte 15,84,178,83,66,0,0 // andps 0x4253(%edx),%xmm6
+ .byte 15,86,178,99,66,0,0 // orps 0x4263(%edx),%xmm6
+ .byte 15,88,170,115,66,0,0 // addps 0x4273(%edx),%xmm5
+ .byte 15,40,186,131,66,0,0 // movaps 0x4283(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,179,64,0,0 // addps 0x40b3(%edx),%xmm6
- .byte 15,40,186,195,64,0,0 // movaps 0x40c3(%edx),%xmm7
+ .byte 15,88,178,147,66,0,0 // addps 0x4293(%edx),%xmm6
+ .byte 15,40,186,163,66,0,0 // movaps 0x42a3(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -54905,21 +55819,21 @@ _sk_parametric_b_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,211,64,0,0 // movaps 0x40d3(%edx),%xmm6
+ .byte 15,40,178,179,66,0,0 // movaps 0x42b3(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,227,64,0,0 // addps 0x40e3(%edx),%xmm5
- .byte 15,40,186,243,64,0,0 // movaps 0x40f3(%edx),%xmm7
+ .byte 15,88,170,195,66,0,0 // addps 0x42c3(%edx),%xmm5
+ .byte 15,40,186,211,66,0,0 // movaps 0x42d3(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,3,65,0,0 // movaps 0x4103(%edx),%xmm7
+ .byte 15,40,186,227,66,0,0 // movaps 0x42e3(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,19,65,0,0 // movaps 0x4113(%edx),%xmm0
+ .byte 15,40,130,243,66,0,0 // movaps 0x42f3(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,35,65,0,0 // mulps 0x4123(%edx),%xmm0
+ .byte 15,89,130,3,67,0,0 // mulps 0x4303(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -54972,15 +55886,15 @@ _sk_parametric_a_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,255,63,0,0 // mulps 0x3fff(%edx),%xmm5
- .byte 15,84,178,15,64,0,0 // andps 0x400f(%edx),%xmm6
- .byte 15,86,178,31,64,0,0 // orps 0x401f(%edx),%xmm6
- .byte 15,88,170,47,64,0,0 // addps 0x402f(%edx),%xmm5
- .byte 15,40,186,63,64,0,0 // movaps 0x403f(%edx),%xmm7
+ .byte 15,89,170,223,65,0,0 // mulps 0x41df(%edx),%xmm5
+ .byte 15,84,178,239,65,0,0 // andps 0x41ef(%edx),%xmm6
+ .byte 15,86,178,255,65,0,0 // orps 0x41ff(%edx),%xmm6
+ .byte 15,88,170,15,66,0,0 // addps 0x420f(%edx),%xmm5
+ .byte 15,40,186,31,66,0,0 // movaps 0x421f(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,79,64,0,0 // addps 0x404f(%edx),%xmm6
- .byte 15,40,186,95,64,0,0 // movaps 0x405f(%edx),%xmm7
+ .byte 15,88,178,47,66,0,0 // addps 0x422f(%edx),%xmm6
+ .byte 15,40,186,63,66,0,0 // movaps 0x423f(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -54990,21 +55904,21 @@ _sk_parametric_a_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,111,64,0,0 // movaps 0x406f(%edx),%xmm6
+ .byte 15,40,178,79,66,0,0 // movaps 0x424f(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,127,64,0,0 // addps 0x407f(%edx),%xmm5
- .byte 15,40,186,143,64,0,0 // movaps 0x408f(%edx),%xmm7
+ .byte 15,88,170,95,66,0,0 // addps 0x425f(%edx),%xmm5
+ .byte 15,40,186,111,66,0,0 // movaps 0x426f(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,159,64,0,0 // movaps 0x409f(%edx),%xmm7
+ .byte 15,40,186,127,66,0,0 // movaps 0x427f(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,175,64,0,0 // movaps 0x40af(%edx),%xmm0
+ .byte 15,40,130,143,66,0,0 // movaps 0x428f(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,191,64,0,0 // mulps 0x40bf(%edx),%xmm0
+ .byte 15,89,130,159,66,0,0 // mulps 0x429f(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -55027,6 +55941,127 @@ _sk_parametric_a_sse2:
.byte 93 // pop %ebp
.byte 195 // ret
+HIDDEN _sk_gamma_sse2
+.globl _sk_gamma_sse2
+FUNCTION(_sk_gamma_sse2)
+_sk_gamma_sse2:
+ .byte 85 // push %ebp
+ .byte 137,229 // mov %esp,%ebp
+ .byte 131,236,40 // sub $0x28,%esp
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,40,216 // movaps %xmm0,%xmm3
+ .byte 232,0,0,0,0 // call 38b2 <_sk_gamma_sse2+0x12>
+ .byte 88 // pop %eax
+ .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
+ .byte 15,89,128,126,65,0,0 // mulps 0x417e(%eax),%xmm0
+ .byte 15,84,152,142,65,0,0 // andps 0x418e(%eax),%xmm3
+ .byte 15,86,152,158,65,0,0 // orps 0x419e(%eax),%xmm3
+ .byte 15,88,128,174,65,0,0 // addps 0x41ae(%eax),%xmm0
+ .byte 15,40,227 // movaps %xmm3,%xmm4
+ .byte 15,89,160,190,65,0,0 // mulps 0x41be(%eax),%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,88,152,206,65,0,0 // addps 0x41ce(%eax),%xmm3
+ .byte 15,40,160,222,65,0,0 // movaps 0x41de(%eax),%xmm4
+ .byte 15,94,227 // divps %xmm3,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 243,15,16,58 // movss (%edx),%xmm7
+ .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
+ .byte 15,89,199 // mulps %xmm7,%xmm0
+ .byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
+ .byte 243,15,91,216 // cvttps2dq %xmm0,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,194,227,1 // cmpltps %xmm3,%xmm4
+ .byte 15,84,160,238,65,0,0 // andps 0x41ee(%eax),%xmm4
+ .byte 15,92,220 // subps %xmm4,%xmm3
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,88,128,254,65,0,0 // addps 0x41fe(%eax),%xmm0
+ .byte 15,40,176,30,66,0,0 // movaps 0x421e(%eax),%xmm6
+ .byte 15,92,244 // subps %xmm4,%xmm6
+ .byte 15,40,168,14,66,0,0 // movaps 0x420e(%eax),%xmm5
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,40,152,46,66,0,0 // movaps 0x422e(%eax),%xmm3
+ .byte 15,40,227 // movaps %xmm3,%xmm4
+ .byte 15,94,230 // divps %xmm6,%xmm4
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
+ .byte 15,89,128,126,65,0,0 // mulps 0x417e(%eax),%xmm0
+ .byte 15,84,136,142,65,0,0 // andps 0x418e(%eax),%xmm1
+ .byte 15,86,136,158,65,0,0 // orps 0x419e(%eax),%xmm1
+ .byte 15,88,128,174,65,0,0 // addps 0x41ae(%eax),%xmm0
+ .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,89,176,190,65,0,0 // mulps 0x41be(%eax),%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,88,136,206,65,0,0 // addps 0x41ce(%eax),%xmm1
+ .byte 15,40,176,222,65,0,0 // movaps 0x41de(%eax),%xmm6
+ .byte 15,94,241 // divps %xmm1,%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,89,199 // mulps %xmm7,%xmm0
+ .byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
+ .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,194,241,1 // cmpltps %xmm1,%xmm6
+ .byte 15,84,176,238,65,0,0 // andps 0x41ee(%eax),%xmm6
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,92,241 // subps %xmm1,%xmm6
+ .byte 15,88,128,254,65,0,0 // addps 0x41fe(%eax),%xmm0
+ .byte 15,40,184,30,66,0,0 // movaps 0x421e(%eax),%xmm7
+ .byte 15,92,254 // subps %xmm6,%xmm7
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,40,203 // movaps %xmm3,%xmm1
+ .byte 15,94,207 // divps %xmm7,%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
+ .byte 15,89,128,126,65,0,0 // mulps 0x417e(%eax),%xmm0
+ .byte 15,84,144,142,65,0,0 // andps 0x418e(%eax),%xmm2
+ .byte 15,86,144,158,65,0,0 // orps 0x419e(%eax),%xmm2
+ .byte 15,88,128,174,65,0,0 // addps 0x41ae(%eax),%xmm0
+ .byte 15,40,176,190,65,0,0 // movaps 0x41be(%eax),%xmm6
+ .byte 15,89,242 // mulps %xmm2,%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,88,144,206,65,0,0 // addps 0x41ce(%eax),%xmm2
+ .byte 15,40,176,222,65,0,0 // movaps 0x41de(%eax),%xmm6
+ .byte 15,94,242 // divps %xmm2,%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0
+ .byte 243,15,91,208 // cvttps2dq %xmm0,%xmm2
+ .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,194,242,1 // cmpltps %xmm2,%xmm6
+ .byte 15,84,176,238,65,0,0 // andps 0x41ee(%eax),%xmm6
+ .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 15,88,128,254,65,0,0 // addps 0x41fe(%eax),%xmm0
+ .byte 15,89,238 // mulps %xmm6,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 15,40,144,30,66,0,0 // movaps 0x421e(%eax),%xmm2
+ .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 15,94,218 // divps %xmm2,%xmm3
+ .byte 15,88,216 // addps %xmm0,%xmm3
+ .byte 15,40,128,62,66,0,0 // movaps 0x423e(%eax),%xmm0
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 102,15,91,196 // cvtps2dq %xmm4,%xmm0
+ .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
+ .byte 102,15,91,211 // cvtps2dq %xmm3,%xmm2
+ .byte 141,65,8 // lea 0x8(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,81,4 // call *0x4(%ecx)
+ .byte 131,196,56 // add $0x38,%esp
+ .byte 93 // pop %ebp
+ .byte 195 // ret
+
HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
@@ -55037,31 +56072,31 @@ _sk_lab_to_xyz_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 38b5 <_sk_lab_to_xyz_sse2+0x15>
+ .byte 232,0,0,0,0 // call 3a9a <_sk_lab_to_xyz_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,89,144,155,63,0,0 // mulps 0x3f9b(%eax),%xmm2
- .byte 15,40,160,171,63,0,0 // movaps 0x3fab(%eax),%xmm4
+ .byte 15,89,144,102,64,0,0 // mulps 0x4066(%eax),%xmm2
+ .byte 15,40,160,118,64,0,0 // movaps 0x4076(%eax),%xmm4
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,168,187,63,0,0 // movaps 0x3fbb(%eax),%xmm5
+ .byte 15,40,168,134,64,0,0 // movaps 0x4086(%eax),%xmm5
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,88,144,203,63,0,0 // addps 0x3fcb(%eax),%xmm2
- .byte 15,89,144,219,63,0,0 // mulps 0x3fdb(%eax),%xmm2
- .byte 15,89,136,235,63,0,0 // mulps 0x3feb(%eax),%xmm1
+ .byte 15,88,144,150,64,0,0 // addps 0x4096(%eax),%xmm2
+ .byte 15,89,144,166,64,0,0 // mulps 0x40a6(%eax),%xmm2
+ .byte 15,89,136,182,64,0,0 // mulps 0x40b6(%eax),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,89,152,251,63,0,0 // mulps 0x3ffb(%eax),%xmm3
+ .byte 15,89,152,198,64,0,0 // mulps 0x40c6(%eax),%xmm3
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,152,11,64,0,0 // movaps 0x400b(%eax),%xmm3
+ .byte 15,40,152,214,64,0,0 // movaps 0x40d6(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,194,224,1 // cmpltps %xmm0,%xmm4
- .byte 15,40,176,27,64,0,0 // movaps 0x401b(%eax),%xmm6
+ .byte 15,40,176,230,64,0,0 // movaps 0x40e6(%eax),%xmm6
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,184,43,64,0,0 // movaps 0x402b(%eax),%xmm7
+ .byte 15,40,184,246,64,0,0 // movaps 0x40f6(%eax),%xmm7
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,85,225 // andnps %xmm1,%xmm4
@@ -55086,8 +56121,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,85,221 // andnps %xmm5,%xmm3
.byte 15,86,216 // orps %xmm0,%xmm3
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,160,59,64,0,0 // mulps 0x403b(%eax),%xmm4
- .byte 15,89,152,75,64,0,0 // mulps 0x404b(%eax),%xmm3
+ .byte 15,89,160,6,65,0,0 // mulps 0x4106(%eax),%xmm4
+ .byte 15,89,152,22,65,0,0 // mulps 0x4116(%eax),%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -55110,7 +56145,7 @@ _sk_load_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 39a5 <_sk_load_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3b8a <_sk_load_a8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55121,13 +56156,13 @@ _sk_load_a8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,60 // jne 39fc <_sk_load_a8_sse2+0x65>
+ .byte 117,60 // jne 3be1 <_sk_load_a8_sse2+0x65>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,107,63,0,0 // pand 0x3f6b(%edx),%xmm0
+ .byte 102,15,219,130,54,64,0,0 // pand 0x4036(%edx),%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,154,123,63,0,0 // mulps 0x3f7b(%edx),%xmm3
+ .byte 15,89,154,70,64,0,0 // mulps 0x4046(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -55144,12 +56179,12 @@ _sk_load_a8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3a36 <_sk_load_a8_sse2+0x9f>
+ .byte 116,50 // je 3c1b <_sk_load_a8_sse2+0x9f>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3a20 <_sk_load_a8_sse2+0x89>
+ .byte 116,19 // je 3c05 <_sk_load_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,187 // jne 39cd <_sk_load_a8_sse2+0x36>
+ .byte 117,187 // jne 3bb2 <_sk_load_a8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -55158,10 +56193,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,151 // jmp 39cd <_sk_load_a8_sse2+0x36>
+ .byte 235,151 // jmp 3bb2 <_sk_load_a8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,141 // jmp 39cd <_sk_load_a8_sse2+0x36>
+ .byte 235,141 // jmp 3bb2 <_sk_load_a8_sse2+0x36>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -55186,15 +56221,15 @@ _sk_load_a8_dst_sse2:
.byte 102,15,127,97,32 // movdqa %xmm4,0x20(%ecx)
.byte 102,15,127,97,16 // movdqa %xmm4,0x10(%ecx)
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 3a79 <_sk_load_a8_dst_sse2+0x39>
+ .byte 232,0,0,0,0 // call 3c5e <_sk_load_a8_dst_sse2+0x39>
.byte 90 // pop %edx
- .byte 117,54 // jne 3ab2 <_sk_load_a8_dst_sse2+0x72>
+ .byte 117,54 // jne 3c97 <_sk_load_a8_dst_sse2+0x72>
.byte 102,15,110,36,55 // movd (%edi,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,183,62,0,0 // pand 0x3eb7(%edx),%xmm4
+ .byte 102,15,219,162,130,63,0,0 // pand 0x3f82(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,199,62,0,0 // mulps 0x3ec7(%edx),%xmm4
+ .byte 15,89,162,146,63,0,0 // mulps 0x3f92(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -55209,11 +56244,11 @@ _sk_load_a8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 3ae8 <_sk_load_a8_dst_sse2+0xa8>
+ .byte 116,46 // je 3ccd <_sk_load_a8_dst_sse2+0xa8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3ad2 <_sk_load_a8_dst_sse2+0x92>
+ .byte 116,19 // je 3cb7 <_sk_load_a8_dst_sse2+0x92>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,197 // jne 3a89 <_sk_load_a8_dst_sse2+0x49>
+ .byte 117,197 // jne 3c6e <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,92,55,2 // movzbl 0x2(%edi,%esi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -55222,10 +56257,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,161 // jmp 3a89 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,161 // jmp 3c6e <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,52,55 // movzbl (%edi,%esi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,151 // jmp 3a89 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,151 // jmp 3c6e <_sk_load_a8_dst_sse2+0x49>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -55266,13 +56301,13 @@ _sk_gather_a8_sse2:
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
- .byte 232,0,0,0,0 // call 3b77 <_sk_gather_a8_sse2+0x85>
+ .byte 232,0,0,0,0 // call 3d5c <_sk_gather_a8_sse2+0x85>
.byte 89 // pop %ecx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,153,217,61,0,0 // mulps 0x3dd9(%ecx),%xmm3
+ .byte 15,89,153,164,62,0,0 // mulps 0x3ea4(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -55297,7 +56332,7 @@ _sk_store_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 3bbb <_sk_store_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3da0 <_sk_store_a8_sse2+0xe>
.byte 94 // pop %esi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55306,7 +56341,7 @@ _sk_store_a8_sse2:
.byte 15,175,81,4 // imul 0x4(%ecx),%edx
.byte 3,23 // add (%edi),%edx
.byte 139,89,8 // mov 0x8(%ecx),%ebx
- .byte 15,40,166,165,61,0,0 // movaps 0x3da5(%esi),%xmm4
+ .byte 15,40,166,112,62,0,0 // movaps 0x3e70(%esi),%xmm4
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
@@ -55315,7 +56350,7 @@ _sk_store_a8_sse2:
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,26 // jne 3c10 <_sk_store_a8_sse2+0x63>
+ .byte 117,26 // jne 3df5 <_sk_store_a8_sse2+0x63>
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 137,52,58 // mov %esi,(%edx,%edi,1)
.byte 141,80,8 // lea 0x8(%eax),%edx
@@ -55333,26 +56368,26 @@ _sk_store_a8_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,57 // je 3c59 <_sk_store_a8_sse2+0xac>
+ .byte 116,57 // je 3e3e <_sk_store_a8_sse2+0xac>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,17 // je 3c36 <_sk_store_a8_sse2+0x89>
+ .byte 116,17 // je 3e1b <_sk_store_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,211 // jne 3bfd <_sk_store_a8_sse2+0x50>
+ .byte 117,211 // jne 3de2 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,200 // movdqa %xmm4,-0x38(%ebp)
.byte 138,93,208 // mov -0x30(%ebp),%bl
.byte 136,92,58,2 // mov %bl,0x2(%edx,%edi,1)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
- .byte 102,15,219,166,181,61,0,0 // pand 0x3db5(%esi),%xmm4
+ .byte 102,15,219,166,128,62,0,0 // pand 0x3e80(%esi),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 102,137,52,58 // mov %si,(%edx,%edi,1)
- .byte 235,164 // jmp 3bfd <_sk_store_a8_sse2+0x50>
+ .byte 235,164 // jmp 3de2 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp)
.byte 138,93,216 // mov -0x28(%ebp),%bl
.byte 136,28,58 // mov %bl,(%edx,%edi,1)
- .byte 235,151 // jmp 3bfd <_sk_store_a8_sse2+0x50>
+ .byte 235,151 // jmp 3de2 <_sk_store_a8_sse2+0x50>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -55364,7 +56399,7 @@ _sk_load_g8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3c74 <_sk_load_g8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3e59 <_sk_load_g8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55375,16 +56410,16 @@ _sk_load_g8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,63 // jne 3cce <_sk_load_g8_sse2+0x68>
+ .byte 117,63 // jne 3eb3 <_sk_load_g8_sse2+0x68>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,12,61,0,0 // pand 0x3d0c(%edx),%xmm0
+ .byte 102,15,219,130,215,61,0,0 // pand 0x3dd7(%edx),%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,28,61,0,0 // mulps 0x3d1c(%edx),%xmm0
+ .byte 15,89,130,231,61,0,0 // mulps 0x3de7(%edx),%xmm0
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,44,61,0,0 // movaps 0x3d2c(%edx),%xmm3
+ .byte 15,40,154,247,61,0,0 // movaps 0x3df7(%edx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 86 // push %esi
@@ -55398,12 +56433,12 @@ _sk_load_g8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3d08 <_sk_load_g8_sse2+0xa2>
+ .byte 116,50 // je 3eed <_sk_load_g8_sse2+0xa2>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3cf2 <_sk_load_g8_sse2+0x8c>
+ .byte 116,19 // je 3ed7 <_sk_load_g8_sse2+0x8c>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,184 // jne 3c9c <_sk_load_g8_sse2+0x36>
+ .byte 117,184 // jne 3e81 <_sk_load_g8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -55412,10 +56447,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,148 // jmp 3c9c <_sk_load_g8_sse2+0x36>
+ .byte 235,148 // jmp 3e81 <_sk_load_g8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,138 // jmp 3c9c <_sk_load_g8_sse2+0x36>
+ .byte 235,138 // jmp 3e81 <_sk_load_g8_sse2+0x36>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -55427,7 +56462,7 @@ _sk_load_g8_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3d20 <_sk_load_g8_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3f05 <_sk_load_g8_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55438,17 +56473,17 @@ _sk_load_g8_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,73 // jne 3d84 <_sk_load_g8_dst_sse2+0x72>
+ .byte 117,73 // jne 3f69 <_sk_load_g8_dst_sse2+0x72>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,144,60,0,0 // pand 0x3c90(%edx),%xmm4
+ .byte 102,15,219,162,91,61,0,0 // pand 0x3d5b(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,160,60,0,0 // mulps 0x3ca0(%edx),%xmm4
+ .byte 15,89,162,107,61,0,0 // mulps 0x3d6b(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
.byte 15,41,97,32 // movaps %xmm4,0x20(%ecx)
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,162,176,60,0,0 // movaps 0x3cb0(%edx),%xmm4
+ .byte 15,40,162,123,61,0,0 // movaps 0x3d7b(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -55463,12 +56498,12 @@ _sk_load_g8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3dbe <_sk_load_g8_dst_sse2+0xac>
+ .byte 116,50 // je 3fa3 <_sk_load_g8_dst_sse2+0xac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3da8 <_sk_load_g8_dst_sse2+0x96>
+ .byte 116,19 // je 3f8d <_sk_load_g8_dst_sse2+0x96>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,174 // jne 3d48 <_sk_load_g8_dst_sse2+0x36>
+ .byte 117,174 // jne 3f2d <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -55477,10 +56512,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,138 // jmp 3d48 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,138 // jmp 3f2d <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,128 // jmp 3d48 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,128 // jmp 3f2d <_sk_load_g8_dst_sse2+0x36>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -55520,17 +56555,17 @@ _sk_gather_g8_sse2:
.byte 193,226,8 // shl $0x8,%edx
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
- .byte 232,0,0,0,0 // call 3e48 <_sk_gather_g8_sse2+0x80>
+ .byte 232,0,0,0,0 // call 402d <_sk_gather_g8_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,152,59,0,0 // mulps 0x3b98(%ecx),%xmm0
+ .byte 15,89,129,99,60,0,0 // mulps 0x3c63(%ecx),%xmm0
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,168,59,0,0 // movaps 0x3ba8(%ecx),%xmm3
+ .byte 15,40,153,115,60,0,0 // movaps 0x3c73(%ecx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 82 // push %edx
@@ -55552,7 +56587,7 @@ _sk_load_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3e93 <_sk_load_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4078 <_sk_load_565_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55564,23 +56599,23 @@ _sk_load_565_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,97 // jne 3f11 <_sk_load_565_sse2+0x8c>
+ .byte 117,97 // jne 40f6 <_sk_load_565_sse2+0x8c>
.byte 243,15,126,20,126 // movq (%esi,%edi,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,109,59,0,0 // movdqa 0x3b6d(%edx),%xmm0
+ .byte 102,15,111,130,56,60,0,0 // movdqa 0x3c38(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,125,59,0,0 // mulps 0x3b7d(%edx),%xmm0
- .byte 102,15,111,138,141,59,0,0 // movdqa 0x3b8d(%edx),%xmm1
+ .byte 15,89,130,72,60,0,0 // mulps 0x3c48(%edx),%xmm0
+ .byte 102,15,111,138,88,60,0,0 // movdqa 0x3c58(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,157,59,0,0 // mulps 0x3b9d(%edx),%xmm1
- .byte 102,15,219,146,173,59,0,0 // pand 0x3bad(%edx),%xmm2
+ .byte 15,89,138,104,60,0,0 // mulps 0x3c68(%edx),%xmm1
+ .byte 102,15,219,146,120,60,0,0 // pand 0x3c78(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,189,59,0,0 // mulps 0x3bbd(%edx),%xmm2
+ .byte 15,89,146,136,60,0,0 // mulps 0x3c88(%edx),%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,205,59,0,0 // movaps 0x3bcd(%edx),%xmm3
+ .byte 15,40,154,152,60,0,0 // movaps 0x3c98(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -55592,22 +56627,22 @@ _sk_load_565_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 3f47 <_sk_load_565_sse2+0xc2>
+ .byte 116,46 // je 412c <_sk_load_565_sse2+0xc2>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3f35 <_sk_load_565_sse2+0xb0>
+ .byte 116,19 // je 411a <_sk_load_565_sse2+0xb0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,146 // jne 3eb9 <_sk_load_565_sse2+0x34>
+ .byte 117,146 // jne 409e <_sk_load_565_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,114,255,255,255 // jmp 3eb9 <_sk_load_565_sse2+0x34>
+ .byte 233,114,255,255,255 // jmp 409e <_sk_load_565_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,214 // movd %esi,%xmm2
- .byte 233,101,255,255,255 // jmp 3eb9 <_sk_load_565_sse2+0x34>
+ .byte 233,101,255,255,255 // jmp 409e <_sk_load_565_sse2+0x34>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -55619,7 +56654,7 @@ _sk_load_565_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3f62 <_sk_load_565_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4147 <_sk_load_565_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55631,24 +56666,24 @@ _sk_load_565_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,113 // jne 3ff0 <_sk_load_565_dst_sse2+0x9c>
+ .byte 117,113 // jne 41d5 <_sk_load_565_dst_sse2+0x9c>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,14,59,0,0 // movdqa 0x3b0e(%edx),%xmm5
+ .byte 102,15,111,170,217,59,0,0 // movdqa 0x3bd9(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,30,59,0,0 // mulps 0x3b1e(%edx),%xmm5
+ .byte 15,89,170,233,59,0,0 // mulps 0x3be9(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,46,59,0,0 // movdqa 0x3b2e(%edx),%xmm5
+ .byte 102,15,111,170,249,59,0,0 // movdqa 0x3bf9(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,62,59,0,0 // mulps 0x3b3e(%edx),%xmm5
+ .byte 15,89,170,9,60,0,0 // mulps 0x3c09(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,219,162,78,59,0,0 // pand 0x3b4e(%edx),%xmm4
+ .byte 102,15,219,162,25,60,0,0 // pand 0x3c19(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,94,59,0,0 // mulps 0x3b5e(%edx),%xmm4
+ .byte 15,89,162,41,60,0,0 // mulps 0x3c29(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
- .byte 15,40,162,110,59,0,0 // movaps 0x3b6e(%edx),%xmm4
+ .byte 15,40,162,57,60,0,0 // movaps 0x3c39(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -55663,22 +56698,22 @@ _sk_load_565_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 4026 <_sk_load_565_dst_sse2+0xd2>
+ .byte 116,46 // je 420b <_sk_load_565_dst_sse2+0xd2>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 4014 <_sk_load_565_dst_sse2+0xc0>
+ .byte 116,19 // je 41f9 <_sk_load_565_dst_sse2+0xc0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,130 // jne 3f88 <_sk_load_565_dst_sse2+0x34>
+ .byte 117,130 // jne 416d <_sk_load_565_dst_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,98,255,255,255 // jmp 3f88 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,98,255,255,255 // jmp 416d <_sk_load_565_dst_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,85,255,255,255 // jmp 3f88 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,85,255,255,255 // jmp 416d <_sk_load_565_dst_sse2+0x34>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -55713,25 +56748,25 @@ _sk_gather_565_sse2:
.byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
- .byte 232,0,0,0,0 // call 40ae <_sk_gather_565_sse2+0x7b>
+ .byte 232,0,0,0,0 // call 4293 <_sk_gather_565_sse2+0x7b>
.byte 90 // pop %edx
.byte 102,15,196,209,3 // pinsrw $0x3,%ecx,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,50,58,0,0 // movdqa 0x3a32(%edx),%xmm0
+ .byte 102,15,111,130,253,58,0,0 // movdqa 0x3afd(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,66,58,0,0 // mulps 0x3a42(%edx),%xmm0
- .byte 102,15,111,138,82,58,0,0 // movdqa 0x3a52(%edx),%xmm1
+ .byte 15,89,130,13,59,0,0 // mulps 0x3b0d(%edx),%xmm0
+ .byte 102,15,111,138,29,59,0,0 // movdqa 0x3b1d(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,98,58,0,0 // mulps 0x3a62(%edx),%xmm1
- .byte 102,15,219,146,114,58,0,0 // pand 0x3a72(%edx),%xmm2
+ .byte 15,89,138,45,59,0,0 // mulps 0x3b2d(%edx),%xmm1
+ .byte 102,15,219,146,61,59,0,0 // pand 0x3b3d(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,130,58,0,0 // mulps 0x3a82(%edx),%xmm2
+ .byte 15,89,146,77,59,0,0 // mulps 0x3b4d(%edx),%xmm2
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,146,58,0,0 // movaps 0x3a92(%edx),%xmm3
+ .byte 15,40,154,93,59,0,0 // movaps 0x3b5d(%edx),%xmm3
.byte 81 // push %ecx
.byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,80,4 // call *0x4(%eax)
@@ -55749,7 +56784,7 @@ _sk_store_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4121 <_sk_store_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4306 <_sk_store_565_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55759,8 +56794,8 @@ _sk_store_565_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,47,58,0,0 // movaps 0x3a2f(%edi),%xmm4
- .byte 15,40,175,63,58,0,0 // movaps 0x3a3f(%edi),%xmm5
+ .byte 15,40,167,250,58,0,0 // movaps 0x3afa(%edi),%xmm4
+ .byte 15,40,175,10,59,0,0 // movaps 0x3b0a(%edi),%xmm5
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,89,244 // mulps %xmm4,%xmm6
@@ -55780,7 +56815,7 @@ _sk_store_565_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 41b5 <_sk_store_565_sse2+0xa2>
+ .byte 117,34 // jne 439a <_sk_store_565_sse2+0xa2>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -55800,20 +56835,20 @@ _sk_store_565_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 41eb <_sk_store_565_sse2+0xd8>
+ .byte 116,37 // je 43d0 <_sk_store_565_sse2+0xd8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 41da <_sk_store_565_sse2+0xc7>
+ .byte 116,15 // je 43bf <_sk_store_565_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 41a2 <_sk_store_565_sse2+0x8f>
+ .byte 117,210 // jne 4387 <_sk_store_565_sse2+0x8f>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 41a2 <_sk_store_565_sse2+0x8f>
+ .byte 235,183 // jmp 4387 <_sk_store_565_sse2+0x8f>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 41a2 <_sk_store_565_sse2+0x8f>
+ .byte 235,173 // jmp 4387 <_sk_store_565_sse2+0x8f>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -55825,7 +56860,7 @@ _sk_load_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4203 <_sk_load_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 43e8 <_sk_load_4444_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55837,24 +56872,24 @@ _sk_load_4444_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,112 // jne 4290 <_sk_load_4444_sse2+0x9b>
+ .byte 117,112 // jne 4475 <_sk_load_4444_sse2+0x9b>
.byte 243,15,126,28,126 // movq (%esi,%edi,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,130,109,57,0,0 // movdqa 0x396d(%edx),%xmm0
+ .byte 102,15,111,130,56,58,0,0 // movdqa 0x3a38(%edx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,125,57,0,0 // mulps 0x397d(%edx),%xmm0
- .byte 102,15,111,138,141,57,0,0 // movdqa 0x398d(%edx),%xmm1
+ .byte 15,89,130,72,58,0,0 // mulps 0x3a48(%edx),%xmm0
+ .byte 102,15,111,138,88,58,0,0 // movdqa 0x3a58(%edx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,157,57,0,0 // mulps 0x399d(%edx),%xmm1
- .byte 102,15,111,146,173,57,0,0 // movdqa 0x39ad(%edx),%xmm2
+ .byte 15,89,138,104,58,0,0 // mulps 0x3a68(%edx),%xmm1
+ .byte 102,15,111,146,120,58,0,0 // movdqa 0x3a78(%edx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,189,57,0,0 // mulps 0x39bd(%edx),%xmm2
- .byte 102,15,219,154,205,57,0,0 // pand 0x39cd(%edx),%xmm3
+ .byte 15,89,146,136,58,0,0 // mulps 0x3a88(%edx),%xmm2
+ .byte 102,15,219,154,152,58,0,0 // pand 0x3a98(%edx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,221,57,0,0 // mulps 0x39dd(%edx),%xmm3
+ .byte 15,89,154,168,58,0,0 // mulps 0x3aa8(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 82 // push %edx
@@ -55868,22 +56903,22 @@ _sk_load_4444_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 42c6 <_sk_load_4444_sse2+0xd1>
+ .byte 116,46 // je 44ab <_sk_load_4444_sse2+0xd1>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 42b4 <_sk_load_4444_sse2+0xbf>
+ .byte 116,19 // je 4499 <_sk_load_4444_sse2+0xbf>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,131 // jne 4229 <_sk_load_4444_sse2+0x34>
+ .byte 117,131 // jne 440e <_sk_load_4444_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,99,255,255,255 // jmp 4229 <_sk_load_4444_sse2+0x34>
+ .byte 233,99,255,255,255 // jmp 440e <_sk_load_4444_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,222 // movd %esi,%xmm3
- .byte 233,86,255,255,255 // jmp 4229 <_sk_load_4444_sse2+0x34>
+ .byte 233,86,255,255,255 // jmp 440e <_sk_load_4444_sse2+0x34>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -55895,7 +56930,7 @@ _sk_load_4444_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 42e1 <_sk_load_4444_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 44c6 <_sk_load_4444_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55907,27 +56942,27 @@ _sk_load_4444_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,128,0,0,0 // jne 4382 <_sk_load_4444_dst_sse2+0xaf>
+ .byte 15,133,128,0,0,0 // jne 4567 <_sk_load_4444_dst_sse2+0xaf>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,15,57,0,0 // movdqa 0x390f(%edx),%xmm5
+ .byte 102,15,111,170,218,57,0,0 // movdqa 0x39da(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,31,57,0,0 // mulps 0x391f(%edx),%xmm5
+ .byte 15,89,170,234,57,0,0 // mulps 0x39ea(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,47,57,0,0 // movdqa 0x392f(%edx),%xmm5
+ .byte 102,15,111,170,250,57,0,0 // movdqa 0x39fa(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,63,57,0,0 // mulps 0x393f(%edx),%xmm5
+ .byte 15,89,170,10,58,0,0 // mulps 0x3a0a(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,111,170,79,57,0,0 // movdqa 0x394f(%edx),%xmm5
+ .byte 102,15,111,170,26,58,0,0 // movdqa 0x3a1a(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,95,57,0,0 // mulps 0x395f(%edx),%xmm5
+ .byte 15,89,170,42,58,0,0 // mulps 0x3a2a(%edx),%xmm5
.byte 15,41,105,48 // movaps %xmm5,0x30(%ecx)
- .byte 102,15,219,162,111,57,0,0 // pand 0x396f(%edx),%xmm4
+ .byte 102,15,219,162,58,58,0,0 // pand 0x3a3a(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,127,57,0,0 // mulps 0x397f(%edx),%xmm4
+ .byte 15,89,162,74,58,0,0 // mulps 0x3a4a(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -55942,22 +56977,22 @@ _sk_load_4444_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 43bc <_sk_load_4444_dst_sse2+0xe9>
+ .byte 116,50 // je 45a1 <_sk_load_4444_dst_sse2+0xe9>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,23 // je 43aa <_sk_load_4444_dst_sse2+0xd7>
+ .byte 116,23 // je 458f <_sk_load_4444_dst_sse2+0xd7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,111,255,255,255 // jne 430b <_sk_load_4444_dst_sse2+0x38>
+ .byte 15,133,111,255,255,255 // jne 44f0 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,79,255,255,255 // jmp 430b <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,79,255,255,255 // jmp 44f0 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,66,255,255,255 // jmp 430b <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,66,255,255,255 // jmp 44f0 <_sk_load_4444_dst_sse2+0x38>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -55993,25 +57028,25 @@ _sk_gather_4444_sse2:
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
.byte 102,15,196,217,3 // pinsrw $0x3,%ecx,%xmm3
- .byte 232,0,0,0,0 // call 4449 <_sk_gather_4444_sse2+0x80>
+ .byte 232,0,0,0,0 // call 462e <_sk_gather_4444_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,129,39,56,0,0 // movdqa 0x3827(%ecx),%xmm0
+ .byte 102,15,111,129,242,56,0,0 // movdqa 0x38f2(%ecx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,55,56,0,0 // mulps 0x3837(%ecx),%xmm0
- .byte 102,15,111,137,71,56,0,0 // movdqa 0x3847(%ecx),%xmm1
+ .byte 15,89,129,2,57,0,0 // mulps 0x3902(%ecx),%xmm0
+ .byte 102,15,111,137,18,57,0,0 // movdqa 0x3912(%ecx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,137,87,56,0,0 // mulps 0x3857(%ecx),%xmm1
- .byte 102,15,111,145,103,56,0,0 // movdqa 0x3867(%ecx),%xmm2
+ .byte 15,89,137,34,57,0,0 // mulps 0x3922(%ecx),%xmm1
+ .byte 102,15,111,145,50,57,0,0 // movdqa 0x3932(%ecx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,145,119,56,0,0 // mulps 0x3877(%ecx),%xmm2
- .byte 102,15,219,153,135,56,0,0 // pand 0x3887(%ecx),%xmm3
+ .byte 15,89,145,66,57,0,0 // mulps 0x3942(%ecx),%xmm2
+ .byte 102,15,219,153,82,57,0,0 // pand 0x3952(%ecx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,153,151,56,0,0 // mulps 0x3897(%ecx),%xmm3
+ .byte 15,89,153,98,57,0,0 // mulps 0x3962(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 81 // push %ecx
@@ -56031,7 +57066,7 @@ _sk_store_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 44c6 <_sk_store_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 46ab <_sk_store_4444_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56041,7 +57076,7 @@ _sk_store_4444_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,42,56,0,0 // movaps 0x382a(%edi),%xmm4
+ .byte 15,40,167,245,56,0,0 // movaps 0x38f5(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -56067,7 +57102,7 @@ _sk_store_4444_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 4569 <_sk_store_4444_sse2+0xb1>
+ .byte 117,34 // jne 474e <_sk_store_4444_sse2+0xb1>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -56087,20 +57122,20 @@ _sk_store_4444_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 459f <_sk_store_4444_sse2+0xe7>
+ .byte 116,37 // je 4784 <_sk_store_4444_sse2+0xe7>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 458e <_sk_store_4444_sse2+0xd6>
+ .byte 116,15 // je 4773 <_sk_store_4444_sse2+0xd6>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 4556 <_sk_store_4444_sse2+0x9e>
+ .byte 117,210 // jne 473b <_sk_store_4444_sse2+0x9e>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 4556 <_sk_store_4444_sse2+0x9e>
+ .byte 235,183 // jmp 473b <_sk_store_4444_sse2+0x9e>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 4556 <_sk_store_4444_sse2+0x9e>
+ .byte 235,173 // jmp 473b <_sk_store_4444_sse2+0x9e>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -56112,7 +57147,7 @@ _sk_load_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 45b7 <_sk_load_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 479c <_sk_load_8888_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56124,13 +57159,13 @@ _sk_load_8888_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 463b <_sk_load_8888_sse2+0x92>
+ .byte 117,102 // jne 4820 <_sk_load_8888_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,146,73,55,0,0 // movdqa 0x3749(%edx),%xmm2
+ .byte 102,15,111,146,20,56,0,0 // movdqa 0x3814(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,89,55,0,0 // movaps 0x3759(%edx),%xmm4
+ .byte 15,40,162,36,56,0,0 // movaps 0x3824(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -56158,18 +57193,18 @@ _sk_load_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 4666 <_sk_load_8888_sse2+0xbd>
+ .byte 116,35 // je 484b <_sk_load_8888_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 465c <_sk_load_8888_sse2+0xb3>
+ .byte 116,16 // je 4841 <_sk_load_8888_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 45da <_sk_load_8888_sse2+0x31>
+ .byte 117,137 // jne 47bf <_sk_load_8888_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 45da <_sk_load_8888_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 47bf <_sk_load_8888_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 45da <_sk_load_8888_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 47bf <_sk_load_8888_sse2+0x31>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -56181,7 +57216,7 @@ _sk_load_8888_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 467e <_sk_load_8888_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4863 <_sk_load_8888_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56193,13 +57228,13 @@ _sk_load_8888_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 4712 <_sk_load_8888_dst_sse2+0xa2>
+ .byte 117,118 // jne 48f7 <_sk_load_8888_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,162,54,0,0 // movdqa 0x36a2(%edx),%xmm5
+ .byte 102,15,111,170,109,55,0,0 // movdqa 0x376d(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,178,54,0,0 // movaps 0x36b2(%edx),%xmm7
+ .byte 15,40,186,125,55,0,0 // movaps 0x377d(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,16 // movaps %xmm6,0x10(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -56231,18 +57266,18 @@ _sk_load_8888_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 4741 <_sk_load_8888_dst_sse2+0xd1>
+ .byte 116,39 // je 4926 <_sk_load_8888_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4737 <_sk_load_8888_dst_sse2+0xc7>
+ .byte 116,20 // je 491c <_sk_load_8888_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 46a1 <_sk_load_8888_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 4886 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 46a1 <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 4886 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 46a1 <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 4886 <_sk_load_8888_dst_sse2+0x31>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -56276,16 +57311,16 @@ _sk_gather_8888_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 47c1 <_sk_gather_8888_sse2+0x76>
+ .byte 232,0,0,0,0 // call 49a6 <_sk_gather_8888_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,145,127,53,0,0 // movdqa 0x357f(%ecx),%xmm2
+ .byte 102,15,111,145,74,54,0,0 // movdqa 0x364a(%ecx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,161,143,53,0,0 // movaps 0x358f(%ecx),%xmm4
+ .byte 15,40,161,90,54,0,0 // movaps 0x365a(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -56319,7 +57354,7 @@ _sk_store_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 483c <_sk_store_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4a21 <_sk_store_8888_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56329,7 +57364,7 @@ _sk_store_8888_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,36,53,0,0 // movaps 0x3524(%edi),%xmm4
+ .byte 15,40,167,239,53,0,0 // movaps 0x35ef(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -56349,7 +57384,7 @@ _sk_store_8888_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 48b9 <_sk_store_8888_sse2+0x8b>
+ .byte 117,24 // jne 4a9e <_sk_store_8888_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -56364,17 +57399,17 @@ _sk_store_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 48dd <_sk_store_8888_sse2+0xaf>
+ .byte 116,28 // je 4ac2 <_sk_store_8888_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 48d6 <_sk_store_8888_sse2+0xa8>
+ .byte 116,16 // je 4abb <_sk_store_8888_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 48a6 <_sk_store_8888_sse2+0x78>
+ .byte 117,219 // jne 4a8b <_sk_store_8888_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 48a6 <_sk_store_8888_sse2+0x78>
+ .byte 235,201 // jmp 4a8b <_sk_store_8888_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 48a6 <_sk_store_8888_sse2+0x78>
+ .byte 235,194 // jmp 4a8b <_sk_store_8888_sse2+0x78>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -56386,7 +57421,7 @@ _sk_load_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 48f2 <_sk_load_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4ad7 <_sk_load_bgra_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56398,13 +57433,13 @@ _sk_load_bgra_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 4976 <_sk_load_bgra_sse2+0x92>
+ .byte 117,102 // jne 4b5b <_sk_load_bgra_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,130,126,52,0,0 // movdqa 0x347e(%edx),%xmm0
+ .byte 102,15,111,130,73,53,0,0 // movdqa 0x3549(%edx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,162,142,52,0,0 // movaps 0x348e(%edx),%xmm4
+ .byte 15,40,162,89,53,0,0 // movaps 0x3559(%edx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -56432,18 +57467,18 @@ _sk_load_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 49a1 <_sk_load_bgra_sse2+0xbd>
+ .byte 116,35 // je 4b86 <_sk_load_bgra_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4997 <_sk_load_bgra_sse2+0xb3>
+ .byte 116,16 // je 4b7c <_sk_load_bgra_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 4915 <_sk_load_bgra_sse2+0x31>
+ .byte 117,137 // jne 4afa <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 4915 <_sk_load_bgra_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 4afa <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 4915 <_sk_load_bgra_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 4afa <_sk_load_bgra_sse2+0x31>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -56455,7 +57490,7 @@ _sk_load_bgra_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 49b9 <_sk_load_bgra_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4b9e <_sk_load_bgra_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56467,13 +57502,13 @@ _sk_load_bgra_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 4a4d <_sk_load_bgra_dst_sse2+0xa2>
+ .byte 117,118 // jne 4c32 <_sk_load_bgra_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,215,51,0,0 // movdqa 0x33d7(%edx),%xmm5
+ .byte 102,15,111,170,162,52,0,0 // movdqa 0x34a2(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,231,51,0,0 // movaps 0x33e7(%edx),%xmm7
+ .byte 15,40,186,178,52,0,0 // movaps 0x34b2(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,48 // movaps %xmm6,0x30(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -56505,18 +57540,18 @@ _sk_load_bgra_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 4a7c <_sk_load_bgra_dst_sse2+0xd1>
+ .byte 116,39 // je 4c61 <_sk_load_bgra_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4a72 <_sk_load_bgra_dst_sse2+0xc7>
+ .byte 116,20 // je 4c57 <_sk_load_bgra_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 49dc <_sk_load_bgra_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 4bc1 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 49dc <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 4bc1 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 49dc <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 4bc1 <_sk_load_bgra_dst_sse2+0x31>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -56550,16 +57585,16 @@ _sk_gather_bgra_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 4afc <_sk_gather_bgra_sse2+0x76>
+ .byte 232,0,0,0,0 // call 4ce1 <_sk_gather_bgra_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,129,180,50,0,0 // movdqa 0x32b4(%ecx),%xmm0
+ .byte 102,15,111,129,127,51,0,0 // movdqa 0x337f(%ecx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,161,196,50,0,0 // movaps 0x32c4(%ecx),%xmm4
+ .byte 15,40,161,143,51,0,0 // movaps 0x338f(%ecx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -56593,7 +57628,7 @@ _sk_store_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4b77 <_sk_store_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4d5c <_sk_store_bgra_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56603,7 +57638,7 @@ _sk_store_bgra_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,89,50,0,0 // movaps 0x3259(%edi),%xmm4
+ .byte 15,40,167,36,51,0,0 // movaps 0x3324(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -56623,7 +57658,7 @@ _sk_store_bgra_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 4bf4 <_sk_store_bgra_sse2+0x8b>
+ .byte 117,24 // jne 4dd9 <_sk_store_bgra_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -56638,17 +57673,17 @@ _sk_store_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 4c18 <_sk_store_bgra_sse2+0xaf>
+ .byte 116,28 // je 4dfd <_sk_store_bgra_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4c11 <_sk_store_bgra_sse2+0xa8>
+ .byte 116,16 // je 4df6 <_sk_store_bgra_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 4be1 <_sk_store_bgra_sse2+0x78>
+ .byte 117,219 // jne 4dc6 <_sk_store_bgra_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 4be1 <_sk_store_bgra_sse2+0x78>
+ .byte 235,201 // jmp 4dc6 <_sk_store_bgra_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 4be1 <_sk_store_bgra_sse2+0x78>
+ .byte 235,194 // jmp 4dc6 <_sk_store_bgra_sse2+0x78>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -56660,7 +57695,7 @@ _sk_load_f16_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,92 // sub $0x5c,%esp
- .byte 232,0,0,0,0 // call 4c2d <_sk_load_f16_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4e12 <_sk_load_f16_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56672,7 +57707,7 @@ _sk_load_f16_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,160,1,0,0 // jne 4def <_sk_load_f16_sse2+0x1d0>
+ .byte 15,133,160,1,0,0 // jne 4fd4 <_sk_load_f16_sse2+0x1d0>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,216 // movapd %xmm0,%xmm3
@@ -56700,7 +57735,7 @@ _sk_load_f16_sse2:
.byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,154,179,49,0,0 // movdqa 0x31b3(%edx),%xmm3
+ .byte 102,15,111,154,126,50,0,0 // movdqa 0x327e(%edx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -56733,15 +57768,15 @@ _sk_load_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,154,195,49,0,0 // movdqa 0x31c3(%edx),%xmm3
+ .byte 102,15,111,154,142,50,0,0 // movdqa 0x328e(%edx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,154,211,49,0,0 // movdqa 0x31d3(%edx),%xmm3
+ .byte 102,15,111,154,158,50,0,0 // movdqa 0x329e(%edx),%xmm3
.byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,154,227,49,0,0 // movdqa 0x31e3(%edx),%xmm3
+ .byte 102,15,111,154,174,50,0,0 // movdqa 0x32ae(%edx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -56773,12 +57808,12 @@ _sk_load_f16_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,89,254,255,255 // je 4c5a <_sk_load_f16_sse2+0x3b>
+ .byte 15,132,89,254,255,255 // je 4e3f <_sk_load_f16_sse2+0x3b>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,74,254,255,255 // jb 4c5a <_sk_load_f16_sse2+0x3b>
+ .byte 15,130,74,254,255,255 // jb 4e3f <_sk_load_f16_sse2+0x3b>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,63,254,255,255 // jmp 4c5a <_sk_load_f16_sse2+0x3b>
+ .byte 233,63,254,255,255 // jmp 4e3f <_sk_load_f16_sse2+0x3b>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -56794,7 +57829,7 @@ _sk_load_f16_dst_sse2:
.byte 15,41,149,120,255,255,255 // movaps %xmm2,-0x88(%ebp)
.byte 102,15,127,77,136 // movdqa %xmm1,-0x78(%ebp)
.byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
- .byte 232,0,0,0,0 // call 4e43 <_sk_load_f16_dst_sse2+0x28>
+ .byte 232,0,0,0,0 // call 5028 <_sk_load_f16_dst_sse2+0x28>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56806,7 +57841,7 @@ _sk_load_f16_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,206,1,0,0 // jne 5033 <_sk_load_f16_dst_sse2+0x218>
+ .byte 15,133,206,1,0,0 // jne 5218 <_sk_load_f16_dst_sse2+0x218>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -56834,7 +57869,7 @@ _sk_load_f16_dst_sse2:
.byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
- .byte 102,15,111,154,221,47,0,0 // movdqa 0x2fdd(%edx),%xmm3
+ .byte 102,15,111,154,168,48,0,0 // movdqa 0x30a8(%edx),%xmm3
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 102,15,239,226 // pxor %xmm2,%xmm4
@@ -56842,13 +57877,13 @@ _sk_load_f16_dst_sse2:
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,15,111,146,253,47,0,0 // movdqa 0x2ffd(%edx),%xmm2
+ .byte 102,15,111,146,200,48,0,0 // movdqa 0x30c8(%edx),%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
.byte 102,15,239,226 // pxor %xmm2,%xmm4
- .byte 102,15,111,178,13,48,0,0 // movdqa 0x300d(%edx),%xmm6
+ .byte 102,15,111,178,216,48,0,0 // movdqa 0x30d8(%edx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,15,102,252 // pcmpgtd %xmm4,%xmm7
- .byte 102,15,111,146,237,47,0,0 // movdqa 0x2fed(%edx),%xmm2
+ .byte 102,15,111,146,184,48,0,0 // movdqa 0x30b8(%edx),%xmm2
.byte 102,15,127,85,184 // movdqa %xmm2,-0x48(%ebp)
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,223,249 // pandn %xmm1,%xmm7
@@ -56916,12 +57951,12 @@ _sk_load_f16_dst_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,43,254,255,255 // je 4e70 <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,132,43,254,255,255 // je 5055 <_sk_load_f16_dst_sse2+0x55>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,28,254,255,255 // jb 4e70 <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,130,28,254,255,255 // jb 5055 <_sk_load_f16_dst_sse2+0x55>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,17,254,255,255 // jmp 4e70 <_sk_load_f16_dst_sse2+0x55>
+ .byte 233,17,254,255,255 // jmp 5055 <_sk_load_f16_dst_sse2+0x55>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -56959,7 +57994,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,194 // movd %xmm0,%edx
.byte 102,15,110,68,209,4 // movd 0x4(%ecx,%edx,8),%xmm0
.byte 102,15,110,60,209 // movd (%ecx,%edx,8),%xmm7
- .byte 232,0,0,0,0 // call 50ed <_sk_gather_f16_sse2+0x8e>
+ .byte 232,0,0,0,0 // call 52d2 <_sk_gather_f16_sse2+0x8e>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,227 // punpckldq %xmm3,%xmm4
@@ -56992,7 +58027,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,69,248 // movd %xmm0,-0x8(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,153,115,45,0,0 // movdqa 0x2d73(%ecx),%xmm3
+ .byte 102,15,111,153,62,46,0,0 // movdqa 0x2e3e(%ecx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -57025,15 +58060,15 @@ _sk_gather_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,153,131,45,0,0 // movdqa 0x2d83(%ecx),%xmm3
+ .byte 102,15,111,153,78,46,0,0 // movdqa 0x2e4e(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,153,147,45,0,0 // movdqa 0x2d93(%ecx),%xmm3
+ .byte 102,15,111,153,94,46,0,0 // movdqa 0x2e5e(%ecx),%xmm3
.byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,153,163,45,0,0 // movdqa 0x2da3(%ecx),%xmm3
+ .byte 102,15,111,153,110,46,0,0 // movdqa 0x2e6e(%ecx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -57072,20 +58107,20 @@ _sk_store_f16_sse2:
.byte 131,236,80 // sub $0x50,%esp
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 52b0 <_sk_store_f16_sse2+0x15>
+ .byte 232,0,0,0,0 // call 5495 <_sk_store_f16_sse2+0x15>
.byte 88 // pop %eax
- .byte 102,15,111,176,240,43,0,0 // movdqa 0x2bf0(%eax),%xmm6
+ .byte 102,15,111,176,187,44,0,0 // movdqa 0x2cbb(%eax),%xmm6
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,219,214 // pand %xmm6,%xmm2
.byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp)
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,239,234 // pxor %xmm2,%xmm5
- .byte 102,15,111,160,0,44,0,0 // movdqa 0x2c00(%eax),%xmm4
+ .byte 102,15,111,160,203,44,0,0 // movdqa 0x2ccb(%eax),%xmm4
.byte 102,15,114,210,16 // psrld $0x10,%xmm2
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0
.byte 102,15,114,213,13 // psrld $0xd,%xmm5
- .byte 102,15,111,184,16,44,0,0 // movdqa 0x2c10(%eax),%xmm7
+ .byte 102,15,111,184,219,44,0,0 // movdqa 0x2cdb(%eax),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,127,125,232 // movdqa %xmm7,-0x18(%ebp)
.byte 102,15,254,213 // paddd %xmm5,%xmm2
@@ -57147,7 +58182,7 @@ _sk_store_f16_sse2:
.byte 3,55 // add (%edi),%esi
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,53 // jne 5422 <_sk_store_f16_sse2+0x187>
+ .byte 117,53 // jne 5607 <_sk_store_f16_sse2+0x187>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,98,197 // punpckldq %xmm5,%xmm0
.byte 243,15,127,4,214 // movdqu %xmm0,(%esi,%edx,8)
@@ -57170,13 +58205,13 @@ _sk_store_f16_sse2:
.byte 102,15,98,213 // punpckldq %xmm5,%xmm2
.byte 102,15,214,20,214 // movq %xmm2,(%esi,%edx,8)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,208 // je 5404 <_sk_store_f16_sse2+0x169>
+ .byte 116,208 // je 55e9 <_sk_store_f16_sse2+0x169>
.byte 102,15,23,84,214,8 // movhpd %xmm2,0x8(%esi,%edx,8)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,197 // jb 5404 <_sk_store_f16_sse2+0x169>
+ .byte 114,197 // jb 55e9 <_sk_store_f16_sse2+0x169>
.byte 102,15,106,205 // punpckhdq %xmm5,%xmm1
.byte 102,15,214,76,214,16 // movq %xmm1,0x10(%esi,%edx,8)
- .byte 235,185 // jmp 5404 <_sk_store_f16_sse2+0x169>
+ .byte 235,185 // jmp 55e9 <_sk_store_f16_sse2+0x169>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -57199,9 +58234,9 @@ _sk_load_u16_be_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 193,230,2 // shl $0x2,%esi
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 5476 <_sk_load_u16_be_sse2+0x2b>
+ .byte 232,0,0,0,0 // call 565b <_sk_load_u16_be_sse2+0x2b>
.byte 90 // pop %edx
- .byte 15,133,11,1,0,0 // jne 5588 <_sk_load_u16_be_sse2+0x13d>
+ .byte 15,133,11,1,0,0 // jne 576d <_sk_load_u16_be_sse2+0x13d>
.byte 102,15,16,4,119 // movupd (%edi,%esi,2),%xmm0
.byte 243,15,111,76,119,16 // movdqu 0x10(%edi,%esi,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -57222,7 +58257,7 @@ _sk_load_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,90,42,0,0 // movaps 0x2a5a(%edx),%xmm4
+ .byte 15,40,162,37,43,0,0 // movaps 0x2b25(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -57272,12 +58307,12 @@ _sk_load_u16_be_sse2:
.byte 242,15,16,4,119 // movsd (%edi,%esi,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,238,254,255,255 // je 5488 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,132,238,254,255,255 // je 566d <_sk_load_u16_be_sse2+0x3d>
.byte 102,15,22,68,119,8 // movhpd 0x8(%edi,%esi,2),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,223,254,255,255 // jb 5488 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,130,223,254,255,255 // jb 566d <_sk_load_u16_be_sse2+0x3d>
.byte 243,15,126,76,119,16 // movq 0x10(%edi,%esi,2),%xmm1
- .byte 233,212,254,255,255 // jmp 5488 <_sk_load_u16_be_sse2+0x3d>
+ .byte 233,212,254,255,255 // jmp 566d <_sk_load_u16_be_sse2+0x3d>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -57299,9 +58334,9 @@ _sk_load_rgb_u16_be_sse2:
.byte 3,50 // add (%edx),%esi
.byte 107,25,3 // imul $0x3,(%ecx),%ebx
.byte 133,255 // test %edi,%edi
- .byte 232,0,0,0,0 // call 55dd <_sk_load_rgb_u16_be_sse2+0x29>
+ .byte 232,0,0,0,0 // call 57c2 <_sk_load_rgb_u16_be_sse2+0x29>
.byte 90 // pop %edx
- .byte 15,133,240,0,0,0 // jne 56d4 <_sk_load_rgb_u16_be_sse2+0x120>
+ .byte 15,133,240,0,0,0 // jne 58b9 <_sk_load_rgb_u16_be_sse2+0x120>
.byte 243,15,111,20,94 // movdqu (%esi,%ebx,2),%xmm2
.byte 243,15,111,92,94,8 // movdqu 0x8(%esi,%ebx,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -57326,7 +58361,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,170,3,41,0,0 // movaps 0x2903(%edx),%xmm5
+ .byte 15,40,170,206,41,0,0 // movaps 0x29ce(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -57352,7 +58387,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,19,41,0,0 // movaps 0x2913(%edx),%xmm3
+ .byte 15,40,154,222,41,0,0 // movaps 0x29de(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -57366,20 +58401,20 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,196,84,94,4,2 // pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,13 // jne 56f6 <_sk_load_rgb_u16_be_sse2+0x142>
+ .byte 117,13 // jne 58db <_sk_load_rgb_u16_be_sse2+0x142>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,16,255,255,255 // jmp 5606 <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,16,255,255,255 // jmp 57eb <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,110,68,94,6 // movd 0x6(%esi,%ebx,2),%xmm0
.byte 102,15,196,68,94,10,2 // pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,18 // jb 571e <_sk_load_rgb_u16_be_sse2+0x16a>
+ .byte 114,18 // jb 5903 <_sk_load_rgb_u16_be_sse2+0x16a>
.byte 102,15,110,92,94,12 // movd 0xc(%esi,%ebx,2),%xmm3
.byte 102,15,196,92,94,16,2 // pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
- .byte 233,232,254,255,255 // jmp 5606 <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,232,254,255,255 // jmp 57eb <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,223,254,255,255 // jmp 5606 <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,223,254,255,255 // jmp 57eb <_sk_load_rgb_u16_be_sse2+0x52>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -57391,9 +58426,9 @@ _sk_store_u16_be_sse2:
.byte 86 // push %esi
.byte 131,236,16 // sub $0x10,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
- .byte 232,0,0,0,0 // call 5738 <_sk_store_u16_be_sse2+0x11>
+ .byte 232,0,0,0,0 // call 591d <_sk_store_u16_be_sse2+0x11>
.byte 88 // pop %eax
- .byte 15,40,176,200,39,0,0 // movaps 0x27c8(%eax),%xmm6
+ .byte 15,40,176,147,40,0,0 // movaps 0x2893(%eax),%xmm6
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,89,230 // mulps %xmm6,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
@@ -57446,7 +58481,7 @@ _sk_store_u16_be_sse2:
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 193,226,2 // shl $0x2,%edx
.byte 133,255 // test %edi,%edi
- .byte 117,45 // jne 583a <_sk_store_u16_be_sse2+0x113>
+ .byte 117,45 // jne 5a1f <_sk_store_u16_be_sse2+0x113>
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,98,221 // punpckldq %xmm5,%xmm3
.byte 243,15,127,28,86 // movdqu %xmm3,(%esi,%edx,2)
@@ -57467,13 +58502,13 @@ _sk_store_u16_be_sse2:
.byte 102,15,98,245 // punpckldq %xmm5,%xmm6
.byte 102,15,214,52,86 // movq %xmm6,(%esi,%edx,2)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,216 // je 5824 <_sk_store_u16_be_sse2+0xfd>
+ .byte 116,216 // je 5a09 <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,23,116,86,8 // movhpd %xmm6,0x8(%esi,%edx,2)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,205 // jb 5824 <_sk_store_u16_be_sse2+0xfd>
+ .byte 114,205 // jb 5a09 <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,106,229 // punpckhdq %xmm5,%xmm4
.byte 102,15,214,100,86,16 // movq %xmm4,0x10(%esi,%edx,2)
- .byte 235,193 // jmp 5824 <_sk_store_u16_be_sse2+0xfd>
+ .byte 235,193 // jmp 5a09 <_sk_store_u16_be_sse2+0xfd>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -57496,7 +58531,7 @@ _sk_load_f32_sse2:
.byte 15,16,36,23 // movups (%edi,%edx,1),%xmm4
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,71 // jne 58da <_sk_load_f32_sse2+0x77>
+ .byte 117,71 // jne 5abf <_sk_load_f32_sse2+0x77>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,68,178,48 // movups 0x30(%edx,%esi,4),%xmm0
@@ -57524,17 +58559,17 @@ _sk_load_f32_sse2:
.byte 195 // ret
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 58ea <_sk_load_f32_sse2+0x87>
+ .byte 117,8 // jne 5acf <_sk_load_f32_sse2+0x87>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 235,184 // jmp 58a2 <_sk_load_f32_sse2+0x3f>
+ .byte 235,184 // jmp 5a87 <_sk_load_f32_sse2+0x3f>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 58fb <_sk_load_f32_sse2+0x98>
+ .byte 114,7 // jb 5ae0 <_sk_load_f32_sse2+0x98>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,167 // jmp 58a2 <_sk_load_f32_sse2+0x3f>
+ .byte 235,167 // jmp 5a87 <_sk_load_f32_sse2+0x3f>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,162 // jmp 58a2 <_sk_load_f32_sse2+0x3f>
+ .byte 235,162 // jmp 5a87 <_sk_load_f32_sse2+0x3f>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -57560,7 +58595,7 @@ _sk_load_f32_dst_sse2:
.byte 15,16,52,23 // movups (%edi,%edx,1),%xmm6
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,97 // jne 599c <_sk_load_f32_dst_sse2+0x9c>
+ .byte 117,97 // jne 5b81 <_sk_load_f32_dst_sse2+0x9c>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,84,178,48 // movups 0x30(%edx,%esi,4),%xmm2
@@ -57594,17 +58629,17 @@ _sk_load_f32_dst_sse2:
.byte 195 // ret
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 59ac <_sk_load_f32_dst_sse2+0xac>
+ .byte 117,8 // jne 5b91 <_sk_load_f32_dst_sse2+0xac>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,158 // jmp 594a <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,158 // jmp 5b2f <_sk_load_f32_dst_sse2+0x4a>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 59bd <_sk_load_f32_dst_sse2+0xbd>
+ .byte 114,7 // jb 5ba2 <_sk_load_f32_dst_sse2+0xbd>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,141 // jmp 594a <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,141 // jmp 5b2f <_sk_load_f32_dst_sse2+0x4a>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,136 // jmp 594a <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,136 // jmp 5b2f <_sk_load_f32_dst_sse2+0x4a>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -57642,7 +58677,7 @@ _sk_store_f32_sse2:
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 102,15,20,239 // unpcklpd %xmm7,%xmm5
.byte 133,255 // test %edi,%edi
- .byte 117,40 // jne 5a48 <_sk_store_f32_sse2+0x86>
+ .byte 117,40 // jne 5c2d <_sk_store_f32_sse2+0x86>
.byte 102,15,21,247 // unpckhpd %xmm7,%xmm6
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
@@ -57659,12 +58694,12 @@ _sk_store_f32_sse2:
.byte 93 // pop %ebp
.byte 195 // ret
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,232 // je 5a35 <_sk_store_f32_sse2+0x73>
+ .byte 116,232 // je 5c1a <_sk_store_f32_sse2+0x73>
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,222 // jb 5a35 <_sk_store_f32_sse2+0x73>
+ .byte 114,222 // jb 5c1a <_sk_store_f32_sse2+0x73>
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
- .byte 235,214 // jmp 5a35 <_sk_store_f32_sse2+0x73>
+ .byte 235,214 // jmp 5c1a <_sk_store_f32_sse2+0x73>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -57725,7 +58760,7 @@ _sk_repeat_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5adc <_sk_repeat_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5cc1 <_sk_repeat_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -57736,7 +58771,7 @@ _sk_repeat_x_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,52,36,0,0 // andps 0x2434(%ecx),%xmm6
+ .byte 15,84,177,255,36,0,0 // andps 0x24ff(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -57763,7 +58798,7 @@ _sk_repeat_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5b42 <_sk_repeat_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5d27 <_sk_repeat_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -57774,7 +58809,7 @@ _sk_repeat_y_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,222,35,0,0 // andps 0x23de(%ecx),%xmm6
+ .byte 15,84,177,169,36,0,0 // andps 0x24a9(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -57801,7 +58836,7 @@ _sk_mirror_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5ba8 <_sk_mirror_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5d8d <_sk_mirror_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -57810,13 +58845,13 @@ _sk_mirror_x_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 243,15,89,177,120,40,0,0 // mulss 0x2878(%ecx),%xmm6
+ .byte 243,15,89,177,67,41,0,0 // mulss 0x2943(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,136,35,0,0 // andps 0x2388(%ecx),%xmm6
+ .byte 15,84,177,83,36,0,0 // andps 0x2453(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -57847,7 +58882,7 @@ _sk_mirror_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5c2d <_sk_mirror_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e12 <_sk_mirror_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -57856,13 +58891,13 @@ _sk_mirror_y_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 243,15,89,177,247,39,0,0 // mulss 0x27f7(%ecx),%xmm6
+ .byte 243,15,89,177,194,40,0,0 // mulss 0x28c2(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,19,35,0,0 // andps 0x2313(%ecx),%xmm6
+ .byte 15,84,177,222,35,0,0 // andps 0x23de(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -57893,12 +58928,12 @@ _sk_clamp_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5cb2 <_sk_clamp_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e97 <_sk_clamp_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,93,160,158,34,0,0 // minps 0x229e(%eax),%xmm4
+ .byte 15,93,160,105,35,0,0 // minps 0x2369(%eax),%xmm4
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -57916,14 +58951,14 @@ _sk_repeat_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5ce2 <_sk_repeat_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5ec7 <_sk_repeat_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 243,15,91,224 // cvttps2dq %xmm0,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,84,168,126,34,0,0 // andps 0x227e(%eax),%xmm5
+ .byte 15,84,168,73,35,0,0 // andps 0x2349(%eax),%xmm5
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -57942,17 +58977,17 @@ _sk_mirror_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5d1d <_sk_mirror_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5f02 <_sk_mirror_x_1_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 15,40,161,83,34,0,0 // movaps 0x2253(%ecx),%xmm4
+ .byte 15,40,161,30,35,0,0 // movaps 0x231e(%ecx),%xmm4
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,169,99,34,0,0 // movaps 0x2263(%ecx),%xmm5
+ .byte 15,40,169,46,35,0,0 // movaps 0x232e(%ecx),%xmm5
.byte 15,89,232 // mulps %xmm0,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,194,238,1 // cmpltps %xmm6,%xmm5
- .byte 15,84,169,115,34,0,0 // andps 0x2273(%ecx),%xmm5
+ .byte 15,84,169,62,35,0,0 // andps 0x233e(%ecx),%xmm5
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,88,246 // addps %xmm6,%xmm6
@@ -57977,13 +59012,13 @@ _sk_luminance_to_alpha_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 5d7b <_sk_luminance_to_alpha_sse2+0xe>
+ .byte 232,0,0,0,0 // call 5f60 <_sk_luminance_to_alpha_sse2+0xe>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,128,37,34,0,0 // mulps 0x2225(%eax),%xmm0
- .byte 15,89,136,53,34,0,0 // mulps 0x2235(%eax),%xmm1
+ .byte 15,89,128,240,34,0,0 // mulps 0x22f0(%eax),%xmm0
+ .byte 15,89,136,0,35,0,0 // mulps 0x2300(%eax),%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,152,69,34,0,0 // mulps 0x2245(%eax),%xmm3
+ .byte 15,89,152,16,35,0,0 // mulps 0x2310(%eax),%xmm3
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -58373,7 +59408,7 @@ _sk_evenly_spaced_gradient_sse2:
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 6218 <_sk_evenly_spaced_gradient_sse2+0x12>
+ .byte 232,0,0,0,0 // call 63fd <_sk_evenly_spaced_gradient_sse2+0x12>
.byte 90 // pop %edx
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -58384,12 +59419,12 @@ _sk_evenly_spaced_gradient_sse2:
.byte 78 // dec %esi
.byte 102,15,110,206 // movd %esi,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
- .byte 102,15,111,146,184,29,0,0 // movdqa 0x1db8(%edx),%xmm2
+ .byte 102,15,111,146,131,30,0,0 // movdqa 0x1e83(%edx),%xmm2
.byte 102,15,219,209 // pand %xmm1,%xmm2
- .byte 102,15,235,146,200,29,0,0 // por 0x1dc8(%edx),%xmm2
+ .byte 102,15,235,146,147,30,0,0 // por 0x1e93(%edx),%xmm2
.byte 102,15,114,209,16 // psrld $0x10,%xmm1
- .byte 102,15,235,138,216,29,0,0 // por 0x1dd8(%edx),%xmm1
- .byte 15,88,138,232,29,0,0 // addps 0x1de8(%edx),%xmm1
+ .byte 102,15,235,138,163,30,0,0 // por 0x1ea3(%edx),%xmm1
+ .byte 15,88,138,179,30,0,0 // addps 0x1eb3(%edx),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -58496,18 +59531,18 @@ _sk_gauss_a_to_rgba_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 63ce <_sk_gauss_a_to_rgba_sse2+0xb>
+ .byte 232,0,0,0,0 // call 65b3 <_sk_gauss_a_to_rgba_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,128,66,28,0,0 // movaps 0x1c42(%eax),%xmm0
+ .byte 15,40,128,13,29,0,0 // movaps 0x1d0d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,82,28,0,0 // addps 0x1c52(%eax),%xmm0
+ .byte 15,88,128,29,29,0,0 // addps 0x1d1d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,98,28,0,0 // addps 0x1c62(%eax),%xmm0
+ .byte 15,88,128,45,29,0,0 // addps 0x1d2d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,114,28,0,0 // addps 0x1c72(%eax),%xmm0
+ .byte 15,88,128,61,29,0,0 // addps 0x1d3d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,130,28,0,0 // addps 0x1c82(%eax),%xmm0
+ .byte 15,88,128,77,29,0,0 // addps 0x1d4d(%eax),%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,200 // movaps %xmm0,%xmm1
@@ -58530,7 +59565,7 @@ _sk_gradient_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 6429 <_sk_gradient_sse2+0xe>
+ .byte 232,0,0,0,0 // call 660e <_sk_gradient_sse2+0xe>
.byte 95 // pop %edi
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
@@ -58539,12 +59574,12 @@ _sk_gradient_sse2:
.byte 139,17 // mov (%ecx),%edx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,250,2 // cmp $0x2,%edx
- .byte 114,43 // jb 646b <_sk_gradient_sse2+0x50>
+ .byte 114,43 // jb 6650 <_sk_gradient_sse2+0x50>
.byte 139,113,36 // mov 0x24(%ecx),%esi
.byte 74 // dec %edx
.byte 131,198,4 // add $0x4,%esi
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,151,55,28,0,0 // movaps 0x1c37(%edi),%xmm2
+ .byte 15,40,151,2,29,0,0 // movaps 0x1d02(%edi),%xmm2
.byte 243,15,16,30 // movss (%esi),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -58552,7 +59587,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 131,198,4 // add $0x4,%esi
.byte 74 // dec %edx
- .byte 117,231 // jne 6452 <_sk_gradient_sse2+0x37>
+ .byte 117,231 // jne 6637 <_sk_gradient_sse2+0x37>
.byte 102,15,126,202 // movd %xmm1,%edx
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,15,126,214 // movd %xmm2,%esi
@@ -58704,7 +59739,7 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 6665 <_sk_xy_to_unit_angle_sse2+0x18>
+ .byte 232,0,0,0,0 // call 684a <_sk_xy_to_unit_angle_sse2+0x18>
.byte 88 // pop %eax
.byte 15,87,237 // xorps %xmm5,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
@@ -58719,30 +59754,30 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,94,247 // divps %xmm7,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,40,128,11,26,0,0 // movaps 0x1a0b(%eax),%xmm0
+ .byte 15,40,128,214,26,0,0 // movaps 0x1ad6(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,27,26,0,0 // addps 0x1a1b(%eax),%xmm0
+ .byte 15,88,128,230,26,0,0 // addps 0x1ae6(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,43,26,0,0 // addps 0x1a2b(%eax),%xmm0
+ .byte 15,88,128,246,26,0,0 // addps 0x1af6(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,59,26,0,0 // addps 0x1a3b(%eax),%xmm0
+ .byte 15,88,128,6,27,0,0 // addps 0x1b06(%eax),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,40,176,75,26,0,0 // movaps 0x1a4b(%eax),%xmm6
+ .byte 15,40,176,22,27,0,0 // movaps 0x1b16(%eax),%xmm6
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,84,245 // andps %xmm5,%xmm6
.byte 15,85,232 // andnps %xmm0,%xmm5
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,86,238 // orps %xmm6,%xmm5
.byte 15,194,204,1 // cmpltps %xmm4,%xmm1
- .byte 15,40,128,91,26,0,0 // movaps 0x1a5b(%eax),%xmm0
+ .byte 15,40,128,38,27,0,0 // movaps 0x1b26(%eax),%xmm0
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,84,193 // andps %xmm1,%xmm0
.byte 15,85,205 // andnps %xmm5,%xmm1
.byte 15,86,200 // orps %xmm0,%xmm1
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,194,196,1 // cmpltps %xmm4,%xmm0
- .byte 15,40,168,107,26,0,0 // movaps 0x1a6b(%eax),%xmm5
+ .byte 15,40,168,54,27,0,0 // movaps 0x1b36(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,193 // andnps %xmm1,%xmm0
@@ -58803,15 +59838,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 6782 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6967 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,94,25,0,0 // mulps 0x195e(%edx),%xmm4
- .byte 15,89,130,110,25,0,0 // mulps 0x196e(%edx),%xmm0
+ .byte 15,89,162,41,26,0,0 // mulps 0x1a29(%edx),%xmm4
+ .byte 15,89,130,57,26,0,0 // mulps 0x1a39(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -58819,11 +59854,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,126,25,0,0 // xorps 0x197e(%edx),%xmm4
+ .byte 15,87,162,73,26,0,0 // xorps 0x1a49(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,142,25,0,0 // mulps 0x198e(%edx),%xmm5
+ .byte 15,89,170,89,26,0,0 // mulps 0x1a59(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,95,196 // maxps %xmm4,%xmm0
@@ -58854,15 +59889,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 6820 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6a05 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,0,25,0,0 // mulps 0x1900(%edx),%xmm4
- .byte 15,89,130,16,25,0,0 // mulps 0x1910(%edx),%xmm0
+ .byte 15,89,162,203,25,0,0 // mulps 0x19cb(%edx),%xmm4
+ .byte 15,89,130,219,25,0,0 // mulps 0x19db(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -58870,11 +59905,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,32,25,0,0 // xorps 0x1920(%edx),%xmm4
+ .byte 15,87,162,235,25,0,0 // xorps 0x19eb(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,48,25,0,0 // mulps 0x1930(%edx),%xmm5
+ .byte 15,89,170,251,25,0,0 // mulps 0x19fb(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
@@ -58894,7 +59929,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 6898 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6a7d <_sk_xy_to_2pt_conical_linear_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -58903,7 +59938,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,169,200,24,0,0 // mulps 0x18c8(%ecx),%xmm5
+ .byte 15,89,169,147,25,0,0 // mulps 0x1993(%ecx),%xmm5
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
@@ -58911,7 +59946,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,228 // mulss %xmm4,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,129,216,24,0,0 // xorps 0x18d8(%ecx),%xmm0
+ .byte 15,87,129,163,25,0,0 // xorps 0x19a3(%ecx),%xmm0
.byte 15,94,197 // divps %xmm5,%xmm0
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
@@ -58985,16 +60020,16 @@ _sk_save_xy_sse2:
.byte 131,236,24 // sub $0x18,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 6975 <_sk_save_xy_sse2+0x12>
+ .byte 232,0,0,0,0 // call 6b5a <_sk_save_xy_sse2+0x12>
.byte 88 // pop %eax
- .byte 15,40,160,11,24,0,0 // movaps 0x180b(%eax),%xmm4
+ .byte 15,40,160,214,24,0,0 // movaps 0x18d6(%eax),%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,88,236 // addps %xmm4,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,144,27,24,0,0 // movaps 0x181b(%eax),%xmm2
+ .byte 15,40,144,230,24,0,0 // movaps 0x18e6(%eax),%xmm2
.byte 15,84,250 // andps %xmm2,%xmm7
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,238 // subps %xmm6,%xmm5
@@ -59069,15 +60104,15 @@ _sk_bilinear_nx_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6a57 <_sk_bilinear_nx_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6c3c <_sk_bilinear_nx_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,73,23,0,0 // addps 0x1749(%eax),%xmm0
- .byte 15,40,168,89,23,0,0 // movaps 0x1759(%eax),%xmm5
+ .byte 15,88,128,20,24,0,0 // addps 0x1814(%eax),%xmm0
+ .byte 15,40,168,36,24,0,0 // movaps 0x1824(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59098,14 +60133,14 @@ _sk_bilinear_px_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6a9a <_sk_bilinear_px_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6c7f <_sk_bilinear_px_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,38,23,0,0 // addps 0x1726(%eax),%xmm0
+ .byte 15,88,128,241,23,0,0 // addps 0x17f1(%eax),%xmm0
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59125,15 +60160,15 @@ _sk_bilinear_ny_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ad3 <_sk_bilinear_ny_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6cb8 <_sk_bilinear_ny_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,253,22,0,0 // addps 0x16fd(%eax),%xmm1
- .byte 15,40,168,13,23,0,0 // movaps 0x170d(%eax),%xmm5
+ .byte 15,88,136,200,23,0,0 // addps 0x17c8(%eax),%xmm1
+ .byte 15,40,168,216,23,0,0 // movaps 0x17d8(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59154,14 +60189,14 @@ _sk_bilinear_py_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6b17 <_sk_bilinear_py_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6cfc <_sk_bilinear_py_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,217,22,0,0 // addps 0x16d9(%eax),%xmm1
+ .byte 15,88,136,164,23,0,0 // addps 0x17a4(%eax),%xmm1
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59181,20 +60216,20 @@ _sk_bicubic_n3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6b51 <_sk_bicubic_n3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6d36 <_sk_bicubic_n3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,175,22,0,0 // addps 0x16af(%eax),%xmm0
- .byte 15,40,168,191,22,0,0 // movaps 0x16bf(%eax),%xmm5
+ .byte 15,88,128,122,23,0,0 // addps 0x177a(%eax),%xmm0
+ .byte 15,40,168,138,23,0,0 // movaps 0x178a(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,207,22,0,0 // mulps 0x16cf(%eax),%xmm5
- .byte 15,88,168,223,22,0,0 // addps 0x16df(%eax),%xmm5
+ .byte 15,89,168,154,23,0,0 // mulps 0x179a(%eax),%xmm5
+ .byte 15,88,168,170,23,0,0 // addps 0x17aa(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59215,23 +60250,23 @@ _sk_bicubic_n1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6bab <_sk_bicubic_n1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6d90 <_sk_bicubic_n1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,149,22,0,0 // addps 0x1695(%eax),%xmm0
- .byte 15,40,168,165,22,0,0 // movaps 0x16a5(%eax),%xmm5
+ .byte 15,88,128,96,23,0,0 // addps 0x1760(%eax),%xmm0
+ .byte 15,40,168,112,23,0,0 // movaps 0x1770(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,181,22,0,0 // movaps 0x16b5(%eax),%xmm4
+ .byte 15,40,160,128,23,0,0 // movaps 0x1780(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,197,22,0,0 // addps 0x16c5(%eax),%xmm4
+ .byte 15,88,160,144,23,0,0 // addps 0x1790(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,213,22,0,0 // addps 0x16d5(%eax),%xmm4
+ .byte 15,88,160,160,23,0,0 // addps 0x17a0(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,229,22,0,0 // addps 0x16e5(%eax),%xmm4
+ .byte 15,88,160,176,23,0,0 // addps 0x17b0(%eax),%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59251,22 +60286,22 @@ _sk_bicubic_p1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c13 <_sk_bicubic_p1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6df8 <_sk_bicubic_p1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,141,22,0,0 // movaps 0x168d(%eax),%xmm4
+ .byte 15,40,160,88,23,0,0 // movaps 0x1758(%eax),%xmm4
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,110,64 // movups 0x40(%esi),%xmm5
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,176,157,22,0,0 // movaps 0x169d(%eax),%xmm6
+ .byte 15,40,176,104,23,0,0 // movaps 0x1768(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,173,22,0,0 // addps 0x16ad(%eax),%xmm6
+ .byte 15,88,176,120,23,0,0 // addps 0x1778(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,189,22,0,0 // addps 0x16bd(%eax),%xmm6
+ .byte 15,88,176,136,23,0,0 // addps 0x1788(%eax),%xmm6
.byte 15,17,182,128,0,0,0 // movups %xmm6,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59286,18 +60321,18 @@ _sk_bicubic_p3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c70 <_sk_bicubic_p3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e55 <_sk_bicubic_p3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,112,22,0,0 // addps 0x1670(%eax),%xmm0
+ .byte 15,88,128,59,23,0,0 // addps 0x173b(%eax),%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,128,22,0,0 // mulps 0x1680(%eax),%xmm4
- .byte 15,88,160,144,22,0,0 // addps 0x1690(%eax),%xmm4
+ .byte 15,89,160,75,23,0,0 // mulps 0x174b(%eax),%xmm4
+ .byte 15,88,160,91,23,0,0 // addps 0x175b(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59318,20 +60353,20 @@ _sk_bicubic_n3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6cc0 <_sk_bicubic_n3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6ea5 <_sk_bicubic_n3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,80,22,0,0 // addps 0x1650(%eax),%xmm1
- .byte 15,40,168,96,22,0,0 // movaps 0x1660(%eax),%xmm5
+ .byte 15,88,136,27,23,0,0 // addps 0x171b(%eax),%xmm1
+ .byte 15,40,168,43,23,0,0 // movaps 0x172b(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,112,22,0,0 // mulps 0x1670(%eax),%xmm5
- .byte 15,88,168,128,22,0,0 // addps 0x1680(%eax),%xmm5
+ .byte 15,89,168,59,23,0,0 // mulps 0x173b(%eax),%xmm5
+ .byte 15,88,168,75,23,0,0 // addps 0x174b(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59352,23 +60387,23 @@ _sk_bicubic_n1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6d1b <_sk_bicubic_n1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6f00 <_sk_bicubic_n1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,53,22,0,0 // addps 0x1635(%eax),%xmm1
- .byte 15,40,168,69,22,0,0 // movaps 0x1645(%eax),%xmm5
+ .byte 15,88,136,0,23,0,0 // addps 0x1700(%eax),%xmm1
+ .byte 15,40,168,16,23,0,0 // movaps 0x1710(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,85,22,0,0 // movaps 0x1655(%eax),%xmm4
+ .byte 15,40,160,32,23,0,0 // movaps 0x1720(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,101,22,0,0 // addps 0x1665(%eax),%xmm4
+ .byte 15,88,160,48,23,0,0 // addps 0x1730(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,117,22,0,0 // addps 0x1675(%eax),%xmm4
+ .byte 15,88,160,64,23,0,0 // addps 0x1740(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,133,22,0,0 // addps 0x1685(%eax),%xmm4
+ .byte 15,88,160,80,23,0,0 // addps 0x1750(%eax),%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59388,22 +60423,22 @@ _sk_bicubic_p1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6d84 <_sk_bicubic_p1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6f69 <_sk_bicubic_p1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,44,22,0,0 // movaps 0x162c(%eax),%xmm4
+ .byte 15,40,160,247,22,0,0 // movaps 0x16f7(%eax),%xmm4
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,110,96 // movups 0x60(%esi),%xmm5
.byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,176,60,22,0,0 // movaps 0x163c(%eax),%xmm6
+ .byte 15,40,176,7,23,0,0 // movaps 0x1707(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,76,22,0,0 // addps 0x164c(%eax),%xmm6
+ .byte 15,88,176,23,23,0,0 // addps 0x1717(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,92,22,0,0 // addps 0x165c(%eax),%xmm6
+ .byte 15,88,176,39,23,0,0 // addps 0x1727(%eax),%xmm6
.byte 15,17,182,160,0,0,0 // movups %xmm6,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59423,18 +60458,18 @@ _sk_bicubic_p3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6de2 <_sk_bicubic_p3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6fc7 <_sk_bicubic_p3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,14,22,0,0 // addps 0x160e(%eax),%xmm1
+ .byte 15,88,136,217,22,0,0 // addps 0x16d9(%eax),%xmm1
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,30,22,0,0 // mulps 0x161e(%eax),%xmm4
- .byte 15,88,160,46,22,0,0 // addps 0x162e(%eax),%xmm4
+ .byte 15,89,160,233,22,0,0 // mulps 0x16e9(%eax),%xmm4
+ .byte 15,88,160,249,22,0,0 // addps 0x16f9(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59671,9 +60706,9 @@ BALIGN16
.byte 0,224 // add %ah,%al
.byte 64 // inc %eax
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 70dc <.literal16+0x1fc>
+ .byte 224,64 // loopne 72bc <.literal16+0x1fc>
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 70e0 <.literal16+0x200>
+ .byte 224,64 // loopne 72c0 <.literal16+0x200>
.byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999
.byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999
.byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax
@@ -59684,16 +60719,16 @@ BALIGN16
.byte 63 // aas
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7101 <.literal16+0x221>
+ .byte 225,61 // loope 72e1 <.literal16+0x221>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7105 <.literal16+0x225>
+ .byte 225,61 // loope 72e5 <.literal16+0x225>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7109 <.literal16+0x229>
+ .byte 225,61 // loope 72e9 <.literal16+0x229>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 710d <.literal16+0x22d>
+ .byte 225,61 // loope 72ed <.literal16+0x22d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -59710,16 +60745,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 7141 <.literal16+0x261>
+ .byte 225,61 // loope 7321 <.literal16+0x261>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7145 <.literal16+0x265>
+ .byte 225,61 // loope 7325 <.literal16+0x265>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7149 <.literal16+0x269>
+ .byte 225,61 // loope 7329 <.literal16+0x269>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 714d <.literal16+0x26d>
+ .byte 225,61 // loope 732d <.literal16+0x26d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -59736,16 +60771,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 7181 <.literal16+0x2a1>
+ .byte 225,61 // loope 7361 <.literal16+0x2a1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7185 <.literal16+0x2a5>
+ .byte 225,61 // loope 7365 <.literal16+0x2a5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7189 <.literal16+0x2a9>
+ .byte 225,61 // loope 7369 <.literal16+0x2a9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 718d <.literal16+0x2ad>
+ .byte 225,61 // loope 736d <.literal16+0x2ad>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -59762,16 +60797,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 71c1 <.literal16+0x2e1>
+ .byte 225,61 // loope 73a1 <.literal16+0x2e1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 71c5 <.literal16+0x2e5>
+ .byte 225,61 // loope 73a5 <.literal16+0x2e5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 71c9 <.literal16+0x2e9>
+ .byte 225,61 // loope 73a9 <.literal16+0x2e9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 71cd <.literal16+0x2ed>
+ .byte 225,61 // loope 73ad <.literal16+0x2ed>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -59793,11 +60828,11 @@ BALIGN16
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%eax)
.byte 67 // inc %ebx
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 720b <.literal16+0x32b>
+ .byte 127,67 // jg 73eb <.literal16+0x32b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 720f <.literal16+0x32f>
+ .byte 127,67 // jg 73ef <.literal16+0x32f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7213 <.literal16+0x333>
+ .byte 127,67 // jg 73f3 <.literal16+0x333>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60071,13 +61106,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7469 <.literal16+0x589>
+ .byte 224,7 // loopne 7649 <.literal16+0x589>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 746d <.literal16+0x58d>
+ .byte 224,7 // loopne 764d <.literal16+0x58d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7471 <.literal16+0x591>
+ .byte 224,7 // loopne 7651 <.literal16+0x591>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7475 <.literal16+0x595>
+ .byte 224,7 // loopne 7655 <.literal16+0x595>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -60126,11 +61161,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 752b <.literal16+0x64b>
+ .byte 127,67 // jg 770b <.literal16+0x64b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 752f <.literal16+0x64f>
+ .byte 127,67 // jg 770f <.literal16+0x64f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7533 <.literal16+0x653>
+ .byte 127,67 // jg 7713 <.literal16+0x653>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax)
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%eax)
@@ -60145,16 +61180,116 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7524 <.literal16+0x644>
+ .byte 127,0 // jg 7704 <.literal16+0x644>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 7708 <.literal16+0x648>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 770c <.literal16+0x64c>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 7710 <.literal16+0x650>
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
+ .byte 119,115 // ja 7795 <.literal16+0x6d5>
+ .byte 248 // clc
+ .byte 194,119,115 // ret $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // ret $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // ret $0x7377
+ .byte 248 // clc
+ .byte 194,117,191 // ret $0xbf75
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // aas
+ .byte 117,191 // jne 76f9 <.literal16+0x639>
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // aas
+ .byte 249 // stc
+ .byte 68 // inc %esp
+ .byte 180,62 // mov $0x3e,%ah
+ .byte 249 // stc
+ .byte 68 // inc %esp
+ .byte 180,62 // mov $0x3e,%ah
+ .byte 249 // stc
+ .byte 68 // inc %esp
+ .byte 180,62 // mov $0x3e,%ah
+ .byte 249 // stc
+ .byte 68 // inc %esp
+ .byte 180,62 // mov $0x3e,%ah
+ .byte 163,233,220,63,163 // mov %eax,0xa33fdce9
+ .byte 233,220,63,163,233 // jmp e9a3b736 <_sk_callback_sse2+0xe9a34728>
+ .byte 220,63 // fdivrl (%edi)
+ .byte 163,233,220,63,0 // mov %eax,0x3fdce9
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
+ .byte 63 // aas
+ .byte 0,0 // add %al,(%eax)
+ .byte 128,63,0 // cmpb $0x0,(%edi)
+ .byte 0,128,63,81,140,242 // add %al,-0xd73aec1(%eax)
+ .byte 66 // inc %edx
+ .byte 81 // push %ecx
+ .byte 140,242 // mov %?,%edx
+ .byte 66 // inc %edx
+ .byte 81 // push %ecx
+ .byte 140,242 // mov %?,%edx
+ .byte 66 // inc %edx
+ .byte 81 // push %ecx
+ .byte 140,242 // mov %?,%edx
+ .byte 66 // inc %edx
+ .byte 141,188,190,63,141,188,190 // lea -0x414372c1(%esi,%edi,4),%edi
+ .byte 63 // aas
+ .byte 141,188,190,63,141,188,190 // lea -0x414372c1(%esi,%edi,4),%edi
+ .byte 63 // aas
+ .byte 248 // clc
+ .byte 245 // cmc
+ .byte 154,64,248,245,154,64,248 // lcall $0xf840,$0x9af5f840
+ .byte 245 // cmc
+ .byte 154,64,248,245,154,64,254 // lcall $0xfe40,$0x9af5f840
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65 // inc %ecx
+ .byte 254 // (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65 // inc %ecx
+ .byte 254 // (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65 // inc %ecx
+ .byte 254 // (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65 // inc %ecx
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,75,0 // add %cl,0x0(%ebx)
+ .byte 0,0 // add %al,(%eax)
+ .byte 75 // dec %ebx
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,75,0 // add %cl,0x0(%ebx)
+ .byte 0,0 // add %al,(%eax)
+ .byte 75 // dec %ebx
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,52,0 // add %dh,(%eax,%eax,1)
+ .byte 0,0 // add %al,(%eax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 77d4 <.literal16+0x714>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7528 <.literal16+0x648>
+ .byte 127,0 // jg 77d8 <.literal16+0x718>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 752c <.literal16+0x64c>
+ .byte 127,0 // jg 77dc <.literal16+0x71c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7530 <.literal16+0x650>
+ .byte 127,0 // jg 77e0 <.literal16+0x720>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60163,7 +61298,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 75b5 <.literal16+0x6d5>
+ .byte 119,115 // ja 7865 <.literal16+0x7a5>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -60174,7 +61309,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 7519 <.literal16+0x639>
+ .byte 117,191 // jne 77c9 <.literal16+0x709>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -60190,7 +61325,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b556 <_sk_callback_sse2+0xe9a3472d>
+ .byte 233,220,63,163,233 // jmp e9a3b806 <_sk_callback_sse2+0xe9a347f8>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60245,16 +61380,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 75f4 <.literal16+0x714>
+ .byte 127,0 // jg 78a4 <.literal16+0x7e4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 75f8 <.literal16+0x718>
+ .byte 127,0 // jg 78a8 <.literal16+0x7e8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 75fc <.literal16+0x71c>
+ .byte 127,0 // jg 78ac <.literal16+0x7ec>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7600 <.literal16+0x720>
+ .byte 127,0 // jg 78b0 <.literal16+0x7f0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60263,7 +61398,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7685 <.literal16+0x7a5>
+ .byte 119,115 // ja 7935 <.literal16+0x875>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -60274,7 +61409,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 75e9 <.literal16+0x709>
+ .byte 117,191 // jne 7899 <.literal16+0x7d9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -60290,7 +61425,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b626 <_sk_callback_sse2+0xe9a347fd>
+ .byte 233,220,63,163,233 // jmp e9a3b8d6 <_sk_callback_sse2+0xe9a348c8>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60345,16 +61480,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 76c4 <.literal16+0x7e4>
+ .byte 127,0 // jg 7974 <.literal16+0x8b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 76c8 <.literal16+0x7e8>
+ .byte 127,0 // jg 7978 <.literal16+0x8b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 76cc <.literal16+0x7ec>
+ .byte 127,0 // jg 797c <.literal16+0x8bc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 76d0 <.literal16+0x7f0>
+ .byte 127,0 // jg 7980 <.literal16+0x8c0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60363,7 +61498,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7755 <.literal16+0x875>
+ .byte 119,115 // ja 7a05 <.literal16+0x945>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -60374,7 +61509,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 76b9 <.literal16+0x7d9>
+ .byte 117,191 // jne 7969 <.literal16+0x8a9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -60390,7 +61525,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b6f6 <_sk_callback_sse2+0xe9a348cd>
+ .byte 233,220,63,163,233 // jmp e9a3b9a6 <_sk_callback_sse2+0xe9a34998>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60445,16 +61580,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7794 <.literal16+0x8b4>
+ .byte 127,0 // jg 7a44 <.literal16+0x984>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7798 <.literal16+0x8b8>
+ .byte 127,0 // jg 7a48 <.literal16+0x988>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 779c <.literal16+0x8bc>
+ .byte 127,0 // jg 7a4c <.literal16+0x98c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 77a0 <.literal16+0x8c0>
+ .byte 127,0 // jg 7a50 <.literal16+0x990>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60463,7 +61598,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7825 <.literal16+0x945>
+ .byte 119,115 // ja 7ad5 <.literal16+0xa15>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -60474,7 +61609,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 7789 <.literal16+0x8a9>
+ .byte 117,191 // jne 7a39 <.literal16+0x979>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -60490,7 +61625,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b7c6 <_sk_callback_sse2+0xe9a3499d>
+ .byte 233,220,63,163,233 // jmp e9a3ba76 <_sk_callback_sse2+0xe9a34a68>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60541,13 +61676,13 @@ BALIGN16
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
- .byte 127,67 // jg 78a7 <.literal16+0x9c7>
+ .byte 127,67 // jg 7b57 <.literal16+0xa97>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 78ab <.literal16+0x9cb>
+ .byte 127,67 // jg 7b5b <.literal16+0xa9b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 78af <.literal16+0x9cf>
+ .byte 127,67 // jg 7b5f <.literal16+0xa9f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 78b3 <.literal16+0x9d3>
+ .byte 127,67 // jg 7b63 <.literal16+0xaa3>
.byte 0,0 // add %al,(%eax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%eax)
@@ -60598,16 +61733,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%ebx)
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 7933 <.literal16+0xa53>
+ .byte 118,63 // jbe 7be3 <.literal16+0xb23>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 7937 <.literal16+0xa57>
+ .byte 118,63 // jbe 7be7 <.literal16+0xb27>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 793b <.literal16+0xa5b>
+ .byte 118,63 // jbe 7beb <.literal16+0xb2b>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 793f <.literal16+0xa5f>
+ .byte 118,63 // jbe 7bef <.literal16+0xb2f>
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
@@ -60636,11 +61771,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%ebx)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 79ab <.literal16+0xacb>
+ .byte 127,67 // jg 7c5b <.literal16+0xb9b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 79af <.literal16+0xacf>
+ .byte 127,67 // jg 7c5f <.literal16+0xb9f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 79b3 <.literal16+0xad3>
+ .byte 127,67 // jg 7c63 <.literal16+0xba3>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,0 // add %al,(%eax)
@@ -60702,13 +61837,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7a29 <.literal16+0xb49>
+ .byte 224,7 // loopne 7cd9 <.literal16+0xc19>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7a2d <.literal16+0xb4d>
+ .byte 224,7 // loopne 7cdd <.literal16+0xc1d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7a31 <.literal16+0xb51>
+ .byte 224,7 // loopne 7ce1 <.literal16+0xc21>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7a35 <.literal16+0xb55>
+ .byte 224,7 // loopne 7ce5 <.literal16+0xc25>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -60754,13 +61889,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7a99 <.literal16+0xbb9>
+ .byte 224,7 // loopne 7d49 <.literal16+0xc89>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7a9d <.literal16+0xbbd>
+ .byte 224,7 // loopne 7d4d <.literal16+0xc8d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7aa1 <.literal16+0xbc1>
+ .byte 224,7 // loopne 7d51 <.literal16+0xc91>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7aa5 <.literal16+0xbc5>
+ .byte 224,7 // loopne 7d55 <.literal16+0xc95>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -60806,13 +61941,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7b09 <.literal16+0xc29>
+ .byte 224,7 // loopne 7db9 <.literal16+0xcf9>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7b0d <.literal16+0xc2d>
+ .byte 224,7 // loopne 7dbd <.literal16+0xcfd>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7b11 <.literal16+0xc31>
+ .byte 224,7 // loopne 7dc1 <.literal16+0xd01>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7b15 <.literal16+0xc35>
+ .byte 224,7 // loopne 7dc5 <.literal16+0xd05>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -60854,13 +61989,13 @@ BALIGN16
.byte 248 // clc
.byte 65 // inc %ecx
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7ba6 <.literal16+0xcc6>
+ .byte 124,66 // jl 7e56 <.literal16+0xd96>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7baa <.literal16+0xcca>
+ .byte 124,66 // jl 7e5a <.literal16+0xd9a>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7bae <.literal16+0xcce>
+ .byte 124,66 // jl 7e5e <.literal16+0xd9e>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7bb2 <.literal16+0xcd2>
+ .byte 124,66 // jl 7e62 <.literal16+0xda2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%eax)
.byte 0,240 // add %dh,%al
@@ -60994,13 +62129,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7d35 <.literal16+0xe55>
+ .byte 112,65 // jo 7fe5 <.literal16+0xf25>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7d39 <.literal16+0xe59>
+ .byte 112,65 // jo 7fe9 <.literal16+0xf29>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7d3d <.literal16+0xe5d>
+ .byte 112,65 // jo 7fed <.literal16+0xf2d>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7d41 <.literal16+0xe61>
+ .byte 112,65 // jo 7ff1 <.literal16+0xf31>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -61031,11 +62166,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7dab <.literal16+0xecb>
+ .byte 127,67 // jg 805b <.literal16+0xf9b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7daf <.literal16+0xecf>
+ .byte 127,67 // jg 805f <.literal16+0xf9f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7db3 <.literal16+0xed3>
+ .byte 127,67 // jg 8063 <.literal16+0xfa3>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -61066,11 +62201,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7e1b <.literal16+0xf3b>
+ .byte 127,67 // jg 80cb <.literal16+0x100b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7e1f <.literal16+0xf3f>
+ .byte 127,67 // jg 80cf <.literal16+0x100f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7e23 <.literal16+0xf43>
+ .byte 127,67 // jg 80d3 <.literal16+0x1013>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
@@ -61169,13 +62304,13 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 255 // (bad)
- .byte 127,71 // jg 7f4b <.literal16+0x106b>
+ .byte 127,71 // jg 81fb <.literal16+0x113b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7f4f <.literal16+0x106f>
+ .byte 127,71 // jg 81ff <.literal16+0x113f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7f53 <.literal16+0x1073>
+ .byte 127,71 // jg 8203 <.literal16+0x1143>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7f57 <.literal16+0x1077>
+ .byte 127,71 // jg 8207 <.literal16+0x1147>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61283,7 +62418,7 @@ BALIGN16
.byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 805c <.literal16+0x117c>
+ .byte 120,57 // js 830c <.literal16+0x124c>
.byte 64 // inc %eax
.byte 18,120,57 // adc 0x39(%eax),%bh
.byte 64 // inc %eax
@@ -61476,11 +62611,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 8242 <.literal16+0x1362>
+ .byte 62,114,28 // jb,pt 84f2 <.literal16+0x1432>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8246 <.literal16+0x1366>
+ .byte 62,114,28 // jb,pt 84f6 <.literal16+0x1436>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 824a <.literal16+0x136a>
+ .byte 62,114,28 // jb,pt 84fa <.literal16+0x143a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -61559,13 +62694,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb 830e <.literal16+0x142e>
+ .byte 114,28 // jb 85be <.literal16+0x14fe>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8312 <.literal16+0x1432>
+ .byte 62,114,28 // jb,pt 85c2 <.literal16+0x1502>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8316 <.literal16+0x1436>
+ .byte 62,114,28 // jb,pt 85c6 <.literal16+0x1506>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 831a <.literal16+0x143a>
+ .byte 62,114,28 // jb,pt 85ca <.literal16+0x150a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -61586,11 +62721,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 8352 <.literal16+0x1472>
+ .byte 62,114,28 // jb,pt 8602 <.literal16+0x1542>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8356 <.literal16+0x1476>
+ .byte 62,114,28 // jb,pt 8606 <.literal16+0x1546>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 835a <.literal16+0x147a>
+ .byte 62,114,28 // jb,pt 860a <.literal16+0x154a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -61669,13 +62804,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb 841e <.literal16+0x153e>
+ .byte 114,28 // jb 86ce <.literal16+0x160e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8422 <_sk_callback_sse2+0x15f9>
+ .byte 62,114,28 // jb,pt 86d2 <_sk_callback_sse2+0x16c4>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8426 <_sk_callback_sse2+0x15fd>
+ .byte 62,114,28 // jb,pt 86d6 <_sk_callback_sse2+0x16c8>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 842a <_sk_callback_sse2+0x1601>
+ .byte 62,114,28 // jb,pt 86da <_sk_callback_sse2+0x16cc>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index 26be202fe5..9e7e80709d 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -101,7 +101,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,249,110,194 ; vmovd %edx,%xmm0
DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,173,88,0,0 ; vbroadcastss 0x58ad(%rip),%ymm1 # 5a0c <_sk_callback_hsw+0x12a>
+ DB 196,226,125,24,13,113,90,0,0 ; vbroadcastss 0x5a71(%rip),%ymm1 # 5bd0 <_sk_callback_hsw+0x12a>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -109,7 +109,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,141,88,0,0 ; vbroadcastss 0x588d(%rip),%ymm2 # 5a10 <_sk_callback_hsw+0x12e>
+ DB 196,226,125,24,21,81,90,0,0 ; vbroadcastss 0x5a51(%rip),%ymm2 # 5bd4 <_sk_callback_hsw+0x12e>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -126,13 +126,13 @@ _sk_dither_hsw LABEL PROC
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9
DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9
- DB 196,98,125,88,21,84,88,0,0 ; vpbroadcastd 0x5854(%rip),%ymm10 # 5a14 <_sk_callback_hsw+0x132>
+ DB 196,98,125,88,21,24,90,0,0 ; vpbroadcastd 0x5a18(%rip),%ymm10 # 5bd8 <_sk_callback_hsw+0x132>
DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11
DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10
- DB 196,98,125,88,37,57,88,0,0 ; vpbroadcastd 0x5839(%rip),%ymm12 # 5a18 <_sk_callback_hsw+0x136>
- DB 196,98,125,88,45,52,88,0,0 ; vpbroadcastd 0x5834(%rip),%ymm13 # 5a1c <_sk_callback_hsw+0x13a>
+ DB 196,98,125,88,37,253,89,0,0 ; vpbroadcastd 0x59fd(%rip),%ymm12 # 5bdc <_sk_callback_hsw+0x136>
+ DB 196,98,125,88,45,248,89,0,0 ; vpbroadcastd 0x59f8(%rip),%ymm13 # 5be0 <_sk_callback_hsw+0x13a>
DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14
DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14
DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13
@@ -147,8 +147,8 @@ _sk_dither_hsw LABEL PROC
DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,230,87,0,0 ; vbroadcastss 0x57e6(%rip),%ymm9 # 5a20 <_sk_callback_hsw+0x13e>
- DB 196,98,125,24,21,225,87,0,0 ; vbroadcastss 0x57e1(%rip),%ymm10 # 5a24 <_sk_callback_hsw+0x142>
+ DB 196,98,125,24,13,170,89,0,0 ; vbroadcastss 0x59aa(%rip),%ymm9 # 5be4 <_sk_callback_hsw+0x13e>
+ DB 196,98,125,24,21,165,89,0,0 ; vbroadcastss 0x59a5(%rip),%ymm10 # 5be8 <_sk_callback_hsw+0x142>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
@@ -178,7 +178,7 @@ _sk_uniform_color_hsw LABEL PROC
PUBLIC _sk_black_color_hsw
_sk_black_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,129,87,0,0 ; vbroadcastss 0x5781(%rip),%ymm3 # 5a28 <_sk_callback_hsw+0x146>
+ DB 196,226,125,24,29,69,89,0,0 ; vbroadcastss 0x5945(%rip),%ymm3 # 5bec <_sk_callback_hsw+0x146>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -187,7 +187,7 @@ _sk_black_color_hsw LABEL PROC
PUBLIC _sk_white_color_hsw
_sk_white_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,108,87,0,0 ; vbroadcastss 0x576c(%rip),%ymm0 # 5a2c <_sk_callback_hsw+0x14a>
+ DB 196,226,125,24,5,48,89,0,0 ; vbroadcastss 0x5930(%rip),%ymm0 # 5bf0 <_sk_callback_hsw+0x14a>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -225,7 +225,7 @@ _sk_clear_hsw LABEL PROC
PUBLIC _sk_srcatop_hsw
_sk_srcatop_hsw LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,15,87,0,0 ; vbroadcastss 0x570f(%rip),%ymm8 # 5a30 <_sk_callback_hsw+0x14e>
+ DB 196,98,125,24,5,211,88,0,0 ; vbroadcastss 0x58d3(%rip),%ymm8 # 5bf4 <_sk_callback_hsw+0x14e>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0
DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1
@@ -239,7 +239,7 @@ _sk_srcatop_hsw LABEL PROC
PUBLIC _sk_dstatop_hsw
_sk_dstatop_hsw LABEL PROC
- DB 196,98,125,24,5,226,86,0,0 ; vbroadcastss 0x56e2(%rip),%ymm8 # 5a34 <_sk_callback_hsw+0x152>
+ DB 196,98,125,24,5,166,88,0,0 ; vbroadcastss 0x58a6(%rip),%ymm8 # 5bf8 <_sk_callback_hsw+0x152>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -272,7 +272,7 @@ _sk_dstin_hsw LABEL PROC
PUBLIC _sk_srcout_hsw
_sk_srcout_hsw LABEL PROC
- DB 196,98,125,24,5,137,86,0,0 ; vbroadcastss 0x5689(%rip),%ymm8 # 5a38 <_sk_callback_hsw+0x156>
+ DB 196,98,125,24,5,77,88,0,0 ; vbroadcastss 0x584d(%rip),%ymm8 # 5bfc <_sk_callback_hsw+0x156>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -283,7 +283,7 @@ _sk_srcout_hsw LABEL PROC
PUBLIC _sk_dstout_hsw
_sk_dstout_hsw LABEL PROC
- DB 196,226,125,24,5,108,86,0,0 ; vbroadcastss 0x566c(%rip),%ymm0 # 5a3c <_sk_callback_hsw+0x15a>
+ DB 196,226,125,24,5,48,88,0,0 ; vbroadcastss 0x5830(%rip),%ymm0 # 5c00 <_sk_callback_hsw+0x15a>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -294,7 +294,7 @@ _sk_dstout_hsw LABEL PROC
PUBLIC _sk_srcover_hsw
_sk_srcover_hsw LABEL PROC
- DB 196,98,125,24,5,79,86,0,0 ; vbroadcastss 0x564f(%rip),%ymm8 # 5a40 <_sk_callback_hsw+0x15e>
+ DB 196,98,125,24,5,19,88,0,0 ; vbroadcastss 0x5813(%rip),%ymm8 # 5c04 <_sk_callback_hsw+0x15e>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -305,7 +305,7 @@ _sk_srcover_hsw LABEL PROC
PUBLIC _sk_dstover_hsw
_sk_dstover_hsw LABEL PROC
- DB 196,98,125,24,5,46,86,0,0 ; vbroadcastss 0x562e(%rip),%ymm8 # 5a44 <_sk_callback_hsw+0x162>
+ DB 196,98,125,24,5,242,87,0,0 ; vbroadcastss 0x57f2(%rip),%ymm8 # 5c08 <_sk_callback_hsw+0x162>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -325,7 +325,7 @@ _sk_modulate_hsw LABEL PROC
PUBLIC _sk_multiply_hsw
_sk_multiply_hsw LABEL PROC
- DB 196,98,125,24,5,249,85,0,0 ; vbroadcastss 0x55f9(%rip),%ymm8 # 5a48 <_sk_callback_hsw+0x166>
+ DB 196,98,125,24,5,189,87,0,0 ; vbroadcastss 0x57bd(%rip),%ymm8 # 5c0c <_sk_callback_hsw+0x166>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -367,7 +367,7 @@ _sk_screen_hsw LABEL PROC
PUBLIC _sk_xor__hsw
_sk_xor__hsw LABEL PROC
- DB 196,98,125,24,5,116,85,0,0 ; vbroadcastss 0x5574(%rip),%ymm8 # 5a4c <_sk_callback_hsw+0x16a>
+ DB 196,98,125,24,5,56,87,0,0 ; vbroadcastss 0x5738(%rip),%ymm8 # 5c10 <_sk_callback_hsw+0x16a>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -399,7 +399,7 @@ _sk_darken_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,252,84,0,0 ; vbroadcastss 0x54fc(%rip),%ymm8 # 5a50 <_sk_callback_hsw+0x16e>
+ DB 196,98,125,24,5,192,86,0,0 ; vbroadcastss 0x56c0(%rip),%ymm8 # 5c14 <_sk_callback_hsw+0x16e>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -422,7 +422,7 @@ _sk_lighten_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,171,84,0,0 ; vbroadcastss 0x54ab(%rip),%ymm8 # 5a54 <_sk_callback_hsw+0x172>
+ DB 196,98,125,24,5,111,86,0,0 ; vbroadcastss 0x566f(%rip),%ymm8 # 5c18 <_sk_callback_hsw+0x172>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -448,7 +448,7 @@ _sk_difference_hsw LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,78,84,0,0 ; vbroadcastss 0x544e(%rip),%ymm8 # 5a58 <_sk_callback_hsw+0x176>
+ DB 196,98,125,24,5,18,86,0,0 ; vbroadcastss 0x5612(%rip),%ymm8 # 5c1c <_sk_callback_hsw+0x176>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -468,7 +468,7 @@ _sk_exclusion_hsw LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,12,84,0,0 ; vbroadcastss 0x540c(%rip),%ymm8 # 5a5c <_sk_callback_hsw+0x17a>
+ DB 196,98,125,24,5,208,85,0,0 ; vbroadcastss 0x55d0(%rip),%ymm8 # 5c20 <_sk_callback_hsw+0x17a>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -476,7 +476,7 @@ _sk_exclusion_hsw LABEL PROC
PUBLIC _sk_colorburn_hsw
_sk_colorburn_hsw LABEL PROC
- DB 196,98,125,24,5,250,83,0,0 ; vbroadcastss 0x53fa(%rip),%ymm8 # 5a60 <_sk_callback_hsw+0x17e>
+ DB 196,98,125,24,5,190,85,0,0 ; vbroadcastss 0x55be(%rip),%ymm8 # 5c24 <_sk_callback_hsw+0x17e>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -532,7 +532,7 @@ _sk_colorburn_hsw LABEL PROC
PUBLIC _sk_colordodge_hsw
_sk_colordodge_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,5,83,0,0 ; vbroadcastss 0x5305(%rip),%ymm9 # 5a64 <_sk_callback_hsw+0x182>
+ DB 196,98,125,24,13,201,84,0,0 ; vbroadcastss 0x54c9(%rip),%ymm9 # 5c28 <_sk_callback_hsw+0x182>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -583,7 +583,7 @@ _sk_colordodge_hsw LABEL PROC
PUBLIC _sk_hardlight_hsw
_sk_hardlight_hsw LABEL PROC
- DB 196,98,125,24,5,38,82,0,0 ; vbroadcastss 0x5226(%rip),%ymm8 # 5a68 <_sk_callback_hsw+0x186>
+ DB 196,98,125,24,5,234,83,0,0 ; vbroadcastss 0x53ea(%rip),%ymm8 # 5c2c <_sk_callback_hsw+0x186>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -632,7 +632,7 @@ _sk_hardlight_hsw LABEL PROC
PUBLIC _sk_overlay_hsw
_sk_overlay_hsw LABEL PROC
- DB 196,98,125,24,5,94,81,0,0 ; vbroadcastss 0x515e(%rip),%ymm8 # 5a6c <_sk_callback_hsw+0x18a>
+ DB 196,98,125,24,5,34,83,0,0 ; vbroadcastss 0x5322(%rip),%ymm8 # 5c30 <_sk_callback_hsw+0x18a>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -692,10 +692,10 @@ _sk_softlight_hsw LABEL PROC
DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,29,101,80,0,0 ; vbroadcastss 0x5065(%rip),%ymm11 # 5a74 <_sk_callback_hsw+0x192>
+ DB 196,98,125,24,29,41,82,0,0 ; vbroadcastss 0x5229(%rip),%ymm11 # 5c38 <_sk_callback_hsw+0x192>
DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12
DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8
- DB 196,98,125,24,37,86,80,0,0 ; vbroadcastss 0x5056(%rip),%ymm12 # 5a78 <_sk_callback_hsw+0x196>
+ DB 196,98,125,24,37,26,82,0,0 ; vbroadcastss 0x521a(%rip),%ymm12 # 5c3c <_sk_callback_hsw+0x196>
DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8
DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14
DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14
@@ -705,7 +705,7 @@ _sk_softlight_hsw LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,25,80,0,0 ; vbroadcastss 0x5019(%rip),%ymm8 # 5a70 <_sk_callback_hsw+0x18e>
+ DB 196,98,125,24,5,221,81,0,0 ; vbroadcastss 0x51dd(%rip),%ymm8 # 5c34 <_sk_callback_hsw+0x18e>
DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -818,11 +818,11 @@ _sk_hue_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,24,78,0,0 ; vbroadcastss 0x4e18(%rip),%ymm14 # 5a7c <_sk_callback_hsw+0x19a>
- DB 196,98,125,24,61,19,78,0,0 ; vbroadcastss 0x4e13(%rip),%ymm15 # 5a80 <_sk_callback_hsw+0x19e>
+ DB 196,98,125,24,53,220,79,0,0 ; vbroadcastss 0x4fdc(%rip),%ymm14 # 5c40 <_sk_callback_hsw+0x19a>
+ DB 196,98,125,24,61,215,79,0,0 ; vbroadcastss 0x4fd7(%rip),%ymm15 # 5c44 <_sk_callback_hsw+0x19e>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,4,78,0,0 ; vbroadcastss 0x4e04(%rip),%ymm0 # 5a84 <_sk_callback_hsw+0x1a2>
+ DB 196,226,125,24,5,200,79,0,0 ; vbroadcastss 0x4fc8(%rip),%ymm0 # 5c48 <_sk_callback_hsw+0x1a2>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -877,7 +877,7 @@ _sk_hue_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,241,76,0,0 ; vbroadcastss 0x4cf1(%rip),%ymm1 # 5a88 <_sk_callback_hsw+0x1a6>
+ DB 196,226,125,24,13,181,78,0,0 ; vbroadcastss 0x4eb5(%rip),%ymm1 # 5c4c <_sk_callback_hsw+0x1a6>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -931,11 +931,11 @@ _sk_saturation_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,2,76,0,0 ; vbroadcastss 0x4c02(%rip),%ymm14 # 5a8c <_sk_callback_hsw+0x1aa>
- DB 196,98,125,24,61,253,75,0,0 ; vbroadcastss 0x4bfd(%rip),%ymm15 # 5a90 <_sk_callback_hsw+0x1ae>
+ DB 196,98,125,24,53,198,77,0,0 ; vbroadcastss 0x4dc6(%rip),%ymm14 # 5c50 <_sk_callback_hsw+0x1aa>
+ DB 196,98,125,24,61,193,77,0,0 ; vbroadcastss 0x4dc1(%rip),%ymm15 # 5c54 <_sk_callback_hsw+0x1ae>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,238,75,0,0 ; vbroadcastss 0x4bee(%rip),%ymm0 # 5a94 <_sk_callback_hsw+0x1b2>
+ DB 196,226,125,24,5,178,77,0,0 ; vbroadcastss 0x4db2(%rip),%ymm0 # 5c58 <_sk_callback_hsw+0x1b2>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -990,7 +990,7 @@ _sk_saturation_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,219,74,0,0 ; vbroadcastss 0x4adb(%rip),%ymm1 # 5a98 <_sk_callback_hsw+0x1b6>
+ DB 196,226,125,24,13,159,76,0,0 ; vbroadcastss 0x4c9f(%rip),%ymm1 # 5c5c <_sk_callback_hsw+0x1b6>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -1018,11 +1018,11 @@ _sk_color_hsw LABEL PROC
DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8
DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10
DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11
- DB 196,98,125,24,45,110,74,0,0 ; vbroadcastss 0x4a6e(%rip),%ymm13 # 5a9c <_sk_callback_hsw+0x1ba>
- DB 196,98,125,24,53,105,74,0,0 ; vbroadcastss 0x4a69(%rip),%ymm14 # 5aa0 <_sk_callback_hsw+0x1be>
+ DB 196,98,125,24,45,50,76,0,0 ; vbroadcastss 0x4c32(%rip),%ymm13 # 5c60 <_sk_callback_hsw+0x1ba>
+ DB 196,98,125,24,53,45,76,0,0 ; vbroadcastss 0x4c2d(%rip),%ymm14 # 5c64 <_sk_callback_hsw+0x1be>
DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12
DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12
- DB 196,98,125,24,61,90,74,0,0 ; vbroadcastss 0x4a5a(%rip),%ymm15 # 5aa4 <_sk_callback_hsw+0x1c2>
+ DB 196,98,125,24,61,30,76,0,0 ; vbroadcastss 0x4c1e(%rip),%ymm15 # 5c68 <_sk_callback_hsw+0x1c2>
DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1078,7 +1078,7 @@ _sk_color_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,60,73,0,0 ; vbroadcastss 0x493c(%rip),%ymm0 # 5aa8 <_sk_callback_hsw+0x1c6>
+ DB 196,226,125,24,5,0,75,0,0 ; vbroadcastss 0x4b00(%rip),%ymm0 # 5c6c <_sk_callback_hsw+0x1c6>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1106,11 +1106,11 @@ _sk_luminosity_hsw LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
- DB 196,98,125,24,45,207,72,0,0 ; vbroadcastss 0x48cf(%rip),%ymm13 # 5aac <_sk_callback_hsw+0x1ca>
- DB 196,98,125,24,53,202,72,0,0 ; vbroadcastss 0x48ca(%rip),%ymm14 # 5ab0 <_sk_callback_hsw+0x1ce>
+ DB 196,98,125,24,45,147,74,0,0 ; vbroadcastss 0x4a93(%rip),%ymm13 # 5c70 <_sk_callback_hsw+0x1ca>
+ DB 196,98,125,24,53,142,74,0,0 ; vbroadcastss 0x4a8e(%rip),%ymm14 # 5c74 <_sk_callback_hsw+0x1ce>
DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12
DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12
- DB 196,98,125,24,61,187,72,0,0 ; vbroadcastss 0x48bb(%rip),%ymm15 # 5ab4 <_sk_callback_hsw+0x1d2>
+ DB 196,98,125,24,61,127,74,0,0 ; vbroadcastss 0x4a7f(%rip),%ymm15 # 5c78 <_sk_callback_hsw+0x1d2>
DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1166,7 +1166,7 @@ _sk_luminosity_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,157,71,0,0 ; vbroadcastss 0x479d(%rip),%ymm0 # 5ab8 <_sk_callback_hsw+0x1d6>
+ DB 196,226,125,24,5,97,73,0,0 ; vbroadcastss 0x4961(%rip),%ymm0 # 5c7c <_sk_callback_hsw+0x1d6>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1198,17 +1198,17 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,178,0,0,0 ; jne 1439 <_sk_srcover_rgba_8888_hsw+0xd9>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,196,84,37,45,75,0,0 ; vandps 0x4b2d(%rip),%ymm7,%ymm4 # 5ec0 <_sk_callback_hsw+0x5de>
+ DB 197,196,84,37,45,77,0,0 ; vandps 0x4d2d(%rip),%ymm7,%ymm4 # 60c0 <_sk_callback_hsw+0x61a>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,69,0,45,64,75,0,0 ; vpshufb 0x4b40(%rip),%ymm7,%ymm5 # 5ee0 <_sk_callback_hsw+0x5fe>
+ DB 196,226,69,0,45,64,77,0,0 ; vpshufb 0x4d40(%rip),%ymm7,%ymm5 # 60e0 <_sk_callback_hsw+0x63a>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,69,0,53,83,75,0,0 ; vpshufb 0x4b53(%rip),%ymm7,%ymm6 # 5f00 <_sk_callback_hsw+0x61e>
+ DB 196,226,69,0,53,83,77,0,0 ; vpshufb 0x4d53(%rip),%ymm7,%ymm6 # 6100 <_sk_callback_hsw+0x65a>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,249,70,0,0 ; vbroadcastss 0x46f9(%rip),%ymm8 # 5abc <_sk_callback_hsw+0x1da>
+ DB 196,98,125,24,5,189,72,0,0 ; vbroadcastss 0x48bd(%rip),%ymm8 # 5c80 <_sk_callback_hsw+0x1da>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,240,70,0,0 ; vbroadcastss 0x46f0(%rip),%ymm9 # 5ac0 <_sk_callback_hsw+0x1de>
+ DB 196,98,125,24,13,180,72,0,0 ; vbroadcastss 0x48b4(%rip),%ymm9 # 5c84 <_sk_callback_hsw+0x1de>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -1264,7 +1264,7 @@ _sk_clamp_0_hsw LABEL PROC
PUBLIC _sk_clamp_1_hsw
_sk_clamp_1_hsw LABEL PROC
- DB 196,98,125,24,5,22,70,0,0 ; vbroadcastss 0x4616(%rip),%ymm8 # 5ac4 <_sk_callback_hsw+0x1e2>
+ DB 196,98,125,24,5,218,71,0,0 ; vbroadcastss 0x47da(%rip),%ymm8 # 5c88 <_sk_callback_hsw+0x1e2>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -1274,7 +1274,7 @@ _sk_clamp_1_hsw LABEL PROC
PUBLIC _sk_clamp_a_hsw
_sk_clamp_a_hsw LABEL PROC
- DB 196,98,125,24,5,249,69,0,0 ; vbroadcastss 0x45f9(%rip),%ymm8 # 5ac8 <_sk_callback_hsw+0x1e6>
+ DB 196,98,125,24,5,189,71,0,0 ; vbroadcastss 0x47bd(%rip),%ymm8 # 5c8c <_sk_callback_hsw+0x1e6>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -1284,7 +1284,7 @@ _sk_clamp_a_hsw LABEL PROC
PUBLIC _sk_clamp_a_dst_hsw
_sk_clamp_a_dst_hsw LABEL PROC
- DB 196,98,125,24,5,223,69,0,0 ; vbroadcastss 0x45df(%rip),%ymm8 # 5acc <_sk_callback_hsw+0x1ea>
+ DB 196,98,125,24,5,163,71,0,0 ; vbroadcastss 0x47a3(%rip),%ymm8 # 5c90 <_sk_callback_hsw+0x1ea>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -1311,7 +1311,7 @@ _sk_swap_rb_hsw LABEL PROC
PUBLIC _sk_invert_hsw
_sk_invert_hsw LABEL PROC
- DB 196,98,125,24,5,158,69,0,0 ; vbroadcastss 0x459e(%rip),%ymm8 # 5ad0 <_sk_callback_hsw+0x1ee>
+ DB 196,98,125,24,5,98,71,0,0 ; vbroadcastss 0x4762(%rip),%ymm8 # 5c94 <_sk_callback_hsw+0x1ee>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -1357,7 +1357,7 @@ PUBLIC _sk_unpremul_hsw
_sk_unpremul_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,50,69,0,0 ; vbroadcastss 0x4532(%rip),%ymm10 # 5ad4 <_sk_callback_hsw+0x1f2>
+ DB 196,98,125,24,21,246,70,0,0 ; vbroadcastss 0x46f6(%rip),%ymm10 # 5c98 <_sk_callback_hsw+0x1f2>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -1368,16 +1368,16 @@ _sk_unpremul_hsw LABEL PROC
PUBLIC _sk_from_srgb_hsw
_sk_from_srgb_hsw LABEL PROC
- DB 196,98,125,24,5,19,69,0,0 ; vbroadcastss 0x4513(%rip),%ymm8 # 5ad8 <_sk_callback_hsw+0x1f6>
+ DB 196,98,125,24,5,215,70,0,0 ; vbroadcastss 0x46d7(%rip),%ymm8 # 5c9c <_sk_callback_hsw+0x1f6>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,5,69,0,0 ; vbroadcastss 0x4505(%rip),%ymm11 # 5adc <_sk_callback_hsw+0x1fa>
- DB 196,98,125,24,37,0,69,0,0 ; vbroadcastss 0x4500(%rip),%ymm12 # 5ae0 <_sk_callback_hsw+0x1fe>
+ DB 196,98,125,24,29,201,70,0,0 ; vbroadcastss 0x46c9(%rip),%ymm11 # 5ca0 <_sk_callback_hsw+0x1fa>
+ DB 196,98,125,24,37,196,70,0,0 ; vbroadcastss 0x46c4(%rip),%ymm12 # 5ca4 <_sk_callback_hsw+0x1fe>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13
- DB 196,98,125,24,53,241,68,0,0 ; vbroadcastss 0x44f1(%rip),%ymm14 # 5ae4 <_sk_callback_hsw+0x202>
+ DB 196,98,125,24,53,181,70,0,0 ; vbroadcastss 0x46b5(%rip),%ymm14 # 5ca8 <_sk_callback_hsw+0x202>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,231,68,0,0 ; vbroadcastss 0x44e7(%rip),%ymm10 # 5ae8 <_sk_callback_hsw+0x206>
+ DB 196,98,125,24,21,171,70,0,0 ; vbroadcastss 0x46ab(%rip),%ymm10 # 5cac <_sk_callback_hsw+0x206>
DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0
DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -1398,16 +1398,16 @@ _sk_from_srgb_hsw LABEL PROC
PUBLIC _sk_from_srgb_dst_hsw
_sk_from_srgb_dst_hsw LABEL PROC
- DB 196,98,125,24,5,143,68,0,0 ; vbroadcastss 0x448f(%rip),%ymm8 # 5aec <_sk_callback_hsw+0x20a>
+ DB 196,98,125,24,5,83,70,0,0 ; vbroadcastss 0x4653(%rip),%ymm8 # 5cb0 <_sk_callback_hsw+0x20a>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,129,68,0,0 ; vbroadcastss 0x4481(%rip),%ymm11 # 5af0 <_sk_callback_hsw+0x20e>
- DB 196,98,125,24,37,124,68,0,0 ; vbroadcastss 0x447c(%rip),%ymm12 # 5af4 <_sk_callback_hsw+0x212>
+ DB 196,98,125,24,29,69,70,0,0 ; vbroadcastss 0x4645(%rip),%ymm11 # 5cb4 <_sk_callback_hsw+0x20e>
+ DB 196,98,125,24,37,64,70,0,0 ; vbroadcastss 0x4640(%rip),%ymm12 # 5cb8 <_sk_callback_hsw+0x212>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,93,168,235 ; vfmadd213ps %ymm11,%ymm4,%ymm13
- DB 196,98,125,24,53,109,68,0,0 ; vbroadcastss 0x446d(%rip),%ymm14 # 5af8 <_sk_callback_hsw+0x216>
+ DB 196,98,125,24,53,49,70,0,0 ; vbroadcastss 0x4631(%rip),%ymm14 # 5cbc <_sk_callback_hsw+0x216>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,99,68,0,0 ; vbroadcastss 0x4463(%rip),%ymm10 # 5afc <_sk_callback_hsw+0x21a>
+ DB 196,98,125,24,21,39,70,0,0 ; vbroadcastss 0x4627(%rip),%ymm10 # 5cc0 <_sk_callback_hsw+0x21a>
DB 196,193,92,194,226,1 ; vcmpltps %ymm10,%ymm4,%ymm4
DB 196,195,21,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm13,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -1429,19 +1429,19 @@ _sk_from_srgb_dst_hsw LABEL PROC
PUBLIC _sk_to_srgb_hsw
_sk_to_srgb_hsw LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,7,68,0,0 ; vbroadcastss 0x4407(%rip),%ymm8 # 5b00 <_sk_callback_hsw+0x21e>
+ DB 196,98,125,24,5,203,69,0,0 ; vbroadcastss 0x45cb(%rip),%ymm8 # 5cc4 <_sk_callback_hsw+0x21e>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,253,67,0,0 ; vbroadcastss 0x43fd(%rip),%ymm11 # 5b04 <_sk_callback_hsw+0x222>
- DB 196,98,125,24,37,248,67,0,0 ; vbroadcastss 0x43f8(%rip),%ymm12 # 5b08 <_sk_callback_hsw+0x226>
+ DB 196,98,125,24,29,193,69,0,0 ; vbroadcastss 0x45c1(%rip),%ymm11 # 5cc8 <_sk_callback_hsw+0x222>
+ DB 196,98,125,24,37,188,69,0,0 ; vbroadcastss 0x45bc(%rip),%ymm12 # 5ccc <_sk_callback_hsw+0x226>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13
- DB 196,98,125,24,53,233,67,0,0 ; vbroadcastss 0x43e9(%rip),%ymm14 # 5b0c <_sk_callback_hsw+0x22a>
+ DB 196,98,125,24,53,173,69,0,0 ; vbroadcastss 0x45ad(%rip),%ymm14 # 5cd0 <_sk_callback_hsw+0x22a>
DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13
- DB 196,98,125,24,61,223,67,0,0 ; vbroadcastss 0x43df(%rip),%ymm15 # 5b10 <_sk_callback_hsw+0x22e>
+ DB 196,98,125,24,61,163,69,0,0 ; vbroadcastss 0x45a3(%rip),%ymm15 # 5cd4 <_sk_callback_hsw+0x22e>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9
- DB 196,98,125,24,45,203,67,0,0 ; vbroadcastss 0x43cb(%rip),%ymm13 # 5b14 <_sk_callback_hsw+0x232>
+ DB 196,98,125,24,45,143,69,0,0 ; vbroadcastss 0x458f(%rip),%ymm13 # 5cd8 <_sk_callback_hsw+0x232>
DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -1473,26 +1473,26 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,64,67,0,0 ; vbroadcastss 0x4340(%rip),%ymm11 # 5b18 <_sk_callback_hsw+0x236>
+ DB 196,98,125,24,29,4,69,0,0 ; vbroadcastss 0x4504(%rip),%ymm11 # 5cdc <_sk_callback_hsw+0x236>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13
- DB 196,98,125,24,53,45,67,0,0 ; vbroadcastss 0x432d(%rip),%ymm14 # 5b1c <_sk_callback_hsw+0x23a>
+ DB 196,98,125,24,53,241,68,0,0 ; vbroadcastss 0x44f1(%rip),%ymm14 # 5ce0 <_sk_callback_hsw+0x23a>
DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13
DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12
DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13
- DB 196,98,125,24,53,20,67,0,0 ; vbroadcastss 0x4314(%rip),%ymm14 # 5b24 <_sk_callback_hsw+0x242>
+ DB 196,98,125,24,53,216,68,0,0 ; vbroadcastss 0x44d8(%rip),%ymm14 # 5ce8 <_sk_callback_hsw+0x242>
DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13
- DB 196,98,125,24,53,2,67,0,0 ; vbroadcastss 0x4302(%rip),%ymm14 # 5b20 <_sk_callback_hsw+0x23e>
+ DB 196,98,125,24,53,198,68,0,0 ; vbroadcastss 0x44c6(%rip),%ymm14 # 5ce4 <_sk_callback_hsw+0x23e>
DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2
DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1
DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,29,229,66,0,0 ; vbroadcastss 0x42e5(%rip),%ymm11 # 5b2c <_sk_callback_hsw+0x24a>
+ DB 196,98,125,24,29,169,68,0,0 ; vbroadcastss 0x44a9(%rip),%ymm11 # 5cf0 <_sk_callback_hsw+0x24a>
DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2
DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11
DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12
@@ -1502,7 +1502,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0
DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- DB 196,98,125,24,5,168,66,0,0 ; vbroadcastss 0x42a8(%rip),%ymm8 # 5b28 <_sk_callback_hsw+0x246>
+ DB 196,98,125,24,5,108,68,0,0 ; vbroadcastss 0x446c(%rip),%ymm8 # 5cec <_sk_callback_hsw+0x246>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1517,30 +1517,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 197,252,40,224 ; vmovaps %ymm0,%ymm4
- DB 196,98,125,24,5,111,66,0,0 ; vbroadcastss 0x426f(%rip),%ymm8 # 5b30 <_sk_callback_hsw+0x24e>
+ DB 196,98,125,24,5,51,68,0,0 ; vbroadcastss 0x4433(%rip),%ymm8 # 5cf4 <_sk_callback_hsw+0x24e>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10
DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11
DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
- DB 196,98,125,24,13,82,66,0,0 ; vbroadcastss 0x4252(%rip),%ymm9 # 5b34 <_sk_callback_hsw+0x252>
+ DB 196,98,125,24,13,22,68,0,0 ; vbroadcastss 0x4416(%rip),%ymm9 # 5cf8 <_sk_callback_hsw+0x252>
DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9
- DB 196,98,125,24,29,72,66,0,0 ; vbroadcastss 0x4248(%rip),%ymm11 # 5b38 <_sk_callback_hsw+0x256>
+ DB 196,98,125,24,29,12,68,0,0 ; vbroadcastss 0x440c(%rip),%ymm11 # 5cfc <_sk_callback_hsw+0x256>
DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,45,50,66,0,0 ; vbroadcastss 0x4232(%rip),%ymm13 # 5b40 <_sk_callback_hsw+0x25e>
+ DB 196,98,125,24,45,246,67,0,0 ; vbroadcastss 0x43f6(%rip),%ymm13 # 5d04 <_sk_callback_hsw+0x25e>
DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0
- DB 196,98,125,24,53,40,66,0,0 ; vbroadcastss 0x4228(%rip),%ymm14 # 5b44 <_sk_callback_hsw+0x262>
+ DB 196,98,125,24,53,236,67,0,0 ; vbroadcastss 0x43ec(%rip),%ymm14 # 5d08 <_sk_callback_hsw+0x262>
DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12
DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12
- DB 196,226,125,24,29,14,66,0,0 ; vbroadcastss 0x420e(%rip),%ymm3 # 5b3c <_sk_callback_hsw+0x25a>
+ DB 196,226,125,24,29,210,67,0,0 ; vbroadcastss 0x43d2(%rip),%ymm3 # 5d00 <_sk_callback_hsw+0x25a>
DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7
DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7
DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12
DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,37,249,65,0,0 ; vbroadcastss 0x41f9(%rip),%ymm12 # 5b48 <_sk_callback_hsw+0x266>
+ DB 196,98,125,24,37,189,67,0,0 ; vbroadcastss 0x43bd(%rip),%ymm12 # 5d0c <_sk_callback_hsw+0x266>
DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15
DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0
DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -1556,7 +1556,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0
DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7
DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- DB 196,226,125,24,5,165,65,0,0 ; vbroadcastss 0x41a5(%rip),%ymm0 # 5b4c <_sk_callback_hsw+0x26a>
+ DB 196,226,125,24,5,105,67,0,0 ; vbroadcastss 0x4369(%rip),%ymm0 # 5d10 <_sk_callback_hsw+0x26a>
DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
@@ -1607,10 +1607,10 @@ _sk_scale_u8_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,59 ; jne 1a9e <_sk_scale_u8_hsw+0x54>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,79,71,0,0 ; vpand 0x474f(%rip),%xmm8,%xmm8 # 61c0 <_sk_callback_hsw+0x8de>
+ DB 197,57,219,5,79,73,0,0 ; vpand 0x494f(%rip),%xmm8,%xmm8 # 63c0 <_sk_callback_hsw+0x91a>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,204,64,0,0 ; vbroadcastss 0x40cc(%rip),%ymm9 # 5b50 <_sk_callback_hsw+0x26e>
+ DB 196,98,125,24,13,144,66,0,0 ; vbroadcastss 0x4290(%rip),%ymm9 # 5d14 <_sk_callback_hsw+0x26e>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -1660,7 +1660,7 @@ _sk_scale_u8_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf001b48 <_sk_callback_hsw+0xffffffffdeffc266>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf001b48 <_sk_callback_hsw+0xffffffffdeffc0a2>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -1698,10 +1698,10 @@ _sk_lerp_u8_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,79 ; jne 1beb <_sk_lerp_u8_hsw+0x68>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,38,70,0,0 ; vpand 0x4626(%rip),%xmm8,%xmm8 # 61d0 <_sk_callback_hsw+0x8ee>
+ DB 197,57,219,5,38,72,0,0 ; vpand 0x4826(%rip),%xmm8,%xmm8 # 63d0 <_sk_callback_hsw+0x92a>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,151,63,0,0 ; vbroadcastss 0x3f97(%rip),%ymm9 # 5b54 <_sk_callback_hsw+0x272>
+ DB 196,98,125,24,13,91,65,0,0 ; vbroadcastss 0x415b(%rip),%ymm9 # 5d18 <_sk_callback_hsw+0x272>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -1782,20 +1782,20 @@ _sk_lerp_565_hsw LABEL PROC
DB 15,133,170,0,0,0 ; jne 1d6a <_sk_lerp_565_hsw+0xca>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,132,62,0,0 ; vpbroadcastd 0x3e84(%rip),%ymm9 # 5b58 <_sk_callback_hsw+0x276>
+ DB 196,98,125,88,13,72,64,0,0 ; vpbroadcastd 0x4048(%rip),%ymm9 # 5d1c <_sk_callback_hsw+0x276>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,117,62,0,0 ; vbroadcastss 0x3e75(%rip),%ymm10 # 5b5c <_sk_callback_hsw+0x27a>
+ DB 196,98,125,24,21,57,64,0,0 ; vbroadcastss 0x4039(%rip),%ymm10 # 5d20 <_sk_callback_hsw+0x27a>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,107,62,0,0 ; vpbroadcastd 0x3e6b(%rip),%ymm10 # 5b60 <_sk_callback_hsw+0x27e>
+ DB 196,98,125,88,21,47,64,0,0 ; vpbroadcastd 0x402f(%rip),%ymm10 # 5d24 <_sk_callback_hsw+0x27e>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,92,62,0,0 ; vbroadcastss 0x3e5c(%rip),%ymm11 # 5b64 <_sk_callback_hsw+0x282>
+ DB 196,98,125,24,29,32,64,0,0 ; vbroadcastss 0x4020(%rip),%ymm11 # 5d28 <_sk_callback_hsw+0x282>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,82,62,0,0 ; vpbroadcastd 0x3e52(%rip),%ymm11 # 5b68 <_sk_callback_hsw+0x286>
+ DB 196,98,125,88,29,22,64,0,0 ; vpbroadcastd 0x4016(%rip),%ymm11 # 5d2c <_sk_callback_hsw+0x286>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,67,62,0,0 ; vbroadcastss 0x3e43(%rip),%ymm11 # 5b6c <_sk_callback_hsw+0x28a>
+ DB 196,98,125,24,29,7,64,0,0 ; vbroadcastss 0x4007(%rip),%ymm11 # 5d30 <_sk_callback_hsw+0x28a>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,53,168,196 ; vfmadd213ps %ymm4,%ymm9,%ymm0
@@ -1866,21 +1866,21 @@ _sk_load_tables_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,105 ; jne 1e8e <_sk_load_tables_hsw+0x7e>
DB 196,193,124,16,26 ; vmovups (%r10),%ymm3
- DB 197,228,84,13,238,64,0,0 ; vandps 0x40ee(%rip),%ymm3,%ymm1 # 5f20 <_sk_callback_hsw+0x63e>
+ DB 197,228,84,13,238,66,0,0 ; vandps 0x42ee(%rip),%ymm3,%ymm1 # 6120 <_sk_callback_hsw+0x67a>
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 72,139,72,8 ; mov 0x8(%rax),%rcx
DB 76,139,80,16 ; mov 0x10(%rax),%r10
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 196,226,109,146,4,137 ; vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0
- DB 196,226,101,0,21,238,64,0,0 ; vpshufb 0x40ee(%rip),%ymm3,%ymm2 # 5f40 <_sk_callback_hsw+0x65e>
+ DB 196,226,101,0,21,238,66,0,0 ; vpshufb 0x42ee(%rip),%ymm3,%ymm2 # 6140 <_sk_callback_hsw+0x69a>
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,194,53,146,12,146 ; vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
- DB 196,98,101,0,13,246,64,0,0 ; vpshufb 0x40f6(%rip),%ymm3,%ymm9 # 5f60 <_sk_callback_hsw+0x67e>
+ DB 196,98,101,0,13,246,66,0,0 ; vpshufb 0x42f6(%rip),%ymm3,%ymm9 # 6160 <_sk_callback_hsw+0x6ba>
DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,238,60,0,0 ; vbroadcastss 0x3cee(%rip),%ymm8 # 5b70 <_sk_callback_hsw+0x28e>
+ DB 196,98,125,24,5,178,62,0,0 ; vbroadcastss 0x3eb2(%rip),%ymm8 # 5d34 <_sk_callback_hsw+0x28e>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -1917,7 +1917,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1
DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2
DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8
- DB 197,121,111,21,194,66,0,0 ; vmovdqa 0x42c2(%rip),%xmm10 # 61e0 <_sk_callback_hsw+0x8fe>
+ DB 197,121,111,21,194,68,0,0 ; vmovdqa 0x44c2(%rip),%xmm10 # 63e0 <_sk_callback_hsw+0x93a>
DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -1939,7 +1939,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,231,59,0,0 ; vbroadcastss 0x3be7(%rip),%ymm8 # 5b74 <_sk_callback_hsw+0x292>
+ DB 196,98,125,24,5,171,61,0,0 ; vbroadcastss 0x3dab(%rip),%ymm8 # 5d38 <_sk_callback_hsw+0x292>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1997,7 +1997,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,98,65,0,0 ; vmovdqa 0x4162(%rip),%xmm9 # 61f0 <_sk_callback_hsw+0x90e>
+ DB 197,121,111,13,98,67,0,0 ; vmovdqa 0x4362(%rip),%xmm9 # 63f0 <_sk_callback_hsw+0x94a>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -2014,7 +2014,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8
DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,149,58,0,0 ; vbroadcastss 0x3a95(%rip),%ymm3 # 5b78 <_sk_callback_hsw+0x296>
+ DB 196,226,125,24,29,89,60,0,0 ; vbroadcastss 0x3c59(%rip),%ymm3 # 5d3c <_sk_callback_hsw+0x296>
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
@@ -2053,7 +2053,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
PUBLIC _sk_byte_tables_hsw
_sk_byte_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,221,57,0,0 ; vbroadcastss 0x39dd(%rip),%ymm8 # 5b7c <_sk_callback_hsw+0x29a>
+ DB 196,98,125,24,5,161,59,0,0 ; vbroadcastss 0x3ba1(%rip),%ymm8 # 5d40 <_sk_callback_hsw+0x29a>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -2175,7 +2175,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,130,55,0,0 ; vbroadcastss 0x3782(%rip),%ymm8 # 5b80 <_sk_callback_hsw+0x29e>
+ DB 196,98,125,24,5,70,57,0,0 ; vbroadcastss 0x3946(%rip),%ymm8 # 5d44 <_sk_callback_hsw+0x29e>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2289,7 +2289,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,110,53,0,0 ; vbroadcastss 0x356e(%rip),%ymm8 # 5b84 <_sk_callback_hsw+0x2a2>
+ DB 196,98,125,24,5,50,55,0,0 ; vbroadcastss 0x3732(%rip),%ymm8 # 5d48 <_sk_callback_hsw+0x2a2>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2378,33 +2378,33 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10
DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,72,52,0,0 ; vbroadcastss 0x3448(%rip),%ymm12 # 5b88 <_sk_callback_hsw+0x2a6>
- DB 196,98,125,24,45,67,52,0,0 ; vbroadcastss 0x3443(%rip),%ymm13 # 5b8c <_sk_callback_hsw+0x2aa>
+ DB 196,98,125,24,37,12,54,0,0 ; vbroadcastss 0x360c(%rip),%ymm12 # 5d4c <_sk_callback_hsw+0x2a6>
+ DB 196,98,125,24,45,7,54,0,0 ; vbroadcastss 0x3607(%rip),%ymm13 # 5d50 <_sk_callback_hsw+0x2aa>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,57,52,0,0 ; vbroadcastss 0x3439(%rip),%ymm13 # 5b90 <_sk_callback_hsw+0x2ae>
+ DB 196,98,125,24,45,253,53,0,0 ; vbroadcastss 0x35fd(%rip),%ymm13 # 5d54 <_sk_callback_hsw+0x2ae>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,47,52,0,0 ; vbroadcastss 0x342f(%rip),%ymm13 # 5b94 <_sk_callback_hsw+0x2b2>
+ DB 196,98,125,24,45,243,53,0,0 ; vbroadcastss 0x35f3(%rip),%ymm13 # 5d58 <_sk_callback_hsw+0x2b2>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,37,52,0,0 ; vbroadcastss 0x3425(%rip),%ymm11 # 5b98 <_sk_callback_hsw+0x2b6>
+ DB 196,98,125,24,29,233,53,0,0 ; vbroadcastss 0x35e9(%rip),%ymm11 # 5d5c <_sk_callback_hsw+0x2b6>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,27,52,0,0 ; vbroadcastss 0x341b(%rip),%ymm12 # 5b9c <_sk_callback_hsw+0x2ba>
+ DB 196,98,125,24,37,223,53,0,0 ; vbroadcastss 0x35df(%rip),%ymm12 # 5d60 <_sk_callback_hsw+0x2ba>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,17,52,0,0 ; vbroadcastss 0x3411(%rip),%ymm12 # 5ba0 <_sk_callback_hsw+0x2be>
+ DB 196,98,125,24,37,213,53,0,0 ; vbroadcastss 0x35d5(%rip),%ymm12 # 5d64 <_sk_callback_hsw+0x2be>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,242,51,0,0 ; vbroadcastss 0x33f2(%rip),%ymm11 # 5ba4 <_sk_callback_hsw+0x2c2>
+ DB 196,98,125,24,29,182,53,0,0 ; vbroadcastss 0x35b6(%rip),%ymm11 # 5d68 <_sk_callback_hsw+0x2c2>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,232,51,0,0 ; vbroadcastss 0x33e8(%rip),%ymm11 # 5ba8 <_sk_callback_hsw+0x2c6>
+ DB 196,98,125,24,29,172,53,0,0 ; vbroadcastss 0x35ac(%rip),%ymm11 # 5d6c <_sk_callback_hsw+0x2c6>
DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11
- DB 196,226,125,24,5,222,51,0,0 ; vbroadcastss 0x33de(%rip),%ymm0 # 5bac <_sk_callback_hsw+0x2ca>
+ DB 196,226,125,24,5,162,53,0,0 ; vbroadcastss 0x35a2(%rip),%ymm0 # 5d70 <_sk_callback_hsw+0x2ca>
DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,212,51,0,0 ; vbroadcastss 0x33d4(%rip),%ymm10 # 5bb0 <_sk_callback_hsw+0x2ce>
+ DB 196,98,125,24,21,152,53,0,0 ; vbroadcastss 0x3598(%rip),%ymm10 # 5d74 <_sk_callback_hsw+0x2ce>
DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0
DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,21,199,51,0,0 ; vbroadcastss 0x33c7(%rip),%ymm10 # 5bb4 <_sk_callback_hsw+0x2d2>
+ DB 196,98,125,24,21,139,53,0,0 ; vbroadcastss 0x358b(%rip),%ymm10 # 5d78 <_sk_callback_hsw+0x2d2>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2412,7 +2412,7 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,158,51,0,0 ; vbroadcastss 0x339e(%rip),%ymm8 # 5bb8 <_sk_callback_hsw+0x2d6>
+ DB 196,98,125,24,5,98,53,0,0 ; vbroadcastss 0x3562(%rip),%ymm8 # 5d7c <_sk_callback_hsw+0x2d6>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2430,33 +2430,33 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10
DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,86,51,0,0 ; vbroadcastss 0x3356(%rip),%ymm12 # 5bbc <_sk_callback_hsw+0x2da>
- DB 196,98,125,24,45,81,51,0,0 ; vbroadcastss 0x3351(%rip),%ymm13 # 5bc0 <_sk_callback_hsw+0x2de>
+ DB 196,98,125,24,37,26,53,0,0 ; vbroadcastss 0x351a(%rip),%ymm12 # 5d80 <_sk_callback_hsw+0x2da>
+ DB 196,98,125,24,45,21,53,0,0 ; vbroadcastss 0x3515(%rip),%ymm13 # 5d84 <_sk_callback_hsw+0x2de>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,71,51,0,0 ; vbroadcastss 0x3347(%rip),%ymm13 # 5bc4 <_sk_callback_hsw+0x2e2>
+ DB 196,98,125,24,45,11,53,0,0 ; vbroadcastss 0x350b(%rip),%ymm13 # 5d88 <_sk_callback_hsw+0x2e2>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,61,51,0,0 ; vbroadcastss 0x333d(%rip),%ymm13 # 5bc8 <_sk_callback_hsw+0x2e6>
+ DB 196,98,125,24,45,1,53,0,0 ; vbroadcastss 0x3501(%rip),%ymm13 # 5d8c <_sk_callback_hsw+0x2e6>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,51,51,0,0 ; vbroadcastss 0x3333(%rip),%ymm11 # 5bcc <_sk_callback_hsw+0x2ea>
+ DB 196,98,125,24,29,247,52,0,0 ; vbroadcastss 0x34f7(%rip),%ymm11 # 5d90 <_sk_callback_hsw+0x2ea>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,41,51,0,0 ; vbroadcastss 0x3329(%rip),%ymm12 # 5bd0 <_sk_callback_hsw+0x2ee>
+ DB 196,98,125,24,37,237,52,0,0 ; vbroadcastss 0x34ed(%rip),%ymm12 # 5d94 <_sk_callback_hsw+0x2ee>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,31,51,0,0 ; vbroadcastss 0x331f(%rip),%ymm12 # 5bd4 <_sk_callback_hsw+0x2f2>
+ DB 196,98,125,24,37,227,52,0,0 ; vbroadcastss 0x34e3(%rip),%ymm12 # 5d98 <_sk_callback_hsw+0x2f2>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,0,51,0,0 ; vbroadcastss 0x3300(%rip),%ymm11 # 5bd8 <_sk_callback_hsw+0x2f6>
+ DB 196,98,125,24,29,196,52,0,0 ; vbroadcastss 0x34c4(%rip),%ymm11 # 5d9c <_sk_callback_hsw+0x2f6>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,246,50,0,0 ; vbroadcastss 0x32f6(%rip),%ymm11 # 5bdc <_sk_callback_hsw+0x2fa>
+ DB 196,98,125,24,29,186,52,0,0 ; vbroadcastss 0x34ba(%rip),%ymm11 # 5da0 <_sk_callback_hsw+0x2fa>
DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11
- DB 196,226,125,24,13,236,50,0,0 ; vbroadcastss 0x32ec(%rip),%ymm1 # 5be0 <_sk_callback_hsw+0x2fe>
+ DB 196,226,125,24,13,176,52,0,0 ; vbroadcastss 0x34b0(%rip),%ymm1 # 5da4 <_sk_callback_hsw+0x2fe>
DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,226,50,0,0 ; vbroadcastss 0x32e2(%rip),%ymm10 # 5be4 <_sk_callback_hsw+0x302>
+ DB 196,98,125,24,21,166,52,0,0 ; vbroadcastss 0x34a6(%rip),%ymm10 # 5da8 <_sk_callback_hsw+0x302>
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
- DB 196,98,125,24,21,213,50,0,0 ; vbroadcastss 0x32d5(%rip),%ymm10 # 5be8 <_sk_callback_hsw+0x306>
+ DB 196,98,125,24,21,153,52,0,0 ; vbroadcastss 0x3499(%rip),%ymm10 # 5dac <_sk_callback_hsw+0x306>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2464,7 +2464,7 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,172,50,0,0 ; vbroadcastss 0x32ac(%rip),%ymm8 # 5bec <_sk_callback_hsw+0x30a>
+ DB 196,98,125,24,5,112,52,0,0 ; vbroadcastss 0x3470(%rip),%ymm8 # 5db0 <_sk_callback_hsw+0x30a>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2482,33 +2482,33 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,100,50,0,0 ; vbroadcastss 0x3264(%rip),%ymm12 # 5bf0 <_sk_callback_hsw+0x30e>
- DB 196,98,125,24,45,95,50,0,0 ; vbroadcastss 0x325f(%rip),%ymm13 # 5bf4 <_sk_callback_hsw+0x312>
+ DB 196,98,125,24,37,40,52,0,0 ; vbroadcastss 0x3428(%rip),%ymm12 # 5db4 <_sk_callback_hsw+0x30e>
+ DB 196,98,125,24,45,35,52,0,0 ; vbroadcastss 0x3423(%rip),%ymm13 # 5db8 <_sk_callback_hsw+0x312>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,85,50,0,0 ; vbroadcastss 0x3255(%rip),%ymm13 # 5bf8 <_sk_callback_hsw+0x316>
+ DB 196,98,125,24,45,25,52,0,0 ; vbroadcastss 0x3419(%rip),%ymm13 # 5dbc <_sk_callback_hsw+0x316>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,75,50,0,0 ; vbroadcastss 0x324b(%rip),%ymm13 # 5bfc <_sk_callback_hsw+0x31a>
+ DB 196,98,125,24,45,15,52,0,0 ; vbroadcastss 0x340f(%rip),%ymm13 # 5dc0 <_sk_callback_hsw+0x31a>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,65,50,0,0 ; vbroadcastss 0x3241(%rip),%ymm11 # 5c00 <_sk_callback_hsw+0x31e>
+ DB 196,98,125,24,29,5,52,0,0 ; vbroadcastss 0x3405(%rip),%ymm11 # 5dc4 <_sk_callback_hsw+0x31e>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,55,50,0,0 ; vbroadcastss 0x3237(%rip),%ymm12 # 5c04 <_sk_callback_hsw+0x322>
+ DB 196,98,125,24,37,251,51,0,0 ; vbroadcastss 0x33fb(%rip),%ymm12 # 5dc8 <_sk_callback_hsw+0x322>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,45,50,0,0 ; vbroadcastss 0x322d(%rip),%ymm12 # 5c08 <_sk_callback_hsw+0x326>
+ DB 196,98,125,24,37,241,51,0,0 ; vbroadcastss 0x33f1(%rip),%ymm12 # 5dcc <_sk_callback_hsw+0x326>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,14,50,0,0 ; vbroadcastss 0x320e(%rip),%ymm11 # 5c0c <_sk_callback_hsw+0x32a>
+ DB 196,98,125,24,29,210,51,0,0 ; vbroadcastss 0x33d2(%rip),%ymm11 # 5dd0 <_sk_callback_hsw+0x32a>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,4,50,0,0 ; vbroadcastss 0x3204(%rip),%ymm11 # 5c10 <_sk_callback_hsw+0x32e>
+ DB 196,98,125,24,29,200,51,0,0 ; vbroadcastss 0x33c8(%rip),%ymm11 # 5dd4 <_sk_callback_hsw+0x32e>
DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11
- DB 196,226,125,24,21,250,49,0,0 ; vbroadcastss 0x31fa(%rip),%ymm2 # 5c14 <_sk_callback_hsw+0x332>
+ DB 196,226,125,24,21,190,51,0,0 ; vbroadcastss 0x33be(%rip),%ymm2 # 5dd8 <_sk_callback_hsw+0x332>
DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,240,49,0,0 ; vbroadcastss 0x31f0(%rip),%ymm10 # 5c18 <_sk_callback_hsw+0x336>
+ DB 196,98,125,24,21,180,51,0,0 ; vbroadcastss 0x33b4(%rip),%ymm10 # 5ddc <_sk_callback_hsw+0x336>
DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2
DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2
- DB 196,98,125,24,21,227,49,0,0 ; vbroadcastss 0x31e3(%rip),%ymm10 # 5c1c <_sk_callback_hsw+0x33a>
+ DB 196,98,125,24,21,167,51,0,0 ; vbroadcastss 0x33a7(%rip),%ymm10 # 5de0 <_sk_callback_hsw+0x33a>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2516,7 +2516,7 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,186,49,0,0 ; vbroadcastss 0x31ba(%rip),%ymm8 # 5c20 <_sk_callback_hsw+0x33e>
+ DB 196,98,125,24,5,126,51,0,0 ; vbroadcastss 0x337e(%rip),%ymm8 # 5de4 <_sk_callback_hsw+0x33e>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2534,33 +2534,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10
DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,114,49,0,0 ; vbroadcastss 0x3172(%rip),%ymm12 # 5c24 <_sk_callback_hsw+0x342>
- DB 196,98,125,24,45,109,49,0,0 ; vbroadcastss 0x316d(%rip),%ymm13 # 5c28 <_sk_callback_hsw+0x346>
+ DB 196,98,125,24,37,54,51,0,0 ; vbroadcastss 0x3336(%rip),%ymm12 # 5de8 <_sk_callback_hsw+0x342>
+ DB 196,98,125,24,45,49,51,0,0 ; vbroadcastss 0x3331(%rip),%ymm13 # 5dec <_sk_callback_hsw+0x346>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,99,49,0,0 ; vbroadcastss 0x3163(%rip),%ymm13 # 5c2c <_sk_callback_hsw+0x34a>
+ DB 196,98,125,24,45,39,51,0,0 ; vbroadcastss 0x3327(%rip),%ymm13 # 5df0 <_sk_callback_hsw+0x34a>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,89,49,0,0 ; vbroadcastss 0x3159(%rip),%ymm13 # 5c30 <_sk_callback_hsw+0x34e>
+ DB 196,98,125,24,45,29,51,0,0 ; vbroadcastss 0x331d(%rip),%ymm13 # 5df4 <_sk_callback_hsw+0x34e>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,79,49,0,0 ; vbroadcastss 0x314f(%rip),%ymm11 # 5c34 <_sk_callback_hsw+0x352>
+ DB 196,98,125,24,29,19,51,0,0 ; vbroadcastss 0x3313(%rip),%ymm11 # 5df8 <_sk_callback_hsw+0x352>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,69,49,0,0 ; vbroadcastss 0x3145(%rip),%ymm12 # 5c38 <_sk_callback_hsw+0x356>
+ DB 196,98,125,24,37,9,51,0,0 ; vbroadcastss 0x3309(%rip),%ymm12 # 5dfc <_sk_callback_hsw+0x356>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,59,49,0,0 ; vbroadcastss 0x313b(%rip),%ymm12 # 5c3c <_sk_callback_hsw+0x35a>
+ DB 196,98,125,24,37,255,50,0,0 ; vbroadcastss 0x32ff(%rip),%ymm12 # 5e00 <_sk_callback_hsw+0x35a>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,28,49,0,0 ; vbroadcastss 0x311c(%rip),%ymm11 # 5c40 <_sk_callback_hsw+0x35e>
+ DB 196,98,125,24,29,224,50,0,0 ; vbroadcastss 0x32e0(%rip),%ymm11 # 5e04 <_sk_callback_hsw+0x35e>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,18,49,0,0 ; vbroadcastss 0x3112(%rip),%ymm11 # 5c44 <_sk_callback_hsw+0x362>
+ DB 196,98,125,24,29,214,50,0,0 ; vbroadcastss 0x32d6(%rip),%ymm11 # 5e08 <_sk_callback_hsw+0x362>
DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11
- DB 196,226,125,24,29,8,49,0,0 ; vbroadcastss 0x3108(%rip),%ymm3 # 5c48 <_sk_callback_hsw+0x366>
+ DB 196,226,125,24,29,204,50,0,0 ; vbroadcastss 0x32cc(%rip),%ymm3 # 5e0c <_sk_callback_hsw+0x366>
DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,254,48,0,0 ; vbroadcastss 0x30fe(%rip),%ymm10 # 5c4c <_sk_callback_hsw+0x36a>
+ DB 196,98,125,24,21,194,50,0,0 ; vbroadcastss 0x32c2(%rip),%ymm10 # 5e10 <_sk_callback_hsw+0x36a>
DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3
DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3
- DB 196,98,125,24,21,241,48,0,0 ; vbroadcastss 0x30f1(%rip),%ymm10 # 5c50 <_sk_callback_hsw+0x36e>
+ DB 196,98,125,24,21,181,50,0,0 ; vbroadcastss 0x32b5(%rip),%ymm10 # 5e14 <_sk_callback_hsw+0x36e>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2568,33 +2568,120 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,200,48,0,0 ; vbroadcastss 0x30c8(%rip),%ymm8 # 5c54 <_sk_callback_hsw+0x372>
+ DB 196,98,125,24,5,140,50,0,0 ; vbroadcastss 0x328c(%rip),%ymm8 # 5e18 <_sk_callback_hsw+0x372>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_gamma_hsw
+_sk_gamma_hsw LABEL PROC
+ DB 72,129,236,184,0,0,0 ; sub $0xb8,%rsp
+ DB 197,252,17,188,36,128,0,0,0 ; vmovups %ymm7,0x80(%rsp)
+ DB 197,252,17,116,36,96 ; vmovups %ymm6,0x60(%rsp)
+ DB 197,252,17,108,36,64 ; vmovups %ymm5,0x40(%rsp)
+ DB 197,252,17,100,36,32 ; vmovups %ymm4,0x20(%rsp)
+ DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
+ DB 197,252,40,250 ; vmovaps %ymm2,%ymm7
+ DB 197,252,40,241 ; vmovaps %ymm1,%ymm6
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,124,91,208 ; vcvtdq2ps %ymm0,%ymm10
+ DB 196,98,125,24,29,73,50,0,0 ; vbroadcastss 0x3249(%rip),%ymm11 # 5e1c <_sk_callback_hsw+0x376>
+ DB 196,226,125,24,45,68,50,0,0 ; vbroadcastss 0x3244(%rip),%ymm5 # 5e20 <_sk_callback_hsw+0x37a>
+ DB 197,124,84,205 ; vandps %ymm5,%ymm0,%ymm9
+ DB 196,226,125,24,37,59,50,0,0 ; vbroadcastss 0x323b(%rip),%ymm4 # 5e24 <_sk_callback_hsw+0x37e>
+ DB 197,52,86,228 ; vorps %ymm4,%ymm9,%ymm12
+ DB 196,98,125,24,45,50,50,0,0 ; vbroadcastss 0x3232(%rip),%ymm13 # 5e28 <_sk_callback_hsw+0x382>
+ DB 196,66,37,168,213 ; vfmadd213ps %ymm13,%ymm11,%ymm10
+ DB 196,98,125,24,13,40,50,0,0 ; vbroadcastss 0x3228(%rip),%ymm9 # 5e2c <_sk_callback_hsw+0x386>
+ DB 196,66,29,188,209 ; vfnmadd231ps %ymm9,%ymm12,%ymm10
+ DB 197,124,91,246 ; vcvtdq2ps %ymm6,%ymm14
+ DB 196,66,37,168,245 ; vfmadd213ps %ymm13,%ymm11,%ymm14
+ DB 197,124,91,255 ; vcvtdq2ps %ymm7,%ymm15
+ DB 196,66,37,168,253 ; vfmadd213ps %ymm13,%ymm11,%ymm15
+ DB 196,98,125,24,29,12,50,0,0 ; vbroadcastss 0x320c(%rip),%ymm11 # 5e30 <_sk_callback_hsw+0x38a>
+ DB 196,65,28,88,227 ; vaddps %ymm11,%ymm12,%ymm12
+ DB 196,98,125,24,45,2,50,0,0 ; vbroadcastss 0x3202(%rip),%ymm13 # 5e34 <_sk_callback_hsw+0x38e>
+ DB 196,65,20,94,228 ; vdivps %ymm12,%ymm13,%ymm12
+ DB 196,65,44,92,212 ; vsubps %ymm12,%ymm10,%ymm10
+ DB 196,98,125,24,32 ; vbroadcastss (%rax),%ymm12
+ DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
+ DB 196,67,125,8,194,1 ; vroundps $0x1,%ymm10,%ymm8
+ DB 196,65,44,92,192 ; vsubps %ymm8,%ymm10,%ymm8
+ DB 196,226,125,24,21,222,49,0,0 ; vbroadcastss 0x31de(%rip),%ymm2 # 5e38 <_sk_callback_hsw+0x392>
+ DB 197,44,88,210 ; vaddps %ymm2,%ymm10,%ymm10
+ DB 196,226,125,24,29,213,49,0,0 ; vbroadcastss 0x31d5(%rip),%ymm3 # 5e3c <_sk_callback_hsw+0x396>
+ DB 196,98,61,188,211 ; vfnmadd231ps %ymm3,%ymm8,%ymm10
+ DB 196,226,125,24,13,203,49,0,0 ; vbroadcastss 0x31cb(%rip),%ymm1 # 5e40 <_sk_callback_hsw+0x39a>
+ DB 196,65,116,92,192 ; vsubps %ymm8,%ymm1,%ymm8
+ DB 196,226,125,24,5,193,49,0,0 ; vbroadcastss 0x31c1(%rip),%ymm0 # 5e44 <_sk_callback_hsw+0x39e>
+ DB 196,65,124,94,192 ; vdivps %ymm8,%ymm0,%ymm8
+ DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
+ DB 197,204,84,245 ; vandps %ymm5,%ymm6,%ymm6
+ DB 197,204,86,244 ; vorps %ymm4,%ymm6,%ymm6
+ DB 196,66,77,188,241 ; vfnmadd231ps %ymm9,%ymm6,%ymm14
+ DB 196,193,76,88,243 ; vaddps %ymm11,%ymm6,%ymm6
+ DB 197,148,94,246 ; vdivps %ymm6,%ymm13,%ymm6
+ DB 197,140,92,246 ; vsubps %ymm6,%ymm14,%ymm6
+ DB 196,193,76,89,244 ; vmulps %ymm12,%ymm6,%ymm6
+ DB 196,99,125,8,214,1 ; vroundps $0x1,%ymm6,%ymm10
+ DB 196,65,76,92,210 ; vsubps %ymm10,%ymm6,%ymm10
+ DB 197,204,88,242 ; vaddps %ymm2,%ymm6,%ymm6
+ DB 196,226,45,188,243 ; vfnmadd231ps %ymm3,%ymm10,%ymm6
+ DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
+ DB 196,65,124,94,210 ; vdivps %ymm10,%ymm0,%ymm10
+ DB 196,193,76,88,242 ; vaddps %ymm10,%ymm6,%ymm6
+ DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5
+ DB 197,212,86,228 ; vorps %ymm4,%ymm5,%ymm4
+ DB 196,66,93,188,249 ; vfnmadd231ps %ymm9,%ymm4,%ymm15
+ DB 196,193,92,88,227 ; vaddps %ymm11,%ymm4,%ymm4
+ DB 197,148,94,228 ; vdivps %ymm4,%ymm13,%ymm4
+ DB 197,132,92,228 ; vsubps %ymm4,%ymm15,%ymm4
+ DB 196,193,92,89,228 ; vmulps %ymm12,%ymm4,%ymm4
+ DB 196,227,125,8,236,1 ; vroundps $0x1,%ymm4,%ymm5
+ DB 197,220,92,237 ; vsubps %ymm5,%ymm4,%ymm5
+ DB 197,220,88,210 ; vaddps %ymm2,%ymm4,%ymm2
+ DB 196,226,85,188,211 ; vfnmadd231ps %ymm3,%ymm5,%ymm2
+ DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
+ DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0
+ DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0
+ DB 196,226,125,24,13,50,49,0,0 ; vbroadcastss 0x3132(%rip),%ymm1 # 5e48 <_sk_callback_hsw+0x3a2>
+ DB 197,188,89,209 ; vmulps %ymm1,%ymm8,%ymm2
+ DB 197,204,89,217 ; vmulps %ymm1,%ymm6,%ymm3
+ DB 197,252,89,225 ; vmulps %ymm1,%ymm0,%ymm4
+ DB 197,253,91,194 ; vcvtps2dq %ymm2,%ymm0
+ DB 197,253,91,203 ; vcvtps2dq %ymm3,%ymm1
+ DB 197,253,91,212 ; vcvtps2dq %ymm4,%ymm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,252,16,28,36 ; vmovups (%rsp),%ymm3
+ DB 197,252,16,100,36,32 ; vmovups 0x20(%rsp),%ymm4
+ DB 197,252,16,108,36,64 ; vmovups 0x40(%rsp),%ymm5
+ DB 197,252,16,116,36,96 ; vmovups 0x60(%rsp),%ymm6
+ DB 197,252,16,188,36,128,0,0,0 ; vmovups 0x80(%rsp),%ymm7
+ DB 72,129,196,184,0,0,0 ; add $0xb8,%rsp
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_lab_to_xyz_hsw
_sk_lab_to_xyz_hsw LABEL PROC
- DB 196,98,125,24,5,186,48,0,0 ; vbroadcastss 0x30ba(%rip),%ymm8 # 5c58 <_sk_callback_hsw+0x376>
- DB 196,98,125,24,13,181,48,0,0 ; vbroadcastss 0x30b5(%rip),%ymm9 # 5c5c <_sk_callback_hsw+0x37a>
- DB 196,98,125,24,21,176,48,0,0 ; vbroadcastss 0x30b0(%rip),%ymm10 # 5c60 <_sk_callback_hsw+0x37e>
+ DB 196,98,125,24,5,234,48,0,0 ; vbroadcastss 0x30ea(%rip),%ymm8 # 5e4c <_sk_callback_hsw+0x3a6>
+ DB 196,98,125,24,13,229,48,0,0 ; vbroadcastss 0x30e5(%rip),%ymm9 # 5e50 <_sk_callback_hsw+0x3aa>
+ DB 196,98,125,24,21,224,48,0,0 ; vbroadcastss 0x30e0(%rip),%ymm10 # 5e54 <_sk_callback_hsw+0x3ae>
DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1
DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2
- DB 196,98,125,24,13,161,48,0,0 ; vbroadcastss 0x30a1(%rip),%ymm9 # 5c64 <_sk_callback_hsw+0x382>
+ DB 196,98,125,24,13,209,48,0,0 ; vbroadcastss 0x30d1(%rip),%ymm9 # 5e58 <_sk_callback_hsw+0x3b2>
DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9
- DB 196,226,125,24,5,151,48,0,0 ; vbroadcastss 0x3097(%rip),%ymm0 # 5c68 <_sk_callback_hsw+0x386>
+ DB 196,226,125,24,5,199,48,0,0 ; vbroadcastss 0x30c7(%rip),%ymm0 # 5e5c <_sk_callback_hsw+0x3b6>
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
- DB 196,98,125,24,5,142,48,0,0 ; vbroadcastss 0x308e(%rip),%ymm8 # 5c6c <_sk_callback_hsw+0x38a>
+ DB 196,98,125,24,5,190,48,0,0 ; vbroadcastss 0x30be(%rip),%ymm8 # 5e60 <_sk_callback_hsw+0x3ba>
DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8
- DB 196,98,125,24,13,132,48,0,0 ; vbroadcastss 0x3084(%rip),%ymm9 # 5c70 <_sk_callback_hsw+0x38e>
+ DB 196,98,125,24,13,180,48,0,0 ; vbroadcastss 0x30b4(%rip),%ymm9 # 5e64 <_sk_callback_hsw+0x3be>
DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9
DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
- DB 196,226,125,24,21,113,48,0,0 ; vbroadcastss 0x3071(%rip),%ymm2 # 5c74 <_sk_callback_hsw+0x392>
+ DB 196,226,125,24,21,161,48,0,0 ; vbroadcastss 0x30a1(%rip),%ymm2 # 5e68 <_sk_callback_hsw+0x3c2>
DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10
- DB 196,98,125,24,29,103,48,0,0 ; vbroadcastss 0x3067(%rip),%ymm11 # 5c78 <_sk_callback_hsw+0x396>
+ DB 196,98,125,24,29,151,48,0,0 ; vbroadcastss 0x3097(%rip),%ymm11 # 5e6c <_sk_callback_hsw+0x3c6>
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,37,93,48,0,0 ; vbroadcastss 0x305d(%rip),%ymm12 # 5c7c <_sk_callback_hsw+0x39a>
+ DB 196,98,125,24,37,141,48,0,0 ; vbroadcastss 0x308d(%rip),%ymm12 # 5e70 <_sk_callback_hsw+0x3ca>
DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8
DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -2609,9 +2696,9 @@ _sk_lab_to_xyz_hsw LABEL PROC
DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- DB 196,226,125,24,5,18,48,0,0 ; vbroadcastss 0x3012(%rip),%ymm0 # 5c80 <_sk_callback_hsw+0x39e>
+ DB 196,226,125,24,5,66,48,0,0 ; vbroadcastss 0x3042(%rip),%ymm0 # 5e74 <_sk_callback_hsw+0x3ce>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,9,48,0,0 ; vbroadcastss 0x3009(%rip),%ymm8 # 5c84 <_sk_callback_hsw+0x3a2>
+ DB 196,98,125,24,5,57,48,0,0 ; vbroadcastss 0x3039(%rip),%ymm8 # 5e78 <_sk_callback_hsw+0x3d2>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2626,12 +2713,12 @@ _sk_load_a8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,53 ; jne 2cd2 <_sk_load_a8_hsw+0x4e>
+ DB 117,53 ; jne 2e96 <_sk_load_a8_hsw+0x4e>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,85,53,0,0 ; vpand 0x3555(%rip),%xmm0,%xmm0 # 6200 <_sk_callback_hsw+0x91e>
+ DB 197,249,219,5,145,53,0,0 ; vpand 0x3591(%rip),%xmm0,%xmm0 # 6400 <_sk_callback_hsw+0x95a>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,203,47,0,0 ; vbroadcastss 0x2fcb(%rip),%ymm1 # 5c88 <_sk_callback_hsw+0x3a6>
+ DB 196,226,125,24,13,251,47,0,0 ; vbroadcastss 0x2ffb(%rip),%ymm1 # 5e7c <_sk_callback_hsw+0x3d6>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2644,15 +2731,15 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,189 ; ja 2ca3 <_sk_load_a8_hsw+0x1f>
+ DB 119,189 ; ja 2e67 <_sk_load_a8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 2d68 <_sk_load_a8_hsw+0xe4>
+ DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 2f2c <_sk_load_a8_hsw+0xe4>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,158 ; jmp 2ca3 <_sk_load_a8_hsw+0x1f>
+ DB 235,158 ; jmp 2e67 <_sk_load_a8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -2660,7 +2747,7 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,118,255,255,255 ; jmpq 2ca3 <_sk_load_a8_hsw+0x1f>
+ DB 233,118,255,255,255 ; jmpq 2e67 <_sk_load_a8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -2671,7 +2758,7 @@ _sk_load_a8_hsw LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,59,255,255,255 ; jmpq 2ca3 <_sk_load_a8_hsw+0x1f>
+ DB 233,59,255,255,255 ; jmpq 2e67 <_sk_load_a8_hsw+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -2702,12 +2789,12 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,53 ; jne 2dd2 <_sk_load_a8_dst_hsw+0x4e>
+ DB 117,53 ; jne 2f96 <_sk_load_a8_dst_hsw+0x4e>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,101,52,0,0 ; vpand 0x3465(%rip),%xmm4,%xmm4 # 6210 <_sk_callback_hsw+0x92e>
+ DB 197,217,219,37,161,52,0,0 ; vpand 0x34a1(%rip),%xmm4,%xmm4 # 6410 <_sk_callback_hsw+0x96a>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,207,46,0,0 ; vbroadcastss 0x2ecf(%rip),%ymm5 # 5c8c <_sk_callback_hsw+0x3aa>
+ DB 196,226,125,24,45,255,46,0,0 ; vbroadcastss 0x2eff(%rip),%ymm5 # 5e80 <_sk_callback_hsw+0x3da>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -2720,15 +2807,15 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,189 ; ja 2da3 <_sk_load_a8_dst_hsw+0x1f>
+ DB 119,189 ; ja 2f67 <_sk_load_a8_dst_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 2e68 <_sk_load_a8_dst_hsw+0xe4>
+ DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 302c <_sk_load_a8_dst_hsw+0xe4>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,158 ; jmp 2da3 <_sk_load_a8_dst_hsw+0x1f>
+ DB 235,158 ; jmp 2f67 <_sk_load_a8_dst_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -2736,7 +2823,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,118,255,255,255 ; jmpq 2da3 <_sk_load_a8_dst_hsw+0x1f>
+ DB 233,118,255,255,255 ; jmpq 2f67 <_sk_load_a8_dst_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -2747,7 +2834,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,59,255,255,255 ; jmpq 2da3 <_sk_load_a8_dst_hsw+0x1f>
+ DB 233,59,255,255,255 ; jmpq 2f67 <_sk_load_a8_dst_hsw+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -2806,7 +2893,7 @@ _sk_gather_a8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,86,45,0,0 ; vbroadcastss 0x2d56(%rip),%ymm1 # 5c90 <_sk_callback_hsw+0x3ae>
+ DB 196,226,125,24,13,134,45,0,0 ; vbroadcastss 0x2d86(%rip),%ymm1 # 5e84 <_sk_callback_hsw+0x3de>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2823,14 +2910,14 @@ _sk_store_a8_hsw LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,41,45,0,0 ; vbroadcastss 0x2d29(%rip),%ymm8 # 5c94 <_sk_callback_hsw+0x3b2>
+ DB 196,98,125,24,5,89,45,0,0 ; vbroadcastss 0x2d59(%rip),%ymm8 # 5e88 <_sk_callback_hsw+0x3e2>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 2f95 <_sk_store_a8_hsw+0x47>
+ DB 117,11 ; jne 3159 <_sk_store_a8_hsw+0x47>
DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -2839,25 +2926,25 @@ _sk_store_a8_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 2f90 <_sk_store_a8_hsw+0x42>
+ DB 119,235 ; ja 3154 <_sk_store_a8_hsw+0x42>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 300c <_sk_store_a8_hsw+0xbe>
+ DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 31d0 <_sk_store_a8_hsw+0xbe>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,201 ; jmp 2f90 <_sk_store_a8_hsw+0x42>
+ DB 235,201 ; jmp 3154 <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,72,50,0,0 ; vpshufb 0x3248(%rip),%xmm8,%xmm8 # 6220 <_sk_callback_hsw+0x93e>
+ DB 196,98,57,0,5,132,50,0,0 ; vpshufb 0x3284(%rip),%xmm8,%xmm8 # 6420 <_sk_callback_hsw+0x97a>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,175 ; jmp 2f90 <_sk_store_a8_hsw+0x42>
+ DB 235,175 ; jmp 3154 <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,46,50,0,0 ; vpshufb 0x322e(%rip),%xmm8,%xmm8 # 6230 <_sk_callback_hsw+0x94e>
+ DB 196,98,57,0,5,106,50,0,0 ; vpshufb 0x326a(%rip),%xmm8,%xmm8 # 6430 <_sk_callback_hsw+0x98a>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
- DB 235,134 ; jmp 2f90 <_sk_store_a8_hsw+0x42>
+ DB 235,134 ; jmp 3154 <_sk_store_a8_hsw+0x42>
DB 102,144 ; xchg %ax,%ax
DB 178,255 ; mov $0xff,%dl
DB 255 ; (bad)
@@ -2889,15 +2976,15 @@ _sk_load_g8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,58 ; jne 307b <_sk_load_g8_hsw+0x53>
+ DB 117,58 ; jne 323f <_sk_load_g8_hsw+0x53>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,241,49,0,0 ; vpand 0x31f1(%rip),%xmm0,%xmm0 # 6240 <_sk_callback_hsw+0x95e>
+ DB 197,249,219,5,45,50,0,0 ; vpand 0x322d(%rip),%xmm0,%xmm0 # 6440 <_sk_callback_hsw+0x99a>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,55,44,0,0 ; vbroadcastss 0x2c37(%rip),%ymm1 # 5c98 <_sk_callback_hsw+0x3b6>
+ DB 196,226,125,24,13,103,44,0,0 ; vbroadcastss 0x2c67(%rip),%ymm1 # 5e8c <_sk_callback_hsw+0x3e6>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,44,44,0,0 ; vbroadcastss 0x2c2c(%rip),%ymm3 # 5c9c <_sk_callback_hsw+0x3ba>
+ DB 196,226,125,24,29,92,44,0,0 ; vbroadcastss 0x2c5c(%rip),%ymm3 # 5e90 <_sk_callback_hsw+0x3ea>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -2907,15 +2994,15 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,184 ; ja 3047 <_sk_load_g8_hsw+0x1f>
+ DB 119,184 ; ja 320b <_sk_load_g8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3114 <_sk_load_g8_hsw+0xec>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 32d8 <_sk_load_g8_hsw+0xec>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,153 ; jmp 3047 <_sk_load_g8_hsw+0x1f>
+ DB 235,153 ; jmp 320b <_sk_load_g8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -2923,7 +3010,7 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,113,255,255,255 ; jmpq 3047 <_sk_load_g8_hsw+0x1f>
+ DB 233,113,255,255,255 ; jmpq 320b <_sk_load_g8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -2934,7 +3021,7 @@ _sk_load_g8_hsw LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,54,255,255,255 ; jmpq 3047 <_sk_load_g8_hsw+0x1f>
+ DB 233,54,255,255,255 ; jmpq 320b <_sk_load_g8_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -2966,15 +3053,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,58 ; jne 3183 <_sk_load_g8_dst_hsw+0x53>
+ DB 117,58 ; jne 3347 <_sk_load_g8_dst_hsw+0x53>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,249,48,0,0 ; vpand 0x30f9(%rip),%xmm4,%xmm4 # 6250 <_sk_callback_hsw+0x96e>
+ DB 197,217,219,37,53,49,0,0 ; vpand 0x3135(%rip),%xmm4,%xmm4 # 6450 <_sk_callback_hsw+0x9aa>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,55,43,0,0 ; vbroadcastss 0x2b37(%rip),%ymm5 # 5ca0 <_sk_callback_hsw+0x3be>
+ DB 196,226,125,24,45,103,43,0,0 ; vbroadcastss 0x2b67(%rip),%ymm5 # 5e94 <_sk_callback_hsw+0x3ee>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,44,43,0,0 ; vbroadcastss 0x2b2c(%rip),%ymm7 # 5ca4 <_sk_callback_hsw+0x3c2>
+ DB 196,226,125,24,61,92,43,0,0 ; vbroadcastss 0x2b5c(%rip),%ymm7 # 5e98 <_sk_callback_hsw+0x3f2>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -2984,15 +3071,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,184 ; ja 314f <_sk_load_g8_dst_hsw+0x1f>
+ DB 119,184 ; ja 3313 <_sk_load_g8_dst_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 321c <_sk_load_g8_dst_hsw+0xec>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 33e0 <_sk_load_g8_dst_hsw+0xec>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,153 ; jmp 314f <_sk_load_g8_dst_hsw+0x1f>
+ DB 235,153 ; jmp 3313 <_sk_load_g8_dst_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -3000,7 +3087,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,113,255,255,255 ; jmpq 314f <_sk_load_g8_dst_hsw+0x1f>
+ DB 233,113,255,255,255 ; jmpq 3313 <_sk_load_g8_dst_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -3011,7 +3098,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,54,255,255,255 ; jmpq 314f <_sk_load_g8_dst_hsw+0x1f>
+ DB 233,54,255,255,255 ; jmpq 3313 <_sk_load_g8_dst_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -3071,10 +3158,10 @@ _sk_gather_g8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,186,41,0,0 ; vbroadcastss 0x29ba(%rip),%ymm1 # 5ca8 <_sk_callback_hsw+0x3c6>
+ DB 196,226,125,24,13,234,41,0,0 ; vbroadcastss 0x29ea(%rip),%ymm1 # 5e9c <_sk_callback_hsw+0x3f6>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,175,41,0,0 ; vbroadcastss 0x29af(%rip),%ymm3 # 5cac <_sk_callback_hsw+0x3ca>
+ DB 196,226,125,24,29,223,41,0,0 ; vbroadcastss 0x29df(%rip),%ymm3 # 5ea0 <_sk_callback_hsw+0x3fa>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -3090,26 +3177,26 @@ _sk_load_565_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,115 ; jne 3396 <_sk_load_565_hsw+0x8f>
+ DB 117,115 ; jne 355a <_sk_load_565_hsw+0x8f>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,121,41,0,0 ; vpbroadcastd 0x2979(%rip),%ymm0 # 5cb0 <_sk_callback_hsw+0x3ce>
+ DB 196,226,125,88,5,169,41,0,0 ; vpbroadcastd 0x29a9(%rip),%ymm0 # 5ea4 <_sk_callback_hsw+0x3fe>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,108,41,0,0 ; vbroadcastss 0x296c(%rip),%ymm1 # 5cb4 <_sk_callback_hsw+0x3d2>
+ DB 196,226,125,24,13,156,41,0,0 ; vbroadcastss 0x299c(%rip),%ymm1 # 5ea8 <_sk_callback_hsw+0x402>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,99,41,0,0 ; vpbroadcastd 0x2963(%rip),%ymm1 # 5cb8 <_sk_callback_hsw+0x3d6>
+ DB 196,226,125,88,13,147,41,0,0 ; vpbroadcastd 0x2993(%rip),%ymm1 # 5eac <_sk_callback_hsw+0x406>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,86,41,0,0 ; vbroadcastss 0x2956(%rip),%ymm3 # 5cbc <_sk_callback_hsw+0x3da>
+ DB 196,226,125,24,29,134,41,0,0 ; vbroadcastss 0x2986(%rip),%ymm3 # 5eb0 <_sk_callback_hsw+0x40a>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,77,41,0,0 ; vpbroadcastd 0x294d(%rip),%ymm3 # 5cc0 <_sk_callback_hsw+0x3de>
+ DB 196,226,125,88,29,125,41,0,0 ; vpbroadcastd 0x297d(%rip),%ymm3 # 5eb4 <_sk_callback_hsw+0x40e>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,64,41,0,0 ; vbroadcastss 0x2940(%rip),%ymm3 # 5cc4 <_sk_callback_hsw+0x3e2>
+ DB 196,226,125,24,29,112,41,0,0 ; vbroadcastss 0x2970(%rip),%ymm3 # 5eb8 <_sk_callback_hsw+0x412>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,53,41,0,0 ; vbroadcastss 0x2935(%rip),%ymm3 # 5cc8 <_sk_callback_hsw+0x3e6>
+ DB 196,226,125,24,29,101,41,0,0 ; vbroadcastss 0x2965(%rip),%ymm3 # 5ebc <_sk_callback_hsw+0x416>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3117,27 +3204,27 @@ _sk_load_565_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,123,255,255,255 ; ja 3329 <_sk_load_565_hsw+0x22>
+ DB 15,135,123,255,255,255 ; ja 34ed <_sk_load_565_hsw+0x22>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 341c <_sk_load_565_hsw+0x115>
+ DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 35e0 <_sk_load_565_hsw+0x115>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,89,255,255,255 ; jmpq 3329 <_sk_load_565_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 34ed <_sk_load_565_hsw+0x22>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,60,255,255,255 ; jmpq 3329 <_sk_load_565_hsw+0x22>
+ DB 233,60,255,255,255 ; jmpq 34ed <_sk_load_565_hsw+0x22>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,15,255,255,255 ; jmpq 3329 <_sk_load_565_hsw+0x22>
+ DB 233,15,255,255,255 ; jmpq 34ed <_sk_load_565_hsw+0x22>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3169,26 +3256,26 @@ _sk_load_565_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,115 ; jne 34c7 <_sk_load_565_dst_hsw+0x8f>
+ DB 117,115 ; jne 368b <_sk_load_565_dst_hsw+0x8f>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,244 ; vpmovzxwd %xmm4,%ymm6
- DB 196,226,125,88,37,100,40,0,0 ; vpbroadcastd 0x2864(%rip),%ymm4 # 5ccc <_sk_callback_hsw+0x3ea>
+ DB 196,226,125,88,37,148,40,0,0 ; vpbroadcastd 0x2894(%rip),%ymm4 # 5ec0 <_sk_callback_hsw+0x41a>
DB 197,205,219,228 ; vpand %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,87,40,0,0 ; vbroadcastss 0x2857(%rip),%ymm5 # 5cd0 <_sk_callback_hsw+0x3ee>
+ DB 196,226,125,24,45,135,40,0,0 ; vbroadcastss 0x2887(%rip),%ymm5 # 5ec4 <_sk_callback_hsw+0x41e>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,78,40,0,0 ; vpbroadcastd 0x284e(%rip),%ymm5 # 5cd4 <_sk_callback_hsw+0x3f2>
+ DB 196,226,125,88,45,126,40,0,0 ; vpbroadcastd 0x287e(%rip),%ymm5 # 5ec8 <_sk_callback_hsw+0x422>
DB 197,205,219,237 ; vpand %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,65,40,0,0 ; vbroadcastss 0x2841(%rip),%ymm7 # 5cd8 <_sk_callback_hsw+0x3f6>
+ DB 196,226,125,24,61,113,40,0,0 ; vbroadcastss 0x2871(%rip),%ymm7 # 5ecc <_sk_callback_hsw+0x426>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,88,61,56,40,0,0 ; vpbroadcastd 0x2838(%rip),%ymm7 # 5cdc <_sk_callback_hsw+0x3fa>
+ DB 196,226,125,88,61,104,40,0,0 ; vpbroadcastd 0x2868(%rip),%ymm7 # 5ed0 <_sk_callback_hsw+0x42a>
DB 197,205,219,247 ; vpand %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,43,40,0,0 ; vbroadcastss 0x282b(%rip),%ymm7 # 5ce0 <_sk_callback_hsw+0x3fe>
+ DB 196,226,125,24,61,91,40,0,0 ; vbroadcastss 0x285b(%rip),%ymm7 # 5ed4 <_sk_callback_hsw+0x42e>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,32,40,0,0 ; vbroadcastss 0x2820(%rip),%ymm7 # 5ce4 <_sk_callback_hsw+0x402>
+ DB 196,226,125,24,61,80,40,0,0 ; vbroadcastss 0x2850(%rip),%ymm7 # 5ed8 <_sk_callback_hsw+0x432>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3196,27 +3283,27 @@ _sk_load_565_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,123,255,255,255 ; ja 345a <_sk_load_565_dst_hsw+0x22>
+ DB 15,135,123,255,255,255 ; ja 361e <_sk_load_565_dst_hsw+0x22>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 354c <_sk_load_565_dst_hsw+0x114>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3710 <_sk_load_565_dst_hsw+0x114>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,89,255,255,255 ; jmpq 345a <_sk_load_565_dst_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 361e <_sk_load_565_dst_hsw+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,60,255,255,255 ; jmpq 345a <_sk_load_565_dst_hsw+0x22>
+ DB 233,60,255,255,255 ; jmpq 361e <_sk_load_565_dst_hsw+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,15,255,255,255 ; jmpq 345a <_sk_load_565_dst_hsw+0x22>
+ DB 233,15,255,255,255 ; jmpq 361e <_sk_load_565_dst_hsw+0x22>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3277,23 +3364,23 @@ _sk_gather_565_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,207,38,0,0 ; vpbroadcastd 0x26cf(%rip),%ymm0 # 5ce8 <_sk_callback_hsw+0x406>
+ DB 196,226,125,88,5,255,38,0,0 ; vpbroadcastd 0x26ff(%rip),%ymm0 # 5edc <_sk_callback_hsw+0x436>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,194,38,0,0 ; vbroadcastss 0x26c2(%rip),%ymm1 # 5cec <_sk_callback_hsw+0x40a>
+ DB 196,226,125,24,13,242,38,0,0 ; vbroadcastss 0x26f2(%rip),%ymm1 # 5ee0 <_sk_callback_hsw+0x43a>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,185,38,0,0 ; vpbroadcastd 0x26b9(%rip),%ymm1 # 5cf0 <_sk_callback_hsw+0x40e>
+ DB 196,226,125,88,13,233,38,0,0 ; vpbroadcastd 0x26e9(%rip),%ymm1 # 5ee4 <_sk_callback_hsw+0x43e>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,172,38,0,0 ; vbroadcastss 0x26ac(%rip),%ymm3 # 5cf4 <_sk_callback_hsw+0x412>
+ DB 196,226,125,24,29,220,38,0,0 ; vbroadcastss 0x26dc(%rip),%ymm3 # 5ee8 <_sk_callback_hsw+0x442>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,163,38,0,0 ; vpbroadcastd 0x26a3(%rip),%ymm3 # 5cf8 <_sk_callback_hsw+0x416>
+ DB 196,226,125,88,29,211,38,0,0 ; vpbroadcastd 0x26d3(%rip),%ymm3 # 5eec <_sk_callback_hsw+0x446>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,150,38,0,0 ; vbroadcastss 0x2696(%rip),%ymm3 # 5cfc <_sk_callback_hsw+0x41a>
+ DB 196,226,125,24,29,198,38,0,0 ; vbroadcastss 0x26c6(%rip),%ymm3 # 5ef0 <_sk_callback_hsw+0x44a>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,139,38,0,0 ; vbroadcastss 0x268b(%rip),%ymm3 # 5d00 <_sk_callback_hsw+0x41e>
+ DB 196,226,125,24,29,187,38,0,0 ; vbroadcastss 0x26bb(%rip),%ymm3 # 5ef4 <_sk_callback_hsw+0x44e>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_hsw
@@ -3306,11 +3393,11 @@ _sk_store_565_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,109,38,0,0 ; vbroadcastss 0x266d(%rip),%ymm8 # 5d04 <_sk_callback_hsw+0x422>
+ DB 196,98,125,24,5,157,38,0,0 ; vbroadcastss 0x269d(%rip),%ymm8 # 5ef8 <_sk_callback_hsw+0x452>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9
- DB 196,98,125,24,21,88,38,0,0 ; vbroadcastss 0x2658(%rip),%ymm10 # 5d08 <_sk_callback_hsw+0x426>
+ DB 196,98,125,24,21,136,38,0,0 ; vbroadcastss 0x2688(%rip),%ymm10 # 5efc <_sk_callback_hsw+0x456>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10
@@ -3321,7 +3408,7 @@ _sk_store_565_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 36ef <_sk_store_565_hsw+0x78>
+ DB 117,11 ; jne 38b3 <_sk_store_565_hsw+0x78>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3330,22 +3417,22 @@ _sk_store_565_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 36ea <_sk_store_565_hsw+0x73>
+ DB 119,235 ; ja 38ae <_sk_store_565_hsw+0x73>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 374c <_sk_store_565_hsw+0xd5>
+ DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3910 <_sk_store_565_hsw+0xd5>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 36ea <_sk_store_565_hsw+0x73>
+ DB 235,206 ; jmp 38ae <_sk_store_565_hsw+0x73>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 36ea <_sk_store_565_hsw+0x73>
+ DB 235,190 ; jmp 38ae <_sk_store_565_hsw+0x73>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 36ea <_sk_store_565_hsw+0x73>
+ DB 235,158 ; jmp 38ae <_sk_store_565_hsw+0x73>
DB 199 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3363,7 +3450,7 @@ _sk_store_565_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe1003764 <_sk_callback_hsw+0xffffffffe0ffde82>
+ DB 232,255,255,255,224 ; callq ffffffffe1003928 <_sk_callback_hsw+0xffffffffe0ffde82>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3379,28 +3466,28 @@ _sk_load_4444_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,139,0,0,0 ; jne 3813 <_sk_load_4444_hsw+0xab>
+ DB 15,133,139,0,0,0 ; jne 39d7 <_sk_load_4444_hsw+0xab>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,112,37,0,0 ; vpbroadcastd 0x2570(%rip),%ymm0 # 5d0c <_sk_callback_hsw+0x42a>
+ DB 196,226,125,88,5,160,37,0,0 ; vpbroadcastd 0x25a0(%rip),%ymm0 # 5f00 <_sk_callback_hsw+0x45a>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,99,37,0,0 ; vbroadcastss 0x2563(%rip),%ymm1 # 5d10 <_sk_callback_hsw+0x42e>
+ DB 196,226,125,24,13,147,37,0,0 ; vbroadcastss 0x2593(%rip),%ymm1 # 5f04 <_sk_callback_hsw+0x45e>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,90,37,0,0 ; vpbroadcastd 0x255a(%rip),%ymm1 # 5d14 <_sk_callback_hsw+0x432>
+ DB 196,226,125,88,13,138,37,0,0 ; vpbroadcastd 0x258a(%rip),%ymm1 # 5f08 <_sk_callback_hsw+0x462>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,77,37,0,0 ; vbroadcastss 0x254d(%rip),%ymm2 # 5d18 <_sk_callback_hsw+0x436>
+ DB 196,226,125,24,21,125,37,0,0 ; vbroadcastss 0x257d(%rip),%ymm2 # 5f0c <_sk_callback_hsw+0x466>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,68,37,0,0 ; vpbroadcastd 0x2544(%rip),%ymm2 # 5d1c <_sk_callback_hsw+0x43a>
+ DB 196,226,125,88,21,116,37,0,0 ; vpbroadcastd 0x2574(%rip),%ymm2 # 5f10 <_sk_callback_hsw+0x46a>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,55,37,0,0 ; vbroadcastss 0x2537(%rip),%ymm8 # 5d20 <_sk_callback_hsw+0x43e>
+ DB 196,98,125,24,5,103,37,0,0 ; vbroadcastss 0x2567(%rip),%ymm8 # 5f14 <_sk_callback_hsw+0x46e>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,45,37,0,0 ; vpbroadcastd 0x252d(%rip),%ymm8 # 5d24 <_sk_callback_hsw+0x442>
+ DB 196,98,125,88,5,93,37,0,0 ; vpbroadcastd 0x255d(%rip),%ymm8 # 5f18 <_sk_callback_hsw+0x472>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,31,37,0,0 ; vbroadcastss 0x251f(%rip),%ymm8 # 5d28 <_sk_callback_hsw+0x446>
+ DB 196,98,125,24,5,79,37,0,0 ; vbroadcastss 0x254f(%rip),%ymm8 # 5f1c <_sk_callback_hsw+0x476>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3410,27 +3497,27 @@ _sk_load_4444_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,99,255,255,255 ; ja 378e <_sk_load_4444_hsw+0x26>
+ DB 15,135,99,255,255,255 ; ja 3952 <_sk_load_4444_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3898 <_sk_load_4444_hsw+0x130>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3a5c <_sk_load_4444_hsw+0x130>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,65,255,255,255 ; jmpq 378e <_sk_load_4444_hsw+0x26>
+ DB 233,65,255,255,255 ; jmpq 3952 <_sk_load_4444_hsw+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,36,255,255,255 ; jmpq 378e <_sk_load_4444_hsw+0x26>
+ DB 233,36,255,255,255 ; jmpq 3952 <_sk_load_4444_hsw+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,247,254,255,255 ; jmpq 378e <_sk_load_4444_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 3952 <_sk_load_4444_hsw+0x26>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3463,28 +3550,28 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,139,0,0,0 ; jne 395f <_sk_load_4444_dst_hsw+0xab>
+ DB 15,133,139,0,0,0 ; jne 3b23 <_sk_load_4444_dst_hsw+0xab>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,252 ; vpmovzxwd %xmm4,%ymm7
- DB 196,226,125,88,37,68,36,0,0 ; vpbroadcastd 0x2444(%rip),%ymm4 # 5d2c <_sk_callback_hsw+0x44a>
+ DB 196,226,125,88,37,116,36,0,0 ; vpbroadcastd 0x2474(%rip),%ymm4 # 5f20 <_sk_callback_hsw+0x47a>
DB 197,197,219,228 ; vpand %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,55,36,0,0 ; vbroadcastss 0x2437(%rip),%ymm5 # 5d30 <_sk_callback_hsw+0x44e>
+ DB 196,226,125,24,45,103,36,0,0 ; vbroadcastss 0x2467(%rip),%ymm5 # 5f24 <_sk_callback_hsw+0x47e>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,46,36,0,0 ; vpbroadcastd 0x242e(%rip),%ymm5 # 5d34 <_sk_callback_hsw+0x452>
+ DB 196,226,125,88,45,94,36,0,0 ; vpbroadcastd 0x245e(%rip),%ymm5 # 5f28 <_sk_callback_hsw+0x482>
DB 197,197,219,237 ; vpand %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,33,36,0,0 ; vbroadcastss 0x2421(%rip),%ymm6 # 5d38 <_sk_callback_hsw+0x456>
+ DB 196,226,125,24,53,81,36,0,0 ; vbroadcastss 0x2451(%rip),%ymm6 # 5f2c <_sk_callback_hsw+0x486>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,88,53,24,36,0,0 ; vpbroadcastd 0x2418(%rip),%ymm6 # 5d3c <_sk_callback_hsw+0x45a>
+ DB 196,226,125,88,53,72,36,0,0 ; vpbroadcastd 0x2448(%rip),%ymm6 # 5f30 <_sk_callback_hsw+0x48a>
DB 197,197,219,246 ; vpand %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,11,36,0,0 ; vbroadcastss 0x240b(%rip),%ymm8 # 5d40 <_sk_callback_hsw+0x45e>
+ DB 196,98,125,24,5,59,36,0,0 ; vbroadcastss 0x243b(%rip),%ymm8 # 5f34 <_sk_callback_hsw+0x48e>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,88,5,1,36,0,0 ; vpbroadcastd 0x2401(%rip),%ymm8 # 5d44 <_sk_callback_hsw+0x462>
+ DB 196,98,125,88,5,49,36,0,0 ; vpbroadcastd 0x2431(%rip),%ymm8 # 5f38 <_sk_callback_hsw+0x492>
DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,243,35,0,0 ; vbroadcastss 0x23f3(%rip),%ymm8 # 5d48 <_sk_callback_hsw+0x466>
+ DB 196,98,125,24,5,35,36,0,0 ; vbroadcastss 0x2423(%rip),%ymm8 # 5f3c <_sk_callback_hsw+0x496>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3494,27 +3581,27 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,99,255,255,255 ; ja 38da <_sk_load_4444_dst_hsw+0x26>
+ DB 15,135,99,255,255,255 ; ja 3a9e <_sk_load_4444_dst_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 39e4 <_sk_load_4444_dst_hsw+0x130>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3ba8 <_sk_load_4444_dst_hsw+0x130>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,65,255,255,255 ; jmpq 38da <_sk_load_4444_dst_hsw+0x26>
+ DB 233,65,255,255,255 ; jmpq 3a9e <_sk_load_4444_dst_hsw+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,36,255,255,255 ; jmpq 38da <_sk_load_4444_dst_hsw+0x26>
+ DB 233,36,255,255,255 ; jmpq 3a9e <_sk_load_4444_dst_hsw+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,247,254,255,255 ; jmpq 38da <_sk_load_4444_dst_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 3a9e <_sk_load_4444_dst_hsw+0x26>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3575,25 +3662,25 @@ _sk_gather_4444_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,155,34,0,0 ; vpbroadcastd 0x229b(%rip),%ymm0 # 5d4c <_sk_callback_hsw+0x46a>
+ DB 196,226,125,88,5,203,34,0,0 ; vpbroadcastd 0x22cb(%rip),%ymm0 # 5f40 <_sk_callback_hsw+0x49a>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,142,34,0,0 ; vbroadcastss 0x228e(%rip),%ymm1 # 5d50 <_sk_callback_hsw+0x46e>
+ DB 196,226,125,24,13,190,34,0,0 ; vbroadcastss 0x22be(%rip),%ymm1 # 5f44 <_sk_callback_hsw+0x49e>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,133,34,0,0 ; vpbroadcastd 0x2285(%rip),%ymm1 # 5d54 <_sk_callback_hsw+0x472>
+ DB 196,226,125,88,13,181,34,0,0 ; vpbroadcastd 0x22b5(%rip),%ymm1 # 5f48 <_sk_callback_hsw+0x4a2>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,120,34,0,0 ; vbroadcastss 0x2278(%rip),%ymm2 # 5d58 <_sk_callback_hsw+0x476>
+ DB 196,226,125,24,21,168,34,0,0 ; vbroadcastss 0x22a8(%rip),%ymm2 # 5f4c <_sk_callback_hsw+0x4a6>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,111,34,0,0 ; vpbroadcastd 0x226f(%rip),%ymm2 # 5d5c <_sk_callback_hsw+0x47a>
+ DB 196,226,125,88,21,159,34,0,0 ; vpbroadcastd 0x229f(%rip),%ymm2 # 5f50 <_sk_callback_hsw+0x4aa>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,98,34,0,0 ; vbroadcastss 0x2262(%rip),%ymm8 # 5d60 <_sk_callback_hsw+0x47e>
+ DB 196,98,125,24,5,146,34,0,0 ; vbroadcastss 0x2292(%rip),%ymm8 # 5f54 <_sk_callback_hsw+0x4ae>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,88,34,0,0 ; vpbroadcastd 0x2258(%rip),%ymm8 # 5d64 <_sk_callback_hsw+0x482>
+ DB 196,98,125,88,5,136,34,0,0 ; vpbroadcastd 0x2288(%rip),%ymm8 # 5f58 <_sk_callback_hsw+0x4b2>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,74,34,0,0 ; vbroadcastss 0x224a(%rip),%ymm8 # 5d68 <_sk_callback_hsw+0x486>
+ DB 196,98,125,24,5,122,34,0,0 ; vbroadcastss 0x227a(%rip),%ymm8 # 5f5c <_sk_callback_hsw+0x4b6>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3608,7 +3695,7 @@ _sk_store_4444_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,37,34,0,0 ; vbroadcastss 0x2225(%rip),%ymm8 # 5d6c <_sk_callback_hsw+0x48a>
+ DB 196,98,125,24,5,85,34,0,0 ; vbroadcastss 0x2255(%rip),%ymm8 # 5f60 <_sk_callback_hsw+0x4ba>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9
@@ -3626,7 +3713,7 @@ _sk_store_4444_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 3bab <_sk_store_4444_hsw+0x84>
+ DB 117,11 ; jne 3d6f <_sk_store_4444_hsw+0x84>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3635,22 +3722,22 @@ _sk_store_4444_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 3ba6 <_sk_store_4444_hsw+0x7f>
+ DB 119,235 ; ja 3d6a <_sk_store_4444_hsw+0x7f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3c08 <_sk_store_4444_hsw+0xe1>
+ DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3dcc <_sk_store_4444_hsw+0xe1>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 3ba6 <_sk_store_4444_hsw+0x7f>
+ DB 235,206 ; jmp 3d6a <_sk_store_4444_hsw+0x7f>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 3ba6 <_sk_store_4444_hsw+0x7f>
+ DB 235,190 ; jmp 3d6a <_sk_store_4444_hsw+0x7f>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 3ba6 <_sk_store_4444_hsw+0x7f>
+ DB 235,158 ; jmp 3d6a <_sk_store_4444_hsw+0x7f>
DB 199 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3668,7 +3755,7 @@ _sk_store_4444_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe1003c20 <_sk_callback_hsw+0xffffffffe0ffe33e>
+ DB 232,255,255,255,224 ; callq ffffffffe1003de4 <_sk_callback_hsw+0xffffffffe0ffe33e>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3685,16 +3772,16 @@ _sk_load_8888_hsw LABEL PROC
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 3c9e <_sk_load_8888_hsw+0x7a>
+ DB 117,87 ; jne 3e62 <_sk_load_8888_hsw+0x7a>
DB 197,252,16,24 ; vmovups (%rax),%ymm3
- DB 197,228,84,5,45,35,0,0 ; vandps 0x232d(%rip),%ymm3,%ymm0 # 5f80 <_sk_callback_hsw+0x69e>
+ DB 197,228,84,5,105,35,0,0 ; vandps 0x2369(%rip),%ymm3,%ymm0 # 6180 <_sk_callback_hsw+0x6da>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,16,33,0,0 ; vbroadcastss 0x2110(%rip),%ymm8 # 5d70 <_sk_callback_hsw+0x48e>
+ DB 196,98,125,24,5,64,33,0,0 ; vbroadcastss 0x2140(%rip),%ymm8 # 5f64 <_sk_callback_hsw+0x4be>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,50,35,0,0 ; vpshufb 0x2332(%rip),%ymm3,%ymm1 # 5fa0 <_sk_callback_hsw+0x6be>
+ DB 196,226,101,0,13,110,35,0,0 ; vpshufb 0x236e(%rip),%ymm3,%ymm1 # 61a0 <_sk_callback_hsw+0x6fa>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,64,35,0,0 ; vpshufb 0x2340(%rip),%ymm3,%ymm2 # 5fc0 <_sk_callback_hsw+0x6de>
+ DB 196,226,101,0,21,124,35,0,0 ; vpshufb 0x237c(%rip),%ymm3,%ymm2 # 61c0 <_sk_callback_hsw+0x71a>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3711,7 +3798,7 @@ _sk_load_8888_hsw LABEL PROC
DB 196,193,249,110,194 ; vmovq %r10,%xmm0
DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0
DB 196,226,125,44,24 ; vmaskmovps (%rax),%ymm0,%ymm3
- DB 235,135 ; jmp 3c4b <_sk_load_8888_hsw+0x27>
+ DB 235,135 ; jmp 3e0f <_sk_load_8888_hsw+0x27>
PUBLIC _sk_load_8888_dst_hsw
_sk_load_8888_dst_hsw LABEL PROC
@@ -3725,16 +3812,16 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 3d3e <_sk_load_8888_dst_hsw+0x7a>
+ DB 117,87 ; jne 3f02 <_sk_load_8888_dst_hsw+0x7a>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,196,84,37,237,34,0,0 ; vandps 0x22ed(%rip),%ymm7,%ymm4 # 5fe0 <_sk_callback_hsw+0x6fe>
+ DB 197,196,84,37,41,35,0,0 ; vandps 0x2329(%rip),%ymm7,%ymm4 # 61e0 <_sk_callback_hsw+0x73a>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,116,32,0,0 ; vbroadcastss 0x2074(%rip),%ymm8 # 5d74 <_sk_callback_hsw+0x492>
+ DB 196,98,125,24,5,164,32,0,0 ; vbroadcastss 0x20a4(%rip),%ymm8 # 5f68 <_sk_callback_hsw+0x4c2>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
- DB 196,226,69,0,45,242,34,0,0 ; vpshufb 0x22f2(%rip),%ymm7,%ymm5 # 6000 <_sk_callback_hsw+0x71e>
+ DB 196,226,69,0,45,46,35,0,0 ; vpshufb 0x232e(%rip),%ymm7,%ymm5 # 6200 <_sk_callback_hsw+0x75a>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
DB 196,193,84,89,232 ; vmulps %ymm8,%ymm5,%ymm5
- DB 196,226,69,0,53,0,35,0,0 ; vpshufb 0x2300(%rip),%ymm7,%ymm6 # 6020 <_sk_callback_hsw+0x73e>
+ DB 196,226,69,0,53,60,35,0,0 ; vpshufb 0x233c(%rip),%ymm7,%ymm6 # 6220 <_sk_callback_hsw+0x77a>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -3751,7 +3838,7 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 196,193,249,110,226 ; vmovq %r10,%xmm4
DB 196,226,125,33,228 ; vpmovsxbd %xmm4,%ymm4
DB 196,226,93,44,56 ; vmaskmovps (%rax),%ymm4,%ymm7
- DB 235,135 ; jmp 3ceb <_sk_load_8888_dst_hsw+0x27>
+ DB 235,135 ; jmp 3eaf <_sk_load_8888_dst_hsw+0x27>
PUBLIC _sk_gather_8888_hsw
_sk_gather_8888_hsw LABEL PROC
@@ -3764,14 +3851,14 @@ _sk_gather_8888_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,174,34,0,0 ; vpand 0x22ae(%rip),%ymm3,%ymm0 # 6040 <_sk_callback_hsw+0x75e>
+ DB 197,229,219,5,234,34,0,0 ; vpand 0x22ea(%rip),%ymm3,%ymm0 # 6240 <_sk_callback_hsw+0x79a>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,217,31,0,0 ; vbroadcastss 0x1fd9(%rip),%ymm8 # 5d78 <_sk_callback_hsw+0x496>
+ DB 196,98,125,24,5,9,32,0,0 ; vbroadcastss 0x2009(%rip),%ymm8 # 5f6c <_sk_callback_hsw+0x4c6>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,179,34,0,0 ; vpshufb 0x22b3(%rip),%ymm3,%ymm1 # 6060 <_sk_callback_hsw+0x77e>
+ DB 196,226,101,0,13,239,34,0,0 ; vpshufb 0x22ef(%rip),%ymm3,%ymm1 # 6260 <_sk_callback_hsw+0x7ba>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,193,34,0,0 ; vpshufb 0x22c1(%rip),%ymm3,%ymm2 # 6080 <_sk_callback_hsw+0x79e>
+ DB 196,226,101,0,21,253,34,0,0 ; vpshufb 0x22fd(%rip),%ymm3,%ymm2 # 6280 <_sk_callback_hsw+0x7da>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3791,7 +3878,7 @@ _sk_store_8888_hsw LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
- DB 196,98,125,24,5,123,31,0,0 ; vbroadcastss 0x1f7b(%rip),%ymm8 # 5d7c <_sk_callback_hsw+0x49a>
+ DB 196,98,125,24,5,171,31,0,0 ; vbroadcastss 0x1fab(%rip),%ymm8 # 5f70 <_sk_callback_hsw+0x4ca>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -3807,7 +3894,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 3e5a <_sk_store_8888_hsw+0x80>
+ DB 117,11 ; jne 401e <_sk_store_8888_hsw+0x80>
DB 197,124,17,0 ; vmovups %ymm8,(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -3820,7 +3907,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,65,249,110,202 ; vmovq %r10,%xmm9
DB 196,66,125,33,201 ; vpmovsxbd %xmm9,%ymm9
DB 196,98,53,46,0 ; vmaskmovps %ymm8,%ymm9,(%rax)
- DB 235,211 ; jmp 3e53 <_sk_store_8888_hsw+0x79>
+ DB 235,211 ; jmp 4017 <_sk_store_8888_hsw+0x79>
PUBLIC _sk_load_bgra_hsw
_sk_load_bgra_hsw LABEL PROC
@@ -3834,16 +3921,16 @@ _sk_load_bgra_hsw LABEL PROC
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 3efa <_sk_load_bgra_hsw+0x7a>
+ DB 117,87 ; jne 40be <_sk_load_bgra_hsw+0x7a>
DB 197,252,16,24 ; vmovups (%rax),%ymm3
- DB 197,228,84,5,241,33,0,0 ; vandps 0x21f1(%rip),%ymm3,%ymm0 # 60a0 <_sk_callback_hsw+0x7be>
+ DB 197,228,84,5,45,34,0,0 ; vandps 0x222d(%rip),%ymm3,%ymm0 # 62a0 <_sk_callback_hsw+0x7fa>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,196,30,0,0 ; vbroadcastss 0x1ec4(%rip),%ymm8 # 5d80 <_sk_callback_hsw+0x49e>
+ DB 196,98,125,24,5,244,30,0,0 ; vbroadcastss 0x1ef4(%rip),%ymm8 # 5f74 <_sk_callback_hsw+0x4ce>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,246,33,0,0 ; vpshufb 0x21f6(%rip),%ymm3,%ymm0 # 60c0 <_sk_callback_hsw+0x7de>
+ DB 196,226,101,0,5,50,34,0,0 ; vpshufb 0x2232(%rip),%ymm3,%ymm0 # 62c0 <_sk_callback_hsw+0x81a>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,4,34,0,0 ; vpshufb 0x2204(%rip),%ymm3,%ymm0 # 60e0 <_sk_callback_hsw+0x7fe>
+ DB 196,226,101,0,5,64,34,0,0 ; vpshufb 0x2240(%rip),%ymm3,%ymm0 # 62e0 <_sk_callback_hsw+0x83a>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3860,7 +3947,7 @@ _sk_load_bgra_hsw LABEL PROC
DB 196,193,249,110,194 ; vmovq %r10,%xmm0
DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0
DB 196,226,125,44,24 ; vmaskmovps (%rax),%ymm0,%ymm3
- DB 235,135 ; jmp 3ea7 <_sk_load_bgra_hsw+0x27>
+ DB 235,135 ; jmp 406b <_sk_load_bgra_hsw+0x27>
PUBLIC _sk_load_bgra_dst_hsw
_sk_load_bgra_dst_hsw LABEL PROC
@@ -3874,16 +3961,16 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 3f9a <_sk_load_bgra_dst_hsw+0x7a>
+ DB 117,87 ; jne 415e <_sk_load_bgra_dst_hsw+0x7a>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,196,84,37,177,33,0,0 ; vandps 0x21b1(%rip),%ymm7,%ymm4 # 6100 <_sk_callback_hsw+0x81e>
+ DB 197,196,84,37,237,33,0,0 ; vandps 0x21ed(%rip),%ymm7,%ymm4 # 6300 <_sk_callback_hsw+0x85a>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,40,30,0,0 ; vbroadcastss 0x1e28(%rip),%ymm8 # 5d84 <_sk_callback_hsw+0x4a2>
+ DB 196,98,125,24,5,88,30,0,0 ; vbroadcastss 0x1e58(%rip),%ymm8 # 5f78 <_sk_callback_hsw+0x4d2>
DB 196,193,92,89,240 ; vmulps %ymm8,%ymm4,%ymm6
- DB 196,226,69,0,37,182,33,0,0 ; vpshufb 0x21b6(%rip),%ymm7,%ymm4 # 6120 <_sk_callback_hsw+0x83e>
+ DB 196,226,69,0,37,242,33,0,0 ; vpshufb 0x21f2(%rip),%ymm7,%ymm4 # 6320 <_sk_callback_hsw+0x87a>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,232 ; vmulps %ymm8,%ymm4,%ymm5
- DB 196,226,69,0,37,196,33,0,0 ; vpshufb 0x21c4(%rip),%ymm7,%ymm4 # 6140 <_sk_callback_hsw+0x85e>
+ DB 196,226,69,0,37,0,34,0,0 ; vpshufb 0x2200(%rip),%ymm7,%ymm4 # 6340 <_sk_callback_hsw+0x89a>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -3900,7 +3987,7 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 196,193,249,110,226 ; vmovq %r10,%xmm4
DB 196,226,125,33,228 ; vpmovsxbd %xmm4,%ymm4
DB 196,226,93,44,56 ; vmaskmovps (%rax),%ymm4,%ymm7
- DB 235,135 ; jmp 3f47 <_sk_load_bgra_dst_hsw+0x27>
+ DB 235,135 ; jmp 410b <_sk_load_bgra_dst_hsw+0x27>
PUBLIC _sk_gather_bgra_hsw
_sk_gather_bgra_hsw LABEL PROC
@@ -3913,14 +4000,14 @@ _sk_gather_bgra_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,114,33,0,0 ; vpand 0x2172(%rip),%ymm3,%ymm0 # 6160 <_sk_callback_hsw+0x87e>
+ DB 197,229,219,5,174,33,0,0 ; vpand 0x21ae(%rip),%ymm3,%ymm0 # 6360 <_sk_callback_hsw+0x8ba>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,141,29,0,0 ; vbroadcastss 0x1d8d(%rip),%ymm8 # 5d88 <_sk_callback_hsw+0x4a6>
+ DB 196,98,125,24,5,189,29,0,0 ; vbroadcastss 0x1dbd(%rip),%ymm8 # 5f7c <_sk_callback_hsw+0x4d6>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,119,33,0,0 ; vpshufb 0x2177(%rip),%ymm3,%ymm0 # 6180 <_sk_callback_hsw+0x89e>
+ DB 196,226,101,0,5,179,33,0,0 ; vpshufb 0x21b3(%rip),%ymm3,%ymm0 # 6380 <_sk_callback_hsw+0x8da>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,133,33,0,0 ; vpshufb 0x2185(%rip),%ymm3,%ymm0 # 61a0 <_sk_callback_hsw+0x8be>
+ DB 196,226,101,0,5,193,33,0,0 ; vpshufb 0x21c1(%rip),%ymm3,%ymm0 # 63a0 <_sk_callback_hsw+0x8fa>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3940,7 +4027,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
- DB 196,98,125,24,5,47,29,0,0 ; vbroadcastss 0x1d2f(%rip),%ymm8 # 5d8c <_sk_callback_hsw+0x4aa>
+ DB 196,98,125,24,5,95,29,0,0 ; vbroadcastss 0x1d5f(%rip),%ymm8 # 5f80 <_sk_callback_hsw+0x4da>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -3956,7 +4043,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 40b6 <_sk_store_bgra_hsw+0x80>
+ DB 117,11 ; jne 427a <_sk_store_bgra_hsw+0x80>
DB 197,124,17,0 ; vmovups %ymm8,(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -3969,7 +4056,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,65,249,110,202 ; vmovq %r10,%xmm9
DB 196,66,125,33,201 ; vpmovsxbd %xmm9,%ymm9
DB 196,98,53,46,0 ; vmaskmovps %ymm8,%ymm9,(%rax)
- DB 235,211 ; jmp 40af <_sk_store_bgra_hsw+0x79>
+ DB 235,211 ; jmp 4273 <_sk_store_bgra_hsw+0x79>
PUBLIC _sk_load_f16_hsw
_sk_load_f16_hsw LABEL PROC
@@ -3981,7 +4068,7 @@ _sk_load_f16_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,101 ; jne 415d <_sk_load_f16_hsw+0x81>
+ DB 117,101 ; jne 4321 <_sk_load_f16_hsw+0x81>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2
DB 196,193,121,16,92,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm3
@@ -4007,29 +4094,29 @@ _sk_load_f16_hsw LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 41c3 <_sk_load_f16_hsw+0xe7>
+ DB 116,85 ; je 4387 <_sk_load_f16_hsw+0xe7>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 41c3 <_sk_load_f16_hsw+0xe7>
+ DB 114,72 ; jb 4387 <_sk_load_f16_hsw+0xe7>
DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 41d0 <_sk_load_f16_hsw+0xf4>
+ DB 116,72 ; je 4394 <_sk_load_f16_hsw+0xf4>
DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 41d0 <_sk_load_f16_hsw+0xf4>
+ DB 114,59 ; jb 4394 <_sk_load_f16_hsw+0xf4>
DB 196,193,123,16,92,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,109,255,255,255 ; je 4113 <_sk_load_f16_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 42d7 <_sk_load_f16_hsw+0x37>
DB 196,193,97,22,92,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,92,255,255,255 ; jb 4113 <_sk_load_f16_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 42d7 <_sk_load_f16_hsw+0x37>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 4113 <_sk_load_f16_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 42d7 <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,67,255,255,255 ; jmpq 4113 <_sk_load_f16_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 42d7 <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,58,255,255,255 ; jmpq 4113 <_sk_load_f16_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 42d7 <_sk_load_f16_hsw+0x37>
PUBLIC _sk_load_f16_dst_hsw
_sk_load_f16_dst_hsw LABEL PROC
@@ -4041,7 +4128,7 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,101 ; jne 425a <_sk_load_f16_dst_hsw+0x81>
+ DB 117,101 ; jne 441e <_sk_load_f16_dst_hsw+0x81>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6
DB 196,193,121,16,124,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm7
@@ -4067,29 +4154,29 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 42c0 <_sk_load_f16_dst_hsw+0xe7>
+ DB 116,85 ; je 4484 <_sk_load_f16_dst_hsw+0xe7>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 42c0 <_sk_load_f16_dst_hsw+0xe7>
+ DB 114,72 ; jb 4484 <_sk_load_f16_dst_hsw+0xe7>
DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 42cd <_sk_load_f16_dst_hsw+0xf4>
+ DB 116,72 ; je 4491 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 42cd <_sk_load_f16_dst_hsw+0xf4>
+ DB 114,59 ; jb 4491 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,123,16,124,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm7
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,109,255,255,255 ; je 4210 <_sk_load_f16_dst_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 43d4 <_sk_load_f16_dst_hsw+0x37>
DB 196,193,65,22,124,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,92,255,255,255 ; jb 4210 <_sk_load_f16_dst_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 43d4 <_sk_load_f16_dst_hsw+0x37>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 4210 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 43d4 <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,67,255,255,255 ; jmpq 4210 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 43d4 <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
- DB 233,58,255,255,255 ; jmpq 4210 <_sk_load_f16_dst_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 43d4 <_sk_load_f16_dst_hsw+0x37>
PUBLIC _sk_gather_f16_hsw
_sk_gather_f16_hsw LABEL PROC
@@ -4148,7 +4235,7 @@ _sk_store_f16_hsw LABEL PROC
DB 196,65,57,98,205 ; vpunpckldq %xmm13,%xmm8,%xmm9
DB 196,65,57,106,197 ; vpunpckhdq %xmm13,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 43db <_sk_store_f16_hsw+0x7b>
+ DB 117,31 ; jne 459f <_sk_store_f16_hsw+0x7b>
DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8)
DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8)
DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8)
@@ -4157,22 +4244,22 @@ _sk_store_f16_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 43d7 <_sk_store_f16_hsw+0x77>
+ DB 116,240 ; je 459b <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 43d7 <_sk_store_f16_hsw+0x77>
+ DB 114,227 ; jb 459b <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8)
- DB 116,218 ; je 43d7 <_sk_store_f16_hsw+0x77>
+ DB 116,218 ; je 459b <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 43d7 <_sk_store_f16_hsw+0x77>
+ DB 114,205 ; jb 459b <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8)
- DB 116,196 ; je 43d7 <_sk_store_f16_hsw+0x77>
+ DB 116,196 ; je 459b <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 43d7 <_sk_store_f16_hsw+0x77>
+ DB 114,183 ; jb 459b <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8)
- DB 235,174 ; jmp 43d7 <_sk_store_f16_hsw+0x77>
+ DB 235,174 ; jmp 459b <_sk_store_f16_hsw+0x77>
PUBLIC _sk_load_u16_be_hsw
_sk_load_u16_be_hsw LABEL PROC
@@ -4185,7 +4272,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 451c <_sk_load_u16_be_hsw+0xf3>
+ DB 15,133,204,0,0,0 ; jne 46e0 <_sk_load_u16_be_hsw+0xf3>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -4204,7 +4291,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,223,24,0,0 ; vbroadcastss 0x18df(%rip),%ymm10 # 5d90 <_sk_callback_hsw+0x4ae>
+ DB 196,98,125,24,21,15,25,0,0 ; vbroadcastss 0x190f(%rip),%ymm10 # 5f84 <_sk_callback_hsw+0x4de>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4232,29 +4319,29 @@ _sk_load_u16_be_hsw LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 4582 <_sk_load_u16_be_hsw+0x159>
+ DB 116,85 ; je 4746 <_sk_load_u16_be_hsw+0x159>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 4582 <_sk_load_u16_be_hsw+0x159>
+ DB 114,72 ; jb 4746 <_sk_load_u16_be_hsw+0x159>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 458f <_sk_load_u16_be_hsw+0x166>
+ DB 116,72 ; je 4753 <_sk_load_u16_be_hsw+0x166>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 458f <_sk_load_u16_be_hsw+0x166>
+ DB 114,59 ; jb 4753 <_sk_load_u16_be_hsw+0x166>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,6,255,255,255 ; je 446b <_sk_load_u16_be_hsw+0x42>
+ DB 15,132,6,255,255,255 ; je 462f <_sk_load_u16_be_hsw+0x42>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,245,254,255,255 ; jb 446b <_sk_load_u16_be_hsw+0x42>
+ DB 15,130,245,254,255,255 ; jb 462f <_sk_load_u16_be_hsw+0x42>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,233,254,255,255 ; jmpq 446b <_sk_load_u16_be_hsw+0x42>
+ DB 233,233,254,255,255 ; jmpq 462f <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,220,254,255,255 ; jmpq 446b <_sk_load_u16_be_hsw+0x42>
+ DB 233,220,254,255,255 ; jmpq 462f <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,211,254,255,255 ; jmpq 446b <_sk_load_u16_be_hsw+0x42>
+ DB 233,211,254,255,255 ; jmpq 462f <_sk_load_u16_be_hsw+0x42>
PUBLIC _sk_load_rgb_u16_be_hsw
_sk_load_rgb_u16_be_hsw LABEL PROC
@@ -4269,7 +4356,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 468f <_sk_load_rgb_u16_be_hsw+0xf7>
+ DB 15,133,204,0,0,0 ; jne 4853 <_sk_load_rgb_u16_be_hsw+0xf7>
DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -4293,7 +4380,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,87,23,0,0 ; vbroadcastss 0x1757(%rip),%ymm10 # 5d94 <_sk_callback_hsw+0x4b2>
+ DB 196,98,125,24,21,135,23,0,0 ; vbroadcastss 0x1787(%rip),%ymm10 # 5f88 <_sk_callback_hsw+0x4e2>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4310,41 +4397,41 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,11,23,0,0 ; vbroadcastss 0x170b(%rip),%ymm3 # 5d98 <_sk_callback_hsw+0x4b6>
+ DB 196,226,125,24,29,59,23,0,0 ; vbroadcastss 0x173b(%rip),%ymm3 # 5f8c <_sk_callback_hsw+0x4e6>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 46a8 <_sk_load_rgb_u16_be_hsw+0x110>
- DB 233,79,255,255,255 ; jmpq 45f7 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 117,5 ; jne 486c <_sk_load_rgb_u16_be_hsw+0x110>
+ DB 233,79,255,255,255 ; jmpq 47bb <_sk_load_rgb_u16_be_hsw+0x5f>
DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 46d7 <_sk_load_rgb_u16_be_hsw+0x13f>
+ DB 114,26 ; jb 489b <_sk_load_rgb_u16_be_hsw+0x13f>
DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 46dc <_sk_load_rgb_u16_be_hsw+0x144>
- DB 233,32,255,255,255 ; jmpq 45f7 <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,27,255,255,255 ; jmpq 45f7 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 117,10 ; jne 48a0 <_sk_load_rgb_u16_be_hsw+0x144>
+ DB 233,32,255,255,255 ; jmpq 47bb <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,27,255,255,255 ; jmpq 47bb <_sk_load_rgb_u16_be_hsw+0x5f>
DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 470b <_sk_load_rgb_u16_be_hsw+0x173>
+ DB 114,26 ; jb 48cf <_sk_load_rgb_u16_be_hsw+0x173>
DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 4710 <_sk_load_rgb_u16_be_hsw+0x178>
- DB 233,236,254,255,255 ; jmpq 45f7 <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,231,254,255,255 ; jmpq 45f7 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 117,10 ; jne 48d4 <_sk_load_rgb_u16_be_hsw+0x178>
+ DB 233,236,254,255,255 ; jmpq 47bb <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,231,254,255,255 ; jmpq 47bb <_sk_load_rgb_u16_be_hsw+0x5f>
DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 4739 <_sk_load_rgb_u16_be_hsw+0x1a1>
+ DB 114,20 ; jb 48fd <_sk_load_rgb_u16_be_hsw+0x1a1>
DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,190,254,255,255 ; jmpq 45f7 <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,185,254,255,255 ; jmpq 45f7 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,190,254,255,255 ; jmpq 47bb <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 233,185,254,255,255 ; jmpq 47bb <_sk_load_rgb_u16_be_hsw+0x5f>
PUBLIC _sk_store_u16_be_hsw
_sk_store_u16_be_hsw LABEL PROC
@@ -4356,7 +4443,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,55,22,0,0 ; vbroadcastss 0x1637(%rip),%ymm8 # 5d9c <_sk_callback_hsw+0x4ba>
+ DB 196,98,125,24,5,103,22,0,0 ; vbroadcastss 0x1667(%rip),%ymm8 # 5f90 <_sk_callback_hsw+0x4ea>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -4394,7 +4481,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 4849 <_sk_store_u16_be_hsw+0x10b>
+ DB 117,31 ; jne 4a0d <_sk_store_u16_be_hsw+0x10b>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -4403,28 +4490,28 @@ _sk_store_u16_be_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4845 <_sk_store_u16_be_hsw+0x107>
+ DB 116,240 ; je 4a09 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4845 <_sk_store_u16_be_hsw+0x107>
+ DB 114,227 ; jb 4a09 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je 4845 <_sk_store_u16_be_hsw+0x107>
+ DB 116,218 ; je 4a09 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 4845 <_sk_store_u16_be_hsw+0x107>
+ DB 114,205 ; jb 4a09 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je 4845 <_sk_store_u16_be_hsw+0x107>
+ DB 116,196 ; je 4a09 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 4845 <_sk_store_u16_be_hsw+0x107>
+ DB 114,183 ; jb 4a09 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp 4845 <_sk_store_u16_be_hsw+0x107>
+ DB 235,174 ; jmp 4a09 <_sk_store_u16_be_hsw+0x107>
PUBLIC _sk_load_f32_hsw
_sk_load_f32_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 4923 <_sk_load_f32_hsw+0x8c>
+ DB 15,135,128,0,0,0 ; ja 4ae7 <_sk_load_f32_hsw+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -4432,7 +4519,7 @@ _sk_load_f32_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 494c <_sk_load_f32_hsw+0xb5>
+ DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 4b10 <_sk_load_f32_hsw+0xb5>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -4478,7 +4565,7 @@ PUBLIC _sk_load_f32_dst_hsw
_sk_load_f32_dst_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 49f8 <_sk_load_f32_dst_hsw+0x8c>
+ DB 15,135,128,0,0,0 ; ja 4bbc <_sk_load_f32_dst_hsw+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -4486,7 +4573,7 @@ _sk_load_f32_dst_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 4a20 <_sk_load_f32_dst_hsw+0xb4>
+ DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 4be4 <_sk_load_f32_dst_hsw+0xb4>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -4548,7 +4635,7 @@ _sk_store_f32_hsw LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne 4abf <_sk_store_f32_hsw+0x7f>
+ DB 117,55 ; jne 4c83 <_sk_store_f32_hsw+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -4561,22 +4648,22 @@ _sk_store_f32_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4abb <_sk_store_f32_hsw+0x7b>
+ DB 116,240 ; je 4c7f <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4abb <_sk_store_f32_hsw+0x7b>
+ DB 114,227 ; jb 4c7f <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je 4abb <_sk_store_f32_hsw+0x7b>
+ DB 116,218 ; je 4c7f <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 4abb <_sk_store_f32_hsw+0x7b>
+ DB 114,205 ; jb 4c7f <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je 4abb <_sk_store_f32_hsw+0x7b>
+ DB 116,195 ; je 4c7f <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb 4abb <_sk_store_f32_hsw+0x7b>
+ DB 114,181 ; jb 4c7f <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp 4abb <_sk_store_f32_hsw+0x7b>
+ DB 235,171 ; jmp 4c7f <_sk_store_f32_hsw+0x7b>
PUBLIC _sk_clamp_x_hsw
_sk_clamp_x_hsw LABEL PROC
@@ -4643,7 +4730,7 @@ _sk_mirror_x_hsw LABEL PROC
DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8
- DB 197,178,89,5,179,17,0,0 ; vmulss 0x11b3(%rip),%xmm9,%xmm0 # 5da0 <_sk_callback_hsw+0x4be>
+ DB 197,178,89,5,227,17,0,0 ; vmulss 0x11e3(%rip),%xmm9,%xmm0 # 5f94 <_sk_callback_hsw+0x4ee>
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0
@@ -4668,7 +4755,7 @@ _sk_mirror_y_hsw LABEL PROC
DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8
- DB 197,178,89,13,83,17,0,0 ; vmulss 0x1153(%rip),%xmm9,%xmm1 # 5da4 <_sk_callback_hsw+0x4c2>
+ DB 197,178,89,13,131,17,0,0 ; vmulss 0x1183(%rip),%xmm9,%xmm1 # 5f98 <_sk_callback_hsw+0x4f2>
DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1
@@ -4688,7 +4775,7 @@ PUBLIC _sk_clamp_x_1_hsw
_sk_clamp_x_1_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,8,17,0,0 ; vbroadcastss 0x1108(%rip),%ymm8 # 5da8 <_sk_callback_hsw+0x4c6>
+ DB 196,98,125,24,5,56,17,0,0 ; vbroadcastss 0x1138(%rip),%ymm8 # 5f9c <_sk_callback_hsw+0x4f6>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -4702,9 +4789,9 @@ _sk_repeat_x_1_hsw LABEL PROC
PUBLIC _sk_mirror_x_1_hsw
_sk_mirror_x_1_hsw LABEL PROC
- DB 196,98,125,24,5,235,16,0,0 ; vbroadcastss 0x10eb(%rip),%ymm8 # 5dac <_sk_callback_hsw+0x4ca>
+ DB 196,98,125,24,5,27,17,0,0 ; vbroadcastss 0x111b(%rip),%ymm8 # 5fa0 <_sk_callback_hsw+0x4fa>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,225,16,0,0 ; vbroadcastss 0x10e1(%rip),%ymm9 # 5db0 <_sk_callback_hsw+0x4ce>
+ DB 196,98,125,24,13,17,17,0,0 ; vbroadcastss 0x1111(%rip),%ymm9 # 5fa4 <_sk_callback_hsw+0x4fe>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -4718,11 +4805,11 @@ _sk_mirror_x_1_hsw LABEL PROC
PUBLIC _sk_luminance_to_alpha_hsw
_sk_luminance_to_alpha_hsw LABEL PROC
- DB 196,226,125,24,29,177,16,0,0 ; vbroadcastss 0x10b1(%rip),%ymm3 # 5db4 <_sk_callback_hsw+0x4d2>
- DB 196,98,125,24,5,172,16,0,0 ; vbroadcastss 0x10ac(%rip),%ymm8 # 5db8 <_sk_callback_hsw+0x4d6>
+ DB 196,226,125,24,29,225,16,0,0 ; vbroadcastss 0x10e1(%rip),%ymm3 # 5fa8 <_sk_callback_hsw+0x502>
+ DB 196,98,125,24,5,220,16,0,0 ; vbroadcastss 0x10dc(%rip),%ymm8 # 5fac <_sk_callback_hsw+0x506>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1
- DB 196,226,125,24,29,157,16,0,0 ; vbroadcastss 0x109d(%rip),%ymm3 # 5dbc <_sk_callback_hsw+0x4da>
+ DB 196,226,125,24,29,205,16,0,0 ; vbroadcastss 0x10cd(%rip),%ymm3 # 5fb0 <_sk_callback_hsw+0x50a>
DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -4906,9 +4993,9 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 77,137,211 ; mov %r10,%r11
DB 73,255,203 ; dec %r11
- DB 120,7 ; js 5018 <_sk_evenly_spaced_gradient_hsw+0x19>
+ DB 120,7 ; js 51dc <_sk_evenly_spaced_gradient_hsw+0x19>
DB 196,193,242,42,203 ; vcvtsi2ss %r11,%xmm1,%xmm1
- DB 235,22 ; jmp 502e <_sk_evenly_spaced_gradient_hsw+0x2f>
+ DB 235,22 ; jmp 51f2 <_sk_evenly_spaced_gradient_hsw+0x2f>
DB 76,137,219 ; mov %r11,%rbx
DB 72,209,235 ; shr %rbx
DB 65,131,227,1 ; and $0x1,%r11d
@@ -4919,7 +5006,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 197,244,89,200 ; vmulps %ymm0,%ymm1,%ymm1
DB 197,126,91,217 ; vcvttps2dq %ymm1,%ymm11
DB 73,131,250,8 ; cmp $0x8,%r10
- DB 119,70 ; ja 5087 <_sk_evenly_spaced_gradient_hsw+0x88>
+ DB 119,70 ; ja 524b <_sk_evenly_spaced_gradient_hsw+0x88>
DB 196,66,37,22,1 ; vpermps (%r9),%ymm11,%ymm8
DB 72,139,88,40 ; mov 0x28(%rax),%rbx
DB 196,98,37,22,11 ; vpermps (%rbx),%ymm11,%ymm9
@@ -4935,7 +5022,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 196,226,37,22,27 ; vpermps (%rbx),%ymm11,%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,98,37,22,40 ; vpermps (%rax),%ymm11,%ymm13
- DB 235,110 ; jmp 50f5 <_sk_evenly_spaced_gradient_hsw+0xf6>
+ DB 235,110 ; jmp 52b9 <_sk_evenly_spaced_gradient_hsw+0xf6>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,153 ; vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -4970,14 +5057,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_hsw
_sk_gauss_a_to_rgba_hsw LABEL PROC
- DB 196,226,125,24,5,165,12,0,0 ; vbroadcastss 0xca5(%rip),%ymm0 # 5dc0 <_sk_callback_hsw+0x4de>
- DB 196,226,125,24,13,160,12,0,0 ; vbroadcastss 0xca0(%rip),%ymm1 # 5dc4 <_sk_callback_hsw+0x4e2>
+ DB 196,226,125,24,5,213,12,0,0 ; vbroadcastss 0xcd5(%rip),%ymm0 # 5fb4 <_sk_callback_hsw+0x50e>
+ DB 196,226,125,24,13,208,12,0,0 ; vbroadcastss 0xcd0(%rip),%ymm1 # 5fb8 <_sk_callback_hsw+0x512>
DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,150,12,0,0 ; vbroadcastss 0xc96(%rip),%ymm0 # 5dc8 <_sk_callback_hsw+0x4e6>
+ DB 196,226,125,24,5,198,12,0,0 ; vbroadcastss 0xcc6(%rip),%ymm0 # 5fbc <_sk_callback_hsw+0x516>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
- DB 196,226,125,24,13,140,12,0,0 ; vbroadcastss 0xc8c(%rip),%ymm1 # 5dcc <_sk_callback_hsw+0x4ea>
+ DB 196,226,125,24,13,188,12,0,0 ; vbroadcastss 0xcbc(%rip),%ymm1 # 5fc0 <_sk_callback_hsw+0x51a>
DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,130,12,0,0 ; vbroadcastss 0xc82(%rip),%ymm0 # 5dd0 <_sk_callback_hsw+0x4ee>
+ DB 196,226,125,24,5,178,12,0,0 ; vbroadcastss 0xcb2(%rip),%ymm0 # 5fc4 <_sk_callback_hsw+0x51e>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -4990,11 +5077,11 @@ _sk_gradient_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 73,131,249,1 ; cmp $0x1,%r9
- DB 15,134,180,0,0,0 ; jbe 5226 <_sk_gradient_hsw+0xc3>
+ DB 15,134,180,0,0,0 ; jbe 53ea <_sk_gradient_hsw+0xc3>
DB 76,139,80,72 ; mov 0x48(%rax),%r10
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 65,187,1,0,0,0 ; mov $0x1,%r11d
- DB 196,226,125,24,21,75,12,0,0 ; vbroadcastss 0xc4b(%rip),%ymm2 # 5dd4 <_sk_callback_hsw+0x4f2>
+ DB 196,226,125,24,21,123,12,0,0 ; vbroadcastss 0xc7b(%rip),%ymm2 # 5fc8 <_sk_callback_hsw+0x522>
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
DB 196,130,125,24,28,154 ; vbroadcastss (%r10,%r11,4),%ymm3
DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3
@@ -5002,10 +5089,10 @@ _sk_gradient_hsw LABEL PROC
DB 196,65,101,254,201 ; vpaddd %ymm9,%ymm3,%ymm9
DB 73,255,195 ; inc %r11
DB 77,57,217 ; cmp %r11,%r9
- DB 117,226 ; jne 518e <_sk_gradient_hsw+0x2b>
+ DB 117,226 ; jne 5352 <_sk_gradient_hsw+0x2b>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 73,131,249,8 ; cmp $0x8,%r9
- DB 118,121 ; jbe 522f <_sk_gradient_hsw+0xcc>
+ DB 118,121 ; jbe 53f3 <_sk_gradient_hsw+0xcc>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,138 ; vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -5029,7 +5116,7 @@ _sk_gradient_hsw LABEL PROC
DB 196,130,21,146,28,137 ; vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,34,13,146,44,136 ; vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- DB 235,77 ; jmp 5273 <_sk_gradient_hsw+0x110>
+ DB 235,77 ; jmp 5437 <_sk_gradient_hsw+0x110>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 196,66,53,22,2 ; vpermps (%r10),%ymm9,%ymm8
@@ -5085,24 +5172,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,202,10,0,0 ; vbroadcastss 0xaca(%rip),%ymm13 # 5dd8 <_sk_callback_hsw+0x4f6>
- DB 196,98,125,24,53,197,10,0,0 ; vbroadcastss 0xac5(%rip),%ymm14 # 5ddc <_sk_callback_hsw+0x4fa>
+ DB 196,98,125,24,45,250,10,0,0 ; vbroadcastss 0xafa(%rip),%ymm13 # 5fcc <_sk_callback_hsw+0x526>
+ DB 196,98,125,24,53,245,10,0,0 ; vbroadcastss 0xaf5(%rip),%ymm14 # 5fd0 <_sk_callback_hsw+0x52a>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
- DB 196,98,125,24,45,187,10,0,0 ; vbroadcastss 0xabb(%rip),%ymm13 # 5de0 <_sk_callback_hsw+0x4fe>
+ DB 196,98,125,24,45,235,10,0,0 ; vbroadcastss 0xaeb(%rip),%ymm13 # 5fd4 <_sk_callback_hsw+0x52e>
DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13
- DB 196,98,125,24,53,177,10,0,0 ; vbroadcastss 0xab1(%rip),%ymm14 # 5de4 <_sk_callback_hsw+0x502>
+ DB 196,98,125,24,53,225,10,0,0 ; vbroadcastss 0xae1(%rip),%ymm14 # 5fd8 <_sk_callback_hsw+0x532>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,156,10,0,0 ; vbroadcastss 0xa9c(%rip),%ymm10 # 5de8 <_sk_callback_hsw+0x506>
+ DB 196,98,125,24,21,204,10,0,0 ; vbroadcastss 0xacc(%rip),%ymm10 # 5fdc <_sk_callback_hsw+0x536>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,134,10,0,0 ; vbroadcastss 0xa86(%rip),%ymm10 # 5dec <_sk_callback_hsw+0x50a>
+ DB 196,98,125,24,21,182,10,0,0 ; vbroadcastss 0xab6(%rip),%ymm10 # 5fe0 <_sk_callback_hsw+0x53a>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,112,10,0,0 ; vbroadcastss 0xa70(%rip),%ymm10 # 5df0 <_sk_callback_hsw+0x50e>
+ DB 196,98,125,24,21,160,10,0,0 ; vbroadcastss 0xaa0(%rip),%ymm10 # 5fe4 <_sk_callback_hsw+0x53e>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -5126,23 +5213,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,36,10,0,0 ; vbroadcastss 0xa24(%rip),%ymm11 # 5df4 <_sk_callback_hsw+0x512>
+ DB 196,98,125,24,29,84,10,0,0 ; vbroadcastss 0xa54(%rip),%ymm11 # 5fe8 <_sk_callback_hsw+0x542>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,3,10,0,0 ; vbroadcastss 0xa03(%rip),%ymm9 # 5df8 <_sk_callback_hsw+0x516>
+ DB 196,98,125,24,13,51,10,0,0 ; vbroadcastss 0xa33(%rip),%ymm9 # 5fec <_sk_callback_hsw+0x546>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,230,9,0,0 ; vbroadcastss 0x9e6(%rip),%ymm9 # 5dfc <_sk_callback_hsw+0x51a>
+ DB 196,98,125,24,13,22,10,0,0 ; vbroadcastss 0xa16(%rip),%ymm9 # 5ff0 <_sk_callback_hsw+0x54a>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,215,9,0,0 ; vbroadcastss 0x9d7(%rip),%ymm11 # 5e00 <_sk_callback_hsw+0x51e>
+ DB 196,98,125,24,29,7,10,0,0 ; vbroadcastss 0xa07(%rip),%ymm11 # 5ff4 <_sk_callback_hsw+0x54e>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5159,23 +5246,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,156,9,0,0 ; vbroadcastss 0x99c(%rip),%ymm11 # 5e04 <_sk_callback_hsw+0x522>
+ DB 196,98,125,24,29,204,9,0,0 ; vbroadcastss 0x9cc(%rip),%ymm11 # 5ff8 <_sk_callback_hsw+0x552>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,123,9,0,0 ; vbroadcastss 0x97b(%rip),%ymm9 # 5e08 <_sk_callback_hsw+0x526>
+ DB 196,98,125,24,13,171,9,0,0 ; vbroadcastss 0x9ab(%rip),%ymm9 # 5ffc <_sk_callback_hsw+0x556>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,94,9,0,0 ; vbroadcastss 0x95e(%rip),%ymm9 # 5e0c <_sk_callback_hsw+0x52a>
+ DB 196,98,125,24,13,142,9,0,0 ; vbroadcastss 0x98e(%rip),%ymm9 # 6000 <_sk_callback_hsw+0x55a>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,79,9,0,0 ; vbroadcastss 0x94f(%rip),%ymm11 # 5e10 <_sk_callback_hsw+0x52e>
+ DB 196,98,125,24,29,127,9,0,0 ; vbroadcastss 0x97f(%rip),%ymm11 # 6004 <_sk_callback_hsw+0x55e>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5191,14 +5278,14 @@ _sk_xy_to_2pt_conical_linear_hsw LABEL PROC
DB 197,58,89,72,44 ; vmulss 0x2c(%rax),%xmm8,%xmm9
DB 196,66,125,24,201 ; vbroadcastss %xmm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,26,9,0,0 ; vbroadcastss 0x91a(%rip),%ymm10 # 5e14 <_sk_callback_hsw+0x532>
+ DB 196,98,125,24,21,74,9,0,0 ; vbroadcastss 0x94a(%rip),%ymm10 # 6008 <_sk_callback_hsw+0x562>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
DB 196,98,125,184,208 ; vfmadd231ps %ymm0,%ymm0,%ymm10
DB 196,193,58,89,192 ; vmulss %xmm8,%xmm8,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,249,8,0,0 ; vbroadcastss 0x8f9(%rip),%ymm8 # 5e18 <_sk_callback_hsw+0x536>
+ DB 196,98,125,24,5,41,9,0,0 ; vbroadcastss 0x929(%rip),%ymm8 # 600c <_sk_callback_hsw+0x566>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5232,7 +5319,7 @@ _sk_apply_vector_mask_hsw LABEL PROC
PUBLIC _sk_save_xy_hsw
_sk_save_xy_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,153,8,0,0 ; vbroadcastss 0x899(%rip),%ymm8 # 5e1c <_sk_callback_hsw+0x53a>
+ DB 196,98,125,24,5,201,8,0,0 ; vbroadcastss 0x8c9(%rip),%ymm8 # 6010 <_sk_callback_hsw+0x56a>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -5262,9 +5349,9 @@ _sk_accumulate_hsw LABEL PROC
PUBLIC _sk_bilinear_nx_hsw
_sk_bilinear_nx_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,45,8,0,0 ; vbroadcastss 0x82d(%rip),%ymm0 # 5e20 <_sk_callback_hsw+0x53e>
+ DB 196,226,125,24,5,93,8,0,0 ; vbroadcastss 0x85d(%rip),%ymm0 # 6014 <_sk_callback_hsw+0x56e>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,36,8,0,0 ; vbroadcastss 0x824(%rip),%ymm8 # 5e24 <_sk_callback_hsw+0x542>
+ DB 196,98,125,24,5,84,8,0,0 ; vbroadcastss 0x854(%rip),%ymm8 # 6018 <_sk_callback_hsw+0x572>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5273,7 +5360,7 @@ _sk_bilinear_nx_hsw LABEL PROC
PUBLIC _sk_bilinear_px_hsw
_sk_bilinear_px_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,12,8,0,0 ; vbroadcastss 0x80c(%rip),%ymm0 # 5e28 <_sk_callback_hsw+0x546>
+ DB 196,226,125,24,5,60,8,0,0 ; vbroadcastss 0x83c(%rip),%ymm0 # 601c <_sk_callback_hsw+0x576>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5283,9 +5370,9 @@ _sk_bilinear_px_hsw LABEL PROC
PUBLIC _sk_bilinear_ny_hsw
_sk_bilinear_ny_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,240,7,0,0 ; vbroadcastss 0x7f0(%rip),%ymm1 # 5e2c <_sk_callback_hsw+0x54a>
+ DB 196,226,125,24,13,32,8,0,0 ; vbroadcastss 0x820(%rip),%ymm1 # 6020 <_sk_callback_hsw+0x57a>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,230,7,0,0 ; vbroadcastss 0x7e6(%rip),%ymm8 # 5e30 <_sk_callback_hsw+0x54e>
+ DB 196,98,125,24,5,22,8,0,0 ; vbroadcastss 0x816(%rip),%ymm8 # 6024 <_sk_callback_hsw+0x57e>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5294,7 +5381,7 @@ _sk_bilinear_ny_hsw LABEL PROC
PUBLIC _sk_bilinear_py_hsw
_sk_bilinear_py_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,206,7,0,0 ; vbroadcastss 0x7ce(%rip),%ymm1 # 5e34 <_sk_callback_hsw+0x552>
+ DB 196,226,125,24,13,254,7,0,0 ; vbroadcastss 0x7fe(%rip),%ymm1 # 6028 <_sk_callback_hsw+0x582>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5304,13 +5391,13 @@ _sk_bilinear_py_hsw LABEL PROC
PUBLIC _sk_bicubic_n3x_hsw
_sk_bicubic_n3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,177,7,0,0 ; vbroadcastss 0x7b1(%rip),%ymm0 # 5e38 <_sk_callback_hsw+0x556>
+ DB 196,226,125,24,5,225,7,0,0 ; vbroadcastss 0x7e1(%rip),%ymm0 # 602c <_sk_callback_hsw+0x586>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,168,7,0,0 ; vbroadcastss 0x7a8(%rip),%ymm8 # 5e3c <_sk_callback_hsw+0x55a>
+ DB 196,98,125,24,5,216,7,0,0 ; vbroadcastss 0x7d8(%rip),%ymm8 # 6030 <_sk_callback_hsw+0x58a>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,153,7,0,0 ; vbroadcastss 0x799(%rip),%ymm10 # 5e40 <_sk_callback_hsw+0x55e>
- DB 196,98,125,24,29,148,7,0,0 ; vbroadcastss 0x794(%rip),%ymm11 # 5e44 <_sk_callback_hsw+0x562>
+ DB 196,98,125,24,21,201,7,0,0 ; vbroadcastss 0x7c9(%rip),%ymm10 # 6034 <_sk_callback_hsw+0x58e>
+ DB 196,98,125,24,29,196,7,0,0 ; vbroadcastss 0x7c4(%rip),%ymm11 # 6038 <_sk_callback_hsw+0x592>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5320,16 +5407,16 @@ _sk_bicubic_n3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n1x_hsw
_sk_bicubic_n1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,119,7,0,0 ; vbroadcastss 0x777(%rip),%ymm0 # 5e48 <_sk_callback_hsw+0x566>
+ DB 196,226,125,24,5,167,7,0,0 ; vbroadcastss 0x7a7(%rip),%ymm0 # 603c <_sk_callback_hsw+0x596>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,110,7,0,0 ; vbroadcastss 0x76e(%rip),%ymm8 # 5e4c <_sk_callback_hsw+0x56a>
+ DB 196,98,125,24,5,158,7,0,0 ; vbroadcastss 0x79e(%rip),%ymm8 # 6040 <_sk_callback_hsw+0x59a>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,100,7,0,0 ; vbroadcastss 0x764(%rip),%ymm9 # 5e50 <_sk_callback_hsw+0x56e>
- DB 196,98,125,24,21,95,7,0,0 ; vbroadcastss 0x75f(%rip),%ymm10 # 5e54 <_sk_callback_hsw+0x572>
+ DB 196,98,125,24,13,148,7,0,0 ; vbroadcastss 0x794(%rip),%ymm9 # 6044 <_sk_callback_hsw+0x59e>
+ DB 196,98,125,24,21,143,7,0,0 ; vbroadcastss 0x78f(%rip),%ymm10 # 6048 <_sk_callback_hsw+0x5a2>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,85,7,0,0 ; vbroadcastss 0x755(%rip),%ymm9 # 5e58 <_sk_callback_hsw+0x576>
+ DB 196,98,125,24,13,133,7,0,0 ; vbroadcastss 0x785(%rip),%ymm9 # 604c <_sk_callback_hsw+0x5a6>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,75,7,0,0 ; vbroadcastss 0x74b(%rip),%ymm10 # 5e5c <_sk_callback_hsw+0x57a>
+ DB 196,98,125,24,21,123,7,0,0 ; vbroadcastss 0x77b(%rip),%ymm10 # 6050 <_sk_callback_hsw+0x5aa>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5338,14 +5425,14 @@ _sk_bicubic_n1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p1x_hsw
_sk_bicubic_p1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,51,7,0,0 ; vbroadcastss 0x733(%rip),%ymm8 # 5e60 <_sk_callback_hsw+0x57e>
+ DB 196,98,125,24,5,99,7,0,0 ; vbroadcastss 0x763(%rip),%ymm8 # 6054 <_sk_callback_hsw+0x5ae>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,37,7,0,0 ; vbroadcastss 0x725(%rip),%ymm10 # 5e64 <_sk_callback_hsw+0x582>
- DB 196,98,125,24,29,32,7,0,0 ; vbroadcastss 0x720(%rip),%ymm11 # 5e68 <_sk_callback_hsw+0x586>
+ DB 196,98,125,24,21,85,7,0,0 ; vbroadcastss 0x755(%rip),%ymm10 # 6058 <_sk_callback_hsw+0x5b2>
+ DB 196,98,125,24,29,80,7,0,0 ; vbroadcastss 0x750(%rip),%ymm11 # 605c <_sk_callback_hsw+0x5b6>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,17,7,0,0 ; vbroadcastss 0x711(%rip),%ymm8 # 5e6c <_sk_callback_hsw+0x58a>
+ DB 196,98,125,24,5,65,7,0,0 ; vbroadcastss 0x741(%rip),%ymm8 # 6060 <_sk_callback_hsw+0x5ba>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5354,12 +5441,12 @@ _sk_bicubic_p1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p3x_hsw
_sk_bicubic_p3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,249,6,0,0 ; vbroadcastss 0x6f9(%rip),%ymm0 # 5e70 <_sk_callback_hsw+0x58e>
+ DB 196,226,125,24,5,41,7,0,0 ; vbroadcastss 0x729(%rip),%ymm0 # 6064 <_sk_callback_hsw+0x5be>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,230,6,0,0 ; vbroadcastss 0x6e6(%rip),%ymm10 # 5e74 <_sk_callback_hsw+0x592>
- DB 196,98,125,24,29,225,6,0,0 ; vbroadcastss 0x6e1(%rip),%ymm11 # 5e78 <_sk_callback_hsw+0x596>
+ DB 196,98,125,24,21,22,7,0,0 ; vbroadcastss 0x716(%rip),%ymm10 # 6068 <_sk_callback_hsw+0x5c2>
+ DB 196,98,125,24,29,17,7,0,0 ; vbroadcastss 0x711(%rip),%ymm11 # 606c <_sk_callback_hsw+0x5c6>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5369,13 +5456,13 @@ _sk_bicubic_p3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n3y_hsw
_sk_bicubic_n3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,196,6,0,0 ; vbroadcastss 0x6c4(%rip),%ymm1 # 5e7c <_sk_callback_hsw+0x59a>
+ DB 196,226,125,24,13,244,6,0,0 ; vbroadcastss 0x6f4(%rip),%ymm1 # 6070 <_sk_callback_hsw+0x5ca>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,186,6,0,0 ; vbroadcastss 0x6ba(%rip),%ymm8 # 5e80 <_sk_callback_hsw+0x59e>
+ DB 196,98,125,24,5,234,6,0,0 ; vbroadcastss 0x6ea(%rip),%ymm8 # 6074 <_sk_callback_hsw+0x5ce>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,171,6,0,0 ; vbroadcastss 0x6ab(%rip),%ymm10 # 5e84 <_sk_callback_hsw+0x5a2>
- DB 196,98,125,24,29,166,6,0,0 ; vbroadcastss 0x6a6(%rip),%ymm11 # 5e88 <_sk_callback_hsw+0x5a6>
+ DB 196,98,125,24,21,219,6,0,0 ; vbroadcastss 0x6db(%rip),%ymm10 # 6078 <_sk_callback_hsw+0x5d2>
+ DB 196,98,125,24,29,214,6,0,0 ; vbroadcastss 0x6d6(%rip),%ymm11 # 607c <_sk_callback_hsw+0x5d6>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5385,16 +5472,16 @@ _sk_bicubic_n3y_hsw LABEL PROC
PUBLIC _sk_bicubic_n1y_hsw
_sk_bicubic_n1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,137,6,0,0 ; vbroadcastss 0x689(%rip),%ymm1 # 5e8c <_sk_callback_hsw+0x5aa>
+ DB 196,226,125,24,13,185,6,0,0 ; vbroadcastss 0x6b9(%rip),%ymm1 # 6080 <_sk_callback_hsw+0x5da>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,127,6,0,0 ; vbroadcastss 0x67f(%rip),%ymm8 # 5e90 <_sk_callback_hsw+0x5ae>
+ DB 196,98,125,24,5,175,6,0,0 ; vbroadcastss 0x6af(%rip),%ymm8 # 6084 <_sk_callback_hsw+0x5de>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,117,6,0,0 ; vbroadcastss 0x675(%rip),%ymm9 # 5e94 <_sk_callback_hsw+0x5b2>
- DB 196,98,125,24,21,112,6,0,0 ; vbroadcastss 0x670(%rip),%ymm10 # 5e98 <_sk_callback_hsw+0x5b6>
+ DB 196,98,125,24,13,165,6,0,0 ; vbroadcastss 0x6a5(%rip),%ymm9 # 6088 <_sk_callback_hsw+0x5e2>
+ DB 196,98,125,24,21,160,6,0,0 ; vbroadcastss 0x6a0(%rip),%ymm10 # 608c <_sk_callback_hsw+0x5e6>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,102,6,0,0 ; vbroadcastss 0x666(%rip),%ymm9 # 5e9c <_sk_callback_hsw+0x5ba>
+ DB 196,98,125,24,13,150,6,0,0 ; vbroadcastss 0x696(%rip),%ymm9 # 6090 <_sk_callback_hsw+0x5ea>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,92,6,0,0 ; vbroadcastss 0x65c(%rip),%ymm10 # 5ea0 <_sk_callback_hsw+0x5be>
+ DB 196,98,125,24,21,140,6,0,0 ; vbroadcastss 0x68c(%rip),%ymm10 # 6094 <_sk_callback_hsw+0x5ee>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5403,14 +5490,14 @@ _sk_bicubic_n1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p1y_hsw
_sk_bicubic_p1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,68,6,0,0 ; vbroadcastss 0x644(%rip),%ymm8 # 5ea4 <_sk_callback_hsw+0x5c2>
+ DB 196,98,125,24,5,116,6,0,0 ; vbroadcastss 0x674(%rip),%ymm8 # 6098 <_sk_callback_hsw+0x5f2>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,53,6,0,0 ; vbroadcastss 0x635(%rip),%ymm10 # 5ea8 <_sk_callback_hsw+0x5c6>
- DB 196,98,125,24,29,48,6,0,0 ; vbroadcastss 0x630(%rip),%ymm11 # 5eac <_sk_callback_hsw+0x5ca>
+ DB 196,98,125,24,21,101,6,0,0 ; vbroadcastss 0x665(%rip),%ymm10 # 609c <_sk_callback_hsw+0x5f6>
+ DB 196,98,125,24,29,96,6,0,0 ; vbroadcastss 0x660(%rip),%ymm11 # 60a0 <_sk_callback_hsw+0x5fa>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,33,6,0,0 ; vbroadcastss 0x621(%rip),%ymm8 # 5eb0 <_sk_callback_hsw+0x5ce>
+ DB 196,98,125,24,5,81,6,0,0 ; vbroadcastss 0x651(%rip),%ymm8 # 60a4 <_sk_callback_hsw+0x5fe>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5419,12 +5506,12 @@ _sk_bicubic_p1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p3y_hsw
_sk_bicubic_p3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,9,6,0,0 ; vbroadcastss 0x609(%rip),%ymm1 # 5eb4 <_sk_callback_hsw+0x5d2>
+ DB 196,226,125,24,13,57,6,0,0 ; vbroadcastss 0x639(%rip),%ymm1 # 60a8 <_sk_callback_hsw+0x602>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,245,5,0,0 ; vbroadcastss 0x5f5(%rip),%ymm10 # 5eb8 <_sk_callback_hsw+0x5d6>
- DB 196,98,125,24,29,240,5,0,0 ; vbroadcastss 0x5f0(%rip),%ymm11 # 5ebc <_sk_callback_hsw+0x5da>
+ DB 196,98,125,24,21,37,6,0,0 ; vbroadcastss 0x625(%rip),%ymm10 # 60ac <_sk_callback_hsw+0x606>
+ DB 196,98,125,24,29,32,6,0,0 ; vbroadcastss 0x620(%rip),%ymm11 # 60b0 <_sk_callback_hsw+0x60a>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5548,25 +5635,25 @@ ALIGN 4
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5ac5 <.literal4+0xb9>
+ DB 71,225,61 ; rex.RXB loope 5c89 <.literal4+0xb9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5ad5 <.literal4+0xc9>
+ DB 71,225,61 ; rex.RXB loope 5c99 <.literal4+0xc9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5ae5 <.literal4+0xd9>
+ DB 71,225,61 ; rex.RXB loope 5ca9 <.literal4+0xd9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 5af5 <.literal4+0xe9>
+ DB 71,225,61 ; rex.RXB loope 5cb9 <.literal4+0xe9>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
@@ -5629,7 +5716,7 @@ ALIGN 4
DB 190,129,128,128,59 ; mov $0x3b808081,%esi
DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5b69 <.literal4+0x15d>
+ DB 224,7 ; loopne 5d2d <.literal4+0x15d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -5645,10 +5732,10 @@ ALIGN 4
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 5b90 <.literal4+0x184>
+ DB 127,0 ; jg 5d54 <.literal4+0x184>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5c09 <.literal4+0x1fd>
+ DB 119,115 ; ja 5dcd <.literal4+0x1fd>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -5662,10 +5749,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5bc4 <.literal4+0x1b8>
+ DB 127,0 ; jg 5d88 <.literal4+0x1b8>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5c3d <.literal4+0x231>
+ DB 119,115 ; ja 5e01 <.literal4+0x231>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -5679,10 +5766,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5bf8 <.literal4+0x1ec>
+ DB 127,0 ; jg 5dbc <.literal4+0x1ec>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5c71 <.literal4+0x265>
+ DB 119,115 ; ja 5e35 <.literal4+0x265>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -5696,10 +5783,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5c2c <.literal4+0x220>
+ DB 127,0 ; jg 5df0 <.literal4+0x220>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5ca5 <.literal4+0x299>
+ DB 119,115 ; ja 5e69 <.literal4+0x299>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -5710,9 +5797,26 @@ ALIGN 4
DB 210,221 ; rcr %cl,%ch
DB 65,0,0 ; add %al,(%r8)
DB 0,75,0 ; add %cl,0x0(%rbx)
- DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax)
+ DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
+ DB 52,255 ; xor $0xff,%al
+ DB 255 ; (bad)
+ DB 127,0 ; jg 5e24 <.literal4+0x254>
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 119,115 ; ja 5e9d <.literal4+0x2cd>
+ DB 248 ; clc
+ DB 194,117,191 ; retq $0xbf75
+ DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
+ DB 62,163,233,220,63,81,140,242,66,141 ; movabs %eax,%ds:0x8d42f28c513fdce9
+ DB 188,190,63,248,245 ; mov $0xf5f83fbe,%esp
+ DB 154 ; (bad)
+ DB 64,254 ; rex (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,0,0 ; add %al,(%r8)
+ DB 0,75,0 ; add %cl,0x0(%rbx)
+ DB 0,200 ; add %cl,%al
DB 66,0,0 ; rex.X add %al,(%rax)
- DB 127,67 ; jg 5ca3 <.literal4+0x297>
+ DB 127,67 ; jg 5e97 <.literal4+0x2c7>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -5724,7 +5828,7 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 5cc3 <.literal4+0x2b7>
+ DB 118,63 ; jbe 5eb7 <.literal4+0x2e7>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
@@ -5746,7 +5850,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5cdd <.literal4+0x2d1>
+ DB 224,7 ; loopne 5ed1 <.literal4+0x301>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -5758,7 +5862,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5cf9 <.literal4+0x2ed>
+ DB 224,7 ; loopne 5eed <.literal4+0x31d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -5769,7 +5873,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 5d4e <.literal4+0x342>
+ DB 124,66 ; jl 5f42 <.literal4+0x372>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -5795,7 +5899,7 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 5db1 <.literal4+0x3a5>
+ DB 112,65 ; jo 5fa5 <.literal4+0x3d5>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
@@ -5809,7 +5913,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 5de7 <.literal4+0x3db>
+ DB 127,71 ; jg 5fdb <.literal4+0x40b>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -5936,16 +6040,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005ee8 <_sk_callback_hsw+0xa000606>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0060e8 <_sk_callback_hsw+0xa000642>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005ef0 <_sk_callback_hsw+0x1200060e>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120060f0 <_sk_callback_hsw+0x1200064a>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005ef8 <_sk_callback_hsw+0x1a000616>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0060f8 <_sk_callback_hsw+0x1a000652>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005f00 <_sk_callback_hsw+0x300061e>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006100 <_sk_callback_hsw+0x300065a>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -5988,16 +6092,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005f48 <_sk_callback_hsw+0xa000666>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006148 <_sk_callback_hsw+0xa0006a2>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005f50 <_sk_callback_hsw+0x1200066e>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006150 <_sk_callback_hsw+0x120006aa>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005f58 <_sk_callback_hsw+0x1a000676>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006158 <_sk_callback_hsw+0x1a0006b2>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005f60 <_sk_callback_hsw+0x300067e>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006160 <_sk_callback_hsw+0x30006ba>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6040,16 +6144,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005fa8 <_sk_callback_hsw+0xa0006c6>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0061a8 <_sk_callback_hsw+0xa000702>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005fb0 <_sk_callback_hsw+0x120006ce>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120061b0 <_sk_callback_hsw+0x1200070a>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005fb8 <_sk_callback_hsw+0x1a0006d6>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0061b8 <_sk_callback_hsw+0x1a000712>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005fc0 <_sk_callback_hsw+0x30006de>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30061c0 <_sk_callback_hsw+0x300071a>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6092,16 +6196,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006008 <_sk_callback_hsw+0xa000726>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006208 <_sk_callback_hsw+0xa000762>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006010 <_sk_callback_hsw+0x1200072e>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006210 <_sk_callback_hsw+0x1200076a>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006018 <_sk_callback_hsw+0x1a000736>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006218 <_sk_callback_hsw+0x1a000772>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006020 <_sk_callback_hsw+0x300073e>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006220 <_sk_callback_hsw+0x300077a>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6144,16 +6248,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006068 <_sk_callback_hsw+0xa000786>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006268 <_sk_callback_hsw+0xa0007c2>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006070 <_sk_callback_hsw+0x1200078e>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006270 <_sk_callback_hsw+0x120007ca>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006078 <_sk_callback_hsw+0x1a000796>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006278 <_sk_callback_hsw+0x1a0007d2>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006080 <_sk_callback_hsw+0x300079e>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006280 <_sk_callback_hsw+0x30007da>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6196,16 +6300,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0060c8 <_sk_callback_hsw+0xa0007e6>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0062c8 <_sk_callback_hsw+0xa000822>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120060d0 <_sk_callback_hsw+0x120007ee>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120062d0 <_sk_callback_hsw+0x1200082a>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0060d8 <_sk_callback_hsw+0x1a0007f6>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0062d8 <_sk_callback_hsw+0x1a000832>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30060e0 <_sk_callback_hsw+0x30007fe>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30062e0 <_sk_callback_hsw+0x300083a>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6248,16 +6352,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006128 <_sk_callback_hsw+0xa000846>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006328 <_sk_callback_hsw+0xa000882>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006130 <_sk_callback_hsw+0x1200084e>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006330 <_sk_callback_hsw+0x1200088a>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006138 <_sk_callback_hsw+0x1a000856>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006338 <_sk_callback_hsw+0x1a000892>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006140 <_sk_callback_hsw+0x300085e>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3006340 <_sk_callback_hsw+0x300089a>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6300,16 +6404,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006188 <_sk_callback_hsw+0xa0008a6>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006388 <_sk_callback_hsw+0xa0008e2>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006190 <_sk_callback_hsw+0x120008ae>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12006390 <_sk_callback_hsw+0x120008ea>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006198 <_sk_callback_hsw+0x1a0008b6>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a006398 <_sk_callback_hsw+0x1a0008f2>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30061a0 <_sk_callback_hsw+0x30008be>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30063a0 <_sk_callback_hsw+0x30008fa>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -6510,7 +6614,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,107,121,0,0 ; vbroadcastss 0x796b(%rip),%ymm1 # 7ad0 <_sk_callback_avx+0x12c>
+ DB 196,226,125,24,13,95,123,0,0 ; vbroadcastss 0x7b5f(%rip),%ymm1 # 7cc4 <_sk_callback_avx+0x12c>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -6519,7 +6623,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,69,121,0,0 ; vbroadcastss 0x7945(%rip),%ymm2 # 7ad4 <_sk_callback_avx+0x130>
+ DB 196,226,125,24,21,57,123,0,0 ; vbroadcastss 0x7b39(%rip),%ymm2 # 7cc8 <_sk_callback_avx+0x130>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -6541,7 +6645,7 @@ _sk_dither_avx LABEL PROC
DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,238,120,0,0 ; vbroadcastss 0x78ee(%rip),%ymm11 # 7ad8 <_sk_callback_avx+0x134>
+ DB 196,98,125,24,29,226,122,0,0 ; vbroadcastss 0x7ae2(%rip),%ymm11 # 7ccc <_sk_callback_avx+0x134>
DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9
DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
@@ -6552,8 +6656,8 @@ _sk_dither_avx LABEL PROC
DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11
DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11
DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- DB 196,98,125,24,37,175,120,0,0 ; vbroadcastss 0x78af(%rip),%ymm12 # 7adc <_sk_callback_avx+0x138>
- DB 196,98,125,24,45,170,120,0,0 ; vbroadcastss 0x78aa(%rip),%ymm13 # 7ae0 <_sk_callback_avx+0x13c>
+ DB 196,98,125,24,37,163,122,0,0 ; vbroadcastss 0x7aa3(%rip),%ymm12 # 7cd0 <_sk_callback_avx+0x138>
+ DB 196,98,125,24,45,158,122,0,0 ; vbroadcastss 0x7a9e(%rip),%ymm13 # 7cd4 <_sk_callback_avx+0x13c>
DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14
DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15
DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14
@@ -6580,9 +6684,9 @@ _sk_dither_avx LABEL PROC
DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8
DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,21,120,0,0 ; vbroadcastss 0x7815(%rip),%ymm9 # 7ae4 <_sk_callback_avx+0x140>
+ DB 196,98,125,24,13,9,122,0,0 ; vbroadcastss 0x7a09(%rip),%ymm9 # 7cd8 <_sk_callback_avx+0x140>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,11,120,0,0 ; vbroadcastss 0x780b(%rip),%ymm9 # 7ae8 <_sk_callback_avx+0x144>
+ DB 196,98,125,24,13,255,121,0,0 ; vbroadcastss 0x79ff(%rip),%ymm9 # 7cdc <_sk_callback_avx+0x144>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
@@ -6612,7 +6716,7 @@ _sk_uniform_color_avx LABEL PROC
PUBLIC _sk_black_color_avx
_sk_black_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,171,119,0,0 ; vbroadcastss 0x77ab(%rip),%ymm3 # 7aec <_sk_callback_avx+0x148>
+ DB 196,226,125,24,29,159,121,0,0 ; vbroadcastss 0x799f(%rip),%ymm3 # 7ce0 <_sk_callback_avx+0x148>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -6621,7 +6725,7 @@ _sk_black_color_avx LABEL PROC
PUBLIC _sk_white_color_avx
_sk_white_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,150,119,0,0 ; vbroadcastss 0x7796(%rip),%ymm0 # 7af0 <_sk_callback_avx+0x14c>
+ DB 196,226,125,24,5,138,121,0,0 ; vbroadcastss 0x798a(%rip),%ymm0 # 7ce4 <_sk_callback_avx+0x14c>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -6659,7 +6763,7 @@ _sk_clear_avx LABEL PROC
PUBLIC _sk_srcatop_avx
_sk_srcatop_avx LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,57,119,0,0 ; vbroadcastss 0x7739(%rip),%ymm8 # 7af4 <_sk_callback_avx+0x150>
+ DB 196,98,125,24,5,45,121,0,0 ; vbroadcastss 0x792d(%rip),%ymm8 # 7ce8 <_sk_callback_avx+0x150>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6678,7 +6782,7 @@ _sk_srcatop_avx LABEL PROC
PUBLIC _sk_dstatop_avx
_sk_dstatop_avx LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
- DB 196,98,125,24,13,251,118,0,0 ; vbroadcastss 0x76fb(%rip),%ymm9 # 7af8 <_sk_callback_avx+0x154>
+ DB 196,98,125,24,13,239,120,0,0 ; vbroadcastss 0x78ef(%rip),%ymm9 # 7cec <_sk_callback_avx+0x154>
DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
@@ -6714,7 +6818,7 @@ _sk_dstin_avx LABEL PROC
PUBLIC _sk_srcout_avx
_sk_srcout_avx LABEL PROC
- DB 196,98,125,24,5,154,118,0,0 ; vbroadcastss 0x769a(%rip),%ymm8 # 7afc <_sk_callback_avx+0x158>
+ DB 196,98,125,24,5,142,120,0,0 ; vbroadcastss 0x788e(%rip),%ymm8 # 7cf0 <_sk_callback_avx+0x158>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -6725,7 +6829,7 @@ _sk_srcout_avx LABEL PROC
PUBLIC _sk_dstout_avx
_sk_dstout_avx LABEL PROC
- DB 196,226,125,24,5,125,118,0,0 ; vbroadcastss 0x767d(%rip),%ymm0 # 7b00 <_sk_callback_avx+0x15c>
+ DB 196,226,125,24,5,113,120,0,0 ; vbroadcastss 0x7871(%rip),%ymm0 # 7cf4 <_sk_callback_avx+0x15c>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -6736,7 +6840,7 @@ _sk_dstout_avx LABEL PROC
PUBLIC _sk_srcover_avx
_sk_srcover_avx LABEL PROC
- DB 196,98,125,24,5,96,118,0,0 ; vbroadcastss 0x7660(%rip),%ymm8 # 7b04 <_sk_callback_avx+0x160>
+ DB 196,98,125,24,5,84,120,0,0 ; vbroadcastss 0x7854(%rip),%ymm8 # 7cf8 <_sk_callback_avx+0x160>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6751,7 +6855,7 @@ _sk_srcover_avx LABEL PROC
PUBLIC _sk_dstover_avx
_sk_dstover_avx LABEL PROC
- DB 196,98,125,24,5,51,118,0,0 ; vbroadcastss 0x7633(%rip),%ymm8 # 7b08 <_sk_callback_avx+0x164>
+ DB 196,98,125,24,5,39,120,0,0 ; vbroadcastss 0x7827(%rip),%ymm8 # 7cfc <_sk_callback_avx+0x164>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -6775,7 +6879,7 @@ _sk_modulate_avx LABEL PROC
PUBLIC _sk_multiply_avx
_sk_multiply_avx LABEL PROC
- DB 196,98,125,24,5,242,117,0,0 ; vbroadcastss 0x75f2(%rip),%ymm8 # 7b0c <_sk_callback_avx+0x168>
+ DB 196,98,125,24,5,230,119,0,0 ; vbroadcastss 0x77e6(%rip),%ymm8 # 7d00 <_sk_callback_avx+0x168>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -6829,7 +6933,7 @@ _sk_screen_avx LABEL PROC
PUBLIC _sk_xor__avx
_sk_xor__avx LABEL PROC
- DB 196,98,125,24,5,65,117,0,0 ; vbroadcastss 0x7541(%rip),%ymm8 # 7b10 <_sk_callback_avx+0x16c>
+ DB 196,98,125,24,5,53,119,0,0 ; vbroadcastss 0x7735(%rip),%ymm8 # 7d04 <_sk_callback_avx+0x16c>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -6864,7 +6968,7 @@ _sk_darken_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,193,116,0,0 ; vbroadcastss 0x74c1(%rip),%ymm8 # 7b14 <_sk_callback_avx+0x170>
+ DB 196,98,125,24,5,181,118,0,0 ; vbroadcastss 0x76b5(%rip),%ymm8 # 7d08 <_sk_callback_avx+0x170>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -6888,7 +6992,7 @@ _sk_lighten_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,109,116,0,0 ; vbroadcastss 0x746d(%rip),%ymm8 # 7b18 <_sk_callback_avx+0x174>
+ DB 196,98,125,24,5,97,118,0,0 ; vbroadcastss 0x7661(%rip),%ymm8 # 7d0c <_sk_callback_avx+0x174>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -6915,7 +7019,7 @@ _sk_difference_avx LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,13,116,0,0 ; vbroadcastss 0x740d(%rip),%ymm8 # 7b1c <_sk_callback_avx+0x178>
+ DB 196,98,125,24,5,1,118,0,0 ; vbroadcastss 0x7601(%rip),%ymm8 # 7d10 <_sk_callback_avx+0x178>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -6936,7 +7040,7 @@ _sk_exclusion_avx LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,200,115,0,0 ; vbroadcastss 0x73c8(%rip),%ymm8 # 7b20 <_sk_callback_avx+0x17c>
+ DB 196,98,125,24,5,188,117,0,0 ; vbroadcastss 0x75bc(%rip),%ymm8 # 7d14 <_sk_callback_avx+0x17c>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -6945,7 +7049,7 @@ _sk_exclusion_avx LABEL PROC
PUBLIC _sk_colorburn_avx
_sk_colorburn_avx LABEL PROC
- DB 196,98,125,24,5,179,115,0,0 ; vbroadcastss 0x73b3(%rip),%ymm8 # 7b24 <_sk_callback_avx+0x180>
+ DB 196,98,125,24,5,167,117,0,0 ; vbroadcastss 0x75a7(%rip),%ymm8 # 7d18 <_sk_callback_avx+0x180>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -7005,7 +7109,7 @@ _sk_colorburn_avx LABEL PROC
PUBLIC _sk_colordodge_avx
_sk_colordodge_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,175,114,0,0 ; vbroadcastss 0x72af(%rip),%ymm9 # 7b28 <_sk_callback_avx+0x184>
+ DB 196,98,125,24,13,163,116,0,0 ; vbroadcastss 0x74a3(%rip),%ymm9 # 7d1c <_sk_callback_avx+0x184>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -7060,7 +7164,7 @@ _sk_colordodge_avx LABEL PROC
PUBLIC _sk_hardlight_avx
_sk_hardlight_avx LABEL PROC
- DB 196,98,125,24,5,193,113,0,0 ; vbroadcastss 0x71c1(%rip),%ymm8 # 7b2c <_sk_callback_avx+0x188>
+ DB 196,98,125,24,5,181,115,0,0 ; vbroadcastss 0x73b5(%rip),%ymm8 # 7d20 <_sk_callback_avx+0x188>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7113,7 +7217,7 @@ _sk_hardlight_avx LABEL PROC
PUBLIC _sk_overlay_avx
_sk_overlay_avx LABEL PROC
- DB 196,98,125,24,5,234,112,0,0 ; vbroadcastss 0x70ea(%rip),%ymm8 # 7b30 <_sk_callback_avx+0x18c>
+ DB 196,98,125,24,5,222,114,0,0 ; vbroadcastss 0x72de(%rip),%ymm8 # 7d24 <_sk_callback_avx+0x18c>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7178,10 +7282,10 @@ _sk_softlight_avx LABEL PROC
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,29,221,111,0,0 ; vbroadcastss 0x6fdd(%rip),%ymm11 # 7b38 <_sk_callback_avx+0x194>
+ DB 196,98,125,24,29,209,113,0,0 ; vbroadcastss 0x71d1(%rip),%ymm11 # 7d2c <_sk_callback_avx+0x194>
DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13
DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8
- DB 196,98,125,24,45,206,111,0,0 ; vbroadcastss 0x6fce(%rip),%ymm13 # 7b3c <_sk_callback_avx+0x198>
+ DB 196,98,125,24,45,194,113,0,0 ; vbroadcastss 0x71c2(%rip),%ymm13 # 7d30 <_sk_callback_avx+0x198>
DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14
DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8
DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14
@@ -7192,7 +7296,7 @@ _sk_softlight_avx LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,140,111,0,0 ; vbroadcastss 0x6f8c(%rip),%ymm8 # 7b34 <_sk_callback_avx+0x190>
+ DB 196,98,125,24,5,128,113,0,0 ; vbroadcastss 0x7180(%rip),%ymm8 # 7d28 <_sk_callback_avx+0x190>
DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
@@ -7319,12 +7423,12 @@ _sk_hue_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,86,109,0,0 ; vbroadcastss 0x6d56(%rip),%ymm14 # 7b40 <_sk_callback_avx+0x19c>
+ DB 196,98,125,24,53,74,111,0,0 ; vbroadcastss 0x6f4a(%rip),%ymm14 # 7d34 <_sk_callback_avx+0x19c>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,76,109,0,0 ; vbroadcastss 0x6d4c(%rip),%ymm15 # 7b44 <_sk_callback_avx+0x1a0>
+ DB 196,98,125,24,61,64,111,0,0 ; vbroadcastss 0x6f40(%rip),%ymm15 # 7d38 <_sk_callback_avx+0x1a0>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,61,109,0,0 ; vbroadcastss 0x6d3d(%rip),%ymm0 # 7b48 <_sk_callback_avx+0x1a4>
+ DB 196,226,125,24,5,49,111,0,0 ; vbroadcastss 0x6f31(%rip),%ymm0 # 7d3c <_sk_callback_avx+0x1a4>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7385,7 +7489,7 @@ _sk_hue_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,22,108,0,0 ; vbroadcastss 0x6c16(%rip),%ymm8 # 7b4c <_sk_callback_avx+0x1a8>
+ DB 196,98,125,24,5,10,110,0,0 ; vbroadcastss 0x6e0a(%rip),%ymm8 # 7d40 <_sk_callback_avx+0x1a8>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7442,12 +7546,12 @@ _sk_saturation_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,30,107,0,0 ; vbroadcastss 0x6b1e(%rip),%ymm14 # 7b50 <_sk_callback_avx+0x1ac>
+ DB 196,98,125,24,53,18,109,0,0 ; vbroadcastss 0x6d12(%rip),%ymm14 # 7d44 <_sk_callback_avx+0x1ac>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,20,107,0,0 ; vbroadcastss 0x6b14(%rip),%ymm15 # 7b54 <_sk_callback_avx+0x1b0>
+ DB 196,98,125,24,61,8,109,0,0 ; vbroadcastss 0x6d08(%rip),%ymm15 # 7d48 <_sk_callback_avx+0x1b0>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,5,107,0,0 ; vbroadcastss 0x6b05(%rip),%ymm0 # 7b58 <_sk_callback_avx+0x1b4>
+ DB 196,226,125,24,5,249,108,0,0 ; vbroadcastss 0x6cf9(%rip),%ymm0 # 7d4c <_sk_callback_avx+0x1b4>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7508,7 +7612,7 @@ _sk_saturation_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,222,105,0,0 ; vbroadcastss 0x69de(%rip),%ymm8 # 7b5c <_sk_callback_avx+0x1b8>
+ DB 196,98,125,24,5,210,107,0,0 ; vbroadcastss 0x6bd2(%rip),%ymm8 # 7d50 <_sk_callback_avx+0x1b8>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7537,12 +7641,12 @@ _sk_color_avx LABEL PROC
DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8
DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9
- DB 196,98,125,24,45,110,105,0,0 ; vbroadcastss 0x696e(%rip),%ymm13 # 7b60 <_sk_callback_avx+0x1bc>
+ DB 196,98,125,24,45,98,107,0,0 ; vbroadcastss 0x6b62(%rip),%ymm13 # 7d54 <_sk_callback_avx+0x1bc>
DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10
- DB 196,98,125,24,53,100,105,0,0 ; vbroadcastss 0x6964(%rip),%ymm14 # 7b64 <_sk_callback_avx+0x1c0>
+ DB 196,98,125,24,53,88,107,0,0 ; vbroadcastss 0x6b58(%rip),%ymm14 # 7d58 <_sk_callback_avx+0x1c0>
DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,85,105,0,0 ; vbroadcastss 0x6955(%rip),%ymm15 # 7b68 <_sk_callback_avx+0x1c4>
+ DB 196,98,125,24,61,73,107,0,0 ; vbroadcastss 0x6b49(%rip),%ymm15 # 7d5c <_sk_callback_avx+0x1c4>
DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7605,7 +7709,7 @@ _sk_color_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,28,104,0,0 ; vbroadcastss 0x681c(%rip),%ymm0 # 7b6c <_sk_callback_avx+0x1c8>
+ DB 196,226,125,24,5,16,106,0,0 ; vbroadcastss 0x6a10(%rip),%ymm0 # 7d60 <_sk_callback_avx+0x1c8>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7635,12 +7739,12 @@ _sk_luminosity_avx LABEL PROC
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9
- DB 196,98,125,24,45,168,103,0,0 ; vbroadcastss 0x67a8(%rip),%ymm13 # 7b70 <_sk_callback_avx+0x1cc>
+ DB 196,98,125,24,45,156,105,0,0 ; vbroadcastss 0x699c(%rip),%ymm13 # 7d64 <_sk_callback_avx+0x1cc>
DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10
- DB 196,98,125,24,53,158,103,0,0 ; vbroadcastss 0x679e(%rip),%ymm14 # 7b74 <_sk_callback_avx+0x1d0>
+ DB 196,98,125,24,53,146,105,0,0 ; vbroadcastss 0x6992(%rip),%ymm14 # 7d68 <_sk_callback_avx+0x1d0>
DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,143,103,0,0 ; vbroadcastss 0x678f(%rip),%ymm15 # 7b78 <_sk_callback_avx+0x1d4>
+ DB 196,98,125,24,61,131,105,0,0 ; vbroadcastss 0x6983(%rip),%ymm15 # 7d6c <_sk_callback_avx+0x1d4>
DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7703,7 +7807,7 @@ _sk_luminosity_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,86,102,0,0 ; vbroadcastss 0x6656(%rip),%ymm0 # 7b7c <_sk_callback_avx+0x1d8>
+ DB 196,226,125,24,5,74,104,0,0 ; vbroadcastss 0x684a(%rip),%ymm0 # 7d70 <_sk_callback_avx+0x1d8>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7739,7 +7843,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,45,1,0,0 ; jne 16cc <_sk_srcover_rgba_8888_avx+0x158>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,124,40,13,181,107,0,0 ; vmovaps 0x6bb5(%rip),%ymm9 # 8160 <_sk_callback_avx+0x7bc>
+ DB 197,124,40,13,213,109,0,0 ; vmovaps 0x6dd5(%rip),%ymm9 # 8380 <_sk_callback_avx+0x7e8>
DB 196,193,68,84,225 ; vandps %ymm9,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5
@@ -7757,9 +7861,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7
DB 196,227,53,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,116,101,0,0 ; vbroadcastss 0x6574(%rip),%ymm8 # 7b80 <_sk_callback_avx+0x1dc>
+ DB 196,98,125,24,5,104,103,0,0 ; vbroadcastss 0x6768(%rip),%ymm8 # 7d74 <_sk_callback_avx+0x1dc>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,107,101,0,0 ; vbroadcastss 0x656b(%rip),%ymm9 # 7b84 <_sk_callback_avx+0x1e0>
+ DB 196,98,125,24,13,95,103,0,0 ; vbroadcastss 0x675f(%rip),%ymm9 # 7d78 <_sk_callback_avx+0x1e0>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
@@ -7805,9 +7909,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,226 ; vmovq %r10,%xmm4
DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4
- DB 196,226,89,0,45,204,104,0,0 ; vpshufb 0x68cc(%rip),%xmm4,%xmm5 # 7fc0 <_sk_callback_avx+0x61c>
+ DB 196,226,89,0,45,236,106,0,0 ; vpshufb 0x6aec(%rip),%xmm4,%xmm5 # 81e0 <_sk_callback_avx+0x648>
DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5
- DB 196,226,89,0,37,206,104,0,0 ; vpshufb 0x68ce(%rip),%xmm4,%xmm4 # 7fd0 <_sk_callback_avx+0x62c>
+ DB 196,226,89,0,37,238,106,0,0 ; vpshufb 0x6aee(%rip),%xmm4,%xmm4 # 81f0 <_sk_callback_avx+0x658>
DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4
DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
DB 196,226,93,44,56 ; vmaskmovps (%rax),%ymm4,%ymm7
@@ -7819,9 +7923,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,65,249,110,202 ; vmovq %r10,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
- DB 196,98,49,0,21,129,104,0,0 ; vpshufb 0x6881(%rip),%xmm9,%xmm10 # 7fc0 <_sk_callback_avx+0x61c>
+ DB 196,98,49,0,21,161,106,0,0 ; vpshufb 0x6aa1(%rip),%xmm9,%xmm10 # 81e0 <_sk_callback_avx+0x648>
DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10
- DB 196,98,49,0,13,131,104,0,0 ; vpshufb 0x6883(%rip),%xmm9,%xmm9 # 7fd0 <_sk_callback_avx+0x62c>
+ DB 196,98,49,0,13,163,106,0,0 ; vpshufb 0x6aa3(%rip),%xmm9,%xmm9 # 81f0 <_sk_callback_avx+0x658>
DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
DB 196,98,53,46,0 ; vmaskmovps %ymm8,%ymm9,(%rax)
@@ -7839,7 +7943,7 @@ _sk_clamp_0_avx LABEL PROC
PUBLIC _sk_clamp_1_avx
_sk_clamp_1_avx LABEL PROC
- DB 196,98,125,24,5,0,100,0,0 ; vbroadcastss 0x6400(%rip),%ymm8 # 7b88 <_sk_callback_avx+0x1e4>
+ DB 196,98,125,24,5,244,101,0,0 ; vbroadcastss 0x65f4(%rip),%ymm8 # 7d7c <_sk_callback_avx+0x1e4>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -7849,7 +7953,7 @@ _sk_clamp_1_avx LABEL PROC
PUBLIC _sk_clamp_a_avx
_sk_clamp_a_avx LABEL PROC
- DB 196,98,125,24,5,227,99,0,0 ; vbroadcastss 0x63e3(%rip),%ymm8 # 7b8c <_sk_callback_avx+0x1e8>
+ DB 196,98,125,24,5,215,101,0,0 ; vbroadcastss 0x65d7(%rip),%ymm8 # 7d80 <_sk_callback_avx+0x1e8>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -7859,7 +7963,7 @@ _sk_clamp_a_avx LABEL PROC
PUBLIC _sk_clamp_a_dst_avx
_sk_clamp_a_dst_avx LABEL PROC
- DB 196,98,125,24,5,201,99,0,0 ; vbroadcastss 0x63c9(%rip),%ymm8 # 7b90 <_sk_callback_avx+0x1ec>
+ DB 196,98,125,24,5,189,101,0,0 ; vbroadcastss 0x65bd(%rip),%ymm8 # 7d84 <_sk_callback_avx+0x1ec>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -7886,7 +7990,7 @@ _sk_swap_rb_avx LABEL PROC
PUBLIC _sk_invert_avx
_sk_invert_avx LABEL PROC
- DB 196,98,125,24,5,136,99,0,0 ; vbroadcastss 0x6388(%rip),%ymm8 # 7b94 <_sk_callback_avx+0x1f0>
+ DB 196,98,125,24,5,124,101,0,0 ; vbroadcastss 0x657c(%rip),%ymm8 # 7d88 <_sk_callback_avx+0x1f0>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -7932,7 +8036,7 @@ PUBLIC _sk_unpremul_avx
_sk_unpremul_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,28,99,0,0 ; vbroadcastss 0x631c(%rip),%ymm10 # 7b98 <_sk_callback_avx+0x1f4>
+ DB 196,98,125,24,21,16,101,0,0 ; vbroadcastss 0x6510(%rip),%ymm10 # 7d8c <_sk_callback_avx+0x1f4>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -7943,17 +8047,17 @@ _sk_unpremul_avx LABEL PROC
PUBLIC _sk_from_srgb_avx
_sk_from_srgb_avx LABEL PROC
- DB 196,98,125,24,5,253,98,0,0 ; vbroadcastss 0x62fd(%rip),%ymm8 # 7b9c <_sk_callback_avx+0x1f8>
+ DB 196,98,125,24,5,241,100,0,0 ; vbroadcastss 0x64f1(%rip),%ymm8 # 7d90 <_sk_callback_avx+0x1f8>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,239,98,0,0 ; vbroadcastss 0x62ef(%rip),%ymm11 # 7ba0 <_sk_callback_avx+0x1fc>
+ DB 196,98,125,24,29,227,100,0,0 ; vbroadcastss 0x64e3(%rip),%ymm11 # 7d94 <_sk_callback_avx+0x1fc>
DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12
- DB 196,98,125,24,45,229,98,0,0 ; vbroadcastss 0x62e5(%rip),%ymm13 # 7ba4 <_sk_callback_avx+0x200>
+ DB 196,98,125,24,45,217,100,0,0 ; vbroadcastss 0x64d9(%rip),%ymm13 # 7d98 <_sk_callback_avx+0x200>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,214,98,0,0 ; vbroadcastss 0x62d6(%rip),%ymm12 # 7ba8 <_sk_callback_avx+0x204>
+ DB 196,98,125,24,37,202,100,0,0 ; vbroadcastss 0x64ca(%rip),%ymm12 # 7d9c <_sk_callback_avx+0x204>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,204,98,0,0 ; vbroadcastss 0x62cc(%rip),%ymm14 # 7bac <_sk_callback_avx+0x208>
+ DB 196,98,125,24,53,192,100,0,0 ; vbroadcastss 0x64c0(%rip),%ymm14 # 7da0 <_sk_callback_avx+0x208>
DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0
DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -7977,17 +8081,17 @@ _sk_from_srgb_avx LABEL PROC
PUBLIC _sk_from_srgb_dst_avx
_sk_from_srgb_dst_avx LABEL PROC
- DB 196,98,125,24,5,101,98,0,0 ; vbroadcastss 0x6265(%rip),%ymm8 # 7bb0 <_sk_callback_avx+0x20c>
+ DB 196,98,125,24,5,89,100,0,0 ; vbroadcastss 0x6459(%rip),%ymm8 # 7da4 <_sk_callback_avx+0x20c>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,87,98,0,0 ; vbroadcastss 0x6257(%rip),%ymm11 # 7bb4 <_sk_callback_avx+0x210>
+ DB 196,98,125,24,29,75,100,0,0 ; vbroadcastss 0x644b(%rip),%ymm11 # 7da8 <_sk_callback_avx+0x210>
DB 196,65,92,89,227 ; vmulps %ymm11,%ymm4,%ymm12
- DB 196,98,125,24,45,77,98,0,0 ; vbroadcastss 0x624d(%rip),%ymm13 # 7bb8 <_sk_callback_avx+0x214>
+ DB 196,98,125,24,45,65,100,0,0 ; vbroadcastss 0x6441(%rip),%ymm13 # 7dac <_sk_callback_avx+0x214>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,62,98,0,0 ; vbroadcastss 0x623e(%rip),%ymm12 # 7bbc <_sk_callback_avx+0x218>
+ DB 196,98,125,24,37,50,100,0,0 ; vbroadcastss 0x6432(%rip),%ymm12 # 7db0 <_sk_callback_avx+0x218>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,52,98,0,0 ; vbroadcastss 0x6234(%rip),%ymm14 # 7bc0 <_sk_callback_avx+0x21c>
+ DB 196,98,125,24,53,40,100,0,0 ; vbroadcastss 0x6428(%rip),%ymm14 # 7db4 <_sk_callback_avx+0x21c>
DB 196,193,92,194,230,1 ; vcmpltps %ymm14,%ymm4,%ymm4
DB 196,195,45,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm10,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -8012,20 +8116,20 @@ _sk_from_srgb_dst_avx LABEL PROC
PUBLIC _sk_to_srgb_avx
_sk_to_srgb_avx LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,201,97,0,0 ; vbroadcastss 0x61c9(%rip),%ymm8 # 7bc4 <_sk_callback_avx+0x220>
+ DB 196,98,125,24,5,189,99,0,0 ; vbroadcastss 0x63bd(%rip),%ymm8 # 7db8 <_sk_callback_avx+0x220>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,191,97,0,0 ; vbroadcastss 0x61bf(%rip),%ymm11 # 7bc8 <_sk_callback_avx+0x224>
+ DB 196,98,125,24,29,179,99,0,0 ; vbroadcastss 0x63b3(%rip),%ymm11 # 7dbc <_sk_callback_avx+0x224>
DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12
- DB 196,98,125,24,45,181,97,0,0 ; vbroadcastss 0x61b5(%rip),%ymm13 # 7bcc <_sk_callback_avx+0x228>
+ DB 196,98,125,24,45,169,99,0,0 ; vbroadcastss 0x63a9(%rip),%ymm13 # 7dc0 <_sk_callback_avx+0x228>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12
- DB 196,98,125,24,53,166,97,0,0 ; vbroadcastss 0x61a6(%rip),%ymm14 # 7bd0 <_sk_callback_avx+0x22c>
+ DB 196,98,125,24,53,154,99,0,0 ; vbroadcastss 0x639a(%rip),%ymm14 # 7dc4 <_sk_callback_avx+0x22c>
DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12
- DB 196,98,125,24,61,156,97,0,0 ; vbroadcastss 0x619c(%rip),%ymm15 # 7bd4 <_sk_callback_avx+0x230>
+ DB 196,98,125,24,61,144,99,0,0 ; vbroadcastss 0x6390(%rip),%ymm15 # 7dc8 <_sk_callback_avx+0x230>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
- DB 196,98,125,24,37,136,97,0,0 ; vbroadcastss 0x6188(%rip),%ymm12 # 7bd8 <_sk_callback_avx+0x234>
+ DB 196,98,125,24,37,124,99,0,0 ; vbroadcastss 0x637c(%rip),%ymm12 # 7dcc <_sk_callback_avx+0x234>
DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -8060,7 +8164,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,238,96,0,0 ; vbroadcastss 0x60ee(%rip),%ymm11 # 7bdc <_sk_callback_avx+0x238>
+ DB 196,98,125,24,29,226,98,0,0 ; vbroadcastss 0x62e2(%rip),%ymm11 # 7dd0 <_sk_callback_avx+0x238>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12
@@ -8070,19 +8174,19 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,199,96,0,0 ; vbroadcastss 0x60c7(%rip),%ymm11 # 7be8 <_sk_callback_avx+0x244>
+ DB 196,98,125,24,29,187,98,0,0 ; vbroadcastss 0x62bb(%rip),%ymm11 # 7ddc <_sk_callback_avx+0x244>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,181,96,0,0 ; vbroadcastss 0x60b5(%rip),%ymm11 # 7be4 <_sk_callback_avx+0x240>
+ DB 196,98,125,24,29,169,98,0,0 ; vbroadcastss 0x62a9(%rip),%ymm11 # 7dd8 <_sk_callback_avx+0x240>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,157,96,0,0 ; vbroadcastss 0x609d(%rip),%ymm2 # 7be0 <_sk_callback_avx+0x23c>
+ DB 196,226,125,24,21,145,98,0,0 ; vbroadcastss 0x6291(%rip),%ymm2 # 7dd4 <_sk_callback_avx+0x23c>
DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,37,132,96,0,0 ; vbroadcastss 0x6084(%rip),%ymm12 # 7bf0 <_sk_callback_avx+0x24c>
+ DB 196,98,125,24,37,120,98,0,0 ; vbroadcastss 0x6278(%rip),%ymm12 # 7de4 <_sk_callback_avx+0x24c>
DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2
DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12
DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11
@@ -8092,7 +8196,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0
DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- DB 196,98,125,24,5,71,96,0,0 ; vbroadcastss 0x6047(%rip),%ymm8 # 7bec <_sk_callback_avx+0x248>
+ DB 196,98,125,24,5,59,98,0,0 ; vbroadcastss 0x623b(%rip),%ymm8 # 7de0 <_sk_callback_avx+0x248>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8107,7 +8211,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,225 ; vmovaps %ymm1,%ymm4
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
- DB 196,98,125,24,5,14,96,0,0 ; vbroadcastss 0x600e(%rip),%ymm8 # 7bf4 <_sk_callback_avx+0x250>
+ DB 196,98,125,24,5,2,98,0,0 ; vbroadcastss 0x6202(%rip),%ymm8 # 7de8 <_sk_callback_avx+0x250>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10
DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11
@@ -8115,23 +8219,23 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,29,232,95,0,0 ; vbroadcastss 0x5fe8(%rip),%ymm11 # 7bf8 <_sk_callback_avx+0x254>
+ DB 196,98,125,24,29,220,97,0,0 ; vbroadcastss 0x61dc(%rip),%ymm11 # 7dec <_sk_callback_avx+0x254>
DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,37,210,95,0,0 ; vbroadcastss 0x5fd2(%rip),%ymm12 # 7c00 <_sk_callback_avx+0x25c>
+ DB 196,98,125,24,37,198,97,0,0 ; vbroadcastss 0x61c6(%rip),%ymm12 # 7df4 <_sk_callback_avx+0x25c>
DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0
- DB 196,98,125,24,45,200,95,0,0 ; vbroadcastss 0x5fc8(%rip),%ymm13 # 7c04 <_sk_callback_avx+0x260>
+ DB 196,98,125,24,45,188,97,0,0 ; vbroadcastss 0x61bc(%rip),%ymm13 # 7df8 <_sk_callback_avx+0x260>
DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14
DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
- DB 196,226,125,24,13,169,95,0,0 ; vbroadcastss 0x5fa9(%rip),%ymm1 # 7bfc <_sk_callback_avx+0x258>
+ DB 196,226,125,24,13,157,97,0,0 ; vbroadcastss 0x619d(%rip),%ymm1 # 7df0 <_sk_callback_avx+0x258>
DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7
DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7
DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14
DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,53,148,95,0,0 ; vbroadcastss 0x5f94(%rip),%ymm14 # 7c08 <_sk_callback_avx+0x264>
+ DB 196,98,125,24,53,136,97,0,0 ; vbroadcastss 0x6188(%rip),%ymm14 # 7dfc <_sk_callback_avx+0x264>
DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -8150,7 +8254,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6
DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6
DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- DB 196,226,125,24,5,54,95,0,0 ; vbroadcastss 0x5f36(%rip),%ymm0 # 7c0c <_sk_callback_avx+0x268>
+ DB 196,226,125,24,5,42,97,0,0 ; vbroadcastss 0x612a(%rip),%ymm0 # 7e00 <_sk_callback_avx+0x268>
DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0
DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3
DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0
@@ -8203,13 +8307,13 @@ _sk_scale_u8_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,75 ; jne 1de3 <_sk_scale_u8_avx+0x64>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,58,98,0,0 ; vpand 0x623a(%rip),%xmm8,%xmm8 # 7fe0 <_sk_callback_avx+0x63c>
+ DB 197,57,219,5,90,100,0,0 ; vpand 0x645a(%rip),%xmm8,%xmm8 # 8200 <_sk_callback_avx+0x668>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,71,94,0,0 ; vbroadcastss 0x5e47(%rip),%ymm9 # 7c10 <_sk_callback_avx+0x26c>
+ DB 196,98,125,24,13,59,96,0,0 ; vbroadcastss 0x603b(%rip),%ymm9 # 7e04 <_sk_callback_avx+0x26c>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -8303,13 +8407,13 @@ _sk_lerp_u8_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,111 ; jne 1f5f <_sk_lerp_u8_avx+0x88>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,242,96,0,0 ; vpand 0x60f2(%rip),%xmm8,%xmm8 # 7ff0 <_sk_callback_avx+0x64c>
+ DB 197,57,219,5,18,99,0,0 ; vpand 0x6312(%rip),%xmm8,%xmm8 # 8210 <_sk_callback_avx+0x678>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,243,92,0,0 ; vbroadcastss 0x5cf3(%rip),%ymm9 # 7c14 <_sk_callback_avx+0x270>
+ DB 196,98,125,24,13,231,94,0,0 ; vbroadcastss 0x5ee7(%rip),%ymm9 # 7e08 <_sk_callback_avx+0x270>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
@@ -8366,7 +8470,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00200c <_sk_callback_avx+0xffffffffdeffa668>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00200c <_sk_callback_avx+0xffffffffdeffa474>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -8394,20 +8498,20 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,188,91,0,0 ; vbroadcastss 0x5bbc(%rip),%ymm9 # 7c18 <_sk_callback_avx+0x274>
+ DB 196,98,125,24,13,176,93,0,0 ; vbroadcastss 0x5db0(%rip),%ymm9 # 7e0c <_sk_callback_avx+0x274>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,173,91,0,0 ; vbroadcastss 0x5bad(%rip),%ymm10 # 7c1c <_sk_callback_avx+0x278>
+ DB 196,98,125,24,21,161,93,0,0 ; vbroadcastss 0x5da1(%rip),%ymm10 # 7e10 <_sk_callback_avx+0x278>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,163,91,0,0 ; vbroadcastss 0x5ba3(%rip),%ymm10 # 7c20 <_sk_callback_avx+0x27c>
+ DB 196,98,125,24,21,151,93,0,0 ; vbroadcastss 0x5d97(%rip),%ymm10 # 7e14 <_sk_callback_avx+0x27c>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,148,91,0,0 ; vbroadcastss 0x5b94(%rip),%ymm11 # 7c24 <_sk_callback_avx+0x280>
+ DB 196,98,125,24,29,136,93,0,0 ; vbroadcastss 0x5d88(%rip),%ymm11 # 7e18 <_sk_callback_avx+0x280>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,138,91,0,0 ; vbroadcastss 0x5b8a(%rip),%ymm11 # 7c28 <_sk_callback_avx+0x284>
+ DB 196,98,125,24,29,126,93,0,0 ; vbroadcastss 0x5d7e(%rip),%ymm11 # 7e1c <_sk_callback_avx+0x284>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,123,91,0,0 ; vbroadcastss 0x5b7b(%rip),%ymm11 # 7c2c <_sk_callback_avx+0x288>
+ DB 196,98,125,24,29,111,93,0,0 ; vbroadcastss 0x5d6f(%rip),%ymm11 # 7e20 <_sk_callback_avx+0x288>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
@@ -8487,7 +8591,7 @@ _sk_load_tables_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,251,1,0,0 ; jne 23ca <_sk_load_tables_avx+0x21e>
DB 196,65,124,16,18 ; vmovups (%r10),%ymm10
- DB 197,124,40,13,164,95,0,0 ; vmovaps 0x5fa4(%rip),%ymm9 # 8180 <_sk_callback_avx+0x7dc>
+ DB 197,124,40,13,196,97,0,0 ; vmovaps 0x61c4(%rip),%ymm9 # 83a0 <_sk_callback_avx+0x808>
DB 196,193,44,84,201 ; vandps %ymm9,%ymm10,%ymm1
DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0
DB 196,193,249,126,195 ; vmovq %xmm0,%r11
@@ -8579,7 +8683,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,123,88,0,0 ; vbroadcastss 0x587b(%rip),%ymm7 # 7c30 <_sk_callback_avx+0x28c>
+ DB 196,226,125,24,61,111,90,0,0 ; vbroadcastss 0x5a6f(%rip),%ymm7 # 7e24 <_sk_callback_avx+0x28c>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -8594,9 +8698,9 @@ _sk_load_tables_avx LABEL PROC
DB 73,211,235 ; shr %cl,%r11
DB 196,193,249,110,195 ; vmovq %r11,%xmm0
DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0
- DB 196,226,121,0,13,14,92,0,0 ; vpshufb 0x5c0e(%rip),%xmm0,%xmm1 # 8000 <_sk_callback_avx+0x65c>
+ DB 196,226,121,0,13,46,94,0,0 ; vpshufb 0x5e2e(%rip),%xmm0,%xmm1 # 8220 <_sk_callback_avx+0x688>
DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1
- DB 196,226,121,0,5,16,92,0,0 ; vpshufb 0x5c10(%rip),%xmm0,%xmm0 # 8010 <_sk_callback_avx+0x66c>
+ DB 196,226,121,0,5,48,94,0,0 ; vpshufb 0x5e30(%rip),%xmm0,%xmm0 # 8230 <_sk_callback_avx+0x698>
DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 196,66,125,44,18 ; vmaskmovps (%r10),%ymm0,%ymm10
@@ -8625,7 +8729,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11
DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1
DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12
- DB 197,121,111,21,159,91,0,0 ; vmovdqa 0x5b9f(%rip),%xmm10 # 8020 <_sk_callback_avx+0x67c>
+ DB 197,121,111,21,191,93,0,0 ; vmovdqa 0x5dbf(%rip),%xmm10 # 8240 <_sk_callback_avx+0x6a8>
DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -8723,7 +8827,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,186,85,0,0 ; vbroadcastss 0x55ba(%rip),%ymm7 # 7c34 <_sk_callback_avx+0x290>
+ DB 196,226,125,24,61,174,87,0,0 ; vbroadcastss 0x57ae(%rip),%ymm7 # 7e28 <_sk_callback_avx+0x290>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -8786,7 +8890,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,57,109,218 ; vpunpckhqdq %xmm2,%xmm8,%xmm11
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,158,88,0,0 ; vmovdqa 0x589e(%rip),%xmm9 # 8030 <_sk_callback_avx+0x68c>
+ DB 197,121,111,13,190,90,0,0 ; vmovdqa 0x5abe(%rip),%xmm9 # 8250 <_sk_callback_avx+0x6b8>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -8876,7 +8980,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2
DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,215,82,0,0 ; vbroadcastss 0x52d7(%rip),%ymm3 # 7c38 <_sk_callback_avx+0x294>
+ DB 196,226,125,24,29,203,84,0,0 ; vbroadcastss 0x54cb(%rip),%ymm3 # 7e2c <_sk_callback_avx+0x294>
DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6
DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7
DB 72,131,196,88 ; add $0x58,%rsp
@@ -8918,7 +9022,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
PUBLIC _sk_byte_tables_avx
_sk_byte_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,16,82,0,0 ; vbroadcastss 0x5210(%rip),%ymm8 # 7c3c <_sk_callback_avx+0x298>
+ DB 196,98,125,24,5,4,84,0,0 ; vbroadcastss 0x5404(%rip),%ymm8 # 7e30 <_sk_callback_avx+0x298>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -9037,7 +9141,7 @@ _sk_byte_tables_avx LABEL PROC
DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1
DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- DB 196,98,125,24,13,186,79,0,0 ; vbroadcastss 0x4fba(%rip),%ymm9 # 7c40 <_sk_callback_avx+0x29c>
+ DB 196,98,125,24,13,174,81,0,0 ; vbroadcastss 0x51ae(%rip),%ymm9 # 7e34 <_sk_callback_avx+0x29c>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -9151,7 +9255,7 @@ _sk_byte_tables_rgb_avx LABEL PROC
DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,155,77,0,0 ; vbroadcastss 0x4d9b(%rip),%ymm9 # 7c44 <_sk_callback_avx+0x2a0>
+ DB 196,98,125,24,13,143,79,0,0 ; vbroadcastss 0x4f8f(%rip),%ymm9 # 7e38 <_sk_callback_avx+0x2a0>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1
DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2
@@ -9346,36 +9450,36 @@ _sk_parametric_r_avx LABEL PROC
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11
- DB 196,98,125,24,37,72,74,0,0 ; vbroadcastss 0x4a48(%rip),%ymm12 # 7c48 <_sk_callback_avx+0x2a4>
+ DB 196,98,125,24,37,60,76,0,0 ; vbroadcastss 0x4c3c(%rip),%ymm12 # 7e3c <_sk_callback_avx+0x2a4>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,62,74,0,0 ; vbroadcastss 0x4a3e(%rip),%ymm12 # 7c4c <_sk_callback_avx+0x2a8>
+ DB 196,98,125,24,37,50,76,0,0 ; vbroadcastss 0x4c32(%rip),%ymm12 # 7e40 <_sk_callback_avx+0x2a8>
DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,52,74,0,0 ; vbroadcastss 0x4a34(%rip),%ymm12 # 7c50 <_sk_callback_avx+0x2ac>
+ DB 196,98,125,24,37,40,76,0,0 ; vbroadcastss 0x4c28(%rip),%ymm12 # 7e44 <_sk_callback_avx+0x2ac>
DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,42,74,0,0 ; vbroadcastss 0x4a2a(%rip),%ymm12 # 7c54 <_sk_callback_avx+0x2b0>
+ DB 196,98,125,24,37,30,76,0,0 ; vbroadcastss 0x4c1e(%rip),%ymm12 # 7e48 <_sk_callback_avx+0x2b0>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,32,74,0,0 ; vbroadcastss 0x4a20(%rip),%ymm12 # 7c58 <_sk_callback_avx+0x2b4>
+ DB 196,98,125,24,37,20,76,0,0 ; vbroadcastss 0x4c14(%rip),%ymm12 # 7e4c <_sk_callback_avx+0x2b4>
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,17,74,0,0 ; vbroadcastss 0x4a11(%rip),%ymm12 # 7c5c <_sk_callback_avx+0x2b8>
+ DB 196,98,125,24,37,5,76,0,0 ; vbroadcastss 0x4c05(%rip),%ymm12 # 7e50 <_sk_callback_avx+0x2b8>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,7,74,0,0 ; vbroadcastss 0x4a07(%rip),%ymm12 # 7c60 <_sk_callback_avx+0x2bc>
+ DB 196,98,125,24,37,251,75,0,0 ; vbroadcastss 0x4bfb(%rip),%ymm12 # 7e54 <_sk_callback_avx+0x2bc>
DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,235,73,0,0 ; vbroadcastss 0x49eb(%rip),%ymm11 # 7c64 <_sk_callback_avx+0x2c0>
+ DB 196,98,125,24,29,223,75,0,0 ; vbroadcastss 0x4bdf(%rip),%ymm11 # 7e58 <_sk_callback_avx+0x2c0>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,225,73,0,0 ; vbroadcastss 0x49e1(%rip),%ymm11 # 7c68 <_sk_callback_avx+0x2c4>
+ DB 196,98,125,24,29,213,75,0,0 ; vbroadcastss 0x4bd5(%rip),%ymm11 # 7e5c <_sk_callback_avx+0x2c4>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,210,73,0,0 ; vbroadcastss 0x49d2(%rip),%ymm11 # 7c6c <_sk_callback_avx+0x2c8>
+ DB 196,98,125,24,29,198,75,0,0 ; vbroadcastss 0x4bc6(%rip),%ymm11 # 7e60 <_sk_callback_avx+0x2c8>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,200,73,0,0 ; vbroadcastss 0x49c8(%rip),%ymm11 # 7c70 <_sk_callback_avx+0x2cc>
+ DB 196,98,125,24,29,188,75,0,0 ; vbroadcastss 0x4bbc(%rip),%ymm11 # 7e64 <_sk_callback_avx+0x2cc>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,185,73,0,0 ; vbroadcastss 0x49b9(%rip),%ymm10 # 7c74 <_sk_callback_avx+0x2d0>
+ DB 196,98,125,24,21,173,75,0,0 ; vbroadcastss 0x4bad(%rip),%ymm10 # 7e68 <_sk_callback_avx+0x2d0>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9383,7 +9487,7 @@ _sk_parametric_r_avx LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,144,73,0,0 ; vbroadcastss 0x4990(%rip),%ymm8 # 7c78 <_sk_callback_avx+0x2d4>
+ DB 196,98,125,24,5,132,75,0,0 ; vbroadcastss 0x4b84(%rip),%ymm8 # 7e6c <_sk_callback_avx+0x2d4>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9403,36 +9507,36 @@ _sk_parametric_g_avx LABEL PROC
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11
- DB 196,98,125,24,37,65,73,0,0 ; vbroadcastss 0x4941(%rip),%ymm12 # 7c7c <_sk_callback_avx+0x2d8>
+ DB 196,98,125,24,37,53,75,0,0 ; vbroadcastss 0x4b35(%rip),%ymm12 # 7e70 <_sk_callback_avx+0x2d8>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,55,73,0,0 ; vbroadcastss 0x4937(%rip),%ymm12 # 7c80 <_sk_callback_avx+0x2dc>
+ DB 196,98,125,24,37,43,75,0,0 ; vbroadcastss 0x4b2b(%rip),%ymm12 # 7e74 <_sk_callback_avx+0x2dc>
DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,45,73,0,0 ; vbroadcastss 0x492d(%rip),%ymm12 # 7c84 <_sk_callback_avx+0x2e0>
+ DB 196,98,125,24,37,33,75,0,0 ; vbroadcastss 0x4b21(%rip),%ymm12 # 7e78 <_sk_callback_avx+0x2e0>
DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,35,73,0,0 ; vbroadcastss 0x4923(%rip),%ymm12 # 7c88 <_sk_callback_avx+0x2e4>
+ DB 196,98,125,24,37,23,75,0,0 ; vbroadcastss 0x4b17(%rip),%ymm12 # 7e7c <_sk_callback_avx+0x2e4>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,25,73,0,0 ; vbroadcastss 0x4919(%rip),%ymm12 # 7c8c <_sk_callback_avx+0x2e8>
+ DB 196,98,125,24,37,13,75,0,0 ; vbroadcastss 0x4b0d(%rip),%ymm12 # 7e80 <_sk_callback_avx+0x2e8>
DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,10,73,0,0 ; vbroadcastss 0x490a(%rip),%ymm12 # 7c90 <_sk_callback_avx+0x2ec>
+ DB 196,98,125,24,37,254,74,0,0 ; vbroadcastss 0x4afe(%rip),%ymm12 # 7e84 <_sk_callback_avx+0x2ec>
DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,0,73,0,0 ; vbroadcastss 0x4900(%rip),%ymm12 # 7c94 <_sk_callback_avx+0x2f0>
+ DB 196,98,125,24,37,244,74,0,0 ; vbroadcastss 0x4af4(%rip),%ymm12 # 7e88 <_sk_callback_avx+0x2f0>
DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1
DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1
DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,228,72,0,0 ; vbroadcastss 0x48e4(%rip),%ymm11 # 7c98 <_sk_callback_avx+0x2f4>
+ DB 196,98,125,24,29,216,74,0,0 ; vbroadcastss 0x4ad8(%rip),%ymm11 # 7e8c <_sk_callback_avx+0x2f4>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,218,72,0,0 ; vbroadcastss 0x48da(%rip),%ymm11 # 7c9c <_sk_callback_avx+0x2f8>
+ DB 196,98,125,24,29,206,74,0,0 ; vbroadcastss 0x4ace(%rip),%ymm11 # 7e90 <_sk_callback_avx+0x2f8>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,203,72,0,0 ; vbroadcastss 0x48cb(%rip),%ymm11 # 7ca0 <_sk_callback_avx+0x2fc>
+ DB 196,98,125,24,29,191,74,0,0 ; vbroadcastss 0x4abf(%rip),%ymm11 # 7e94 <_sk_callback_avx+0x2fc>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,193,72,0,0 ; vbroadcastss 0x48c1(%rip),%ymm11 # 7ca4 <_sk_callback_avx+0x300>
+ DB 196,98,125,24,29,181,74,0,0 ; vbroadcastss 0x4ab5(%rip),%ymm11 # 7e98 <_sk_callback_avx+0x300>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,178,72,0,0 ; vbroadcastss 0x48b2(%rip),%ymm10 # 7ca8 <_sk_callback_avx+0x304>
+ DB 196,98,125,24,21,166,74,0,0 ; vbroadcastss 0x4aa6(%rip),%ymm10 # 7e9c <_sk_callback_avx+0x304>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9440,7 +9544,7 @@ _sk_parametric_g_avx LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,137,72,0,0 ; vbroadcastss 0x4889(%rip),%ymm8 # 7cac <_sk_callback_avx+0x308>
+ DB 196,98,125,24,5,125,74,0,0 ; vbroadcastss 0x4a7d(%rip),%ymm8 # 7ea0 <_sk_callback_avx+0x308>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9460,36 +9564,36 @@ _sk_parametric_b_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11
- DB 196,98,125,24,37,58,72,0,0 ; vbroadcastss 0x483a(%rip),%ymm12 # 7cb0 <_sk_callback_avx+0x30c>
+ DB 196,98,125,24,37,46,74,0,0 ; vbroadcastss 0x4a2e(%rip),%ymm12 # 7ea4 <_sk_callback_avx+0x30c>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,48,72,0,0 ; vbroadcastss 0x4830(%rip),%ymm12 # 7cb4 <_sk_callback_avx+0x310>
+ DB 196,98,125,24,37,36,74,0,0 ; vbroadcastss 0x4a24(%rip),%ymm12 # 7ea8 <_sk_callback_avx+0x310>
DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,38,72,0,0 ; vbroadcastss 0x4826(%rip),%ymm12 # 7cb8 <_sk_callback_avx+0x314>
+ DB 196,98,125,24,37,26,74,0,0 ; vbroadcastss 0x4a1a(%rip),%ymm12 # 7eac <_sk_callback_avx+0x314>
DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,28,72,0,0 ; vbroadcastss 0x481c(%rip),%ymm12 # 7cbc <_sk_callback_avx+0x318>
+ DB 196,98,125,24,37,16,74,0,0 ; vbroadcastss 0x4a10(%rip),%ymm12 # 7eb0 <_sk_callback_avx+0x318>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,18,72,0,0 ; vbroadcastss 0x4812(%rip),%ymm12 # 7cc0 <_sk_callback_avx+0x31c>
+ DB 196,98,125,24,37,6,74,0,0 ; vbroadcastss 0x4a06(%rip),%ymm12 # 7eb4 <_sk_callback_avx+0x31c>
DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,3,72,0,0 ; vbroadcastss 0x4803(%rip),%ymm12 # 7cc4 <_sk_callback_avx+0x320>
+ DB 196,98,125,24,37,247,73,0,0 ; vbroadcastss 0x49f7(%rip),%ymm12 # 7eb8 <_sk_callback_avx+0x320>
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,249,71,0,0 ; vbroadcastss 0x47f9(%rip),%ymm12 # 7cc8 <_sk_callback_avx+0x324>
+ DB 196,98,125,24,37,237,73,0,0 ; vbroadcastss 0x49ed(%rip),%ymm12 # 7ebc <_sk_callback_avx+0x324>
DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2
DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,221,71,0,0 ; vbroadcastss 0x47dd(%rip),%ymm11 # 7ccc <_sk_callback_avx+0x328>
+ DB 196,98,125,24,29,209,73,0,0 ; vbroadcastss 0x49d1(%rip),%ymm11 # 7ec0 <_sk_callback_avx+0x328>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,211,71,0,0 ; vbroadcastss 0x47d3(%rip),%ymm11 # 7cd0 <_sk_callback_avx+0x32c>
+ DB 196,98,125,24,29,199,73,0,0 ; vbroadcastss 0x49c7(%rip),%ymm11 # 7ec4 <_sk_callback_avx+0x32c>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,196,71,0,0 ; vbroadcastss 0x47c4(%rip),%ymm11 # 7cd4 <_sk_callback_avx+0x330>
+ DB 196,98,125,24,29,184,73,0,0 ; vbroadcastss 0x49b8(%rip),%ymm11 # 7ec8 <_sk_callback_avx+0x330>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,186,71,0,0 ; vbroadcastss 0x47ba(%rip),%ymm11 # 7cd8 <_sk_callback_avx+0x334>
+ DB 196,98,125,24,29,174,73,0,0 ; vbroadcastss 0x49ae(%rip),%ymm11 # 7ecc <_sk_callback_avx+0x334>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,171,71,0,0 ; vbroadcastss 0x47ab(%rip),%ymm10 # 7cdc <_sk_callback_avx+0x338>
+ DB 196,98,125,24,21,159,73,0,0 ; vbroadcastss 0x499f(%rip),%ymm10 # 7ed0 <_sk_callback_avx+0x338>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9497,7 +9601,7 @@ _sk_parametric_b_avx LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,130,71,0,0 ; vbroadcastss 0x4782(%rip),%ymm8 # 7ce0 <_sk_callback_avx+0x33c>
+ DB 196,98,125,24,5,118,73,0,0 ; vbroadcastss 0x4976(%rip),%ymm8 # 7ed4 <_sk_callback_avx+0x33c>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9517,36 +9621,36 @@ _sk_parametric_a_avx LABEL PROC
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11
- DB 196,98,125,24,37,51,71,0,0 ; vbroadcastss 0x4733(%rip),%ymm12 # 7ce4 <_sk_callback_avx+0x340>
+ DB 196,98,125,24,37,39,73,0,0 ; vbroadcastss 0x4927(%rip),%ymm12 # 7ed8 <_sk_callback_avx+0x340>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,41,71,0,0 ; vbroadcastss 0x4729(%rip),%ymm12 # 7ce8 <_sk_callback_avx+0x344>
+ DB 196,98,125,24,37,29,73,0,0 ; vbroadcastss 0x491d(%rip),%ymm12 # 7edc <_sk_callback_avx+0x344>
DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,31,71,0,0 ; vbroadcastss 0x471f(%rip),%ymm12 # 7cec <_sk_callback_avx+0x348>
+ DB 196,98,125,24,37,19,73,0,0 ; vbroadcastss 0x4913(%rip),%ymm12 # 7ee0 <_sk_callback_avx+0x348>
DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,21,71,0,0 ; vbroadcastss 0x4715(%rip),%ymm12 # 7cf0 <_sk_callback_avx+0x34c>
+ DB 196,98,125,24,37,9,73,0,0 ; vbroadcastss 0x4909(%rip),%ymm12 # 7ee4 <_sk_callback_avx+0x34c>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,11,71,0,0 ; vbroadcastss 0x470b(%rip),%ymm12 # 7cf4 <_sk_callback_avx+0x350>
+ DB 196,98,125,24,37,255,72,0,0 ; vbroadcastss 0x48ff(%rip),%ymm12 # 7ee8 <_sk_callback_avx+0x350>
DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,252,70,0,0 ; vbroadcastss 0x46fc(%rip),%ymm12 # 7cf8 <_sk_callback_avx+0x354>
+ DB 196,98,125,24,37,240,72,0,0 ; vbroadcastss 0x48f0(%rip),%ymm12 # 7eec <_sk_callback_avx+0x354>
DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,242,70,0,0 ; vbroadcastss 0x46f2(%rip),%ymm12 # 7cfc <_sk_callback_avx+0x358>
+ DB 196,98,125,24,37,230,72,0,0 ; vbroadcastss 0x48e6(%rip),%ymm12 # 7ef0 <_sk_callback_avx+0x358>
DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3
DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,214,70,0,0 ; vbroadcastss 0x46d6(%rip),%ymm11 # 7d00 <_sk_callback_avx+0x35c>
+ DB 196,98,125,24,29,202,72,0,0 ; vbroadcastss 0x48ca(%rip),%ymm11 # 7ef4 <_sk_callback_avx+0x35c>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,204,70,0,0 ; vbroadcastss 0x46cc(%rip),%ymm11 # 7d04 <_sk_callback_avx+0x360>
+ DB 196,98,125,24,29,192,72,0,0 ; vbroadcastss 0x48c0(%rip),%ymm11 # 7ef8 <_sk_callback_avx+0x360>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,189,70,0,0 ; vbroadcastss 0x46bd(%rip),%ymm11 # 7d08 <_sk_callback_avx+0x364>
+ DB 196,98,125,24,29,177,72,0,0 ; vbroadcastss 0x48b1(%rip),%ymm11 # 7efc <_sk_callback_avx+0x364>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,179,70,0,0 ; vbroadcastss 0x46b3(%rip),%ymm11 # 7d0c <_sk_callback_avx+0x368>
+ DB 196,98,125,24,29,167,72,0,0 ; vbroadcastss 0x48a7(%rip),%ymm11 # 7f00 <_sk_callback_avx+0x368>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,164,70,0,0 ; vbroadcastss 0x46a4(%rip),%ymm10 # 7d10 <_sk_callback_avx+0x36c>
+ DB 196,98,125,24,21,152,72,0,0 ; vbroadcastss 0x4898(%rip),%ymm10 # 7f04 <_sk_callback_avx+0x36c>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9554,38 +9658,135 @@ _sk_parametric_a_avx LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,123,70,0,0 ; vbroadcastss 0x467b(%rip),%ymm8 # 7d14 <_sk_callback_avx+0x370>
+ DB 196,98,125,24,5,111,72,0,0 ; vbroadcastss 0x486f(%rip),%ymm8 # 7f08 <_sk_callback_avx+0x370>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_gamma_avx
+_sk_gamma_avx LABEL PROC
+ DB 72,129,236,216,0,0,0 ; sub $0xd8,%rsp
+ DB 197,252,17,188,36,160,0,0,0 ; vmovups %ymm7,0xa0(%rsp)
+ DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
+ DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
+ DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
+ DB 197,252,17,92,36,32 ; vmovups %ymm3,0x20(%rsp)
+ DB 197,252,40,250 ; vmovaps %ymm2,%ymm7
+ DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,252,91,200 ; vcvtdq2ps %ymm0,%ymm1
+ DB 196,98,125,24,5,40,72,0,0 ; vbroadcastss 0x4828(%rip),%ymm8 # 7f0c <_sk_callback_avx+0x374>
+ DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
+ DB 196,98,125,24,13,30,72,0,0 ; vbroadcastss 0x481e(%rip),%ymm9 # 7f10 <_sk_callback_avx+0x378>
+ DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
+ DB 196,226,125,24,37,20,72,0,0 ; vbroadcastss 0x4814(%rip),%ymm4 # 7f14 <_sk_callback_avx+0x37c>
+ DB 197,252,86,196 ; vorps %ymm4,%ymm0,%ymm0
+ DB 196,98,125,24,21,11,72,0,0 ; vbroadcastss 0x480b(%rip),%ymm10 # 7f18 <_sk_callback_avx+0x380>
+ DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
+ DB 196,98,125,24,29,1,72,0,0 ; vbroadcastss 0x4801(%rip),%ymm11 # 7f1c <_sk_callback_avx+0x384>
+ DB 196,193,124,89,211 ; vmulps %ymm11,%ymm0,%ymm2
+ DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1
+ DB 196,98,125,24,37,243,71,0,0 ; vbroadcastss 0x47f3(%rip),%ymm12 # 7f20 <_sk_callback_avx+0x388>
+ DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
+ DB 196,98,125,24,45,233,71,0,0 ; vbroadcastss 0x47e9(%rip),%ymm13 # 7f24 <_sk_callback_avx+0x38c>
+ DB 197,148,94,192 ; vdivps %ymm0,%ymm13,%ymm0
+ DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0
+ DB 196,98,125,24,48 ; vbroadcastss (%rax),%ymm14
+ DB 196,193,124,89,198 ; vmulps %ymm14,%ymm0,%ymm0
+ DB 196,227,125,8,200,1 ; vroundps $0x1,%ymm0,%ymm1
+ DB 197,252,92,241 ; vsubps %ymm1,%ymm0,%ymm6
+ DB 196,98,125,24,61,200,71,0,0 ; vbroadcastss 0x47c8(%rip),%ymm15 # 7f28 <_sk_callback_avx+0x390>
+ DB 196,193,124,88,199 ; vaddps %ymm15,%ymm0,%ymm0
+ DB 196,226,125,24,29,190,71,0,0 ; vbroadcastss 0x47be(%rip),%ymm3 # 7f2c <_sk_callback_avx+0x394>
+ DB 197,204,89,203 ; vmulps %ymm3,%ymm6,%ymm1
+ DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
+ DB 196,226,125,24,21,177,71,0,0 ; vbroadcastss 0x47b1(%rip),%ymm2 # 7f30 <_sk_callback_avx+0x398>
+ DB 197,236,92,198 ; vsubps %ymm6,%ymm2,%ymm0
+ DB 196,226,125,24,53,168,71,0,0 ; vbroadcastss 0x47a8(%rip),%ymm6 # 7f34 <_sk_callback_avx+0x39c>
+ DB 197,204,94,192 ; vdivps %ymm0,%ymm6,%ymm0
+ DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
+ DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
+ DB 197,252,91,205 ; vcvtdq2ps %ymm5,%ymm1
+ DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
+ DB 196,193,84,84,233 ; vandps %ymm9,%ymm5,%ymm5
+ DB 197,212,86,236 ; vorps %ymm4,%ymm5,%ymm5
+ DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
+ DB 196,193,84,89,195 ; vmulps %ymm11,%ymm5,%ymm0
+ DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0
+ DB 196,193,84,88,204 ; vaddps %ymm12,%ymm5,%ymm1
+ DB 197,148,94,201 ; vdivps %ymm1,%ymm13,%ymm1
+ DB 197,252,92,193 ; vsubps %ymm1,%ymm0,%ymm0
+ DB 196,193,124,89,198 ; vmulps %ymm14,%ymm0,%ymm0
+ DB 196,227,125,8,200,1 ; vroundps $0x1,%ymm0,%ymm1
+ DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
+ DB 196,193,124,88,199 ; vaddps %ymm15,%ymm0,%ymm0
+ DB 197,244,89,235 ; vmulps %ymm3,%ymm1,%ymm5
+ DB 197,252,92,197 ; vsubps %ymm5,%ymm0,%ymm0
+ DB 197,236,92,201 ; vsubps %ymm1,%ymm2,%ymm1
+ DB 197,204,94,201 ; vdivps %ymm1,%ymm6,%ymm1
+ DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
+ DB 197,252,91,207 ; vcvtdq2ps %ymm7,%ymm1
+ DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
+ DB 196,193,68,84,233 ; vandps %ymm9,%ymm7,%ymm5
+ DB 197,212,86,228 ; vorps %ymm4,%ymm5,%ymm4
+ DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
+ DB 196,193,92,89,235 ; vmulps %ymm11,%ymm4,%ymm5
+ DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
+ DB 196,193,92,88,228 ; vaddps %ymm12,%ymm4,%ymm4
+ DB 197,148,94,228 ; vdivps %ymm4,%ymm13,%ymm4
+ DB 197,244,92,204 ; vsubps %ymm4,%ymm1,%ymm1
+ DB 196,193,116,89,206 ; vmulps %ymm14,%ymm1,%ymm1
+ DB 196,227,125,8,225,1 ; vroundps $0x1,%ymm1,%ymm4
+ DB 197,244,92,228 ; vsubps %ymm4,%ymm1,%ymm4
+ DB 196,193,116,88,207 ; vaddps %ymm15,%ymm1,%ymm1
+ DB 197,220,89,219 ; vmulps %ymm3,%ymm4,%ymm3
+ DB 197,244,92,203 ; vsubps %ymm3,%ymm1,%ymm1
+ DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
+ DB 197,204,94,210 ; vdivps %ymm2,%ymm6,%ymm2
+ DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
+ DB 196,226,125,24,21,236,70,0,0 ; vbroadcastss 0x46ec(%rip),%ymm2 # 7f38 <_sk_callback_avx+0x3a0>
+ DB 197,236,89,28,36 ; vmulps (%rsp),%ymm2,%ymm3
+ DB 197,252,89,226 ; vmulps %ymm2,%ymm0,%ymm4
+ DB 197,244,89,210 ; vmulps %ymm2,%ymm1,%ymm2
+ DB 197,253,91,195 ; vcvtps2dq %ymm3,%ymm0
+ DB 197,253,91,204 ; vcvtps2dq %ymm4,%ymm1
+ DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,252,16,92,36,32 ; vmovups 0x20(%rsp),%ymm3
+ DB 197,252,16,100,36,64 ; vmovups 0x40(%rsp),%ymm4
+ DB 197,252,16,108,36,96 ; vmovups 0x60(%rsp),%ymm5
+ DB 197,252,16,180,36,128,0,0,0 ; vmovups 0x80(%rsp),%ymm6
+ DB 197,252,16,188,36,160,0,0,0 ; vmovups 0xa0(%rsp),%ymm7
+ DB 72,129,196,216,0,0,0 ; add $0xd8,%rsp
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_lab_to_xyz_avx
_sk_lab_to_xyz_avx LABEL PROC
- DB 196,98,125,24,5,109,70,0,0 ; vbroadcastss 0x466d(%rip),%ymm8 # 7d18 <_sk_callback_avx+0x374>
+ DB 196,98,125,24,5,159,70,0,0 ; vbroadcastss 0x469f(%rip),%ymm8 # 7f3c <_sk_callback_avx+0x3a4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,99,70,0,0 ; vbroadcastss 0x4663(%rip),%ymm8 # 7d1c <_sk_callback_avx+0x378>
+ DB 196,98,125,24,5,149,70,0,0 ; vbroadcastss 0x4695(%rip),%ymm8 # 7f40 <_sk_callback_avx+0x3a8>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,89,70,0,0 ; vbroadcastss 0x4659(%rip),%ymm9 # 7d20 <_sk_callback_avx+0x37c>
+ DB 196,98,125,24,13,139,70,0,0 ; vbroadcastss 0x468b(%rip),%ymm9 # 7f44 <_sk_callback_avx+0x3ac>
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2
- DB 196,98,125,24,5,69,70,0,0 ; vbroadcastss 0x4645(%rip),%ymm8 # 7d24 <_sk_callback_avx+0x380>
+ DB 196,98,125,24,5,119,70,0,0 ; vbroadcastss 0x4677(%rip),%ymm8 # 7f48 <_sk_callback_avx+0x3b0>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,59,70,0,0 ; vbroadcastss 0x463b(%rip),%ymm8 # 7d28 <_sk_callback_avx+0x384>
+ DB 196,98,125,24,5,109,70,0,0 ; vbroadcastss 0x466d(%rip),%ymm8 # 7f4c <_sk_callback_avx+0x3b4>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,49,70,0,0 ; vbroadcastss 0x4631(%rip),%ymm8 # 7d2c <_sk_callback_avx+0x388>
+ DB 196,98,125,24,5,99,70,0,0 ; vbroadcastss 0x4663(%rip),%ymm8 # 7f50 <_sk_callback_avx+0x3b8>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1
- DB 196,98,125,24,5,35,70,0,0 ; vbroadcastss 0x4623(%rip),%ymm8 # 7d30 <_sk_callback_avx+0x38c>
+ DB 196,98,125,24,5,85,70,0,0 ; vbroadcastss 0x4655(%rip),%ymm8 # 7f54 <_sk_callback_avx+0x3bc>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2
DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8
DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8
- DB 196,98,125,24,13,12,70,0,0 ; vbroadcastss 0x460c(%rip),%ymm9 # 7d34 <_sk_callback_avx+0x390>
+ DB 196,98,125,24,13,62,70,0,0 ; vbroadcastss 0x463e(%rip),%ymm9 # 7f58 <_sk_callback_avx+0x3c0>
DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,1,70,0,0 ; vbroadcastss 0x4601(%rip),%ymm11 # 7d38 <_sk_callback_avx+0x394>
+ DB 196,98,125,24,29,51,70,0,0 ; vbroadcastss 0x4633(%rip),%ymm11 # 7f5c <_sk_callback_avx+0x3c4>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,37,247,69,0,0 ; vbroadcastss 0x45f7(%rip),%ymm12 # 7d3c <_sk_callback_avx+0x398>
+ DB 196,98,125,24,37,41,70,0,0 ; vbroadcastss 0x4629(%rip),%ymm12 # 7f60 <_sk_callback_avx+0x3c8>
DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1
DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -9600,9 +9801,9 @@ _sk_lab_to_xyz_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2
DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- DB 196,226,125,24,5,173,69,0,0 ; vbroadcastss 0x45ad(%rip),%ymm0 # 7d40 <_sk_callback_avx+0x39c>
+ DB 196,226,125,24,5,223,69,0,0 ; vbroadcastss 0x45df(%rip),%ymm0 # 7f64 <_sk_callback_avx+0x3cc>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,164,69,0,0 ; vbroadcastss 0x45a4(%rip),%ymm8 # 7d44 <_sk_callback_avx+0x3a0>
+ DB 196,98,125,24,5,214,69,0,0 ; vbroadcastss 0x45d6(%rip),%ymm8 # 7f68 <_sk_callback_avx+0x3d0>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9617,15 +9818,15 @@ _sk_load_a8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne 3805 <_sk_load_a8_avx+0x5c>
+ DB 117,67 ; jne 39f7 <_sk_load_a8_avx+0x5c>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,112,72,0,0 ; vpand 0x4870(%rip),%xmm0,%xmm0 # 8040 <_sk_callback_avx+0x69c>
+ DB 197,249,219,5,158,72,0,0 ; vpand 0x489e(%rip),%xmm0,%xmm0 # 8260 <_sk_callback_avx+0x6c8>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,88,69,0,0 ; vbroadcastss 0x4558(%rip),%ymm1 # 7d48 <_sk_callback_avx+0x3a4>
+ DB 196,226,125,24,13,138,69,0,0 ; vbroadcastss 0x458a(%rip),%ymm1 # 7f6c <_sk_callback_avx+0x3d4>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -9638,15 +9839,15 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,175 ; ja 37c8 <_sk_load_a8_avx+0x1f>
+ DB 119,175 ; ja 39ba <_sk_load_a8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # 389c <_sk_load_a8_avx+0xf3>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3a90 <_sk_load_a8_avx+0xf5>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,144 ; jmp 37c8 <_sk_load_a8_avx+0x1f>
+ DB 235,144 ; jmp 39ba <_sk_load_a8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -9654,7 +9855,7 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,104,255,255,255 ; jmpq 37c8 <_sk_load_a8_avx+0x1f>
+ DB 233,104,255,255,255 ; jmpq 39ba <_sk_load_a8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -9665,22 +9866,24 @@ _sk_load_a8_avx LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,45,255,255,255 ; jmpq 37c8 <_sk_load_a8_avx+0x1f>
- DB 144 ; nop
- DB 145 ; xchg %eax,%ecx
+ DB 233,45,255,255,255 ; jmpq 39ba <_sk_load_a8_avx+0x1f>
+ DB 15,31,0 ; nopl (%rax)
+ DB 143 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,171,255,255,255,156 ; ljmp *-0x63000001(%rbx)
+ DB 255,169,255,255,255,154 ; ljmp *-0x65000001(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,231 ; jmpq *%rdi
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf0038ac <_sk_callback_avx+0xffffffffdeffbf08>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,211 ; callq *%rbx
+ DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
+ DB 255,209 ; callq *%rcx
DB 255 ; (bad)
- DB 255,196 ; inc %esp
+ DB 255 ; (bad)
+ DB 255,194 ; inc %edx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -9695,15 +9898,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne 3914 <_sk_load_a8_dst_avx+0x5c>
+ DB 117,67 ; jne 3b08 <_sk_load_a8_dst_avx+0x5c>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,113,71,0,0 ; vpand 0x4771(%rip),%xmm4,%xmm4 # 8050 <_sk_callback_avx+0x6ac>
+ DB 197,217,219,37,157,71,0,0 ; vpand 0x479d(%rip),%xmm4,%xmm4 # 8270 <_sk_callback_avx+0x6d8>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,77,68,0,0 ; vbroadcastss 0x444d(%rip),%ymm5 # 7d4c <_sk_callback_avx+0x3a8>
+ DB 196,226,125,24,45,125,68,0,0 ; vbroadcastss 0x447d(%rip),%ymm5 # 7f70 <_sk_callback_avx+0x3d8>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -9716,15 +9919,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,175 ; ja 38d7 <_sk_load_a8_dst_avx+0x1f>
+ DB 119,175 ; ja 3acb <_sk_load_a8_dst_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 39ac <_sk_load_a8_dst_avx+0xf4>
+ DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 3ba0 <_sk_load_a8_dst_avx+0xf4>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,144 ; jmp 38d7 <_sk_load_a8_dst_avx+0x1f>
+ DB 235,144 ; jmp 3acb <_sk_load_a8_dst_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -9732,7 +9935,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,104,255,255,255 ; jmpq 38d7 <_sk_load_a8_dst_avx+0x1f>
+ DB 233,104,255,255,255 ; jmpq 3acb <_sk_load_a8_dst_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -9743,7 +9946,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,45,255,255,255 ; jmpq 38d7 <_sk_load_a8_dst_avx+0x1f>
+ DB 233,45,255,255,255 ; jmpq 3acb <_sk_load_a8_dst_avx+0x1f>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -9752,7 +9955,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde0039bc <_sk_callback_avx+0xffffffffddffc018>
+ DB 232,255,255,255,221 ; callq ffffffffde003bb0 <_sk_callback_avx+0xffffffffddffc018>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -9805,7 +10008,7 @@ _sk_gather_a8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,188,66,0,0 ; vbroadcastss 0x42bc(%rip),%ymm1 # 7d50 <_sk_callback_avx+0x3ac>
+ DB 196,226,125,24,13,236,66,0,0 ; vbroadcastss 0x42ec(%rip),%ymm1 # 7f74 <_sk_callback_avx+0x3dc>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -9822,14 +10025,14 @@ _sk_store_a8_avx LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,143,66,0,0 ; vbroadcastss 0x428f(%rip),%ymm8 # 7d54 <_sk_callback_avx+0x3b0>
+ DB 196,98,125,24,5,191,66,0,0 ; vbroadcastss 0x42bf(%rip),%ymm8 # 7f78 <_sk_callback_avx+0x3e0>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 3aef <_sk_store_a8_avx+0x47>
+ DB 117,11 ; jne 3ce3 <_sk_store_a8_avx+0x47>
DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -9838,25 +10041,25 @@ _sk_store_a8_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 3aea <_sk_store_a8_avx+0x42>
+ DB 119,235 ; ja 3cde <_sk_store_a8_avx+0x42>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 3b64 <_sk_store_a8_avx+0xbc>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 3d58 <_sk_store_a8_avx+0xbc>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,201 ; jmp 3aea <_sk_store_a8_avx+0x42>
+ DB 235,201 ; jmp 3cde <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,46,69,0,0 ; vpshufb 0x452e(%rip),%xmm8,%xmm8 # 8060 <_sk_callback_avx+0x6bc>
+ DB 196,98,57,0,5,90,69,0,0 ; vpshufb 0x455a(%rip),%xmm8,%xmm8 # 8280 <_sk_callback_avx+0x6e8>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,175 ; jmp 3aea <_sk_store_a8_avx+0x42>
+ DB 235,175 ; jmp 3cde <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,20,69,0,0 ; vpshufb 0x4514(%rip),%xmm8,%xmm8 # 8070 <_sk_callback_avx+0x6cc>
+ DB 196,98,57,0,5,64,69,0,0 ; vpshufb 0x4540(%rip),%xmm8,%xmm8 # 8290 <_sk_callback_avx+0x6f8>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
- DB 235,134 ; jmp 3aea <_sk_store_a8_avx+0x42>
+ DB 235,134 ; jmp 3cde <_sk_store_a8_avx+0x42>
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
DB 255,197 ; inc %ebp
@@ -9887,18 +10090,18 @@ _sk_load_g8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne 3be1 <_sk_load_g8_avx+0x61>
+ DB 117,72 ; jne 3dd5 <_sk_load_g8_avx+0x61>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,217,68,0,0 ; vpand 0x44d9(%rip),%xmm0,%xmm0 # 8080 <_sk_callback_avx+0x6dc>
+ DB 197,249,219,5,5,69,0,0 ; vpand 0x4505(%rip),%xmm0,%xmm0 # 82a0 <_sk_callback_avx+0x708>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,145,65,0,0 ; vbroadcastss 0x4191(%rip),%ymm1 # 7d58 <_sk_callback_avx+0x3b4>
+ DB 196,226,125,24,13,193,65,0,0 ; vbroadcastss 0x41c1(%rip),%ymm1 # 7f7c <_sk_callback_avx+0x3e4>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,134,65,0,0 ; vbroadcastss 0x4186(%rip),%ymm3 # 7d5c <_sk_callback_avx+0x3b8>
+ DB 196,226,125,24,29,182,65,0,0 ; vbroadcastss 0x41b6(%rip),%ymm3 # 7f80 <_sk_callback_avx+0x3e8>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -9908,15 +10111,15 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,170 ; ja 3b9f <_sk_load_g8_avx+0x1f>
+ DB 119,170 ; ja 3d93 <_sk_load_g8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # 3c78 <_sk_load_g8_avx+0xf8>
+ DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # 3e6c <_sk_load_g8_avx+0xf8>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,139 ; jmp 3b9f <_sk_load_g8_avx+0x1f>
+ DB 235,139 ; jmp 3d93 <_sk_load_g8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -9924,7 +10127,7 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,99,255,255,255 ; jmpq 3b9f <_sk_load_g8_avx+0x1f>
+ DB 233,99,255,255,255 ; jmpq 3d93 <_sk_load_g8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -9935,7 +10138,7 @@ _sk_load_g8_avx LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,40,255,255,255 ; jmpq 3b9f <_sk_load_g8_avx+0x1f>
+ DB 233,40,255,255,255 ; jmpq 3d93 <_sk_load_g8_avx+0x1f>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -9944,7 +10147,7 @@ _sk_load_g8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf003c88 <_sk_callback_avx+0xffffffffdeffc2e4>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003e7c <_sk_callback_avx+0xffffffffdeffc2e4>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -9965,18 +10168,18 @@ _sk_load_g8_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne 3cf5 <_sk_load_g8_dst_avx+0x61>
+ DB 117,72 ; jne 3ee9 <_sk_load_g8_dst_avx+0x61>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,213,67,0,0 ; vpand 0x43d5(%rip),%xmm4,%xmm4 # 8090 <_sk_callback_avx+0x6ec>
+ DB 197,217,219,37,1,68,0,0 ; vpand 0x4401(%rip),%xmm4,%xmm4 # 82b0 <_sk_callback_avx+0x718>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,133,64,0,0 ; vbroadcastss 0x4085(%rip),%ymm5 # 7d60 <_sk_callback_avx+0x3bc>
+ DB 196,226,125,24,45,181,64,0,0 ; vbroadcastss 0x40b5(%rip),%ymm5 # 7f84 <_sk_callback_avx+0x3ec>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,122,64,0,0 ; vbroadcastss 0x407a(%rip),%ymm7 # 7d64 <_sk_callback_avx+0x3c0>
+ DB 196,226,125,24,61,170,64,0,0 ; vbroadcastss 0x40aa(%rip),%ymm7 # 7f88 <_sk_callback_avx+0x3f0>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -9986,15 +10189,15 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,170 ; ja 3cb3 <_sk_load_g8_dst_avx+0x1f>
+ DB 119,170 ; ja 3ea7 <_sk_load_g8_dst_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # 3d8c <_sk_load_g8_dst_avx+0xf8>
+ DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # 3f80 <_sk_load_g8_dst_avx+0xf8>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,139 ; jmp 3cb3 <_sk_load_g8_dst_avx+0x1f>
+ DB 235,139 ; jmp 3ea7 <_sk_load_g8_dst_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -10002,7 +10205,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,99,255,255,255 ; jmpq 3cb3 <_sk_load_g8_dst_avx+0x1f>
+ DB 233,99,255,255,255 ; jmpq 3ea7 <_sk_load_g8_dst_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -10013,7 +10216,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,40,255,255,255 ; jmpq 3cb3 <_sk_load_g8_dst_avx+0x1f>
+ DB 233,40,255,255,255 ; jmpq 3ea7 <_sk_load_g8_dst_avx+0x1f>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -10022,7 +10225,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf003d9c <_sk_callback_avx+0xffffffffdeffc3f8>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003f90 <_sk_callback_avx+0xffffffffdeffc3f8>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10075,10 +10278,10 @@ _sk_gather_g8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,244,62,0,0 ; vbroadcastss 0x3ef4(%rip),%ymm1 # 7d68 <_sk_callback_avx+0x3c4>
+ DB 196,226,125,24,13,36,63,0,0 ; vbroadcastss 0x3f24(%rip),%ymm1 # 7f8c <_sk_callback_avx+0x3f4>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,233,62,0,0 ; vbroadcastss 0x3ee9(%rip),%ymm3 # 7d6c <_sk_callback_avx+0x3c8>
+ DB 196,226,125,24,29,25,63,0,0 ; vbroadcastss 0x3f19(%rip),%ymm3 # 7f90 <_sk_callback_avx+0x3f8>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -10094,29 +10297,29 @@ _sk_load_565_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,129,0,0,0 ; jne 3f2e <_sk_load_565_avx+0xa1>
+ DB 15,133,129,0,0,0 ; jne 4122 <_sk_load_565_avx+0xa1>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,161,62,0,0 ; vbroadcastss 0x3ea1(%rip),%ymm0 # 7d70 <_sk_callback_avx+0x3cc>
+ DB 196,226,125,24,5,209,62,0,0 ; vbroadcastss 0x3ed1(%rip),%ymm0 # 7f94 <_sk_callback_avx+0x3fc>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,148,62,0,0 ; vbroadcastss 0x3e94(%rip),%ymm1 # 7d74 <_sk_callback_avx+0x3d0>
+ DB 196,226,125,24,13,196,62,0,0 ; vbroadcastss 0x3ec4(%rip),%ymm1 # 7f98 <_sk_callback_avx+0x400>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,139,62,0,0 ; vbroadcastss 0x3e8b(%rip),%ymm1 # 7d78 <_sk_callback_avx+0x3d4>
+ DB 196,226,125,24,13,187,62,0,0 ; vbroadcastss 0x3ebb(%rip),%ymm1 # 7f9c <_sk_callback_avx+0x404>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,126,62,0,0 ; vbroadcastss 0x3e7e(%rip),%ymm3 # 7d7c <_sk_callback_avx+0x3d8>
+ DB 196,226,125,24,29,174,62,0,0 ; vbroadcastss 0x3eae(%rip),%ymm3 # 7fa0 <_sk_callback_avx+0x408>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,117,62,0,0 ; vbroadcastss 0x3e75(%rip),%ymm3 # 7d80 <_sk_callback_avx+0x3dc>
+ DB 196,226,125,24,29,165,62,0,0 ; vbroadcastss 0x3ea5(%rip),%ymm3 # 7fa4 <_sk_callback_avx+0x40c>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,104,62,0,0 ; vbroadcastss 0x3e68(%rip),%ymm3 # 7d84 <_sk_callback_avx+0x3e0>
+ DB 196,226,125,24,29,152,62,0,0 ; vbroadcastss 0x3e98(%rip),%ymm3 # 7fa8 <_sk_callback_avx+0x410>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,93,62,0,0 ; vbroadcastss 0x3e5d(%rip),%ymm3 # 7d88 <_sk_callback_avx+0x3e4>
+ DB 196,226,125,24,29,141,62,0,0 ; vbroadcastss 0x3e8d(%rip),%ymm3 # 7fac <_sk_callback_avx+0x414>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10124,27 +10327,27 @@ _sk_load_565_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,109,255,255,255 ; ja 3eb3 <_sk_load_565_avx+0x26>
+ DB 15,135,109,255,255,255 ; ja 40a7 <_sk_load_565_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 3fb4 <_sk_load_565_avx+0x127>
+ DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 41a8 <_sk_load_565_avx+0x127>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,75,255,255,255 ; jmpq 3eb3 <_sk_load_565_avx+0x26>
+ DB 233,75,255,255,255 ; jmpq 40a7 <_sk_load_565_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,46,255,255,255 ; jmpq 3eb3 <_sk_load_565_avx+0x26>
+ DB 233,46,255,255,255 ; jmpq 40a7 <_sk_load_565_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,1,255,255,255 ; jmpq 3eb3 <_sk_load_565_avx+0x26>
+ DB 233,1,255,255,255 ; jmpq 40a7 <_sk_load_565_avx+0x26>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -10176,29 +10379,29 @@ _sk_load_565_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,129,0,0,0 ; jne 4071 <_sk_load_565_dst_avx+0xa1>
+ DB 15,133,129,0,0,0 ; jne 4265 <_sk_load_565_dst_avx+0xa1>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,245,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- DB 196,226,125,24,37,122,61,0,0 ; vbroadcastss 0x3d7a(%rip),%ymm4 # 7d8c <_sk_callback_avx+0x3e8>
+ DB 196,226,125,24,37,170,61,0,0 ; vbroadcastss 0x3daa(%rip),%ymm4 # 7fb0 <_sk_callback_avx+0x418>
DB 197,204,84,228 ; vandps %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,109,61,0,0 ; vbroadcastss 0x3d6d(%rip),%ymm5 # 7d90 <_sk_callback_avx+0x3ec>
+ DB 196,226,125,24,45,157,61,0,0 ; vbroadcastss 0x3d9d(%rip),%ymm5 # 7fb4 <_sk_callback_avx+0x41c>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,100,61,0,0 ; vbroadcastss 0x3d64(%rip),%ymm5 # 7d94 <_sk_callback_avx+0x3f0>
+ DB 196,226,125,24,45,148,61,0,0 ; vbroadcastss 0x3d94(%rip),%ymm5 # 7fb8 <_sk_callback_avx+0x420>
DB 197,204,84,237 ; vandps %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,87,61,0,0 ; vbroadcastss 0x3d57(%rip),%ymm7 # 7d98 <_sk_callback_avx+0x3f4>
+ DB 196,226,125,24,61,135,61,0,0 ; vbroadcastss 0x3d87(%rip),%ymm7 # 7fbc <_sk_callback_avx+0x424>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,24,61,78,61,0,0 ; vbroadcastss 0x3d4e(%rip),%ymm7 # 7d9c <_sk_callback_avx+0x3f8>
+ DB 196,226,125,24,61,126,61,0,0 ; vbroadcastss 0x3d7e(%rip),%ymm7 # 7fc0 <_sk_callback_avx+0x428>
DB 197,204,84,247 ; vandps %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,65,61,0,0 ; vbroadcastss 0x3d41(%rip),%ymm7 # 7da0 <_sk_callback_avx+0x3fc>
+ DB 196,226,125,24,61,113,61,0,0 ; vbroadcastss 0x3d71(%rip),%ymm7 # 7fc4 <_sk_callback_avx+0x42c>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,54,61,0,0 ; vbroadcastss 0x3d36(%rip),%ymm7 # 7da4 <_sk_callback_avx+0x400>
+ DB 196,226,125,24,61,102,61,0,0 ; vbroadcastss 0x3d66(%rip),%ymm7 # 7fc8 <_sk_callback_avx+0x430>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10206,27 +10409,27 @@ _sk_load_565_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,109,255,255,255 ; ja 3ff6 <_sk_load_565_dst_avx+0x26>
+ DB 15,135,109,255,255,255 ; ja 41ea <_sk_load_565_dst_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # 40f8 <_sk_load_565_dst_avx+0x128>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # 42ec <_sk_load_565_dst_avx+0x128>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,75,255,255,255 ; jmpq 3ff6 <_sk_load_565_dst_avx+0x26>
+ DB 233,75,255,255,255 ; jmpq 41ea <_sk_load_565_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,46,255,255,255 ; jmpq 3ff6 <_sk_load_565_dst_avx+0x26>
+ DB 233,46,255,255,255 ; jmpq 41ea <_sk_load_565_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,1,255,255,255 ; jmpq 3ff6 <_sk_load_565_dst_avx+0x26>
+ DB 233,1,255,255,255 ; jmpq 41ea <_sk_load_565_dst_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10296,23 +10499,23 @@ _sk_gather_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,194,59,0,0 ; vbroadcastss 0x3bc2(%rip),%ymm0 # 7da8 <_sk_callback_avx+0x404>
+ DB 196,226,125,24,5,242,59,0,0 ; vbroadcastss 0x3bf2(%rip),%ymm0 # 7fcc <_sk_callback_avx+0x434>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,181,59,0,0 ; vbroadcastss 0x3bb5(%rip),%ymm1 # 7dac <_sk_callback_avx+0x408>
+ DB 196,226,125,24,13,229,59,0,0 ; vbroadcastss 0x3be5(%rip),%ymm1 # 7fd0 <_sk_callback_avx+0x438>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,172,59,0,0 ; vbroadcastss 0x3bac(%rip),%ymm1 # 7db0 <_sk_callback_avx+0x40c>
+ DB 196,226,125,24,13,220,59,0,0 ; vbroadcastss 0x3bdc(%rip),%ymm1 # 7fd4 <_sk_callback_avx+0x43c>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,159,59,0,0 ; vbroadcastss 0x3b9f(%rip),%ymm3 # 7db4 <_sk_callback_avx+0x410>
+ DB 196,226,125,24,29,207,59,0,0 ; vbroadcastss 0x3bcf(%rip),%ymm3 # 7fd8 <_sk_callback_avx+0x440>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,150,59,0,0 ; vbroadcastss 0x3b96(%rip),%ymm3 # 7db8 <_sk_callback_avx+0x414>
+ DB 196,226,125,24,29,198,59,0,0 ; vbroadcastss 0x3bc6(%rip),%ymm3 # 7fdc <_sk_callback_avx+0x444>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,137,59,0,0 ; vbroadcastss 0x3b89(%rip),%ymm3 # 7dbc <_sk_callback_avx+0x418>
+ DB 196,226,125,24,29,185,59,0,0 ; vbroadcastss 0x3bb9(%rip),%ymm3 # 7fe0 <_sk_callback_avx+0x448>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,126,59,0,0 ; vbroadcastss 0x3b7e(%rip),%ymm3 # 7dc0 <_sk_callback_avx+0x41c>
+ DB 196,226,125,24,29,174,59,0,0 ; vbroadcastss 0x3bae(%rip),%ymm3 # 7fe4 <_sk_callback_avx+0x44c>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_avx
@@ -10325,14 +10528,14 @@ _sk_store_565_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,96,59,0,0 ; vbroadcastss 0x3b60(%rip),%ymm8 # 7dc4 <_sk_callback_avx+0x420>
+ DB 196,98,125,24,5,144,59,0,0 ; vbroadcastss 0x3b90(%rip),%ymm8 # 7fe8 <_sk_callback_avx+0x450>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- DB 196,98,125,24,21,57,59,0,0 ; vbroadcastss 0x3b39(%rip),%ymm10 # 7dc8 <_sk_callback_avx+0x424>
+ DB 196,98,125,24,21,105,59,0,0 ; vbroadcastss 0x3b69(%rip),%ymm10 # 7fec <_sk_callback_avx+0x454>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11
@@ -10346,7 +10549,7 @@ _sk_store_565_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 42e0 <_sk_store_565_avx+0x9c>
+ DB 117,11 ; jne 44d4 <_sk_store_565_avx+0x9c>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10355,22 +10558,22 @@ _sk_store_565_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 42db <_sk_store_565_avx+0x97>
+ DB 119,235 ; ja 44cf <_sk_store_565_avx+0x97>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # 4340 <_sk_store_565_avx+0xfc>
+ DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # 4534 <_sk_store_565_avx+0xfc>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 42db <_sk_store_565_avx+0x97>
+ DB 235,206 ; jmp 44cf <_sk_store_565_avx+0x97>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 42db <_sk_store_565_avx+0x97>
+ DB 235,190 ; jmp 44cf <_sk_store_565_avx+0x97>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 42db <_sk_store_565_avx+0x97>
+ DB 235,158 ; jmp 44cf <_sk_store_565_avx+0x97>
DB 15,31,0 ; nopl (%rax)
DB 196 ; (bad)
DB 255 ; (bad)
@@ -10407,31 +10610,31 @@ _sk_load_4444_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,153,0,0,0 ; jne 4415 <_sk_load_4444_avx+0xb9>
+ DB 15,133,153,0,0,0 ; jne 4609 <_sk_load_4444_avx+0xb9>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,46,58,0,0 ; vbroadcastss 0x3a2e(%rip),%ymm0 # 7dcc <_sk_callback_avx+0x428>
+ DB 196,226,125,24,5,94,58,0,0 ; vbroadcastss 0x3a5e(%rip),%ymm0 # 7ff0 <_sk_callback_avx+0x458>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,33,58,0,0 ; vbroadcastss 0x3a21(%rip),%ymm1 # 7dd0 <_sk_callback_avx+0x42c>
+ DB 196,226,125,24,13,81,58,0,0 ; vbroadcastss 0x3a51(%rip),%ymm1 # 7ff4 <_sk_callback_avx+0x45c>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,24,58,0,0 ; vbroadcastss 0x3a18(%rip),%ymm1 # 7dd4 <_sk_callback_avx+0x430>
+ DB 196,226,125,24,13,72,58,0,0 ; vbroadcastss 0x3a48(%rip),%ymm1 # 7ff8 <_sk_callback_avx+0x460>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,11,58,0,0 ; vbroadcastss 0x3a0b(%rip),%ymm2 # 7dd8 <_sk_callback_avx+0x434>
+ DB 196,226,125,24,21,59,58,0,0 ; vbroadcastss 0x3a3b(%rip),%ymm2 # 7ffc <_sk_callback_avx+0x464>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,2,58,0,0 ; vbroadcastss 0x3a02(%rip),%ymm2 # 7ddc <_sk_callback_avx+0x438>
+ DB 196,226,125,24,21,50,58,0,0 ; vbroadcastss 0x3a32(%rip),%ymm2 # 8000 <_sk_callback_avx+0x468>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,245,57,0,0 ; vbroadcastss 0x39f5(%rip),%ymm8 # 7de0 <_sk_callback_avx+0x43c>
+ DB 196,98,125,24,5,37,58,0,0 ; vbroadcastss 0x3a25(%rip),%ymm8 # 8004 <_sk_callback_avx+0x46c>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,235,57,0,0 ; vbroadcastss 0x39eb(%rip),%ymm8 # 7de4 <_sk_callback_avx+0x440>
+ DB 196,98,125,24,5,27,58,0,0 ; vbroadcastss 0x3a1b(%rip),%ymm8 # 8008 <_sk_callback_avx+0x470>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,221,57,0,0 ; vbroadcastss 0x39dd(%rip),%ymm8 # 7de8 <_sk_callback_avx+0x444>
+ DB 196,98,125,24,5,13,58,0,0 ; vbroadcastss 0x3a0d(%rip),%ymm8 # 800c <_sk_callback_avx+0x474>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10441,27 +10644,27 @@ _sk_load_4444_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,85,255,255,255 ; ja 4382 <_sk_load_4444_avx+0x26>
+ DB 15,135,85,255,255,255 ; ja 4576 <_sk_load_4444_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # 449c <_sk_load_4444_avx+0x140>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # 4690 <_sk_load_4444_avx+0x140>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,51,255,255,255 ; jmpq 4382 <_sk_load_4444_avx+0x26>
+ DB 233,51,255,255,255 ; jmpq 4576 <_sk_load_4444_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,22,255,255,255 ; jmpq 4382 <_sk_load_4444_avx+0x26>
+ DB 233,22,255,255,255 ; jmpq 4576 <_sk_load_4444_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,233,254,255,255 ; jmpq 4382 <_sk_load_4444_avx+0x26>
+ DB 233,233,254,255,255 ; jmpq 4576 <_sk_load_4444_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10496,31 +10699,31 @@ _sk_load_4444_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,153,0,0,0 ; jne 4571 <_sk_load_4444_dst_avx+0xb9>
+ DB 15,133,153,0,0,0 ; jne 4765 <_sk_load_4444_dst_avx+0xb9>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,253,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- DB 196,226,125,24,37,242,56,0,0 ; vbroadcastss 0x38f2(%rip),%ymm4 # 7dec <_sk_callback_avx+0x448>
+ DB 196,226,125,24,37,34,57,0,0 ; vbroadcastss 0x3922(%rip),%ymm4 # 8010 <_sk_callback_avx+0x478>
DB 197,196,84,228 ; vandps %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,229,56,0,0 ; vbroadcastss 0x38e5(%rip),%ymm5 # 7df0 <_sk_callback_avx+0x44c>
+ DB 196,226,125,24,45,21,57,0,0 ; vbroadcastss 0x3915(%rip),%ymm5 # 8014 <_sk_callback_avx+0x47c>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,220,56,0,0 ; vbroadcastss 0x38dc(%rip),%ymm5 # 7df4 <_sk_callback_avx+0x450>
+ DB 196,226,125,24,45,12,57,0,0 ; vbroadcastss 0x390c(%rip),%ymm5 # 8018 <_sk_callback_avx+0x480>
DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,207,56,0,0 ; vbroadcastss 0x38cf(%rip),%ymm6 # 7df8 <_sk_callback_avx+0x454>
+ DB 196,226,125,24,53,255,56,0,0 ; vbroadcastss 0x38ff(%rip),%ymm6 # 801c <_sk_callback_avx+0x484>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,24,53,198,56,0,0 ; vbroadcastss 0x38c6(%rip),%ymm6 # 7dfc <_sk_callback_avx+0x458>
+ DB 196,226,125,24,53,246,56,0,0 ; vbroadcastss 0x38f6(%rip),%ymm6 # 8020 <_sk_callback_avx+0x488>
DB 197,196,84,246 ; vandps %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,185,56,0,0 ; vbroadcastss 0x38b9(%rip),%ymm8 # 7e00 <_sk_callback_avx+0x45c>
+ DB 196,98,125,24,5,233,56,0,0 ; vbroadcastss 0x38e9(%rip),%ymm8 # 8024 <_sk_callback_avx+0x48c>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,24,5,175,56,0,0 ; vbroadcastss 0x38af(%rip),%ymm8 # 7e04 <_sk_callback_avx+0x460>
+ DB 196,98,125,24,5,223,56,0,0 ; vbroadcastss 0x38df(%rip),%ymm8 # 8028 <_sk_callback_avx+0x490>
DB 196,193,68,84,248 ; vandps %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,161,56,0,0 ; vbroadcastss 0x38a1(%rip),%ymm8 # 7e08 <_sk_callback_avx+0x464>
+ DB 196,98,125,24,5,209,56,0,0 ; vbroadcastss 0x38d1(%rip),%ymm8 # 802c <_sk_callback_avx+0x494>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10530,27 +10733,27 @@ _sk_load_4444_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,85,255,255,255 ; ja 44de <_sk_load_4444_dst_avx+0x26>
+ DB 15,135,85,255,255,255 ; ja 46d2 <_sk_load_4444_dst_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # 45f8 <_sk_load_4444_dst_avx+0x140>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # 47ec <_sk_load_4444_dst_avx+0x140>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,51,255,255,255 ; jmpq 44de <_sk_load_4444_dst_avx+0x26>
+ DB 233,51,255,255,255 ; jmpq 46d2 <_sk_load_4444_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,22,255,255,255 ; jmpq 44de <_sk_load_4444_dst_avx+0x26>
+ DB 233,22,255,255,255 ; jmpq 46d2 <_sk_load_4444_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,233,254,255,255 ; jmpq 44de <_sk_load_4444_dst_avx+0x26>
+ DB 233,233,254,255,255 ; jmpq 46d2 <_sk_load_4444_dst_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10620,25 +10823,25 @@ _sk_gather_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,38,55,0,0 ; vbroadcastss 0x3726(%rip),%ymm0 # 7e0c <_sk_callback_avx+0x468>
+ DB 196,226,125,24,5,86,55,0,0 ; vbroadcastss 0x3756(%rip),%ymm0 # 8030 <_sk_callback_avx+0x498>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,25,55,0,0 ; vbroadcastss 0x3719(%rip),%ymm1 # 7e10 <_sk_callback_avx+0x46c>
+ DB 196,226,125,24,13,73,55,0,0 ; vbroadcastss 0x3749(%rip),%ymm1 # 8034 <_sk_callback_avx+0x49c>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,16,55,0,0 ; vbroadcastss 0x3710(%rip),%ymm1 # 7e14 <_sk_callback_avx+0x470>
+ DB 196,226,125,24,13,64,55,0,0 ; vbroadcastss 0x3740(%rip),%ymm1 # 8038 <_sk_callback_avx+0x4a0>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,3,55,0,0 ; vbroadcastss 0x3703(%rip),%ymm2 # 7e18 <_sk_callback_avx+0x474>
+ DB 196,226,125,24,21,51,55,0,0 ; vbroadcastss 0x3733(%rip),%ymm2 # 803c <_sk_callback_avx+0x4a4>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,250,54,0,0 ; vbroadcastss 0x36fa(%rip),%ymm2 # 7e1c <_sk_callback_avx+0x478>
+ DB 196,226,125,24,21,42,55,0,0 ; vbroadcastss 0x372a(%rip),%ymm2 # 8040 <_sk_callback_avx+0x4a8>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,237,54,0,0 ; vbroadcastss 0x36ed(%rip),%ymm8 # 7e20 <_sk_callback_avx+0x47c>
+ DB 196,98,125,24,5,29,55,0,0 ; vbroadcastss 0x371d(%rip),%ymm8 # 8044 <_sk_callback_avx+0x4ac>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,227,54,0,0 ; vbroadcastss 0x36e3(%rip),%ymm8 # 7e24 <_sk_callback_avx+0x480>
+ DB 196,98,125,24,5,19,55,0,0 ; vbroadcastss 0x3713(%rip),%ymm8 # 8048 <_sk_callback_avx+0x4b0>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,213,54,0,0 ; vbroadcastss 0x36d5(%rip),%ymm8 # 7e28 <_sk_callback_avx+0x484>
+ DB 196,98,125,24,5,5,55,0,0 ; vbroadcastss 0x3705(%rip),%ymm8 # 804c <_sk_callback_avx+0x4b4>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10653,7 +10856,7 @@ _sk_store_4444_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,176,54,0,0 ; vbroadcastss 0x36b0(%rip),%ymm8 # 7e2c <_sk_callback_avx+0x488>
+ DB 196,98,125,24,5,224,54,0,0 ; vbroadcastss 0x36e0(%rip),%ymm8 # 8050 <_sk_callback_avx+0x4b8>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10
@@ -10680,7 +10883,7 @@ _sk_store_4444_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 4816 <_sk_store_4444_avx+0xba>
+ DB 117,11 ; jne 4a0a <_sk_store_4444_avx+0xba>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10689,22 +10892,22 @@ _sk_store_4444_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 4811 <_sk_store_4444_avx+0xb5>
+ DB 119,235 ; ja 4a05 <_sk_store_4444_avx+0xb5>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # 4874 <_sk_store_4444_avx+0x118>
+ DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # 4a68 <_sk_store_4444_avx+0x118>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 4811 <_sk_store_4444_avx+0xb5>
+ DB 235,206 ; jmp 4a05 <_sk_store_4444_avx+0xb5>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 4811 <_sk_store_4444_avx+0xb5>
+ DB 235,190 ; jmp 4a05 <_sk_store_4444_avx+0xb5>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 4811 <_sk_store_4444_avx+0xb5>
+ DB 235,158 ; jmp 4a05 <_sk_store_4444_avx+0xb5>
DB 144 ; nop
DB 198 ; (bad)
DB 255 ; (bad)
@@ -10743,12 +10946,12 @@ _sk_load_8888_avx LABEL PROC
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,138,0,0,0 ; jne 4942 <_sk_load_8888_avx+0xb2>
+ DB 15,133,138,0,0,0 ; jne 4b36 <_sk_load_8888_avx+0xb2>
DB 197,252,16,24 ; vmovups (%rax),%ymm3
- DB 197,124,40,21,220,56,0,0 ; vmovaps 0x38dc(%rip),%ymm10 # 81a0 <_sk_callback_avx+0x7fc>
+ DB 197,124,40,21,8,57,0,0 ; vmovaps 0x3908(%rip),%ymm10 # 83c0 <_sk_callback_avx+0x828>
DB 196,193,100,84,194 ; vandps %ymm10,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,90,53,0,0 ; vbroadcastss 0x355a(%rip),%ymm8 # 7e30 <_sk_callback_avx+0x48c>
+ DB 196,98,125,24,5,138,53,0,0 ; vbroadcastss 0x358a(%rip),%ymm8 # 8054 <_sk_callback_avx+0x4bc>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
DB 196,195,125,25,217,1 ; vextractf128 $0x1,%ymm3,%xmm9
@@ -10779,13 +10982,13 @@ _sk_load_8888_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,194 ; vmovq %r10,%xmm0
DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0
- DB 196,226,121,0,13,54,55,0,0 ; vpshufb 0x3736(%rip),%xmm0,%xmm1 # 80a0 <_sk_callback_avx+0x6fc>
+ DB 196,226,121,0,13,98,55,0,0 ; vpshufb 0x3762(%rip),%xmm0,%xmm1 # 82c0 <_sk_callback_avx+0x728>
DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1
- DB 196,226,121,0,5,56,55,0,0 ; vpshufb 0x3738(%rip),%xmm0,%xmm0 # 80b0 <_sk_callback_avx+0x70c>
+ DB 196,226,121,0,5,100,55,0,0 ; vpshufb 0x3764(%rip),%xmm0,%xmm0 # 82d0 <_sk_callback_avx+0x738>
DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 196,226,125,44,24 ; vmaskmovps (%rax),%ymm0,%ymm3
- DB 233,47,255,255,255 ; jmpq 48bc <_sk_load_8888_avx+0x2c>
+ DB 233,47,255,255,255 ; jmpq 4ab0 <_sk_load_8888_avx+0x2c>
PUBLIC _sk_load_8888_dst_avx
_sk_load_8888_dst_avx LABEL PROC
@@ -10800,12 +11003,12 @@ _sk_load_8888_dst_avx LABEL PROC
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,138,0,0,0 ; jne 4a3f <_sk_load_8888_dst_avx+0xb2>
+ DB 15,133,138,0,0,0 ; jne 4c33 <_sk_load_8888_dst_avx+0xb2>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,124,40,21,255,55,0,0 ; vmovaps 0x37ff(%rip),%ymm10 # 81c0 <_sk_callback_avx+0x81c>
+ DB 197,124,40,21,43,56,0,0 ; vmovaps 0x382b(%rip),%ymm10 # 83e0 <_sk_callback_avx+0x848>
DB 196,193,68,84,226 ; vandps %ymm10,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,97,52,0,0 ; vbroadcastss 0x3461(%rip),%ymm8 # 7e34 <_sk_callback_avx+0x490>
+ DB 196,98,125,24,5,145,52,0,0 ; vbroadcastss 0x3491(%rip),%ymm8 # 8058 <_sk_callback_avx+0x4c0>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5
DB 196,195,125,25,249,1 ; vextractf128 $0x1,%ymm7,%xmm9
@@ -10836,13 +11039,13 @@ _sk_load_8888_dst_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,226 ; vmovq %r10,%xmm4
DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4
- DB 196,226,89,0,45,89,54,0,0 ; vpshufb 0x3659(%rip),%xmm4,%xmm5 # 80c0 <_sk_callback_avx+0x71c>
+ DB 196,226,89,0,45,133,54,0,0 ; vpshufb 0x3685(%rip),%xmm4,%xmm5 # 82e0 <_sk_callback_avx+0x748>
DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5
- DB 196,226,89,0,37,91,54,0,0 ; vpshufb 0x365b(%rip),%xmm4,%xmm4 # 80d0 <_sk_callback_avx+0x72c>
+ DB 196,226,89,0,37,135,54,0,0 ; vpshufb 0x3687(%rip),%xmm4,%xmm4 # 82f0 <_sk_callback_avx+0x758>
DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4
DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
DB 196,226,93,44,56 ; vmaskmovps (%rax),%ymm4,%ymm7
- DB 233,47,255,255,255 ; jmpq 49b9 <_sk_load_8888_dst_avx+0x2c>
+ DB 233,47,255,255,255 ; jmpq 4bad <_sk_load_8888_dst_avx+0x2c>
PUBLIC _sk_gather_8888_avx
_sk_gather_8888_avx LABEL PROC
@@ -10879,10 +11082,10 @@ _sk_gather_8888_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,171,54,0,0 ; vmovaps 0x36ab(%rip),%ymm10 # 81e0 <_sk_callback_avx+0x83c>
+ DB 197,124,40,21,215,54,0,0 ; vmovaps 0x36d7(%rip),%ymm10 # 8400 <_sk_callback_avx+0x868>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,241,50,0,0 ; vbroadcastss 0x32f1(%rip),%ymm9 # 7e38 <_sk_callback_avx+0x494>
+ DB 196,98,125,24,13,33,51,0,0 ; vbroadcastss 0x3321(%rip),%ymm9 # 805c <_sk_callback_avx+0x4c4>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -10916,7 +11119,7 @@ _sk_store_8888_avx LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
- DB 196,98,125,24,5,108,50,0,0 ; vbroadcastss 0x326c(%rip),%ymm8 # 7e3c <_sk_callback_avx+0x498>
+ DB 196,98,125,24,5,156,50,0,0 ; vbroadcastss 0x329c(%rip),%ymm8 # 8060 <_sk_callback_avx+0x4c8>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -10941,7 +11144,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,13 ; jne 4c61 <_sk_store_8888_avx+0xb9>
+ DB 117,13 ; jne 4e55 <_sk_store_8888_avx+0xb9>
DB 197,124,17,0 ; vmovups %ymm8,(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -10954,13 +11157,13 @@ _sk_store_8888_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,65,249,110,202 ; vmovq %r10,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
- DB 196,98,49,0,21,87,52,0,0 ; vpshufb 0x3457(%rip),%xmm9,%xmm10 # 80e0 <_sk_callback_avx+0x73c>
+ DB 196,98,49,0,21,131,52,0,0 ; vpshufb 0x3483(%rip),%xmm9,%xmm10 # 8300 <_sk_callback_avx+0x768>
DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10
- DB 196,98,49,0,13,89,52,0,0 ; vpshufb 0x3459(%rip),%xmm9,%xmm9 # 80f0 <_sk_callback_avx+0x74c>
+ DB 196,98,49,0,13,133,52,0,0 ; vpshufb 0x3485(%rip),%xmm9,%xmm9 # 8310 <_sk_callback_avx+0x778>
DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
DB 196,98,53,46,0 ; vmaskmovps %ymm8,%ymm9,(%rax)
- DB 235,175 ; jmp 4c58 <_sk_store_8888_avx+0xb0>
+ DB 235,175 ; jmp 4e4c <_sk_store_8888_avx+0xb0>
PUBLIC _sk_load_bgra_avx
_sk_load_bgra_avx LABEL PROC
@@ -10975,12 +11178,12 @@ _sk_load_bgra_avx LABEL PROC
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,138,0,0,0 ; jne 4d5b <_sk_load_bgra_avx+0xb2>
+ DB 15,133,138,0,0,0 ; jne 4f4f <_sk_load_bgra_avx+0xb2>
DB 197,252,16,24 ; vmovups (%rax),%ymm3
- DB 197,124,40,21,35,53,0,0 ; vmovaps 0x3523(%rip),%ymm10 # 8200 <_sk_callback_avx+0x85c>
+ DB 197,124,40,21,79,53,0,0 ; vmovaps 0x354f(%rip),%ymm10 # 8420 <_sk_callback_avx+0x888>
DB 196,193,100,84,202 ; vandps %ymm10,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,98,125,24,5,81,49,0,0 ; vbroadcastss 0x3151(%rip),%ymm8 # 7e40 <_sk_callback_avx+0x49c>
+ DB 196,98,125,24,5,129,49,0,0 ; vbroadcastss 0x3181(%rip),%ymm8 # 8064 <_sk_callback_avx+0x4cc>
DB 196,193,116,89,208 ; vmulps %ymm8,%ymm1,%ymm2
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
DB 196,195,125,25,217,1 ; vextractf128 $0x1,%ymm3,%xmm9
@@ -11011,13 +11214,13 @@ _sk_load_bgra_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,194 ; vmovq %r10,%xmm0
DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0
- DB 196,226,121,0,13,125,51,0,0 ; vpshufb 0x337d(%rip),%xmm0,%xmm1 # 8100 <_sk_callback_avx+0x75c>
+ DB 196,226,121,0,13,169,51,0,0 ; vpshufb 0x33a9(%rip),%xmm0,%xmm1 # 8320 <_sk_callback_avx+0x788>
DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1
- DB 196,226,121,0,5,127,51,0,0 ; vpshufb 0x337f(%rip),%xmm0,%xmm0 # 8110 <_sk_callback_avx+0x76c>
+ DB 196,226,121,0,5,171,51,0,0 ; vpshufb 0x33ab(%rip),%xmm0,%xmm0 # 8330 <_sk_callback_avx+0x798>
DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 196,226,125,44,24 ; vmaskmovps (%rax),%ymm0,%ymm3
- DB 233,47,255,255,255 ; jmpq 4cd5 <_sk_load_bgra_avx+0x2c>
+ DB 233,47,255,255,255 ; jmpq 4ec9 <_sk_load_bgra_avx+0x2c>
PUBLIC _sk_load_bgra_dst_avx
_sk_load_bgra_dst_avx LABEL PROC
@@ -11032,12 +11235,12 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,138,0,0,0 ; jne 4e58 <_sk_load_bgra_dst_avx+0xb2>
+ DB 15,133,138,0,0,0 ; jne 504c <_sk_load_bgra_dst_avx+0xb2>
DB 197,252,16,56 ; vmovups (%rax),%ymm7
- DB 197,124,40,21,70,52,0,0 ; vmovaps 0x3446(%rip),%ymm10 # 8220 <_sk_callback_avx+0x87c>
+ DB 197,124,40,21,114,52,0,0 ; vmovaps 0x3472(%rip),%ymm10 # 8440 <_sk_callback_avx+0x8a8>
DB 196,193,68,84,234 ; vandps %ymm10,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,98,125,24,5,88,48,0,0 ; vbroadcastss 0x3058(%rip),%ymm8 # 7e44 <_sk_callback_avx+0x4a0>
+ DB 196,98,125,24,5,136,48,0,0 ; vbroadcastss 0x3088(%rip),%ymm8 # 8068 <_sk_callback_avx+0x4d0>
DB 196,193,84,89,240 ; vmulps %ymm8,%ymm5,%ymm6
DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5
DB 196,195,125,25,249,1 ; vextractf128 $0x1,%ymm7,%xmm9
@@ -11068,13 +11271,13 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,193,249,110,226 ; vmovq %r10,%xmm4
DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4
- DB 196,226,89,0,45,160,50,0,0 ; vpshufb 0x32a0(%rip),%xmm4,%xmm5 # 8120 <_sk_callback_avx+0x77c>
+ DB 196,226,89,0,45,204,50,0,0 ; vpshufb 0x32cc(%rip),%xmm4,%xmm5 # 8340 <_sk_callback_avx+0x7a8>
DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5
- DB 196,226,89,0,37,162,50,0,0 ; vpshufb 0x32a2(%rip),%xmm4,%xmm4 # 8130 <_sk_callback_avx+0x78c>
+ DB 196,226,89,0,37,206,50,0,0 ; vpshufb 0x32ce(%rip),%xmm4,%xmm4 # 8350 <_sk_callback_avx+0x7b8>
DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4
DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
DB 196,226,93,44,56 ; vmaskmovps (%rax),%ymm4,%ymm7
- DB 233,47,255,255,255 ; jmpq 4dd2 <_sk_load_bgra_dst_avx+0x2c>
+ DB 233,47,255,255,255 ; jmpq 4fc6 <_sk_load_bgra_dst_avx+0x2c>
PUBLIC _sk_gather_bgra_avx
_sk_gather_bgra_avx LABEL PROC
@@ -11111,10 +11314,10 @@ _sk_gather_bgra_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,13,242,50,0,0 ; vmovaps 0x32f2(%rip),%ymm9 # 8240 <_sk_callback_avx+0x89c>
+ DB 197,124,40,13,30,51,0,0 ; vmovaps 0x331e(%rip),%ymm9 # 8460 <_sk_callback_avx+0x8c8>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,232,46,0,0 ; vbroadcastss 0x2ee8(%rip),%ymm10 # 7e48 <_sk_callback_avx+0x4a4>
+ DB 196,98,125,24,21,24,47,0,0 ; vbroadcastss 0x2f18(%rip),%ymm10 # 806c <_sk_callback_avx+0x4d4>
DB 196,193,124,89,210 ; vmulps %ymm10,%ymm0,%ymm2
DB 196,193,121,114,208,8 ; vpsrld $0x8,%xmm8,%xmm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
@@ -11148,7 +11351,7 @@ _sk_store_bgra_avx LABEL PROC
DB 72,3,8 ; add (%rax),%rcx
DB 72,99,194 ; movslq %edx,%rax
DB 72,141,4,129 ; lea (%rcx,%rax,4),%rax
- DB 196,98,125,24,5,99,46,0,0 ; vbroadcastss 0x2e63(%rip),%ymm8 # 7e4c <_sk_callback_avx+0x4a8>
+ DB 196,98,125,24,5,147,46,0,0 ; vbroadcastss 0x2e93(%rip),%ymm8 # 8070 <_sk_callback_avx+0x4d8>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11173,7 +11376,7 @@ _sk_store_bgra_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,13 ; jne 507a <_sk_store_bgra_avx+0xb9>
+ DB 117,13 ; jne 526e <_sk_store_bgra_avx+0xb9>
DB 197,124,17,0 ; vmovups %ymm8,(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -11186,13 +11389,13 @@ _sk_store_bgra_avx LABEL PROC
DB 73,211,234 ; shr %cl,%r10
DB 196,65,249,110,202 ; vmovq %r10,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
- DB 196,98,49,0,21,158,48,0,0 ; vpshufb 0x309e(%rip),%xmm9,%xmm10 # 8140 <_sk_callback_avx+0x79c>
+ DB 196,98,49,0,21,202,48,0,0 ; vpshufb 0x30ca(%rip),%xmm9,%xmm10 # 8360 <_sk_callback_avx+0x7c8>
DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10
- DB 196,98,49,0,13,160,48,0,0 ; vpshufb 0x30a0(%rip),%xmm9,%xmm9 # 8150 <_sk_callback_avx+0x7ac>
+ DB 196,98,49,0,13,204,48,0,0 ; vpshufb 0x30cc(%rip),%xmm9,%xmm9 # 8370 <_sk_callback_avx+0x7d8>
DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
DB 196,98,53,46,0 ; vmaskmovps %ymm8,%ymm9,(%rax)
- DB 235,175 ; jmp 5071 <_sk_store_bgra_avx+0xb0>
+ DB 235,175 ; jmp 5265 <_sk_store_bgra_avx+0xb0>
PUBLIC _sk_load_f16_avx
_sk_load_f16_avx LABEL PROC
@@ -11209,7 +11412,7 @@ _sk_load_f16_avx LABEL PROC
DB 197,252,17,116,36,64 ; vmovups %ymm6,0x40(%rsp)
DB 197,252,17,108,36,32 ; vmovups %ymm5,0x20(%rsp)
DB 197,254,127,36,36 ; vmovdqu %ymm4,(%rsp)
- DB 15,133,147,2,0,0 ; jne 5393 <_sk_load_f16_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne 5587 <_sk_load_f16_avx+0x2d1>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2
DB 196,193,121,16,76,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm1
@@ -11227,13 +11430,13 @@ _sk_load_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,243,44,0,0 ; vbroadcastss 0x2cf3(%rip),%ymm12 # 7e50 <_sk_callback_avx+0x4ac>
+ DB 196,98,125,24,37,35,45,0,0 ; vbroadcastss 0x2d23(%rip),%ymm12 # 8074 <_sk_callback_avx+0x4dc>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,223,44,0,0 ; vbroadcastss 0x2cdf(%rip),%xmm11 # 7e54 <_sk_callback_avx+0x4b0>
+ DB 196,98,121,24,29,15,45,0,0 ; vbroadcastss 0x2d0f(%rip),%xmm11 # 8078 <_sk_callback_avx+0x4e0>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,213,44,0,0 ; vbroadcastss 0x2cd5(%rip),%xmm13 # 7e58 <_sk_callback_avx+0x4b4>
+ DB 196,98,121,24,45,5,45,0,0 ; vbroadcastss 0x2d05(%rip),%xmm13 # 807c <_sk_callback_avx+0x4e4>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11247,7 +11450,7 @@ _sk_load_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,139,44,0,0 ; vbroadcastss 0x2c8b(%rip),%xmm3 # 7e5c <_sk_callback_avx+0x4b8>
+ DB 196,226,121,24,29,187,44,0,0 ; vbroadcastss 0x2cbb(%rip),%xmm3 # 8080 <_sk_callback_avx+0x4e8>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -11340,29 +11543,29 @@ _sk_load_f16_avx LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 53f9 <_sk_load_f16_avx+0x337>
+ DB 116,85 ; je 55ed <_sk_load_f16_avx+0x337>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 53f9 <_sk_load_f16_avx+0x337>
+ DB 114,72 ; jb 55ed <_sk_load_f16_avx+0x337>
DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 5406 <_sk_load_f16_avx+0x344>
+ DB 116,72 ; je 55fa <_sk_load_f16_avx+0x344>
DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 5406 <_sk_load_f16_avx+0x344>
+ DB 114,59 ; jb 55fa <_sk_load_f16_avx+0x344>
DB 196,193,123,16,76,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,63,253,255,255 ; je 511b <_sk_load_f16_avx+0x59>
+ DB 15,132,63,253,255,255 ; je 530f <_sk_load_f16_avx+0x59>
DB 196,193,113,22,76,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,46,253,255,255 ; jb 511b <_sk_load_f16_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb 530f <_sk_load_f16_avx+0x59>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq 511b <_sk_load_f16_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq 530f <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,21,253,255,255 ; jmpq 511b <_sk_load_f16_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq 530f <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
- DB 233,12,253,255,255 ; jmpq 511b <_sk_load_f16_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq 530f <_sk_load_f16_avx+0x59>
PUBLIC _sk_load_f16_dst_avx
_sk_load_f16_dst_avx LABEL PROC
@@ -11379,7 +11582,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,252,17,84,36,64 ; vmovups %ymm2,0x40(%rsp)
DB 197,252,17,76,36,32 ; vmovups %ymm1,0x20(%rsp)
DB 197,254,127,4,36 ; vmovdqu %ymm0,(%rsp)
- DB 15,133,147,2,0,0 ; jne 56e0 <_sk_load_f16_dst_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne 58d4 <_sk_load_f16_dst_avx+0x2d1>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6
DB 196,193,121,16,108,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm5
@@ -11397,13 +11600,13 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,217,105,232 ; vpunpckhwd %xmm0,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- DB 196,98,125,24,37,182,41,0,0 ; vbroadcastss 0x29b6(%rip),%ymm12 # 7e60 <_sk_callback_avx+0x4bc>
+ DB 196,98,125,24,37,230,41,0,0 ; vbroadcastss 0x29e6(%rip),%ymm12 # 8084 <_sk_callback_avx+0x4ec>
DB 196,193,92,84,236 ; vandps %ymm12,%ymm4,%ymm5
DB 197,220,87,229 ; vxorps %ymm5,%ymm4,%ymm4
DB 196,195,125,25,230,1 ; vextractf128 $0x1,%ymm4,%xmm14
- DB 196,98,121,24,29,162,41,0,0 ; vbroadcastss 0x29a2(%rip),%xmm11 # 7e64 <_sk_callback_avx+0x4c0>
+ DB 196,98,121,24,29,210,41,0,0 ; vbroadcastss 0x29d2(%rip),%xmm11 # 8088 <_sk_callback_avx+0x4f0>
DB 196,193,8,87,251 ; vxorps %xmm11,%xmm14,%xmm7
- DB 196,98,121,24,45,152,41,0,0 ; vbroadcastss 0x2998(%rip),%xmm13 # 7e68 <_sk_callback_avx+0x4c4>
+ DB 196,98,121,24,45,200,41,0,0 ; vbroadcastss 0x29c8(%rip),%xmm13 # 808c <_sk_callback_avx+0x4f4>
DB 197,145,102,255 ; vpcmpgtd %xmm7,%xmm13,%xmm7
DB 196,65,88,87,211 ; vxorps %xmm11,%xmm4,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11417,7 +11620,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,227,93,24,231,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
DB 197,220,86,229 ; vorps %ymm5,%ymm4,%ymm4
DB 196,227,125,25,229,1 ; vextractf128 $0x1,%ymm4,%xmm5
- DB 196,226,121,24,61,78,41,0,0 ; vbroadcastss 0x294e(%rip),%xmm7 # 7e6c <_sk_callback_avx+0x4c8>
+ DB 196,226,121,24,61,126,41,0,0 ; vbroadcastss 0x297e(%rip),%xmm7 # 8090 <_sk_callback_avx+0x4f8>
DB 197,209,254,239 ; vpaddd %xmm7,%xmm5,%xmm5
DB 197,217,254,231 ; vpaddd %xmm7,%xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -11510,29 +11713,29 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 5746 <_sk_load_f16_dst_avx+0x337>
+ DB 116,85 ; je 593a <_sk_load_f16_dst_avx+0x337>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 5746 <_sk_load_f16_dst_avx+0x337>
+ DB 114,72 ; jb 593a <_sk_load_f16_dst_avx+0x337>
DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 5753 <_sk_load_f16_dst_avx+0x344>
+ DB 116,72 ; je 5947 <_sk_load_f16_dst_avx+0x344>
DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 5753 <_sk_load_f16_dst_avx+0x344>
+ DB 114,59 ; jb 5947 <_sk_load_f16_dst_avx+0x344>
DB 196,193,123,16,108,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm5
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,63,253,255,255 ; je 5468 <_sk_load_f16_dst_avx+0x59>
+ DB 15,132,63,253,255,255 ; je 565c <_sk_load_f16_dst_avx+0x59>
DB 196,193,81,22,108,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,46,253,255,255 ; jb 5468 <_sk_load_f16_dst_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb 565c <_sk_load_f16_dst_avx+0x59>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq 5468 <_sk_load_f16_dst_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq 565c <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,21,253,255,255 ; jmpq 5468 <_sk_load_f16_dst_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq 565c <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
- DB 233,12,253,255,255 ; jmpq 5468 <_sk_load_f16_dst_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq 565c <_sk_load_f16_dst_avx+0x59>
PUBLIC _sk_gather_f16_avx
_sk_gather_f16_avx LABEL PROC
@@ -11591,13 +11794,13 @@ _sk_gather_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,8,38,0,0 ; vbroadcastss 0x2608(%rip),%ymm12 # 7e70 <_sk_callback_avx+0x4cc>
+ DB 196,98,125,24,37,56,38,0,0 ; vbroadcastss 0x2638(%rip),%ymm12 # 8094 <_sk_callback_avx+0x4fc>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,244,37,0,0 ; vbroadcastss 0x25f4(%rip),%xmm11 # 7e74 <_sk_callback_avx+0x4d0>
+ DB 196,98,121,24,29,36,38,0,0 ; vbroadcastss 0x2624(%rip),%xmm11 # 8098 <_sk_callback_avx+0x500>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,234,37,0,0 ; vbroadcastss 0x25ea(%rip),%xmm13 # 7e78 <_sk_callback_avx+0x4d4>
+ DB 196,98,121,24,45,26,38,0,0 ; vbroadcastss 0x261a(%rip),%xmm13 # 809c <_sk_callback_avx+0x504>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11611,7 +11814,7 @@ _sk_gather_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,160,37,0,0 ; vbroadcastss 0x25a0(%rip),%xmm3 # 7e7c <_sk_callback_avx+0x4d8>
+ DB 196,226,121,24,29,208,37,0,0 ; vbroadcastss 0x25d0(%rip),%xmm3 # 80a0 <_sk_callback_avx+0x508>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -11709,12 +11912,12 @@ _sk_store_f16_avx LABEL PROC
DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
- DB 196,98,125,24,13,180,35,0,0 ; vbroadcastss 0x23b4(%rip),%ymm9 # 7e80 <_sk_callback_avx+0x4dc>
+ DB 196,98,125,24,13,228,35,0,0 ; vbroadcastss 0x23e4(%rip),%ymm9 # 80a4 <_sk_callback_avx+0x50c>
DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11
DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12
- DB 196,98,121,24,5,154,35,0,0 ; vbroadcastss 0x239a(%rip),%xmm8 # 7e84 <_sk_callback_avx+0x4e0>
+ DB 196,98,121,24,5,202,35,0,0 ; vbroadcastss 0x23ca(%rip),%xmm8 # 80a8 <_sk_callback_avx+0x510>
DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13
DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14
DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -11724,7 +11927,7 @@ _sk_store_f16_avx LABEL PROC
DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11
DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12
- DB 196,98,125,24,21,97,35,0,0 ; vbroadcastss 0x2361(%rip),%ymm10 # 7e88 <_sk_callback_avx+0x4e4>
+ DB 196,98,125,24,21,145,35,0,0 ; vbroadcastss 0x2391(%rip),%ymm10 # 80ac <_sk_callback_avx+0x514>
DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14
DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15
DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12
@@ -11811,7 +12014,7 @@ _sk_store_f16_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,79 ; jne 5d24 <_sk_store_f16_avx+0x286>
+ DB 117,79 ; jne 5f18 <_sk_store_f16_avx+0x286>
DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8)
DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8)
DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8)
@@ -11827,22 +12030,22 @@ _sk_store_f16_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,192 ; je 5cf0 <_sk_store_f16_avx+0x252>
+ DB 116,192 ; je 5ee4 <_sk_store_f16_avx+0x252>
DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,179 ; jb 5cf0 <_sk_store_f16_avx+0x252>
+ DB 114,179 ; jb 5ee4 <_sk_store_f16_avx+0x252>
DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8)
- DB 116,170 ; je 5cf0 <_sk_store_f16_avx+0x252>
+ DB 116,170 ; je 5ee4 <_sk_store_f16_avx+0x252>
DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,157 ; jb 5cf0 <_sk_store_f16_avx+0x252>
+ DB 114,157 ; jb 5ee4 <_sk_store_f16_avx+0x252>
DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8)
- DB 116,148 ; je 5cf0 <_sk_store_f16_avx+0x252>
+ DB 116,148 ; je 5ee4 <_sk_store_f16_avx+0x252>
DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,135 ; jb 5cf0 <_sk_store_f16_avx+0x252>
+ DB 114,135 ; jb 5ee4 <_sk_store_f16_avx+0x252>
DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8)
- DB 233,123,255,255,255 ; jmpq 5cf0 <_sk_store_f16_avx+0x252>
+ DB 233,123,255,255,255 ; jmpq 5ee4 <_sk_store_f16_avx+0x252>
PUBLIC _sk_load_u16_be_avx
_sk_load_u16_be_avx LABEL PROC
@@ -11855,7 +12058,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,253,0,0,0 ; jne 5e99 <_sk_load_u16_be_avx+0x124>
+ DB 15,133,253,0,0,0 ; jne 608d <_sk_load_u16_be_avx+0x124>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -11877,7 +12080,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,127,32,0,0 ; vbroadcastss 0x207f(%rip),%ymm11 # 7e8c <_sk_callback_avx+0x4e8>
+ DB 196,98,125,24,29,175,32,0,0 ; vbroadcastss 0x20af(%rip),%ymm11 # 80b0 <_sk_callback_avx+0x518>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -11911,29 +12114,29 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 5eff <_sk_load_u16_be_avx+0x18a>
+ DB 116,85 ; je 60f3 <_sk_load_u16_be_avx+0x18a>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 5eff <_sk_load_u16_be_avx+0x18a>
+ DB 114,72 ; jb 60f3 <_sk_load_u16_be_avx+0x18a>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 5f0c <_sk_load_u16_be_avx+0x197>
+ DB 116,72 ; je 6100 <_sk_load_u16_be_avx+0x197>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 5f0c <_sk_load_u16_be_avx+0x197>
+ DB 114,59 ; jb 6100 <_sk_load_u16_be_avx+0x197>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,213,254,255,255 ; je 5db7 <_sk_load_u16_be_avx+0x42>
+ DB 15,132,213,254,255,255 ; je 5fab <_sk_load_u16_be_avx+0x42>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,196,254,255,255 ; jb 5db7 <_sk_load_u16_be_avx+0x42>
+ DB 15,130,196,254,255,255 ; jb 5fab <_sk_load_u16_be_avx+0x42>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,184,254,255,255 ; jmpq 5db7 <_sk_load_u16_be_avx+0x42>
+ DB 233,184,254,255,255 ; jmpq 5fab <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,171,254,255,255 ; jmpq 5db7 <_sk_load_u16_be_avx+0x42>
+ DB 233,171,254,255,255 ; jmpq 5fab <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,162,254,255,255 ; jmpq 5db7 <_sk_load_u16_be_avx+0x42>
+ DB 233,162,254,255,255 ; jmpq 5fab <_sk_load_u16_be_avx+0x42>
PUBLIC _sk_load_rgb_u16_be_avx
_sk_load_rgb_u16_be_avx LABEL PROC
@@ -11948,7 +12151,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,243,0,0,0 ; jne 6033 <_sk_load_rgb_u16_be_avx+0x11e>
+ DB 15,133,243,0,0,0 ; jne 6227 <_sk_load_rgb_u16_be_avx+0x11e>
DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -11975,7 +12178,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,198,30,0,0 ; vbroadcastss 0x1ec6(%rip),%ymm11 # 7e90 <_sk_callback_avx+0x4ec>
+ DB 196,98,125,24,29,246,30,0,0 ; vbroadcastss 0x1ef6(%rip),%ymm11 # 80b4 <_sk_callback_avx+0x51c>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -11996,41 +12199,41 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,99,30,0,0 ; vbroadcastss 0x1e63(%rip),%ymm3 # 7e94 <_sk_callback_avx+0x4f0>
+ DB 196,226,125,24,29,147,30,0,0 ; vbroadcastss 0x1e93(%rip),%ymm3 # 80b8 <_sk_callback_avx+0x520>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 604c <_sk_load_rgb_u16_be_avx+0x137>
- DB 233,40,255,255,255 ; jmpq 5f74 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 117,5 ; jne 6240 <_sk_load_rgb_u16_be_avx+0x137>
+ DB 233,40,255,255,255 ; jmpq 6168 <_sk_load_rgb_u16_be_avx+0x5f>
DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 607b <_sk_load_rgb_u16_be_avx+0x166>
+ DB 114,26 ; jb 626f <_sk_load_rgb_u16_be_avx+0x166>
DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 6080 <_sk_load_rgb_u16_be_avx+0x16b>
- DB 233,249,254,255,255 ; jmpq 5f74 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,244,254,255,255 ; jmpq 5f74 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 117,10 ; jne 6274 <_sk_load_rgb_u16_be_avx+0x16b>
+ DB 233,249,254,255,255 ; jmpq 6168 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,244,254,255,255 ; jmpq 6168 <_sk_load_rgb_u16_be_avx+0x5f>
DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 60af <_sk_load_rgb_u16_be_avx+0x19a>
+ DB 114,26 ; jb 62a3 <_sk_load_rgb_u16_be_avx+0x19a>
DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 60b4 <_sk_load_rgb_u16_be_avx+0x19f>
- DB 233,197,254,255,255 ; jmpq 5f74 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,192,254,255,255 ; jmpq 5f74 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 117,10 ; jne 62a8 <_sk_load_rgb_u16_be_avx+0x19f>
+ DB 233,197,254,255,255 ; jmpq 6168 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,192,254,255,255 ; jmpq 6168 <_sk_load_rgb_u16_be_avx+0x5f>
DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 60dd <_sk_load_rgb_u16_be_avx+0x1c8>
+ DB 114,20 ; jb 62d1 <_sk_load_rgb_u16_be_avx+0x1c8>
DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,151,254,255,255 ; jmpq 5f74 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,146,254,255,255 ; jmpq 5f74 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,151,254,255,255 ; jmpq 6168 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 233,146,254,255,255 ; jmpq 6168 <_sk_load_rgb_u16_be_avx+0x5f>
PUBLIC _sk_store_u16_be_avx
_sk_store_u16_be_avx LABEL PROC
@@ -12042,7 +12245,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,143,29,0,0 ; vbroadcastss 0x1d8f(%rip),%ymm8 # 7e98 <_sk_callback_avx+0x4f4>
+ DB 196,98,125,24,5,191,29,0,0 ; vbroadcastss 0x1dbf(%rip),%ymm8 # 80bc <_sk_callback_avx+0x524>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -12080,7 +12283,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 61ed <_sk_store_u16_be_avx+0x10b>
+ DB 117,31 ; jne 63e1 <_sk_store_u16_be_avx+0x10b>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -12089,28 +12292,28 @@ _sk_store_u16_be_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 61e9 <_sk_store_u16_be_avx+0x107>
+ DB 116,240 ; je 63dd <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 61e9 <_sk_store_u16_be_avx+0x107>
+ DB 114,227 ; jb 63dd <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je 61e9 <_sk_store_u16_be_avx+0x107>
+ DB 116,218 ; je 63dd <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 61e9 <_sk_store_u16_be_avx+0x107>
+ DB 114,205 ; jb 63dd <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je 61e9 <_sk_store_u16_be_avx+0x107>
+ DB 116,196 ; je 63dd <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 61e9 <_sk_store_u16_be_avx+0x107>
+ DB 114,183 ; jb 63dd <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp 61e9 <_sk_store_u16_be_avx+0x107>
+ DB 235,174 ; jmp 63dd <_sk_store_u16_be_avx+0x107>
PUBLIC _sk_load_f32_avx
_sk_load_f32_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 62c7 <_sk_load_f32_avx+0x8c>
+ DB 15,135,128,0,0,0 ; ja 64bb <_sk_load_f32_avx+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -12118,7 +12321,7 @@ _sk_load_f32_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 62f0 <_sk_load_f32_avx+0xb5>
+ DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 64e4 <_sk_load_f32_avx+0xb5>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -12164,7 +12367,7 @@ PUBLIC _sk_load_f32_dst_avx
_sk_load_f32_dst_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 639c <_sk_load_f32_dst_avx+0x8c>
+ DB 15,135,128,0,0,0 ; ja 6590 <_sk_load_f32_dst_avx+0x8c>
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -12172,7 +12375,7 @@ _sk_load_f32_dst_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 63c4 <_sk_load_f32_dst_avx+0xb4>
+ DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 65b8 <_sk_load_f32_dst_avx+0xb4>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -12234,7 +12437,7 @@ _sk_store_f32_avx LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne 6463 <_sk_store_f32_avx+0x7f>
+ DB 117,55 ; jne 6657 <_sk_store_f32_avx+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -12247,22 +12450,22 @@ _sk_store_f32_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 645f <_sk_store_f32_avx+0x7b>
+ DB 116,240 ; je 6653 <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 645f <_sk_store_f32_avx+0x7b>
+ DB 114,227 ; jb 6653 <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je 645f <_sk_store_f32_avx+0x7b>
+ DB 116,218 ; je 6653 <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 645f <_sk_store_f32_avx+0x7b>
+ DB 114,205 ; jb 6653 <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je 645f <_sk_store_f32_avx+0x7b>
+ DB 116,195 ; je 6653 <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb 645f <_sk_store_f32_avx+0x7b>
+ DB 114,181 ; jb 6653 <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp 645f <_sk_store_f32_avx+0x7b>
+ DB 235,171 ; jmp 6653 <_sk_store_f32_avx+0x7b>
PUBLIC _sk_clamp_x_avx
_sk_clamp_x_avx LABEL PROC
@@ -12345,7 +12548,7 @@ _sk_mirror_x_avx LABEL PROC
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- DB 197,178,89,5,179,24,0,0 ; vmulss 0x18b3(%rip),%xmm9,%xmm0 # 7e9c <_sk_callback_avx+0x4f8>
+ DB 197,178,89,5,227,24,0,0 ; vmulss 0x18e3(%rip),%xmm9,%xmm0 # 80c0 <_sk_callback_avx+0x528>
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
@@ -12377,7 +12580,7 @@ _sk_mirror_y_avx LABEL PROC
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- DB 197,178,89,13,42,24,0,0 ; vmulss 0x182a(%rip),%xmm9,%xmm1 # 7ea0 <_sk_callback_avx+0x4fc>
+ DB 197,178,89,13,90,24,0,0 ; vmulss 0x185a(%rip),%xmm9,%xmm1 # 80c4 <_sk_callback_avx+0x52c>
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
@@ -12402,7 +12605,7 @@ PUBLIC _sk_clamp_x_1_avx
_sk_clamp_x_1_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,196,23,0,0 ; vbroadcastss 0x17c4(%rip),%ymm8 # 7ea4 <_sk_callback_avx+0x500>
+ DB 196,98,125,24,5,244,23,0,0 ; vbroadcastss 0x17f4(%rip),%ymm8 # 80c8 <_sk_callback_avx+0x530>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -12416,9 +12619,9 @@ _sk_repeat_x_1_avx LABEL PROC
PUBLIC _sk_mirror_x_1_avx
_sk_mirror_x_1_avx LABEL PROC
- DB 196,98,125,24,5,167,23,0,0 ; vbroadcastss 0x17a7(%rip),%ymm8 # 7ea8 <_sk_callback_avx+0x504>
+ DB 196,98,125,24,5,215,23,0,0 ; vbroadcastss 0x17d7(%rip),%ymm8 # 80cc <_sk_callback_avx+0x534>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,157,23,0,0 ; vbroadcastss 0x179d(%rip),%ymm9 # 7eac <_sk_callback_avx+0x508>
+ DB 196,98,125,24,13,205,23,0,0 ; vbroadcastss 0x17cd(%rip),%ymm9 # 80d0 <_sk_callback_avx+0x538>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -12432,12 +12635,12 @@ _sk_mirror_x_1_avx LABEL PROC
PUBLIC _sk_luminance_to_alpha_avx
_sk_luminance_to_alpha_avx LABEL PROC
- DB 196,226,125,24,29,109,23,0,0 ; vbroadcastss 0x176d(%rip),%ymm3 # 7eb0 <_sk_callback_avx+0x50c>
+ DB 196,226,125,24,29,157,23,0,0 ; vbroadcastss 0x179d(%rip),%ymm3 # 80d4 <_sk_callback_avx+0x53c>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,29,100,23,0,0 ; vbroadcastss 0x1764(%rip),%ymm3 # 7eb4 <_sk_callback_avx+0x510>
+ DB 196,226,125,24,29,148,23,0,0 ; vbroadcastss 0x1794(%rip),%ymm3 # 80d8 <_sk_callback_avx+0x540>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,87,23,0,0 ; vbroadcastss 0x1757(%rip),%ymm1 # 7eb8 <_sk_callback_avx+0x514>
+ DB 196,226,125,24,13,135,23,0,0 ; vbroadcastss 0x1787(%rip),%ymm1 # 80dc <_sk_callback_avx+0x544>
DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -12670,9 +12873,9 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 72,139,104,8 ; mov 0x8(%rax),%rbp
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 6b08 <_sk_evenly_spaced_gradient_avx+0x28>
+ DB 120,7 ; js 6cfc <_sk_evenly_spaced_gradient_avx+0x28>
DB 196,225,242,42,203 ; vcvtsi2ss %rbx,%xmm1,%xmm1
- DB 235,21 ; jmp 6b1d <_sk_evenly_spaced_gradient_avx+0x3d>
+ DB 235,21 ; jmp 6d11 <_sk_evenly_spaced_gradient_avx+0x3d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -12829,18 +13032,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_avx
_sk_gauss_a_to_rgba_avx LABEL PROC
- DB 196,226,125,24,5,56,16,0,0 ; vbroadcastss 0x1038(%rip),%ymm0 # 7ebc <_sk_callback_avx+0x518>
+ DB 196,226,125,24,5,104,16,0,0 ; vbroadcastss 0x1068(%rip),%ymm0 # 80e0 <_sk_callback_avx+0x548>
DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
- DB 196,226,125,24,13,47,16,0,0 ; vbroadcastss 0x102f(%rip),%ymm1 # 7ec0 <_sk_callback_avx+0x51c>
+ DB 196,226,125,24,13,95,16,0,0 ; vbroadcastss 0x105f(%rip),%ymm1 # 80e4 <_sk_callback_avx+0x54c>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,34,16,0,0 ; vbroadcastss 0x1022(%rip),%ymm1 # 7ec4 <_sk_callback_avx+0x520>
+ DB 196,226,125,24,13,82,16,0,0 ; vbroadcastss 0x1052(%rip),%ymm1 # 80e8 <_sk_callback_avx+0x550>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,21,16,0,0 ; vbroadcastss 0x1015(%rip),%ymm1 # 7ec8 <_sk_callback_avx+0x524>
+ DB 196,226,125,24,13,69,16,0,0 ; vbroadcastss 0x1045(%rip),%ymm1 # 80ec <_sk_callback_avx+0x554>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,8,16,0,0 ; vbroadcastss 0x1008(%rip),%ymm1 # 7ecc <_sk_callback_avx+0x528>
+ DB 196,226,125,24,13,56,16,0,0 ; vbroadcastss 0x1038(%rip),%ymm1 # 80f0 <_sk_callback_avx+0x558>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -12862,12 +13065,12 @@ _sk_gradient_avx LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,80 ; jb 6f4a <_sk_gradient_avx+0x72>
+ DB 114,80 ; jb 713e <_sk_gradient_avx+0x72>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
- DB 196,98,125,24,21,189,15,0,0 ; vbroadcastss 0xfbd(%rip),%ymm10 # 7ed0 <_sk_callback_avx+0x52c>
+ DB 196,98,125,24,21,237,15,0,0 ; vbroadcastss 0xfed(%rip),%ymm10 # 80f4 <_sk_callback_avx+0x55c>
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8
DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8
@@ -12879,7 +13082,7 @@ _sk_gradient_avx LABEL PROC
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,205 ; jne 6f17 <_sk_gradient_avx+0x3f>
+ DB 117,205 ; jne 710b <_sk_gradient_avx+0x3f>
DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -13059,27 +13262,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,176,11,0,0 ; vbroadcastss 0xbb0(%rip),%ymm13 # 7ed4 <_sk_callback_avx+0x530>
+ DB 196,98,125,24,45,224,11,0,0 ; vbroadcastss 0xbe0(%rip),%ymm13 # 80f8 <_sk_callback_avx+0x560>
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,166,11,0,0 ; vbroadcastss 0xba6(%rip),%ymm14 # 7ed8 <_sk_callback_avx+0x534>
+ DB 196,98,125,24,53,214,11,0,0 ; vbroadcastss 0xbd6(%rip),%ymm14 # 80fc <_sk_callback_avx+0x564>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,151,11,0,0 ; vbroadcastss 0xb97(%rip),%ymm14 # 7edc <_sk_callback_avx+0x538>
+ DB 196,98,125,24,53,199,11,0,0 ; vbroadcastss 0xbc7(%rip),%ymm14 # 8100 <_sk_callback_avx+0x568>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12
- DB 196,98,125,24,45,136,11,0,0 ; vbroadcastss 0xb88(%rip),%ymm13 # 7ee0 <_sk_callback_avx+0x53c>
+ DB 196,98,125,24,45,184,11,0,0 ; vbroadcastss 0xbb8(%rip),%ymm13 # 8104 <_sk_callback_avx+0x56c>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,115,11,0,0 ; vbroadcastss 0xb73(%rip),%ymm10 # 7ee4 <_sk_callback_avx+0x540>
+ DB 196,98,125,24,21,163,11,0,0 ; vbroadcastss 0xba3(%rip),%ymm10 # 8108 <_sk_callback_avx+0x570>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,93,11,0,0 ; vbroadcastss 0xb5d(%rip),%ymm10 # 7ee8 <_sk_callback_avx+0x544>
+ DB 196,98,125,24,21,141,11,0,0 ; vbroadcastss 0xb8d(%rip),%ymm10 # 810c <_sk_callback_avx+0x574>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,71,11,0,0 ; vbroadcastss 0xb47(%rip),%ymm10 # 7eec <_sk_callback_avx+0x548>
+ DB 196,98,125,24,21,119,11,0,0 ; vbroadcastss 0xb77(%rip),%ymm10 # 8110 <_sk_callback_avx+0x578>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -13105,7 +13308,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,241,10,0,0 ; vbroadcastss 0xaf1(%rip),%ymm11 # 7ef0 <_sk_callback_avx+0x54c>
+ DB 196,98,125,24,29,33,11,0,0 ; vbroadcastss 0xb21(%rip),%ymm11 # 8114 <_sk_callback_avx+0x57c>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13114,17 +13317,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,197,10,0,0 ; vbroadcastss 0xac5(%rip),%ymm9 # 7ef4 <_sk_callback_avx+0x550>
+ DB 196,98,125,24,13,245,10,0,0 ; vbroadcastss 0xaf5(%rip),%ymm9 # 8118 <_sk_callback_avx+0x580>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,163,10,0,0 ; vbroadcastss 0xaa3(%rip),%ymm9 # 7ef8 <_sk_callback_avx+0x554>
+ DB 196,98,125,24,13,211,10,0,0 ; vbroadcastss 0xad3(%rip),%ymm9 # 811c <_sk_callback_avx+0x584>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,148,10,0,0 ; vbroadcastss 0xa94(%rip),%ymm11 # 7efc <_sk_callback_avx+0x558>
+ DB 196,98,125,24,29,196,10,0,0 ; vbroadcastss 0xac4(%rip),%ymm11 # 8120 <_sk_callback_avx+0x588>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13142,7 +13345,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,83,10,0,0 ; vbroadcastss 0xa53(%rip),%ymm11 # 7f00 <_sk_callback_avx+0x55c>
+ DB 196,98,125,24,29,131,10,0,0 ; vbroadcastss 0xa83(%rip),%ymm11 # 8124 <_sk_callback_avx+0x58c>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13151,17 +13354,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,39,10,0,0 ; vbroadcastss 0xa27(%rip),%ymm9 # 7f04 <_sk_callback_avx+0x560>
+ DB 196,98,125,24,13,87,10,0,0 ; vbroadcastss 0xa57(%rip),%ymm9 # 8128 <_sk_callback_avx+0x590>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,5,10,0,0 ; vbroadcastss 0xa05(%rip),%ymm9 # 7f08 <_sk_callback_avx+0x564>
+ DB 196,98,125,24,13,53,10,0,0 ; vbroadcastss 0xa35(%rip),%ymm9 # 812c <_sk_callback_avx+0x594>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,246,9,0,0 ; vbroadcastss 0x9f6(%rip),%ymm11 # 7f0c <_sk_callback_avx+0x568>
+ DB 196,98,125,24,29,38,10,0,0 ; vbroadcastss 0xa26(%rip),%ymm11 # 8130 <_sk_callback_avx+0x598>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13178,7 +13381,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,67,121,4,201,0 ; vpermilps $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,187,9,0,0 ; vbroadcastss 0x9bb(%rip),%ymm10 # 7f10 <_sk_callback_avx+0x56c>
+ DB 196,98,125,24,21,235,9,0,0 ; vbroadcastss 0x9eb(%rip),%ymm10 # 8134 <_sk_callback_avx+0x59c>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
@@ -13187,7 +13390,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,143,9,0,0 ; vbroadcastss 0x98f(%rip),%ymm8 # 7f14 <_sk_callback_avx+0x570>
+ DB 196,98,125,24,5,191,9,0,0 ; vbroadcastss 0x9bf(%rip),%ymm8 # 8138 <_sk_callback_avx+0x5a0>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13222,7 +13425,7 @@ _sk_apply_vector_mask_avx LABEL PROC
PUBLIC _sk_save_xy_avx
_sk_save_xy_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,43,9,0,0 ; vbroadcastss 0x92b(%rip),%ymm8 # 7f18 <_sk_callback_avx+0x574>
+ DB 196,98,125,24,5,91,9,0,0 ; vbroadcastss 0x95b(%rip),%ymm8 # 813c <_sk_callback_avx+0x5a4>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -13255,9 +13458,9 @@ _sk_accumulate_avx LABEL PROC
PUBLIC _sk_bilinear_nx_avx
_sk_bilinear_nx_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,183,8,0,0 ; vbroadcastss 0x8b7(%rip),%ymm0 # 7f1c <_sk_callback_avx+0x578>
+ DB 196,226,125,24,5,231,8,0,0 ; vbroadcastss 0x8e7(%rip),%ymm0 # 8140 <_sk_callback_avx+0x5a8>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,174,8,0,0 ; vbroadcastss 0x8ae(%rip),%ymm8 # 7f20 <_sk_callback_avx+0x57c>
+ DB 196,98,125,24,5,222,8,0,0 ; vbroadcastss 0x8de(%rip),%ymm8 # 8144 <_sk_callback_avx+0x5ac>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13266,7 +13469,7 @@ _sk_bilinear_nx_avx LABEL PROC
PUBLIC _sk_bilinear_px_avx
_sk_bilinear_px_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,150,8,0,0 ; vbroadcastss 0x896(%rip),%ymm0 # 7f24 <_sk_callback_avx+0x580>
+ DB 196,226,125,24,5,198,8,0,0 ; vbroadcastss 0x8c6(%rip),%ymm0 # 8148 <_sk_callback_avx+0x5b0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13276,9 +13479,9 @@ _sk_bilinear_px_avx LABEL PROC
PUBLIC _sk_bilinear_ny_avx
_sk_bilinear_ny_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,122,8,0,0 ; vbroadcastss 0x87a(%rip),%ymm1 # 7f28 <_sk_callback_avx+0x584>
+ DB 196,226,125,24,13,170,8,0,0 ; vbroadcastss 0x8aa(%rip),%ymm1 # 814c <_sk_callback_avx+0x5b4>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,112,8,0,0 ; vbroadcastss 0x870(%rip),%ymm8 # 7f2c <_sk_callback_avx+0x588>
+ DB 196,98,125,24,5,160,8,0,0 ; vbroadcastss 0x8a0(%rip),%ymm8 # 8150 <_sk_callback_avx+0x5b8>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13287,7 +13490,7 @@ _sk_bilinear_ny_avx LABEL PROC
PUBLIC _sk_bilinear_py_avx
_sk_bilinear_py_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,88,8,0,0 ; vbroadcastss 0x858(%rip),%ymm1 # 7f30 <_sk_callback_avx+0x58c>
+ DB 196,226,125,24,13,136,8,0,0 ; vbroadcastss 0x888(%rip),%ymm1 # 8154 <_sk_callback_avx+0x5bc>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13297,14 +13500,14 @@ _sk_bilinear_py_avx LABEL PROC
PUBLIC _sk_bicubic_n3x_avx
_sk_bicubic_n3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,59,8,0,0 ; vbroadcastss 0x83b(%rip),%ymm0 # 7f34 <_sk_callback_avx+0x590>
+ DB 196,226,125,24,5,107,8,0,0 ; vbroadcastss 0x86b(%rip),%ymm0 # 8158 <_sk_callback_avx+0x5c0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,50,8,0,0 ; vbroadcastss 0x832(%rip),%ymm8 # 7f38 <_sk_callback_avx+0x594>
+ DB 196,98,125,24,5,98,8,0,0 ; vbroadcastss 0x862(%rip),%ymm8 # 815c <_sk_callback_avx+0x5c4>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,35,8,0,0 ; vbroadcastss 0x823(%rip),%ymm10 # 7f3c <_sk_callback_avx+0x598>
+ DB 196,98,125,24,21,83,8,0,0 ; vbroadcastss 0x853(%rip),%ymm10 # 8160 <_sk_callback_avx+0x5c8>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,25,8,0,0 ; vbroadcastss 0x819(%rip),%ymm10 # 7f40 <_sk_callback_avx+0x59c>
+ DB 196,98,125,24,21,73,8,0,0 ; vbroadcastss 0x849(%rip),%ymm10 # 8164 <_sk_callback_avx+0x5cc>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13314,19 +13517,19 @@ _sk_bicubic_n3x_avx LABEL PROC
PUBLIC _sk_bicubic_n1x_avx
_sk_bicubic_n1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,252,7,0,0 ; vbroadcastss 0x7fc(%rip),%ymm0 # 7f44 <_sk_callback_avx+0x5a0>
+ DB 196,226,125,24,5,44,8,0,0 ; vbroadcastss 0x82c(%rip),%ymm0 # 8168 <_sk_callback_avx+0x5d0>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,243,7,0,0 ; vbroadcastss 0x7f3(%rip),%ymm8 # 7f48 <_sk_callback_avx+0x5a4>
+ DB 196,98,125,24,5,35,8,0,0 ; vbroadcastss 0x823(%rip),%ymm8 # 816c <_sk_callback_avx+0x5d4>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,233,7,0,0 ; vbroadcastss 0x7e9(%rip),%ymm9 # 7f4c <_sk_callback_avx+0x5a8>
+ DB 196,98,125,24,13,25,8,0,0 ; vbroadcastss 0x819(%rip),%ymm9 # 8170 <_sk_callback_avx+0x5d8>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,223,7,0,0 ; vbroadcastss 0x7df(%rip),%ymm10 # 7f50 <_sk_callback_avx+0x5ac>
+ DB 196,98,125,24,21,15,8,0,0 ; vbroadcastss 0x80f(%rip),%ymm10 # 8174 <_sk_callback_avx+0x5dc>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,208,7,0,0 ; vbroadcastss 0x7d0(%rip),%ymm10 # 7f54 <_sk_callback_avx+0x5b0>
+ DB 196,98,125,24,21,0,8,0,0 ; vbroadcastss 0x800(%rip),%ymm10 # 8178 <_sk_callback_avx+0x5e0>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,193,7,0,0 ; vbroadcastss 0x7c1(%rip),%ymm9 # 7f58 <_sk_callback_avx+0x5b4>
+ DB 196,98,125,24,13,241,7,0,0 ; vbroadcastss 0x7f1(%rip),%ymm9 # 817c <_sk_callback_avx+0x5e4>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13335,17 +13538,17 @@ _sk_bicubic_n1x_avx LABEL PROC
PUBLIC _sk_bicubic_p1x_avx
_sk_bicubic_p1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,169,7,0,0 ; vbroadcastss 0x7a9(%rip),%ymm8 # 7f5c <_sk_callback_avx+0x5b8>
+ DB 196,98,125,24,5,217,7,0,0 ; vbroadcastss 0x7d9(%rip),%ymm8 # 8180 <_sk_callback_avx+0x5e8>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,155,7,0,0 ; vbroadcastss 0x79b(%rip),%ymm10 # 7f60 <_sk_callback_avx+0x5bc>
+ DB 196,98,125,24,21,203,7,0,0 ; vbroadcastss 0x7cb(%rip),%ymm10 # 8184 <_sk_callback_avx+0x5ec>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,145,7,0,0 ; vbroadcastss 0x791(%rip),%ymm11 # 7f64 <_sk_callback_avx+0x5c0>
+ DB 196,98,125,24,29,193,7,0,0 ; vbroadcastss 0x7c1(%rip),%ymm11 # 8188 <_sk_callback_avx+0x5f0>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,120,7,0,0 ; vbroadcastss 0x778(%rip),%ymm9 # 7f68 <_sk_callback_avx+0x5c4>
+ DB 196,98,125,24,13,168,7,0,0 ; vbroadcastss 0x7a8(%rip),%ymm9 # 818c <_sk_callback_avx+0x5f4>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13354,13 +13557,13 @@ _sk_bicubic_p1x_avx LABEL PROC
PUBLIC _sk_bicubic_p3x_avx
_sk_bicubic_p3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,96,7,0,0 ; vbroadcastss 0x760(%rip),%ymm0 # 7f6c <_sk_callback_avx+0x5c8>
+ DB 196,226,125,24,5,144,7,0,0 ; vbroadcastss 0x790(%rip),%ymm0 # 8190 <_sk_callback_avx+0x5f8>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,77,7,0,0 ; vbroadcastss 0x74d(%rip),%ymm10 # 7f70 <_sk_callback_avx+0x5cc>
+ DB 196,98,125,24,21,125,7,0,0 ; vbroadcastss 0x77d(%rip),%ymm10 # 8194 <_sk_callback_avx+0x5fc>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,67,7,0,0 ; vbroadcastss 0x743(%rip),%ymm10 # 7f74 <_sk_callback_avx+0x5d0>
+ DB 196,98,125,24,21,115,7,0,0 ; vbroadcastss 0x773(%rip),%ymm10 # 8198 <_sk_callback_avx+0x600>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -13370,14 +13573,14 @@ _sk_bicubic_p3x_avx LABEL PROC
PUBLIC _sk_bicubic_n3y_avx
_sk_bicubic_n3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,38,7,0,0 ; vbroadcastss 0x726(%rip),%ymm1 # 7f78 <_sk_callback_avx+0x5d4>
+ DB 196,226,125,24,13,86,7,0,0 ; vbroadcastss 0x756(%rip),%ymm1 # 819c <_sk_callback_avx+0x604>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,28,7,0,0 ; vbroadcastss 0x71c(%rip),%ymm8 # 7f7c <_sk_callback_avx+0x5d8>
+ DB 196,98,125,24,5,76,7,0,0 ; vbroadcastss 0x74c(%rip),%ymm8 # 81a0 <_sk_callback_avx+0x608>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,13,7,0,0 ; vbroadcastss 0x70d(%rip),%ymm10 # 7f80 <_sk_callback_avx+0x5dc>
+ DB 196,98,125,24,21,61,7,0,0 ; vbroadcastss 0x73d(%rip),%ymm10 # 81a4 <_sk_callback_avx+0x60c>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,3,7,0,0 ; vbroadcastss 0x703(%rip),%ymm10 # 7f84 <_sk_callback_avx+0x5e0>
+ DB 196,98,125,24,21,51,7,0,0 ; vbroadcastss 0x733(%rip),%ymm10 # 81a8 <_sk_callback_avx+0x610>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13387,19 +13590,19 @@ _sk_bicubic_n3y_avx LABEL PROC
PUBLIC _sk_bicubic_n1y_avx
_sk_bicubic_n1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,230,6,0,0 ; vbroadcastss 0x6e6(%rip),%ymm1 # 7f88 <_sk_callback_avx+0x5e4>
+ DB 196,226,125,24,13,22,7,0,0 ; vbroadcastss 0x716(%rip),%ymm1 # 81ac <_sk_callback_avx+0x614>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,220,6,0,0 ; vbroadcastss 0x6dc(%rip),%ymm8 # 7f8c <_sk_callback_avx+0x5e8>
+ DB 196,98,125,24,5,12,7,0,0 ; vbroadcastss 0x70c(%rip),%ymm8 # 81b0 <_sk_callback_avx+0x618>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,210,6,0,0 ; vbroadcastss 0x6d2(%rip),%ymm9 # 7f90 <_sk_callback_avx+0x5ec>
+ DB 196,98,125,24,13,2,7,0,0 ; vbroadcastss 0x702(%rip),%ymm9 # 81b4 <_sk_callback_avx+0x61c>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,200,6,0,0 ; vbroadcastss 0x6c8(%rip),%ymm10 # 7f94 <_sk_callback_avx+0x5f0>
+ DB 196,98,125,24,21,248,6,0,0 ; vbroadcastss 0x6f8(%rip),%ymm10 # 81b8 <_sk_callback_avx+0x620>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,185,6,0,0 ; vbroadcastss 0x6b9(%rip),%ymm10 # 7f98 <_sk_callback_avx+0x5f4>
+ DB 196,98,125,24,21,233,6,0,0 ; vbroadcastss 0x6e9(%rip),%ymm10 # 81bc <_sk_callback_avx+0x624>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,170,6,0,0 ; vbroadcastss 0x6aa(%rip),%ymm9 # 7f9c <_sk_callback_avx+0x5f8>
+ DB 196,98,125,24,13,218,6,0,0 ; vbroadcastss 0x6da(%rip),%ymm9 # 81c0 <_sk_callback_avx+0x628>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13408,17 +13611,17 @@ _sk_bicubic_n1y_avx LABEL PROC
PUBLIC _sk_bicubic_p1y_avx
_sk_bicubic_p1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,146,6,0,0 ; vbroadcastss 0x692(%rip),%ymm8 # 7fa0 <_sk_callback_avx+0x5fc>
+ DB 196,98,125,24,5,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm8 # 81c4 <_sk_callback_avx+0x62c>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,131,6,0,0 ; vbroadcastss 0x683(%rip),%ymm10 # 7fa4 <_sk_callback_avx+0x600>
+ DB 196,98,125,24,21,179,6,0,0 ; vbroadcastss 0x6b3(%rip),%ymm10 # 81c8 <_sk_callback_avx+0x630>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,121,6,0,0 ; vbroadcastss 0x679(%rip),%ymm11 # 7fa8 <_sk_callback_avx+0x604>
+ DB 196,98,125,24,29,169,6,0,0 ; vbroadcastss 0x6a9(%rip),%ymm11 # 81cc <_sk_callback_avx+0x634>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,96,6,0,0 ; vbroadcastss 0x660(%rip),%ymm9 # 7fac <_sk_callback_avx+0x608>
+ DB 196,98,125,24,13,144,6,0,0 ; vbroadcastss 0x690(%rip),%ymm9 # 81d0 <_sk_callback_avx+0x638>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13427,13 +13630,13 @@ _sk_bicubic_p1y_avx LABEL PROC
PUBLIC _sk_bicubic_p3y_avx
_sk_bicubic_p3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,72,6,0,0 ; vbroadcastss 0x648(%rip),%ymm1 # 7fb0 <_sk_callback_avx+0x60c>
+ DB 196,226,125,24,13,120,6,0,0 ; vbroadcastss 0x678(%rip),%ymm1 # 81d4 <_sk_callback_avx+0x63c>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,52,6,0,0 ; vbroadcastss 0x634(%rip),%ymm10 # 7fb4 <_sk_callback_avx+0x610>
+ DB 196,98,125,24,21,100,6,0,0 ; vbroadcastss 0x664(%rip),%ymm10 # 81d8 <_sk_callback_avx+0x640>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,42,6,0,0 ; vbroadcastss 0x62a(%rip),%ymm10 # 7fb8 <_sk_callback_avx+0x614>
+ DB 196,98,125,24,21,90,6,0,0 ; vbroadcastss 0x65a(%rip),%ymm10 # 81dc <_sk_callback_avx+0x644>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -13557,25 +13760,25 @@ ALIGN 4
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 7b89 <.literal4+0xb9>
+ DB 71,225,61 ; rex.RXB loope 7d7d <.literal4+0xb9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 7b99 <.literal4+0xc9>
+ DB 71,225,61 ; rex.RXB loope 7d8d <.literal4+0xc9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 7ba9 <.literal4+0xd9>
+ DB 71,225,61 ; rex.RXB loope 7d9d <.literal4+0xd9>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 7bb9 <.literal4+0xe9>
+ DB 71,225,61 ; rex.RXB loope 7dad <.literal4+0xe9>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
@@ -13640,7 +13843,7 @@ ALIGN 4
DB 190,129,128,128,59 ; mov $0x3b808081,%esi
DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 7c29 <.literal4+0x159>
+ DB 224,7 ; loopne 7e1d <.literal4+0x159>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -13656,10 +13859,27 @@ ALIGN 4
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 7c50 <.literal4+0x180>
+ DB 127,0 ; jg 7e44 <.literal4+0x180>
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 119,115 ; ja 7ebd <.literal4+0x1f9>
+ DB 248 ; clc
+ DB 194,117,191 ; retq $0xbf75
+ DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
+ DB 62,163,233,220,63,81,140,242,66,141 ; movabs %eax,%ds:0x8d42f28c513fdce9
+ DB 188,190,63,248,245 ; mov $0xf5f83fbe,%esp
+ DB 154 ; (bad)
+ DB 64,254 ; rex (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,0,0 ; add %al,(%r8)
+ DB 0,75,0 ; add %cl,0x0(%rbx)
+ DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
+ DB 52,255 ; xor $0xff,%al
+ DB 255 ; (bad)
+ DB 127,0 ; jg 7e78 <.literal4+0x1b4>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 7cc9 <.literal4+0x1f9>
+ DB 119,115 ; ja 7ef1 <.literal4+0x22d>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -13673,10 +13893,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7c84 <.literal4+0x1b4>
+ DB 127,0 ; jg 7eac <.literal4+0x1e8>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 7cfd <.literal4+0x22d>
+ DB 119,115 ; ja 7f25 <.literal4+0x261>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -13690,10 +13910,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7cb8 <.literal4+0x1e8>
+ DB 127,0 ; jg 7ee0 <.literal4+0x21c>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 7d31 <.literal4+0x261>
+ DB 119,115 ; ja 7f59 <.literal4+0x295>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -13707,10 +13927,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7cec <.literal4+0x21c>
+ DB 127,0 ; jg 7f14 <.literal4+0x250>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 7d65 <.literal4+0x295>
+ DB 119,115 ; ja 7f8d <.literal4+0x2c9>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -13721,9 +13941,9 @@ ALIGN 4
DB 210,221 ; rcr %cl,%ch
DB 65,0,0 ; add %al,(%r8)
DB 0,75,0 ; add %cl,0x0(%rbx)
- DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax)
+ DB 0,200 ; add %cl,%al
DB 66,0,0 ; rex.X add %al,(%rax)
- DB 127,67 ; jg 7d63 <.literal4+0x293>
+ DB 127,67 ; jg 7f87 <.literal4+0x2c3>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -13735,7 +13955,7 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 7d83 <.literal4+0x2b3>
+ DB 118,63 ; jbe 7fa7 <.literal4+0x2e3>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
@@ -13757,7 +13977,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 7d9d <.literal4+0x2cd>
+ DB 224,7 ; loopne 7fc1 <.literal4+0x2fd>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -13769,7 +13989,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 7db9 <.literal4+0x2e9>
+ DB 224,7 ; loopne 7fdd <.literal4+0x319>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -13780,7 +14000,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 7e0e <.literal4+0x33e>
+ DB 124,66 ; jl 8032 <.literal4+0x36e>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -13806,7 +14026,7 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 7e71 <.literal4+0x3a1>
+ DB 112,65 ; jo 8095 <.literal4+0x3d1>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
@@ -13832,7 +14052,7 @@ ALIGN 4
DB 0,128,55,0,0,128 ; add %al,-0x7fffffc9(%rax)
DB 63 ; (bad)
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 7ee3 <.literal4+0x413>
+ DB 127,71 ; jg 8107 <.literal4+0x443>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -14378,7 +14598,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,59,93,0,0 ; movaps 0x5d3b(%rip),%xmm2 # 5e90 <_sk_callback_sse41+0xd9>
+ DB 15,40,21,251,94,0,0 ; movaps 0x5efb(%rip),%xmm2 # 6050 <_sk_callback_sse41+0xd5>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -14387,7 +14607,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,42,93,0,0 ; movaps 0x5d2a(%rip),%xmm2 # 5ea0 <_sk_callback_sse41+0xe9>
+ DB 15,40,21,234,94,0,0 ; movaps 0x5eea(%rip),%xmm2 # 6060 <_sk_callback_sse41+0xe5>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -14405,14 +14625,14 @@ _sk_dither_sse41 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,248,92,0,0 ; movdqa 0x5cf8(%rip),%xmm10 # 5eb0 <_sk_callback_sse41+0xf9>
+ DB 102,68,15,111,21,184,94,0,0 ; movdqa 0x5eb8(%rip),%xmm10 # 6070 <_sk_callback_sse41+0xf5>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,228,92,0,0 ; movdqa 0x5ce4(%rip),%xmm12 # 5ec0 <_sk_callback_sse41+0x109>
- DB 102,68,15,111,45,235,92,0,0 ; movdqa 0x5ceb(%rip),%xmm13 # 5ed0 <_sk_callback_sse41+0x119>
+ DB 102,68,15,111,37,164,94,0,0 ; movdqa 0x5ea4(%rip),%xmm12 # 6080 <_sk_callback_sse41+0x105>
+ DB 102,68,15,111,45,171,94,0,0 ; movdqa 0x5eab(%rip),%xmm13 # 6090 <_sk_callback_sse41+0x115>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -14428,8 +14648,8 @@ _sk_dither_sse41 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,166,92,0,0 ; mulps 0x5ca6(%rip),%xmm8 # 5ee0 <_sk_callback_sse41+0x129>
- DB 68,15,88,5,174,92,0,0 ; addps 0x5cae(%rip),%xmm8 # 5ef0 <_sk_callback_sse41+0x139>
+ DB 68,15,89,5,102,94,0,0 ; mulps 0x5e66(%rip),%xmm8 # 60a0 <_sk_callback_sse41+0x125>
+ DB 68,15,88,5,110,94,0,0 ; addps 0x5e6e(%rip),%xmm8 # 60b0 <_sk_callback_sse41+0x135>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -14467,7 +14687,7 @@ _sk_uniform_color_sse41 LABEL PROC
PUBLIC _sk_black_color_sse41
_sk_black_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,68,92,0,0 ; movaps 0x5c44(%rip),%xmm3 # 5f00 <_sk_callback_sse41+0x149>
+ DB 15,40,29,4,94,0,0 ; movaps 0x5e04(%rip),%xmm3 # 60c0 <_sk_callback_sse41+0x145>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -14476,7 +14696,7 @@ _sk_black_color_sse41 LABEL PROC
PUBLIC _sk_white_color_sse41
_sk_white_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,64,92,0,0 ; movaps 0x5c40(%rip),%xmm0 # 5f10 <_sk_callback_sse41+0x159>
+ DB 15,40,5,0,94,0,0 ; movaps 0x5e00(%rip),%xmm0 # 60d0 <_sk_callback_sse41+0x155>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -14514,7 +14734,7 @@ _sk_clear_sse41 LABEL PROC
PUBLIC _sk_srcatop_sse41
_sk_srcatop_sse41 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,0,92,0,0 ; movaps 0x5c00(%rip),%xmm8 # 5f20 <_sk_callback_sse41+0x169>
+ DB 68,15,40,5,192,93,0,0 ; movaps 0x5dc0(%rip),%xmm8 # 60e0 <_sk_callback_sse41+0x165>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -14537,7 +14757,7 @@ PUBLIC _sk_dstatop_sse41
_sk_dstatop_sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,195,91,0,0 ; movaps 0x5bc3(%rip),%xmm9 # 5f30 <_sk_callback_sse41+0x179>
+ DB 68,15,40,13,131,93,0,0 ; movaps 0x5d83(%rip),%xmm9 # 60f0 <_sk_callback_sse41+0x175>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -14578,7 +14798,7 @@ _sk_dstin_sse41 LABEL PROC
PUBLIC _sk_srcout_sse41
_sk_srcout_sse41 LABEL PROC
- DB 68,15,40,5,103,91,0,0 ; movaps 0x5b67(%rip),%xmm8 # 5f40 <_sk_callback_sse41+0x189>
+ DB 68,15,40,5,39,93,0,0 ; movaps 0x5d27(%rip),%xmm8 # 6100 <_sk_callback_sse41+0x185>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -14589,7 +14809,7 @@ _sk_srcout_sse41 LABEL PROC
PUBLIC _sk_dstout_sse41
_sk_dstout_sse41 LABEL PROC
- DB 68,15,40,5,87,91,0,0 ; movaps 0x5b57(%rip),%xmm8 # 5f50 <_sk_callback_sse41+0x199>
+ DB 68,15,40,5,23,93,0,0 ; movaps 0x5d17(%rip),%xmm8 # 6110 <_sk_callback_sse41+0x195>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -14604,7 +14824,7 @@ _sk_dstout_sse41 LABEL PROC
PUBLIC _sk_srcover_sse41
_sk_srcover_sse41 LABEL PROC
- DB 68,15,40,5,58,91,0,0 ; movaps 0x5b3a(%rip),%xmm8 # 5f60 <_sk_callback_sse41+0x1a9>
+ DB 68,15,40,5,250,92,0,0 ; movaps 0x5cfa(%rip),%xmm8 # 6120 <_sk_callback_sse41+0x1a5>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -14622,7 +14842,7 @@ _sk_srcover_sse41 LABEL PROC
PUBLIC _sk_dstover_sse41
_sk_dstover_sse41 LABEL PROC
- DB 68,15,40,5,14,91,0,0 ; movaps 0x5b0e(%rip),%xmm8 # 5f70 <_sk_callback_sse41+0x1b9>
+ DB 68,15,40,5,206,92,0,0 ; movaps 0x5cce(%rip),%xmm8 # 6130 <_sk_callback_sse41+0x1b5>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -14646,7 +14866,7 @@ _sk_modulate_sse41 LABEL PROC
PUBLIC _sk_multiply_sse41
_sk_multiply_sse41 LABEL PROC
- DB 68,15,40,5,226,90,0,0 ; movaps 0x5ae2(%rip),%xmm8 # 5f80 <_sk_callback_sse41+0x1c9>
+ DB 68,15,40,5,162,92,0,0 ; movaps 0x5ca2(%rip),%xmm8 # 6140 <_sk_callback_sse41+0x1c5>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -14715,7 +14935,7 @@ _sk_screen_sse41 LABEL PROC
PUBLIC _sk_xor__sse41
_sk_xor__sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,23,90,0,0 ; movaps 0x5a17(%rip),%xmm3 # 5f90 <_sk_callback_sse41+0x1d9>
+ DB 15,40,29,215,91,0,0 ; movaps 0x5bd7(%rip),%xmm3 # 6150 <_sk_callback_sse41+0x1d5>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -14761,7 +14981,7 @@ _sk_darken_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,130,89,0,0 ; movaps 0x5982(%rip),%xmm2 # 5fa0 <_sk_callback_sse41+0x1e9>
+ DB 15,40,21,66,91,0,0 ; movaps 0x5b42(%rip),%xmm2 # 6160 <_sk_callback_sse41+0x1e5>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -14793,7 +15013,7 @@ _sk_lighten_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,39,89,0,0 ; movaps 0x5927(%rip),%xmm2 # 5fb0 <_sk_callback_sse41+0x1f9>
+ DB 15,40,21,231,90,0,0 ; movaps 0x5ae7(%rip),%xmm2 # 6170 <_sk_callback_sse41+0x1f5>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -14828,7 +15048,7 @@ _sk_difference_sse41 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,193,88,0,0 ; movaps 0x58c1(%rip),%xmm2 # 5fc0 <_sk_callback_sse41+0x209>
+ DB 15,40,21,129,90,0,0 ; movaps 0x5a81(%rip),%xmm2 # 6180 <_sk_callback_sse41+0x205>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -14854,7 +15074,7 @@ _sk_exclusion_sse41 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,129,88,0,0 ; movaps 0x5881(%rip),%xmm2 # 5fd0 <_sk_callback_sse41+0x219>
+ DB 15,40,21,65,90,0,0 ; movaps 0x5a41(%rip),%xmm2 # 6190 <_sk_callback_sse41+0x215>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -14865,7 +15085,7 @@ _sk_exclusion_sse41 LABEL PROC
PUBLIC _sk_colorburn_sse41
_sk_colorburn_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,116,88,0,0 ; movaps 0x5874(%rip),%xmm10 # 5fe0 <_sk_callback_sse41+0x229>
+ DB 68,15,40,21,52,90,0,0 ; movaps 0x5a34(%rip),%xmm10 # 61a0 <_sk_callback_sse41+0x225>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,203 ; movaps %xmm11,%xmm9
@@ -14945,7 +15165,7 @@ _sk_colorburn_sse41 LABEL PROC
PUBLIC _sk_colordodge_sse41
_sk_colordodge_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,82,87,0,0 ; movaps 0x5752(%rip),%xmm10 # 5ff0 <_sk_callback_sse41+0x239>
+ DB 68,15,40,21,18,89,0,0 ; movaps 0x5912(%rip),%xmm10 # 61b0 <_sk_callback_sse41+0x235>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -15026,7 +15246,7 @@ _sk_hardlight_sse41 LABEL PROC
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,40,86,0,0 ; movaps 0x5628(%rip),%xmm10 # 6000 <_sk_callback_sse41+0x249>
+ DB 68,15,40,21,232,87,0,0 ; movaps 0x57e8(%rip),%xmm10 # 61c0 <_sk_callback_sse41+0x245>
DB 65,15,40,234 ; movaps %xmm10,%xmm5
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -15108,7 +15328,7 @@ PUBLIC _sk_overlay_sse41
_sk_overlay_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,240 ; movaps %xmm0,%xmm14
- DB 68,15,40,21,10,85,0,0 ; movaps 0x550a(%rip),%xmm10 # 6010 <_sk_callback_sse41+0x259>
+ DB 68,15,40,21,202,86,0,0 ; movaps 0x56ca(%rip),%xmm10 # 61d0 <_sk_callback_sse41+0x255>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -15192,7 +15412,7 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 65,15,84,193 ; andps %xmm9,%xmm0
- DB 15,40,13,221,83,0,0 ; movaps 0x53dd(%rip),%xmm1 # 6020 <_sk_callback_sse41+0x269>
+ DB 15,40,13,157,85,0,0 ; movaps 0x559d(%rip),%xmm1 # 61e0 <_sk_callback_sse41+0x265>
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 68,15,40,240 ; movaps %xmm0,%xmm14
@@ -15205,10 +15425,10 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,40,45,187,83,0,0 ; movaps 0x53bb(%rip),%xmm13 # 6030 <_sk_callback_sse41+0x279>
+ DB 68,15,40,45,123,85,0,0 ; movaps 0x557b(%rip),%xmm13 # 61f0 <_sk_callback_sse41+0x275>
DB 69,15,88,245 ; addps %xmm13,%xmm14
DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 68,15,40,37,187,83,0,0 ; movaps 0x53bb(%rip),%xmm12 # 6040 <_sk_callback_sse41+0x289>
+ DB 68,15,40,37,123,85,0,0 ; movaps 0x557b(%rip),%xmm12 # 6200 <_sk_callback_sse41+0x285>
DB 69,15,89,252 ; mulps %xmm12,%xmm15
DB 69,15,88,254 ; addps %xmm14,%xmm15
DB 15,40,198 ; movaps %xmm6,%xmm0
@@ -15394,12 +15614,12 @@ _sk_hue_sse41 LABEL PROC
DB 68,15,84,208 ; andps %xmm0,%xmm10
DB 15,84,200 ; andps %xmm0,%xmm1
DB 68,15,84,232 ; andps %xmm0,%xmm13
- DB 15,40,5,33,81,0,0 ; movaps 0x5121(%rip),%xmm0 # 6050 <_sk_callback_sse41+0x299>
+ DB 15,40,5,225,82,0,0 ; movaps 0x52e1(%rip),%xmm0 # 6210 <_sk_callback_sse41+0x295>
DB 68,15,89,224 ; mulps %xmm0,%xmm12
- DB 15,40,21,38,81,0,0 ; movaps 0x5126(%rip),%xmm2 # 6060 <_sk_callback_sse41+0x2a9>
+ DB 15,40,21,230,82,0,0 ; movaps 0x52e6(%rip),%xmm2 # 6220 <_sk_callback_sse41+0x2a5>
DB 15,89,250 ; mulps %xmm2,%xmm7
DB 65,15,88,252 ; addps %xmm12,%xmm7
- DB 68,15,40,53,39,81,0,0 ; movaps 0x5127(%rip),%xmm14 # 6070 <_sk_callback_sse41+0x2b9>
+ DB 68,15,40,53,231,82,0,0 ; movaps 0x52e7(%rip),%xmm14 # 6230 <_sk_callback_sse41+0x2b5>
DB 68,15,40,252 ; movaps %xmm4,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,255 ; addps %xmm7,%xmm15
@@ -15482,7 +15702,7 @@ _sk_hue_sse41 LABEL PROC
DB 65,15,88,214 ; addps %xmm14,%xmm2
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,40,13,236,79,0,0 ; movaps 0x4fec(%rip),%xmm9 # 6080 <_sk_callback_sse41+0x2c9>
+ DB 68,15,40,13,172,81,0,0 ; movaps 0x51ac(%rip),%xmm9 # 6240 <_sk_callback_sse41+0x2c5>
DB 65,15,40,225 ; movaps %xmm9,%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0
@@ -15576,14 +15796,14 @@ _sk_saturation_sse41 LABEL PROC
DB 68,15,84,215 ; andps %xmm7,%xmm10
DB 68,15,84,223 ; andps %xmm7,%xmm11
DB 68,15,84,199 ; andps %xmm7,%xmm8
- DB 15,40,21,159,78,0,0 ; movaps 0x4e9f(%rip),%xmm2 # 6090 <_sk_callback_sse41+0x2d9>
+ DB 15,40,21,95,80,0,0 ; movaps 0x505f(%rip),%xmm2 # 6250 <_sk_callback_sse41+0x2d5>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,40,13,162,78,0,0 ; movaps 0x4ea2(%rip),%xmm1 # 60a0 <_sk_callback_sse41+0x2e9>
+ DB 15,40,13,98,80,0,0 ; movaps 0x5062(%rip),%xmm1 # 6260 <_sk_callback_sse41+0x2e5>
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,249 ; mulps %xmm1,%xmm7
DB 15,88,251 ; addps %xmm3,%xmm7
- DB 68,15,40,45,161,78,0,0 ; movaps 0x4ea1(%rip),%xmm13 # 60b0 <_sk_callback_sse41+0x2f9>
+ DB 68,15,40,45,97,80,0,0 ; movaps 0x5061(%rip),%xmm13 # 6270 <_sk_callback_sse41+0x2f5>
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 68,15,88,247 ; addps %xmm7,%xmm14
DB 65,15,40,218 ; movaps %xmm10,%xmm3
@@ -15664,7 +15884,7 @@ _sk_saturation_sse41 LABEL PROC
DB 65,15,88,253 ; addps %xmm13,%xmm7
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11
- DB 68,15,40,13,103,77,0,0 ; movaps 0x4d67(%rip),%xmm9 # 60c0 <_sk_callback_sse41+0x309>
+ DB 68,15,40,13,39,79,0,0 ; movaps 0x4f27(%rip),%xmm9 # 6280 <_sk_callback_sse41+0x305>
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 68,15,92,204 ; subps %xmm4,%xmm9
DB 15,40,60,36 ; movaps (%rsp),%xmm7
@@ -15719,14 +15939,14 @@ _sk_color_sse41 LABEL PROC
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 68,15,89,244 ; mulps %xmm4,%xmm14
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 68,15,40,13,172,76,0,0 ; movaps 0x4cac(%rip),%xmm9 # 60d0 <_sk_callback_sse41+0x319>
+ DB 68,15,40,13,108,78,0,0 ; movaps 0x4e6c(%rip),%xmm9 # 6290 <_sk_callback_sse41+0x315>
DB 65,15,40,250 ; movaps %xmm10,%xmm7
DB 65,15,89,249 ; mulps %xmm9,%xmm7
- DB 68,15,40,21,172,76,0,0 ; movaps 0x4cac(%rip),%xmm10 # 60e0 <_sk_callback_sse41+0x329>
+ DB 68,15,40,21,108,78,0,0 ; movaps 0x4e6c(%rip),%xmm10 # 62a0 <_sk_callback_sse41+0x325>
DB 65,15,40,219 ; movaps %xmm11,%xmm3
DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,40,29,169,76,0,0 ; movaps 0x4ca9(%rip),%xmm11 # 60f0 <_sk_callback_sse41+0x339>
+ DB 68,15,40,29,105,78,0,0 ; movaps 0x4e69(%rip),%xmm11 # 62b0 <_sk_callback_sse41+0x335>
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
@@ -15811,7 +16031,7 @@ _sk_color_sse41 LABEL PROC
DB 65,15,88,251 ; addps %xmm11,%xmm7
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1
- DB 68,15,40,13,101,75,0,0 ; movaps 0x4b65(%rip),%xmm9 # 6100 <_sk_callback_sse41+0x349>
+ DB 68,15,40,13,37,77,0,0 ; movaps 0x4d25(%rip),%xmm9 # 62c0 <_sk_callback_sse41+0x345>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
DB 68,15,89,192 ; mulps %xmm0,%xmm8
@@ -15863,13 +16083,13 @@ _sk_luminosity_sse41 LABEL PROC
DB 69,15,89,216 ; mulps %xmm8,%xmm11
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,89,205 ; mulps %xmm5,%xmm9
- DB 68,15,40,5,183,74,0,0 ; movaps 0x4ab7(%rip),%xmm8 # 6110 <_sk_callback_sse41+0x359>
+ DB 68,15,40,5,119,76,0,0 ; movaps 0x4c77(%rip),%xmm8 # 62d0 <_sk_callback_sse41+0x355>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 68,15,40,21,187,74,0,0 ; movaps 0x4abb(%rip),%xmm10 # 6120 <_sk_callback_sse41+0x369>
+ DB 68,15,40,21,123,76,0,0 ; movaps 0x4c7b(%rip),%xmm10 # 62e0 <_sk_callback_sse41+0x365>
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 65,15,89,234 ; mulps %xmm10,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 68,15,40,37,185,74,0,0 ; movaps 0x4ab9(%rip),%xmm12 # 6130 <_sk_callback_sse41+0x379>
+ DB 68,15,40,37,121,76,0,0 ; movaps 0x4c79(%rip),%xmm12 # 62f0 <_sk_callback_sse41+0x375>
DB 68,15,40,242 ; movaps %xmm2,%xmm14
DB 69,15,89,244 ; mulps %xmm12,%xmm14
DB 68,15,88,245 ; addps %xmm5,%xmm14
@@ -15954,7 +16174,7 @@ _sk_luminosity_sse41 LABEL PROC
DB 65,15,88,244 ; addps %xmm12,%xmm6
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9
- DB 15,40,5,111,73,0,0 ; movaps 0x496f(%rip),%xmm0 # 6140 <_sk_callback_sse41+0x389>
+ DB 15,40,5,47,75,0,0 ; movaps 0x4b2f(%rip),%xmm0 # 6300 <_sk_callback_sse41+0x385>
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,92,215 ; subps %xmm7,%xmm2
DB 15,89,226 ; mulps %xmm2,%xmm4
@@ -16001,20 +16221,20 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 15,133,219,0,0,0 ; jne 193c <_sk_srcover_rgba_8888_sse41+0xfb>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,37,222,72,0,0 ; movdqa 0x48de(%rip),%xmm4 # 6150 <_sk_callback_sse41+0x399>
+ DB 102,15,111,37,158,74,0,0 ; movdqa 0x4a9e(%rip),%xmm4 # 6310 <_sk_callback_sse41+0x395>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,218,72,0,0 ; pshufb 0x48da(%rip),%xmm5 # 6160 <_sk_callback_sse41+0x3a9>
+ DB 102,15,56,0,45,154,74,0,0 ; pshufb 0x4a9a(%rip),%xmm5 # 6320 <_sk_callback_sse41+0x3a5>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,218,72,0,0 ; pshufb 0x48da(%rip),%xmm6 # 6170 <_sk_callback_sse41+0x3b9>
+ DB 102,15,56,0,53,154,74,0,0 ; pshufb 0x4a9a(%rip),%xmm6 # 6330 <_sk_callback_sse41+0x3b5>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 68,15,40,5,215,72,0,0 ; movaps 0x48d7(%rip),%xmm8 # 6180 <_sk_callback_sse41+0x3c9>
+ DB 68,15,40,5,151,74,0,0 ; movaps 0x4a97(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x3c5>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,219,72,0,0 ; movaps 0x48db(%rip),%xmm12 # 6190 <_sk_callback_sse41+0x3d9>
+ DB 68,15,40,37,155,74,0,0 ; movaps 0x4a9b(%rip),%xmm12 # 6350 <_sk_callback_sse41+0x3d5>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -16090,7 +16310,7 @@ _sk_clamp_0_sse41 LABEL PROC
PUBLIC _sk_clamp_1_sse41
_sk_clamp_1_sse41 LABEL PROC
- DB 68,15,40,5,198,71,0,0 ; movaps 0x47c6(%rip),%xmm8 # 61a0 <_sk_callback_sse41+0x3e9>
+ DB 68,15,40,5,134,73,0,0 ; movaps 0x4986(%rip),%xmm8 # 6360 <_sk_callback_sse41+0x3e5>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -16100,7 +16320,7 @@ _sk_clamp_1_sse41 LABEL PROC
PUBLIC _sk_clamp_a_sse41
_sk_clamp_a_sse41 LABEL PROC
- DB 15,93,29,187,71,0,0 ; minps 0x47bb(%rip),%xmm3 # 61b0 <_sk_callback_sse41+0x3f9>
+ DB 15,93,29,123,73,0,0 ; minps 0x497b(%rip),%xmm3 # 6370 <_sk_callback_sse41+0x3f5>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -16109,7 +16329,7 @@ _sk_clamp_a_sse41 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse41
_sk_clamp_a_dst_sse41 LABEL PROC
- DB 15,93,61,183,71,0,0 ; minps 0x47b7(%rip),%xmm7 # 61c0 <_sk_callback_sse41+0x409>
+ DB 15,93,61,119,73,0,0 ; minps 0x4977(%rip),%xmm7 # 6380 <_sk_callback_sse41+0x405>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -16138,7 +16358,7 @@ _sk_swap_rb_sse41 LABEL PROC
PUBLIC _sk_invert_sse41
_sk_invert_sse41 LABEL PROC
- DB 68,15,40,5,131,71,0,0 ; movaps 0x4783(%rip),%xmm8 # 61d0 <_sk_callback_sse41+0x419>
+ DB 68,15,40,5,67,73,0,0 ; movaps 0x4943(%rip),%xmm8 # 6390 <_sk_callback_sse41+0x415>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -16190,7 +16410,7 @@ _sk_premul_dst_sse41 LABEL PROC
PUBLIC _sk_unpremul_sse41
_sk_unpremul_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,29,71,0,0 ; movaps 0x471d(%rip),%xmm9 # 61e0 <_sk_callback_sse41+0x429>
+ DB 68,15,40,13,221,72,0,0 ; movaps 0x48dd(%rip),%xmm9 # 63a0 <_sk_callback_sse41+0x425>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -16202,20 +16422,20 @@ _sk_unpremul_sse41 LABEL PROC
PUBLIC _sk_from_srgb_sse41
_sk_from_srgb_sse41 LABEL PROC
- DB 68,15,40,29,8,71,0,0 ; movaps 0x4708(%rip),%xmm11 # 61f0 <_sk_callback_sse41+0x439>
+ DB 68,15,40,29,200,72,0,0 ; movaps 0x48c8(%rip),%xmm11 # 63b0 <_sk_callback_sse41+0x435>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
DB 68,15,40,208 ; movaps %xmm0,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
- DB 68,15,40,37,0,71,0,0 ; movaps 0x4700(%rip),%xmm12 # 6200 <_sk_callback_sse41+0x449>
+ DB 68,15,40,37,192,72,0,0 ; movaps 0x48c0(%rip),%xmm12 # 63c0 <_sk_callback_sse41+0x445>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,0,71,0,0 ; movaps 0x4700(%rip),%xmm13 # 6210 <_sk_callback_sse41+0x459>
+ DB 68,15,40,45,192,72,0,0 ; movaps 0x48c0(%rip),%xmm13 # 63d0 <_sk_callback_sse41+0x455>
DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,40,53,0,71,0,0 ; movaps 0x4700(%rip),%xmm14 # 6220 <_sk_callback_sse41+0x469>
+ DB 68,15,40,53,192,72,0,0 ; movaps 0x48c0(%rip),%xmm14 # 63e0 <_sk_callback_sse41+0x465>
DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 68,15,40,61,4,71,0,0 ; movaps 0x4704(%rip),%xmm15 # 6230 <_sk_callback_sse41+0x479>
+ DB 68,15,40,61,196,72,0,0 ; movaps 0x48c4(%rip),%xmm15 # 63f0 <_sk_callback_sse41+0x475>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,40,209 ; movaps %xmm1,%xmm10
@@ -16250,19 +16470,19 @@ PUBLIC _sk_from_srgb_dst_sse41
_sk_from_srgb_dst_sse41 LABEL PROC
DB 68,15,40,204 ; movaps %xmm4,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,29,143,70,0,0 ; movaps 0x468f(%rip),%xmm11 # 6240 <_sk_callback_sse41+0x489>
+ DB 68,15,40,29,79,72,0,0 ; movaps 0x484f(%rip),%xmm11 # 6400 <_sk_callback_sse41+0x485>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 68,15,40,37,136,70,0,0 ; movaps 0x4688(%rip),%xmm12 # 6250 <_sk_callback_sse41+0x499>
+ DB 68,15,40,37,72,72,0,0 ; movaps 0x4848(%rip),%xmm12 # 6410 <_sk_callback_sse41+0x495>
DB 65,15,89,228 ; mulps %xmm12,%xmm4
- DB 68,15,40,45,140,70,0,0 ; movaps 0x468c(%rip),%xmm13 # 6260 <_sk_callback_sse41+0x4a9>
+ DB 68,15,40,45,76,72,0,0 ; movaps 0x484c(%rip),%xmm13 # 6420 <_sk_callback_sse41+0x4a5>
DB 65,15,88,229 ; addps %xmm13,%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 68,15,40,53,141,70,0,0 ; movaps 0x468d(%rip),%xmm14 # 6270 <_sk_callback_sse41+0x4b9>
+ DB 68,15,40,53,77,72,0,0 ; movaps 0x484d(%rip),%xmm14 # 6430 <_sk_callback_sse41+0x4b5>
DB 65,15,88,230 ; addps %xmm14,%xmm4
- DB 68,15,40,61,145,70,0,0 ; movaps 0x4691(%rip),%xmm15 # 6280 <_sk_callback_sse41+0x4c9>
+ DB 68,15,40,61,81,72,0,0 ; movaps 0x4851(%rip),%xmm15 # 6440 <_sk_callback_sse41+0x4c5>
DB 69,15,194,207,1 ; cmpltps %xmm15,%xmm9
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,226 ; blendvps %xmm0,%xmm10,%xmm4
@@ -16305,22 +16525,22 @@ _sk_to_srgb_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
- DB 68,15,40,29,2,70,0,0 ; movaps 0x4602(%rip),%xmm11 # 6290 <_sk_callback_sse41+0x4d9>
+ DB 68,15,40,29,194,71,0,0 ; movaps 0x47c2(%rip),%xmm11 # 6450 <_sk_callback_sse41+0x4d5>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 68,15,40,37,2,70,0,0 ; movaps 0x4602(%rip),%xmm12 # 62a0 <_sk_callback_sse41+0x4e9>
+ DB 68,15,40,37,194,71,0,0 ; movaps 0x47c2(%rip),%xmm12 # 6460 <_sk_callback_sse41+0x4e5>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 69,15,89,252 ; mulps %xmm12,%xmm15
- DB 68,15,40,21,2,70,0,0 ; movaps 0x4602(%rip),%xmm10 # 62b0 <_sk_callback_sse41+0x4f9>
+ DB 68,15,40,21,194,71,0,0 ; movaps 0x47c2(%rip),%xmm10 # 6470 <_sk_callback_sse41+0x4f5>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 68,15,40,45,2,70,0,0 ; movaps 0x4602(%rip),%xmm13 # 62c0 <_sk_callback_sse41+0x509>
+ DB 68,15,40,45,194,71,0,0 ; movaps 0x47c2(%rip),%xmm13 # 6480 <_sk_callback_sse41+0x505>
DB 69,15,88,253 ; addps %xmm13,%xmm15
- DB 68,15,40,53,6,70,0,0 ; movaps 0x4606(%rip),%xmm14 # 62d0 <_sk_callback_sse41+0x519>
+ DB 68,15,40,53,198,71,0,0 ; movaps 0x47c6(%rip),%xmm14 # 6490 <_sk_callback_sse41+0x515>
DB 69,15,88,198 ; addps %xmm14,%xmm8
DB 69,15,83,192 ; rcpps %xmm8,%xmm8
DB 69,15,89,199 ; mulps %xmm15,%xmm8
- DB 68,15,40,61,2,70,0,0 ; movaps 0x4602(%rip),%xmm15 # 62e0 <_sk_callback_sse41+0x529>
+ DB 68,15,40,61,194,71,0,0 ; movaps 0x47c2(%rip),%xmm15 # 64a0 <_sk_callback_sse41+0x525>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9
@@ -16372,7 +16592,7 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 68,15,93,226 ; minps %xmm2,%xmm12
DB 65,15,40,203 ; movaps %xmm11,%xmm1
DB 65,15,92,204 ; subps %xmm12,%xmm1
- DB 68,15,40,53,76,69,0,0 ; movaps 0x454c(%rip),%xmm14 # 62f0 <_sk_callback_sse41+0x539>
+ DB 68,15,40,53,12,71,0,0 ; movaps 0x470c(%rip),%xmm14 # 64b0 <_sk_callback_sse41+0x535>
DB 68,15,94,241 ; divps %xmm1,%xmm14
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10
@@ -16381,27 +16601,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15
- DB 68,15,84,61,51,69,0,0 ; andps 0x4533(%rip),%xmm15 # 6300 <_sk_callback_sse41+0x549>
+ DB 68,15,84,61,243,70,0,0 ; andps 0x46f3(%rip),%xmm15 # 64c0 <_sk_callback_sse41+0x545>
DB 68,15,88,248 ; addps %xmm0,%xmm15
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 68,15,40,45,38,69,0,0 ; movaps 0x4526(%rip),%xmm13 # 6310 <_sk_callback_sse41+0x559>
+ DB 68,15,40,45,230,70,0,0 ; movaps 0x46e6(%rip),%xmm13 # 64d0 <_sk_callback_sse41+0x555>
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,88,5,34,69,0,0 ; addps 0x4522(%rip),%xmm8 # 6320 <_sk_callback_sse41+0x569>
+ DB 68,15,88,5,226,70,0,0 ; addps 0x46e2(%rip),%xmm8 # 64e0 <_sk_callback_sse41+0x565>
DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8
- DB 68,15,89,5,26,69,0,0 ; mulps 0x451a(%rip),%xmm8 # 6330 <_sk_callback_sse41+0x579>
+ DB 68,15,89,5,218,70,0,0 ; mulps 0x46da(%rip),%xmm8 # 64f0 <_sk_callback_sse41+0x575>
DB 69,15,40,203 ; movaps %xmm11,%xmm9
DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9
DB 69,15,84,193 ; andps %xmm9,%xmm8
DB 69,15,92,235 ; subps %xmm11,%xmm13
DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,5,14,69,0,0 ; movaps 0x450e(%rip),%xmm0 # 6340 <_sk_callback_sse41+0x589>
+ DB 15,40,5,206,70,0,0 ; movaps 0x46ce(%rip),%xmm0 # 6500 <_sk_callback_sse41+0x585>
DB 65,15,40,211 ; movaps %xmm11,%xmm2
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
@@ -16422,7 +16642,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp)
DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
DB 68,15,40,208 ; movaps %xmm0,%xmm10
- DB 68,15,40,13,208,68,0,0 ; movaps 0x44d0(%rip),%xmm9 # 6350 <_sk_callback_sse41+0x599>
+ DB 68,15,40,13,144,70,0,0 ; movaps 0x4690(%rip),%xmm9 # 6510 <_sk_callback_sse41+0x595>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
DB 15,40,217 ; movaps %xmm1,%xmm3
@@ -16435,19 +16655,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,20,36 ; movaps %xmm2,(%rsp)
DB 69,15,88,192 ; addps %xmm8,%xmm8
DB 68,15,92,197 ; subps %xmm5,%xmm8
- DB 68,15,40,53,172,68,0,0 ; movaps 0x44ac(%rip),%xmm14 # 6360 <_sk_callback_sse41+0x5a9>
+ DB 68,15,40,53,108,70,0,0 ; movaps 0x466c(%rip),%xmm14 # 6520 <_sk_callback_sse41+0x5a5>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0
DB 68,15,92,240 ; subps %xmm0,%xmm14
- DB 68,15,40,29,165,68,0,0 ; movaps 0x44a5(%rip),%xmm11 # 6370 <_sk_callback_sse41+0x5b9>
+ DB 68,15,40,29,101,70,0,0 ; movaps 0x4665(%rip),%xmm11 # 6530 <_sk_callback_sse41+0x5b5>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 65,15,92,240 ; subps %xmm8,%xmm6
- DB 15,40,61,158,68,0,0 ; movaps 0x449e(%rip),%xmm7 # 6380 <_sk_callback_sse41+0x5c9>
+ DB 15,40,61,94,70,0,0 ; movaps 0x465e(%rip),%xmm7 # 6540 <_sk_callback_sse41+0x5c5>
DB 69,15,40,238 ; movaps %xmm14,%xmm13
DB 68,15,89,239 ; mulps %xmm7,%xmm13
- DB 15,40,29,159,68,0,0 ; movaps 0x449f(%rip),%xmm3 # 6390 <_sk_callback_sse41+0x5d9>
+ DB 15,40,29,95,70,0,0 ; movaps 0x465f(%rip),%xmm3 # 6550 <_sk_callback_sse41+0x5d5>
DB 68,15,40,227 ; movaps %xmm3,%xmm12
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 68,15,89,230 ; mulps %xmm6,%xmm12
@@ -16457,7 +16677,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,40,253 ; movaps %xmm5,%xmm15
DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15
- DB 68,15,40,37,126,68,0,0 ; movaps 0x447e(%rip),%xmm12 # 63a0 <_sk_callback_sse41+0x5e9>
+ DB 68,15,40,37,62,70,0,0 ; movaps 0x463e(%rip),%xmm12 # 6560 <_sk_callback_sse41+0x5e5>
DB 65,15,40,196 ; movaps %xmm12,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,89,238 ; mulps %xmm6,%xmm13
@@ -16491,7 +16711,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,40,198 ; movaps %xmm14,%xmm0
DB 15,40,20,36 ; movaps (%rsp),%xmm2
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,88,21,247,67,0,0 ; addps 0x43f7(%rip),%xmm10 # 63b0 <_sk_callback_sse41+0x5f9>
+ DB 68,15,88,21,183,69,0,0 ; addps 0x45b7(%rip),%xmm10 # 6570 <_sk_callback_sse41+0x5f5>
DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11
@@ -16545,9 +16765,9 @@ _sk_scale_u8_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,52 ; jne 20a4 <_sk_scale_u8_sse41+0x4c>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,64,67,0,0 ; pand 0x4340(%rip),%xmm8 # 63c0 <_sk_callback_sse41+0x609>
+ DB 102,68,15,219,5,0,69,0,0 ; pand 0x4500(%rip),%xmm8 # 6580 <_sk_callback_sse41+0x605>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,68,67,0,0 ; mulps 0x4344(%rip),%xmm8 # 63d0 <_sk_callback_sse41+0x619>
+ DB 68,15,89,5,4,69,0,0 ; mulps 0x4504(%rip),%xmm8 # 6590 <_sk_callback_sse41+0x615>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -16607,9 +16827,9 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,72 ; jne 2193 <_sk_lerp_u8_sse41+0x60>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,133,66,0,0 ; pand 0x4285(%rip),%xmm8 # 63e0 <_sk_callback_sse41+0x629>
+ DB 102,68,15,219,5,69,68,0,0 ; pand 0x4445(%rip),%xmm8 # 65a0 <_sk_callback_sse41+0x625>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,137,66,0,0 ; mulps 0x4289(%rip),%xmm8 # 63f0 <_sk_callback_sse41+0x639>
+ DB 68,15,89,5,73,68,0,0 ; mulps 0x4449(%rip),%xmm8 # 65b0 <_sk_callback_sse41+0x635>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -16657,17 +16877,17 @@ _sk_lerp_565_sse41 LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,152,0,0,0 ; jne 22a4 <_sk_lerp_565_sse41+0xb7>
DB 102,71,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm10
- DB 102,68,15,111,5,228,65,0,0 ; movdqa 0x41e4(%rip),%xmm8 # 6400 <_sk_callback_sse41+0x649>
+ DB 102,68,15,111,5,164,67,0,0 ; movdqa 0x43a4(%rip),%xmm8 # 65c0 <_sk_callback_sse41+0x645>
DB 102,69,15,219,194 ; pand %xmm10,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,227,65,0,0 ; mulps 0x41e3(%rip),%xmm8 # 6410 <_sk_callback_sse41+0x659>
- DB 102,68,15,111,13,234,65,0,0 ; movdqa 0x41ea(%rip),%xmm9 # 6420 <_sk_callback_sse41+0x669>
+ DB 68,15,89,5,163,67,0,0 ; mulps 0x43a3(%rip),%xmm8 # 65d0 <_sk_callback_sse41+0x655>
+ DB 102,68,15,111,13,170,67,0,0 ; movdqa 0x43aa(%rip),%xmm9 # 65e0 <_sk_callback_sse41+0x665>
DB 102,69,15,219,202 ; pand %xmm10,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,233,65,0,0 ; mulps 0x41e9(%rip),%xmm9 # 6430 <_sk_callback_sse41+0x679>
- DB 102,68,15,219,21,240,65,0,0 ; pand 0x41f0(%rip),%xmm10 # 6440 <_sk_callback_sse41+0x689>
+ DB 68,15,89,13,169,67,0,0 ; mulps 0x43a9(%rip),%xmm9 # 65f0 <_sk_callback_sse41+0x675>
+ DB 102,68,15,219,21,176,67,0,0 ; pand 0x43b0(%rip),%xmm10 # 6600 <_sk_callback_sse41+0x685>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,244,65,0,0 ; mulps 0x41f4(%rip),%xmm10 # 6450 <_sk_callback_sse41+0x699>
+ DB 68,15,89,21,180,67,0,0 ; mulps 0x43b4(%rip),%xmm10 # 6610 <_sk_callback_sse41+0x695>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -16719,7 +16939,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,15,111,5,65,65,0,0 ; movdqa 0x4141(%rip),%xmm0 # 6460 <_sk_callback_sse41+0x6a9>
+ DB 102,15,111,5,1,67,0,0 ; movdqa 0x4301(%rip),%xmm0 # 6620 <_sk_callback_sse41+0x6a5>
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -16734,7 +16954,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,66,15,58,33,4,179,32 ; insertps $0x20,(%rbx,%r14,4),%xmm0
DB 102,66,15,58,33,4,11,48 ; insertps $0x30,(%rbx,%r9,1),%xmm0
DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1
- DB 102,15,56,0,13,252,64,0,0 ; pshufb 0x40fc(%rip),%xmm1 # 6470 <_sk_callback_sse41+0x6b9>
+ DB 102,15,56,0,13,188,66,0,0 ; pshufb 0x42bc(%rip),%xmm1 # 6630 <_sk_callback_sse41+0x6b5>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
DB 68,15,182,211 ; movzbl %bl,%r10d
@@ -16749,7 +16969,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
DB 76,139,72,24 ; mov 0x18(%rax),%r9
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
- DB 102,15,56,0,21,184,64,0,0 ; pshufb 0x40b8(%rip),%xmm2 # 6480 <_sk_callback_sse41+0x6c9>
+ DB 102,15,56,0,21,120,66,0,0 ; pshufb 0x4278(%rip),%xmm2 # 6640 <_sk_callback_sse41+0x6c5>
DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx
DB 102,72,15,126,208 ; movq %xmm2,%rax
DB 68,15,182,208 ; movzbl %al,%r10d
@@ -16764,7 +16984,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3
- DB 15,89,29,117,64,0,0 ; mulps 0x4075(%rip),%xmm3 # 6490 <_sk_callback_sse41+0x6d9>
+ DB 15,89,29,53,66,0,0 ; mulps 0x4235(%rip),%xmm3 # 6650 <_sk_callback_sse41+0x6d5>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -16805,7 +17025,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,5,227,63,0,0 ; movdqa 0x3fe3(%rip),%xmm8 # 64a0 <_sk_callback_sse41+0x6e9>
+ DB 102,68,15,111,5,163,65,0,0 ; movdqa 0x41a3(%rip),%xmm8 # 6660 <_sk_callback_sse41+0x6e5>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -16823,7 +17043,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
DB 243,66,15,16,20,11 ; movss (%rbx,%r9,1),%xmm2
DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
- DB 102,15,56,0,13,146,63,0,0 ; pshufb 0x3f92(%rip),%xmm1 # 64b0 <_sk_callback_sse41+0x6f9>
+ DB 102,15,56,0,13,82,65,0,0 ; pshufb 0x4152(%rip),%xmm1 # 6670 <_sk_callback_sse41+0x6f5>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -16859,7 +17079,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,235,216 ; por %xmm8,%xmm3
DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,224,62,0,0 ; mulps 0x3ee0(%rip),%xmm3 # 64c0 <_sk_callback_sse41+0x709>
+ DB 15,89,29,160,64,0,0 ; mulps 0x40a0(%rip),%xmm3 # 6680 <_sk_callback_sse41+0x705>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -16899,7 +17119,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
- DB 102,68,15,111,5,85,62,0,0 ; movdqa 0x3e55(%rip),%xmm8 # 64d0 <_sk_callback_sse41+0x719>
+ DB 102,68,15,111,5,21,64,0,0 ; movdqa 0x4015(%rip),%xmm8 # 6690 <_sk_callback_sse41+0x715>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -16917,7 +17137,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0
DB 243,66,15,16,28,11 ; movss (%rbx,%r9,1),%xmm3
DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0
- DB 102,15,56,0,13,4,62,0,0 ; pshufb 0x3e04(%rip),%xmm1 # 64e0 <_sk_callback_sse41+0x729>
+ DB 102,15,56,0,13,196,63,0,0 ; pshufb 0x3fc4(%rip),%xmm1 # 66a0 <_sk_callback_sse41+0x725>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -16948,7 +17168,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,65,15,16,28,25 ; movss (%r9,%rbx,1),%xmm3
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,111,61,0,0 ; movaps 0x3d6f(%rip),%xmm3 # 64f0 <_sk_callback_sse41+0x739>
+ DB 15,40,29,47,63,0,0 ; movaps 0x3f2f(%rip),%xmm3 # 66b0 <_sk_callback_sse41+0x735>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -16980,7 +17200,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 65,84 ; push %r12
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,7,61,0,0 ; movaps 0x3d07(%rip),%xmm8 # 6500 <_sk_callback_sse41+0x749>
+ DB 68,15,40,5,199,62,0,0 ; movaps 0x3ec7(%rip),%xmm8 # 66c0 <_sk_callback_sse41+0x745>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
@@ -16999,7 +17219,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,184,60,0,0 ; movaps 0x3cb8(%rip),%xmm9 # 6510 <_sk_callback_sse41+0x759>
+ DB 68,15,40,13,120,62,0,0 ; movaps 0x3e78(%rip),%xmm9 # 66d0 <_sk_callback_sse41+0x755>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -17093,7 +17313,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,48,59,0,0 ; movaps 0x3b30(%rip),%xmm9 # 6520 <_sk_callback_sse41+0x769>
+ DB 68,15,40,13,240,60,0,0 ; movaps 0x3cf0(%rip),%xmm9 # 66e0 <_sk_callback_sse41+0x765>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -17270,31 +17490,31 @@ _sk_parametric_r_sse41 LABEL PROC
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8
- DB 68,15,89,5,120,56,0,0 ; mulps 0x3878(%rip),%xmm8 # 6530 <_sk_callback_sse41+0x779>
- DB 68,15,84,21,128,56,0,0 ; andps 0x3880(%rip),%xmm10 # 6540 <_sk_callback_sse41+0x789>
- DB 68,15,86,21,136,56,0,0 ; orps 0x3888(%rip),%xmm10 # 6550 <_sk_callback_sse41+0x799>
- DB 68,15,88,5,144,56,0,0 ; addps 0x3890(%rip),%xmm8 # 6560 <_sk_callback_sse41+0x7a9>
- DB 68,15,40,37,152,56,0,0 ; movaps 0x3898(%rip),%xmm12 # 6570 <_sk_callback_sse41+0x7b9>
+ DB 68,15,89,5,56,58,0,0 ; mulps 0x3a38(%rip),%xmm8 # 66f0 <_sk_callback_sse41+0x775>
+ DB 68,15,84,21,64,58,0,0 ; andps 0x3a40(%rip),%xmm10 # 6700 <_sk_callback_sse41+0x785>
+ DB 68,15,86,21,72,58,0,0 ; orps 0x3a48(%rip),%xmm10 # 6710 <_sk_callback_sse41+0x795>
+ DB 68,15,88,5,80,58,0,0 ; addps 0x3a50(%rip),%xmm8 # 6720 <_sk_callback_sse41+0x7a5>
+ DB 68,15,40,37,88,58,0,0 ; movaps 0x3a58(%rip),%xmm12 # 6730 <_sk_callback_sse41+0x7b5>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
- DB 68,15,88,21,152,56,0,0 ; addps 0x3898(%rip),%xmm10 # 6580 <_sk_callback_sse41+0x7c9>
- DB 68,15,40,37,160,56,0,0 ; movaps 0x38a0(%rip),%xmm12 # 6590 <_sk_callback_sse41+0x7d9>
+ DB 68,15,88,21,88,58,0,0 ; addps 0x3a58(%rip),%xmm10 # 6740 <_sk_callback_sse41+0x7c5>
+ DB 68,15,40,37,96,58,0,0 ; movaps 0x3a60(%rip),%xmm12 # 6750 <_sk_callback_sse41+0x7d5>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
DB 69,15,89,195 ; mulps %xmm11,%xmm8
DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,5,141,56,0,0 ; addps 0x388d(%rip),%xmm8 # 65a0 <_sk_callback_sse41+0x7e9>
- DB 68,15,40,21,149,56,0,0 ; movaps 0x3895(%rip),%xmm10 # 65b0 <_sk_callback_sse41+0x7f9>
+ DB 68,15,88,5,77,58,0,0 ; addps 0x3a4d(%rip),%xmm8 # 6760 <_sk_callback_sse41+0x7e5>
+ DB 68,15,40,21,85,58,0,0 ; movaps 0x3a55(%rip),%xmm10 # 6770 <_sk_callback_sse41+0x7f5>
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 69,15,92,194 ; subps %xmm10,%xmm8
- DB 68,15,40,21,149,56,0,0 ; movaps 0x3895(%rip),%xmm10 # 65c0 <_sk_callback_sse41+0x809>
+ DB 68,15,40,21,85,58,0,0 ; movaps 0x3a55(%rip),%xmm10 # 6780 <_sk_callback_sse41+0x805>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 68,15,40,29,153,56,0,0 ; movaps 0x3899(%rip),%xmm11 # 65d0 <_sk_callback_sse41+0x819>
+ DB 68,15,40,29,89,58,0,0 ; movaps 0x3a59(%rip),%xmm11 # 6790 <_sk_callback_sse41+0x815>
DB 69,15,94,218 ; divps %xmm10,%xmm11
DB 69,15,88,216 ; addps %xmm8,%xmm11
- DB 68,15,89,29,153,56,0,0 ; mulps 0x3899(%rip),%xmm11 # 65e0 <_sk_callback_sse41+0x829>
+ DB 68,15,89,29,89,58,0,0 ; mulps 0x3a59(%rip),%xmm11 # 67a0 <_sk_callback_sse41+0x825>
DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10
DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
@@ -17302,7 +17522,7 @@ _sk_parametric_r_sse41 LABEL PROC
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,128,56,0,0 ; minps 0x3880(%rip),%xmm8 # 65f0 <_sk_callback_sse41+0x839>
+ DB 68,15,93,5,64,58,0,0 ; minps 0x3a40(%rip),%xmm8 # 67b0 <_sk_callback_sse41+0x835>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -17330,31 +17550,31 @@ _sk_parametric_g_sse41 LABEL PROC
DB 68,15,88,217 ; addps %xmm1,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,33,56,0,0 ; mulps 0x3821(%rip),%xmm12 # 6600 <_sk_callback_sse41+0x849>
- DB 68,15,84,29,41,56,0,0 ; andps 0x3829(%rip),%xmm11 # 6610 <_sk_callback_sse41+0x859>
- DB 68,15,86,29,49,56,0,0 ; orps 0x3831(%rip),%xmm11 # 6620 <_sk_callback_sse41+0x869>
- DB 68,15,88,37,57,56,0,0 ; addps 0x3839(%rip),%xmm12 # 6630 <_sk_callback_sse41+0x879>
- DB 15,40,13,66,56,0,0 ; movaps 0x3842(%rip),%xmm1 # 6640 <_sk_callback_sse41+0x889>
+ DB 68,15,89,37,225,57,0,0 ; mulps 0x39e1(%rip),%xmm12 # 67c0 <_sk_callback_sse41+0x845>
+ DB 68,15,84,29,233,57,0,0 ; andps 0x39e9(%rip),%xmm11 # 67d0 <_sk_callback_sse41+0x855>
+ DB 68,15,86,29,241,57,0,0 ; orps 0x39f1(%rip),%xmm11 # 67e0 <_sk_callback_sse41+0x865>
+ DB 68,15,88,37,249,57,0,0 ; addps 0x39f9(%rip),%xmm12 # 67f0 <_sk_callback_sse41+0x875>
+ DB 15,40,13,2,58,0,0 ; movaps 0x3a02(%rip),%xmm1 # 6800 <_sk_callback_sse41+0x885>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,88,29,66,56,0,0 ; addps 0x3842(%rip),%xmm11 # 6650 <_sk_callback_sse41+0x899>
- DB 15,40,13,75,56,0,0 ; movaps 0x384b(%rip),%xmm1 # 6660 <_sk_callback_sse41+0x8a9>
+ DB 68,15,88,29,2,58,0,0 ; addps 0x3a02(%rip),%xmm11 # 6810 <_sk_callback_sse41+0x895>
+ DB 15,40,13,11,58,0,0 ; movaps 0x3a0b(%rip),%xmm1 # 6820 <_sk_callback_sse41+0x8a5>
DB 65,15,94,203 ; divps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,56,56,0,0 ; addps 0x3838(%rip),%xmm12 # 6670 <_sk_callback_sse41+0x8b9>
- DB 15,40,13,65,56,0,0 ; movaps 0x3841(%rip),%xmm1 # 6680 <_sk_callback_sse41+0x8c9>
+ DB 68,15,88,37,248,57,0,0 ; addps 0x39f8(%rip),%xmm12 # 6830 <_sk_callback_sse41+0x8b5>
+ DB 15,40,13,1,58,0,0 ; movaps 0x3a01(%rip),%xmm1 # 6840 <_sk_callback_sse41+0x8c5>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,40,21,65,56,0,0 ; movaps 0x3841(%rip),%xmm10 # 6690 <_sk_callback_sse41+0x8d9>
+ DB 68,15,40,21,1,58,0,0 ; movaps 0x3a01(%rip),%xmm10 # 6850 <_sk_callback_sse41+0x8d5>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,13,70,56,0,0 ; movaps 0x3846(%rip),%xmm1 # 66a0 <_sk_callback_sse41+0x8e9>
+ DB 15,40,13,6,58,0,0 ; movaps 0x3a06(%rip),%xmm1 # 6860 <_sk_callback_sse41+0x8e5>
DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,204 ; addps %xmm12,%xmm1
- DB 15,89,13,71,56,0,0 ; mulps 0x3847(%rip),%xmm1 # 66b0 <_sk_callback_sse41+0x8f9>
+ DB 15,89,13,7,58,0,0 ; mulps 0x3a07(%rip),%xmm1 # 6870 <_sk_callback_sse41+0x8f5>
DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10
DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
@@ -17362,7 +17582,7 @@ _sk_parametric_g_sse41 LABEL PROC
DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,93,13,50,56,0,0 ; minps 0x3832(%rip),%xmm1 # 66c0 <_sk_callback_sse41+0x909>
+ DB 15,93,13,242,57,0,0 ; minps 0x39f2(%rip),%xmm1 # 6880 <_sk_callback_sse41+0x905>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -17390,31 +17610,31 @@ _sk_parametric_b_sse41 LABEL PROC
DB 68,15,88,218 ; addps %xmm2,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,211,55,0,0 ; mulps 0x37d3(%rip),%xmm12 # 66d0 <_sk_callback_sse41+0x919>
- DB 68,15,84,29,219,55,0,0 ; andps 0x37db(%rip),%xmm11 # 66e0 <_sk_callback_sse41+0x929>
- DB 68,15,86,29,227,55,0,0 ; orps 0x37e3(%rip),%xmm11 # 66f0 <_sk_callback_sse41+0x939>
- DB 68,15,88,37,235,55,0,0 ; addps 0x37eb(%rip),%xmm12 # 6700 <_sk_callback_sse41+0x949>
- DB 15,40,21,244,55,0,0 ; movaps 0x37f4(%rip),%xmm2 # 6710 <_sk_callback_sse41+0x959>
+ DB 68,15,89,37,147,57,0,0 ; mulps 0x3993(%rip),%xmm12 # 6890 <_sk_callback_sse41+0x915>
+ DB 68,15,84,29,155,57,0,0 ; andps 0x399b(%rip),%xmm11 # 68a0 <_sk_callback_sse41+0x925>
+ DB 68,15,86,29,163,57,0,0 ; orps 0x39a3(%rip),%xmm11 # 68b0 <_sk_callback_sse41+0x935>
+ DB 68,15,88,37,171,57,0,0 ; addps 0x39ab(%rip),%xmm12 # 68c0 <_sk_callback_sse41+0x945>
+ DB 15,40,21,180,57,0,0 ; movaps 0x39b4(%rip),%xmm2 # 68d0 <_sk_callback_sse41+0x955>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,88,29,244,55,0,0 ; addps 0x37f4(%rip),%xmm11 # 6720 <_sk_callback_sse41+0x969>
- DB 15,40,21,253,55,0,0 ; movaps 0x37fd(%rip),%xmm2 # 6730 <_sk_callback_sse41+0x979>
+ DB 68,15,88,29,180,57,0,0 ; addps 0x39b4(%rip),%xmm11 # 68e0 <_sk_callback_sse41+0x965>
+ DB 15,40,21,189,57,0,0 ; movaps 0x39bd(%rip),%xmm2 # 68f0 <_sk_callback_sse41+0x975>
DB 65,15,94,211 ; divps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,234,55,0,0 ; addps 0x37ea(%rip),%xmm12 # 6740 <_sk_callback_sse41+0x989>
- DB 15,40,21,243,55,0,0 ; movaps 0x37f3(%rip),%xmm2 # 6750 <_sk_callback_sse41+0x999>
+ DB 68,15,88,37,170,57,0,0 ; addps 0x39aa(%rip),%xmm12 # 6900 <_sk_callback_sse41+0x985>
+ DB 15,40,21,179,57,0,0 ; movaps 0x39b3(%rip),%xmm2 # 6910 <_sk_callback_sse41+0x995>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,40,21,243,55,0,0 ; movaps 0x37f3(%rip),%xmm10 # 6760 <_sk_callback_sse41+0x9a9>
+ DB 68,15,40,21,179,57,0,0 ; movaps 0x39b3(%rip),%xmm10 # 6920 <_sk_callback_sse41+0x9a5>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,21,248,55,0,0 ; movaps 0x37f8(%rip),%xmm2 # 6770 <_sk_callback_sse41+0x9b9>
+ DB 15,40,21,184,57,0,0 ; movaps 0x39b8(%rip),%xmm2 # 6930 <_sk_callback_sse41+0x9b5>
DB 65,15,94,210 ; divps %xmm10,%xmm2
DB 65,15,88,212 ; addps %xmm12,%xmm2
- DB 15,89,21,249,55,0,0 ; mulps 0x37f9(%rip),%xmm2 # 6780 <_sk_callback_sse41+0x9c9>
+ DB 15,89,21,185,57,0,0 ; mulps 0x39b9(%rip),%xmm2 # 6940 <_sk_callback_sse41+0x9c5>
DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10
DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
@@ -17422,7 +17642,7 @@ _sk_parametric_b_sse41 LABEL PROC
DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,93,21,228,55,0,0 ; minps 0x37e4(%rip),%xmm2 # 6790 <_sk_callback_sse41+0x9d9>
+ DB 15,93,21,164,57,0,0 ; minps 0x39a4(%rip),%xmm2 # 6950 <_sk_callback_sse41+0x9d5>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -17450,31 +17670,31 @@ _sk_parametric_a_sse41 LABEL PROC
DB 68,15,88,219 ; addps %xmm3,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,133,55,0,0 ; mulps 0x3785(%rip),%xmm12 # 67a0 <_sk_callback_sse41+0x9e9>
- DB 68,15,84,29,141,55,0,0 ; andps 0x378d(%rip),%xmm11 # 67b0 <_sk_callback_sse41+0x9f9>
- DB 68,15,86,29,149,55,0,0 ; orps 0x3795(%rip),%xmm11 # 67c0 <_sk_callback_sse41+0xa09>
- DB 68,15,88,37,157,55,0,0 ; addps 0x379d(%rip),%xmm12 # 67d0 <_sk_callback_sse41+0xa19>
- DB 15,40,29,166,55,0,0 ; movaps 0x37a6(%rip),%xmm3 # 67e0 <_sk_callback_sse41+0xa29>
+ DB 68,15,89,37,69,57,0,0 ; mulps 0x3945(%rip),%xmm12 # 6960 <_sk_callback_sse41+0x9e5>
+ DB 68,15,84,29,77,57,0,0 ; andps 0x394d(%rip),%xmm11 # 6970 <_sk_callback_sse41+0x9f5>
+ DB 68,15,86,29,85,57,0,0 ; orps 0x3955(%rip),%xmm11 # 6980 <_sk_callback_sse41+0xa05>
+ DB 68,15,88,37,93,57,0,0 ; addps 0x395d(%rip),%xmm12 # 6990 <_sk_callback_sse41+0xa15>
+ DB 15,40,29,102,57,0,0 ; movaps 0x3966(%rip),%xmm3 # 69a0 <_sk_callback_sse41+0xa25>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,88,29,166,55,0,0 ; addps 0x37a6(%rip),%xmm11 # 67f0 <_sk_callback_sse41+0xa39>
- DB 15,40,29,175,55,0,0 ; movaps 0x37af(%rip),%xmm3 # 6800 <_sk_callback_sse41+0xa49>
+ DB 68,15,88,29,102,57,0,0 ; addps 0x3966(%rip),%xmm11 # 69b0 <_sk_callback_sse41+0xa35>
+ DB 15,40,29,111,57,0,0 ; movaps 0x396f(%rip),%xmm3 # 69c0 <_sk_callback_sse41+0xa45>
DB 65,15,94,219 ; divps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,156,55,0,0 ; addps 0x379c(%rip),%xmm12 # 6810 <_sk_callback_sse41+0xa59>
- DB 15,40,29,165,55,0,0 ; movaps 0x37a5(%rip),%xmm3 # 6820 <_sk_callback_sse41+0xa69>
+ DB 68,15,88,37,92,57,0,0 ; addps 0x395c(%rip),%xmm12 # 69d0 <_sk_callback_sse41+0xa55>
+ DB 15,40,29,101,57,0,0 ; movaps 0x3965(%rip),%xmm3 # 69e0 <_sk_callback_sse41+0xa65>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,40,21,165,55,0,0 ; movaps 0x37a5(%rip),%xmm10 # 6830 <_sk_callback_sse41+0xa79>
+ DB 68,15,40,21,101,57,0,0 ; movaps 0x3965(%rip),%xmm10 # 69f0 <_sk_callback_sse41+0xa75>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,29,170,55,0,0 ; movaps 0x37aa(%rip),%xmm3 # 6840 <_sk_callback_sse41+0xa89>
+ DB 15,40,29,106,57,0,0 ; movaps 0x396a(%rip),%xmm3 # 6a00 <_sk_callback_sse41+0xa85>
DB 65,15,94,218 ; divps %xmm10,%xmm3
DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 15,89,29,171,55,0,0 ; mulps 0x37ab(%rip),%xmm3 # 6850 <_sk_callback_sse41+0xa99>
+ DB 15,89,29,107,57,0,0 ; mulps 0x396b(%rip),%xmm3 # 6a10 <_sk_callback_sse41+0xa95>
DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10
DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
@@ -17482,37 +17702,147 @@ _sk_parametric_a_sse41 LABEL PROC
DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,93,29,150,55,0,0 ; minps 0x3796(%rip),%xmm3 # 6860 <_sk_callback_sse41+0xaa9>
+ DB 15,93,29,86,57,0,0 ; minps 0x3956(%rip),%xmm3 # 6a20 <_sk_callback_sse41+0xaa5>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_gamma_sse41
+_sk_gamma_sse41 LABEL PROC
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 15,41,124,36,64 ; movaps %xmm7,0x40(%rsp)
+ DB 15,41,116,36,48 ; movaps %xmm6,0x30(%rsp)
+ DB 15,41,108,36,32 ; movaps %xmm5,0x20(%rsp)
+ DB 15,41,100,36,16 ; movaps %xmm4,0x10(%rsp)
+ DB 15,41,28,36 ; movaps %xmm3,(%rsp)
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
+ DB 15,89,5,50,57,0,0 ; mulps 0x3932(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xab5>
+ DB 68,15,40,53,58,57,0,0 ; movaps 0x393a(%rip),%xmm14 # 6a40 <_sk_callback_sse41+0xac5>
+ DB 65,15,84,214 ; andps %xmm14,%xmm2
+ DB 68,15,40,37,62,57,0,0 ; movaps 0x393e(%rip),%xmm12 # 6a50 <_sk_callback_sse41+0xad5>
+ DB 65,15,86,212 ; orps %xmm12,%xmm2
+ DB 68,15,40,21,66,57,0,0 ; movaps 0x3942(%rip),%xmm10 # 6a60 <_sk_callback_sse41+0xae5>
+ DB 65,15,88,194 ; addps %xmm10,%xmm0
+ DB 68,15,40,29,70,57,0,0 ; movaps 0x3946(%rip),%xmm11 # 6a70 <_sk_callback_sse41+0xaf5>
+ DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 65,15,89,227 ; mulps %xmm11,%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 68,15,40,13,68,57,0,0 ; movaps 0x3944(%rip),%xmm9 # 6a80 <_sk_callback_sse41+0xb05>
+ DB 65,15,88,209 ; addps %xmm9,%xmm2
+ DB 68,15,40,45,72,57,0,0 ; movaps 0x3948(%rip),%xmm13 # 6a90 <_sk_callback_sse41+0xb15>
+ DB 65,15,40,229 ; movaps %xmm13,%xmm4
+ DB 15,94,226 ; divps %xmm2,%xmm4
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 243,68,15,16,0 ; movss (%rax),%xmm8
+ DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
+ DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 102,15,58,8,208,1 ; roundps $0x1,%xmm0,%xmm2
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,92,226 ; subps %xmm2,%xmm4
+ DB 15,40,53,43,57,0,0 ; movaps 0x392b(%rip),%xmm6 # 6aa0 <_sk_callback_sse41+0xb25>
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,40,61,65,57,0,0 ; movaps 0x3941(%rip),%xmm7 # 6ac0 <_sk_callback_sse41+0xb45>
+ DB 15,40,239 ; movaps %xmm7,%xmm5
+ DB 15,92,236 ; subps %xmm4,%xmm5
+ DB 15,40,212 ; movaps %xmm4,%xmm2
+ DB 15,40,37,33,57,0,0 ; movaps 0x3921(%rip),%xmm4 # 6ab0 <_sk_callback_sse41+0xb35>
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,92,194 ; subps %xmm2,%xmm0
+ DB 68,15,40,61,51,57,0,0 ; movaps 0x3933(%rip),%xmm15 # 6ad0 <_sk_callback_sse41+0xb55>
+ DB 65,15,40,215 ; movaps %xmm15,%xmm2
+ DB 15,94,213 ; divps %xmm5,%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
+ DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
+ DB 15,89,5,127,56,0,0 ; mulps 0x387f(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xab5>
+ DB 65,15,84,206 ; andps %xmm14,%xmm1
+ DB 65,15,86,204 ; orps %xmm12,%xmm1
+ DB 65,15,88,194 ; addps %xmm10,%xmm0
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 65,15,89,235 ; mulps %xmm11,%xmm5
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 65,15,88,201 ; addps %xmm9,%xmm1
+ DB 69,15,40,241 ; movaps %xmm9,%xmm14
+ DB 65,15,40,237 ; movaps %xmm13,%xmm5
+ DB 15,94,233 ; divps %xmm1,%xmm5
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 102,15,58,8,200,1 ; roundps $0x1,%xmm0,%xmm1
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 68,15,40,206 ; movaps %xmm6,%xmm9
+ DB 15,40,247 ; movaps %xmm7,%xmm6
+ DB 15,92,245 ; subps %xmm5,%xmm6
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 65,15,40,207 ; movaps %xmm15,%xmm1
+ DB 15,94,206 ; divps %xmm6,%xmm1
+ DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
+ DB 15,89,5,32,56,0,0 ; mulps 0x3820(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xab5>
+ DB 15,84,29,41,56,0,0 ; andps 0x3829(%rip),%xmm3 # 6a40 <_sk_callback_sse41+0xac5>
+ DB 65,15,86,220 ; orps %xmm12,%xmm3
+ DB 65,15,88,194 ; addps %xmm10,%xmm0
+ DB 68,15,89,219 ; mulps %xmm3,%xmm11
+ DB 65,15,92,195 ; subps %xmm11,%xmm0
+ DB 65,15,88,222 ; addps %xmm14,%xmm3
+ DB 68,15,94,235 ; divps %xmm3,%xmm13
+ DB 65,15,92,197 ; subps %xmm13,%xmm0
+ DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 102,15,58,8,216,1 ; roundps $0x1,%xmm0,%xmm3
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,92,235 ; subps %xmm3,%xmm5
+ DB 65,15,88,193 ; addps %xmm9,%xmm0
+ DB 15,89,229 ; mulps %xmm5,%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,92,253 ; subps %xmm5,%xmm7
+ DB 68,15,94,255 ; divps %xmm7,%xmm15
+ DB 68,15,88,248 ; addps %xmm0,%xmm15
+ DB 15,40,5,129,56,0,0 ; movaps 0x3881(%rip),%xmm0 # 6ae0 <_sk_callback_sse41+0xb65>
+ DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 68,15,89,248 ; mulps %xmm0,%xmm15
+ DB 102,15,91,194 ; cvtps2dq %xmm2,%xmm0
+ DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
+ DB 102,65,15,91,215 ; cvtps2dq %xmm15,%xmm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 15,40,28,36 ; movaps (%rsp),%xmm3
+ DB 15,40,100,36,16 ; movaps 0x10(%rsp),%xmm4
+ DB 15,40,108,36,32 ; movaps 0x20(%rsp),%xmm5
+ DB 15,40,116,36,48 ; movaps 0x30(%rsp),%xmm6
+ DB 15,40,124,36,64 ; movaps 0x40(%rsp),%xmm7
+ DB 72,131,196,88 ; add $0x58,%rsp
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_lab_to_xyz_sse41
_sk_lab_to_xyz_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,89,5,146,55,0,0 ; mulps 0x3792(%rip),%xmm8 # 6870 <_sk_callback_sse41+0xab9>
- DB 68,15,40,13,154,55,0,0 ; movaps 0x379a(%rip),%xmm9 # 6880 <_sk_callback_sse41+0xac9>
+ DB 68,15,89,5,78,56,0,0 ; mulps 0x384e(%rip),%xmm8 # 6af0 <_sk_callback_sse41+0xb75>
+ DB 68,15,40,13,86,56,0,0 ; movaps 0x3856(%rip),%xmm9 # 6b00 <_sk_callback_sse41+0xb85>
DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,40,5,159,55,0,0 ; movaps 0x379f(%rip),%xmm0 # 6890 <_sk_callback_sse41+0xad9>
+ DB 15,40,5,91,56,0,0 ; movaps 0x385b(%rip),%xmm0 # 6b10 <_sk_callback_sse41+0xb95>
DB 15,88,200 ; addps %xmm0,%xmm1
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,88,5,157,55,0,0 ; addps 0x379d(%rip),%xmm8 # 68a0 <_sk_callback_sse41+0xae9>
- DB 68,15,89,5,165,55,0,0 ; mulps 0x37a5(%rip),%xmm8 # 68b0 <_sk_callback_sse41+0xaf9>
- DB 15,89,13,174,55,0,0 ; mulps 0x37ae(%rip),%xmm1 # 68c0 <_sk_callback_sse41+0xb09>
+ DB 68,15,88,5,89,56,0,0 ; addps 0x3859(%rip),%xmm8 # 6b20 <_sk_callback_sse41+0xba5>
+ DB 68,15,89,5,97,56,0,0 ; mulps 0x3861(%rip),%xmm8 # 6b30 <_sk_callback_sse41+0xbb5>
+ DB 15,89,13,106,56,0,0 ; mulps 0x386a(%rip),%xmm1 # 6b40 <_sk_callback_sse41+0xbc5>
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 15,89,21,179,55,0,0 ; mulps 0x37b3(%rip),%xmm2 # 68d0 <_sk_callback_sse41+0xb19>
+ DB 15,89,21,111,56,0,0 ; mulps 0x386f(%rip),%xmm2 # 6b50 <_sk_callback_sse41+0xbd5>
DB 69,15,40,208 ; movaps %xmm8,%xmm10
DB 68,15,92,210 ; subps %xmm2,%xmm10
DB 68,15,40,217 ; movaps %xmm1,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
- DB 68,15,40,13,167,55,0,0 ; movaps 0x37a7(%rip),%xmm9 # 68e0 <_sk_callback_sse41+0xb29>
+ DB 68,15,40,13,99,56,0,0 ; movaps 0x3863(%rip),%xmm9 # 6b60 <_sk_callback_sse41+0xbe5>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 15,40,21,167,55,0,0 ; movaps 0x37a7(%rip),%xmm2 # 68f0 <_sk_callback_sse41+0xb39>
+ DB 15,40,21,99,56,0,0 ; movaps 0x3863(%rip),%xmm2 # 6b70 <_sk_callback_sse41+0xbf5>
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 68,15,40,37,172,55,0,0 ; movaps 0x37ac(%rip),%xmm12 # 6900 <_sk_callback_sse41+0xb49>
+ DB 68,15,40,37,104,56,0,0 ; movaps 0x3868(%rip),%xmm12 # 6b80 <_sk_callback_sse41+0xc05>
DB 65,15,89,204 ; mulps %xmm12,%xmm1
DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
DB 69,15,40,216 ; movaps %xmm8,%xmm11
@@ -17531,8 +17861,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC
DB 65,15,89,212 ; mulps %xmm12,%xmm2
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2
- DB 15,89,13,101,55,0,0 ; mulps 0x3765(%rip),%xmm1 # 6910 <_sk_callback_sse41+0xb59>
- DB 15,89,21,110,55,0,0 ; mulps 0x376e(%rip),%xmm2 # 6920 <_sk_callback_sse41+0xb69>
+ DB 15,89,13,33,56,0,0 ; mulps 0x3821(%rip),%xmm1 # 6b90 <_sk_callback_sse41+0xc15>
+ DB 15,89,21,42,56,0,0 ; mulps 0x382a(%rip),%xmm2 # 6ba0 <_sk_callback_sse41+0xc25>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,40,200 ; movaps %xmm8,%xmm1
@@ -17547,11 +17877,11 @@ _sk_load_a8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,39 ; jne 31fc <_sk_load_a8_sse41+0x3f>
+ DB 117,39 ; jne 33c0 <_sk_load_a8_sse41+0x3f>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,76,55,0,0 ; pand 0x374c(%rip),%xmm0 # 6930 <_sk_callback_sse41+0xb79>
+ DB 102,15,219,5,8,56,0,0 ; pand 0x3808(%rip),%xmm0 # 6bb0 <_sk_callback_sse41+0xc35>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,82,55,0,0 ; mulps 0x3752(%rip),%xmm3 # 6940 <_sk_callback_sse41+0xb89>
+ DB 15,89,29,14,56,0,0 ; mulps 0x380e(%rip),%xmm3 # 6bc0 <_sk_callback_sse41+0xc45>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -17560,12 +17890,12 @@ _sk_load_a8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 323e <_sk_load_a8_sse41+0x81>
+ DB 116,53 ; je 3402 <_sk_load_a8_sse41+0x81>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 3228 <_sk_load_a8_sse41+0x6b>
+ DB 116,21 ; je 33ec <_sk_load_a8_sse41+0x6b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 31dc <_sk_load_a8_sse41+0x1f>
+ DB 117,195 ; jne 33a0 <_sk_load_a8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -17573,10 +17903,10 @@ _sk_load_a8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,158 ; jmp 31dc <_sk_load_a8_sse41+0x1f>
+ DB 235,158 ; jmp 33a0 <_sk_load_a8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,147 ; jmp 31dc <_sk_load_a8_sse41+0x1f>
+ DB 235,147 ; jmp 33a0 <_sk_load_a8_sse41+0x1f>
PUBLIC _sk_load_a8_dst_sse41
_sk_load_a8_dst_sse41 LABEL PROC
@@ -17587,11 +17917,11 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,39 ; jne 3288 <_sk_load_a8_dst_sse41+0x3f>
+ DB 117,39 ; jne 344c <_sk_load_a8_dst_sse41+0x3f>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,224,54,0,0 ; pand 0x36e0(%rip),%xmm4 # 6950 <_sk_callback_sse41+0xb99>
+ DB 102,15,219,37,156,55,0,0 ; pand 0x379c(%rip),%xmm4 # 6bd0 <_sk_callback_sse41+0xc55>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,230,54,0,0 ; mulps 0x36e6(%rip),%xmm7 # 6960 <_sk_callback_sse41+0xba9>
+ DB 15,89,61,162,55,0,0 ; mulps 0x37a2(%rip),%xmm7 # 6be0 <_sk_callback_sse41+0xc65>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
@@ -17600,12 +17930,12 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 32ca <_sk_load_a8_dst_sse41+0x81>
+ DB 116,53 ; je 348e <_sk_load_a8_dst_sse41+0x81>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 32b4 <_sk_load_a8_dst_sse41+0x6b>
+ DB 116,21 ; je 3478 <_sk_load_a8_dst_sse41+0x6b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 3268 <_sk_load_a8_dst_sse41+0x1f>
+ DB 117,195 ; jne 342c <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -17613,10 +17943,10 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,158 ; jmp 3268 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,158 ; jmp 342c <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,147 ; jmp 3268 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,147 ; jmp 342c <_sk_load_a8_dst_sse41+0x1f>
PUBLIC _sk_gather_a8_sse41
_sk_gather_a8_sse41 LABEL PROC
@@ -17643,7 +17973,7 @@ _sk_gather_a8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,43,54,0,0 ; mulps 0x362b(%rip),%xmm3 # 6970 <_sk_callback_sse41+0xbb9>
+ DB 15,89,29,231,54,0,0 ; mulps 0x36e7(%rip),%xmm3 # 6bf0 <_sk_callback_sse41+0xc75>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -17660,13 +17990,13 @@ _sk_store_a8_sse41 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,12,54,0,0 ; movaps 0x360c(%rip),%xmm8 # 6980 <_sk_callback_sse41+0xbc9>
+ DB 68,15,40,5,200,54,0,0 ; movaps 0x36c8(%rip),%xmm8 # 6c00 <_sk_callback_sse41+0xc85>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 339e <_sk_store_a8_sse41+0x49>
+ DB 117,17 ; jne 3562 <_sk_store_a8_sse41+0x49>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,25 ; mov %eax,(%r9,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -17676,17 +18006,17 @@ _sk_store_a8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 33da <_sk_store_a8_sse41+0x85>
+ DB 116,41 ; je 359e <_sk_store_a8_sse41+0x85>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 33c6 <_sk_store_a8_sse41+0x71>
+ DB 116,15 ; je 358a <_sk_store_a8_sse41+0x71>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,217 ; jne 3396 <_sk_store_a8_sse41+0x41>
+ DB 117,217 ; jne 355a <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,68,25,2,8 ; pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- DB 102,68,15,56,0,5,192,53,0,0 ; pshufb 0x35c0(%rip),%xmm8 # 6990 <_sk_callback_sse41+0xbd9>
+ DB 102,68,15,56,0,5,124,54,0,0 ; pshufb 0x367c(%rip),%xmm8 # 6c10 <_sk_callback_sse41+0xc95>
DB 102,71,15,58,21,4,25,0 ; pextrw $0x0,%xmm8,(%r9,%r11,1)
- DB 235,188 ; jmp 3396 <_sk_store_a8_sse41+0x41>
+ DB 235,188 ; jmp 355a <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,4,25,0 ; pextrb $0x0,%xmm8,(%r9,%r11,1)
- DB 235,178 ; jmp 3396 <_sk_store_a8_sse41+0x41>
+ DB 235,178 ; jmp 355a <_sk_store_a8_sse41+0x41>
PUBLIC _sk_load_g8_sse41
_sk_load_g8_sse41 LABEL PROC
@@ -17697,25 +18027,25 @@ _sk_load_g8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 3426 <_sk_load_g8_sse41+0x42>
+ DB 117,42 ; jne 35ea <_sk_load_g8_sse41+0x42>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,149,53,0,0 ; pand 0x3595(%rip),%xmm0 # 69a0 <_sk_callback_sse41+0xbe9>
+ DB 102,15,219,5,81,54,0,0 ; pand 0x3651(%rip),%xmm0 # 6c20 <_sk_callback_sse41+0xca5>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,155,53,0,0 ; mulps 0x359b(%rip),%xmm0 # 69b0 <_sk_callback_sse41+0xbf9>
+ DB 15,89,5,87,54,0,0 ; mulps 0x3657(%rip),%xmm0 # 6c30 <_sk_callback_sse41+0xcb5>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,162,53,0,0 ; movaps 0x35a2(%rip),%xmm3 # 69c0 <_sk_callback_sse41+0xc09>
+ DB 15,40,29,94,54,0,0 ; movaps 0x365e(%rip),%xmm3 # 6c40 <_sk_callback_sse41+0xcc5>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 3468 <_sk_load_g8_sse41+0x84>
+ DB 116,53 ; je 362c <_sk_load_g8_sse41+0x84>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 3452 <_sk_load_g8_sse41+0x6e>
+ DB 116,21 ; je 3616 <_sk_load_g8_sse41+0x6e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 3403 <_sk_load_g8_sse41+0x1f>
+ DB 117,192 ; jne 35c7 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -17723,10 +18053,10 @@ _sk_load_g8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,155 ; jmp 3403 <_sk_load_g8_sse41+0x1f>
+ DB 235,155 ; jmp 35c7 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,144 ; jmp 3403 <_sk_load_g8_sse41+0x1f>
+ DB 235,144 ; jmp 35c7 <_sk_load_g8_sse41+0x1f>
PUBLIC _sk_load_g8_dst_sse41
_sk_load_g8_dst_sse41 LABEL PROC
@@ -17737,25 +18067,25 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 34b5 <_sk_load_g8_dst_sse41+0x42>
+ DB 117,42 ; jne 3679 <_sk_load_g8_dst_sse41+0x42>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,54,53,0,0 ; pand 0x3536(%rip),%xmm4 # 69d0 <_sk_callback_sse41+0xc19>
+ DB 102,15,219,37,242,53,0,0 ; pand 0x35f2(%rip),%xmm4 # 6c50 <_sk_callback_sse41+0xcd5>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,60,53,0,0 ; mulps 0x353c(%rip),%xmm4 # 69e0 <_sk_callback_sse41+0xc29>
+ DB 15,89,37,248,53,0,0 ; mulps 0x35f8(%rip),%xmm4 # 6c60 <_sk_callback_sse41+0xce5>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,67,53,0,0 ; movaps 0x3543(%rip),%xmm7 # 69f0 <_sk_callback_sse41+0xc39>
+ DB 15,40,61,255,53,0,0 ; movaps 0x35ff(%rip),%xmm7 # 6c70 <_sk_callback_sse41+0xcf5>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 34f7 <_sk_load_g8_dst_sse41+0x84>
+ DB 116,53 ; je 36bb <_sk_load_g8_dst_sse41+0x84>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 34e1 <_sk_load_g8_dst_sse41+0x6e>
+ DB 116,21 ; je 36a5 <_sk_load_g8_dst_sse41+0x6e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 3492 <_sk_load_g8_dst_sse41+0x1f>
+ DB 117,192 ; jne 3656 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -17763,10 +18093,10 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,155 ; jmp 3492 <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,155 ; jmp 3656 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,144 ; jmp 3492 <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,144 ; jmp 3656 <_sk_load_g8_dst_sse41+0x1f>
PUBLIC _sk_gather_g8_sse41
_sk_gather_g8_sse41 LABEL PROC
@@ -17793,9 +18123,9 @@ _sk_gather_g8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,142,52,0,0 ; mulps 0x348e(%rip),%xmm0 # 6a00 <_sk_callback_sse41+0xc49>
+ DB 15,89,5,74,53,0,0 ; mulps 0x354a(%rip),%xmm0 # 6c80 <_sk_callback_sse41+0xd05>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,149,52,0,0 ; movaps 0x3495(%rip),%xmm3 # 6a10 <_sk_callback_sse41+0xc59>
+ DB 15,40,29,81,53,0,0 ; movaps 0x3551(%rip),%xmm3 # 6c90 <_sk_callback_sse41+0xd15>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -17811,41 +18141,41 @@ _sk_load_565_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,80 ; jne 35ef <_sk_load_565_sse41+0x6b>
+ DB 117,80 ; jne 37b3 <_sk_load_565_sse41+0x6b>
DB 102,67,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm2
- DB 102,15,111,5,114,52,0,0 ; movdqa 0x3472(%rip),%xmm0 # 6a20 <_sk_callback_sse41+0xc69>
+ DB 102,15,111,5,46,53,0,0 ; movdqa 0x352e(%rip),%xmm0 # 6ca0 <_sk_callback_sse41+0xd25>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,116,52,0,0 ; mulps 0x3474(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xc79>
- DB 102,15,111,13,124,52,0,0 ; movdqa 0x347c(%rip),%xmm1 # 6a40 <_sk_callback_sse41+0xc89>
+ DB 15,89,5,48,53,0,0 ; mulps 0x3530(%rip),%xmm0 # 6cb0 <_sk_callback_sse41+0xd35>
+ DB 102,15,111,13,56,53,0,0 ; movdqa 0x3538(%rip),%xmm1 # 6cc0 <_sk_callback_sse41+0xd45>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,126,52,0,0 ; mulps 0x347e(%rip),%xmm1 # 6a50 <_sk_callback_sse41+0xc99>
- DB 102,15,219,21,134,52,0,0 ; pand 0x3486(%rip),%xmm2 # 6a60 <_sk_callback_sse41+0xca9>
+ DB 15,89,13,58,53,0,0 ; mulps 0x353a(%rip),%xmm1 # 6cd0 <_sk_callback_sse41+0xd55>
+ DB 102,15,219,21,66,53,0,0 ; pand 0x3542(%rip),%xmm2 # 6ce0 <_sk_callback_sse41+0xd65>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,140,52,0,0 ; mulps 0x348c(%rip),%xmm2 # 6a70 <_sk_callback_sse41+0xcb9>
+ DB 15,89,21,72,53,0,0 ; mulps 0x3548(%rip),%xmm2 # 6cf0 <_sk_callback_sse41+0xd75>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,147,52,0,0 ; movaps 0x3493(%rip),%xmm3 # 6a80 <_sk_callback_sse41+0xcc9>
+ DB 15,40,29,79,53,0,0 ; movaps 0x354f(%rip),%xmm3 # 6d00 <_sk_callback_sse41+0xd85>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 3631 <_sk_load_565_sse41+0xad>
+ DB 116,53 ; je 37f5 <_sk_load_565_sse41+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 361b <_sk_load_565_sse41+0x97>
+ DB 116,21 ; je 37df <_sk_load_565_sse41+0x97>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 35a6 <_sk_load_565_sse41+0x22>
+ DB 117,154 ; jne 376a <_sk_load_565_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm2
- DB 233,117,255,255,255 ; jmpq 35a6 <_sk_load_565_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 376a <_sk_load_565_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,103,255,255,255 ; jmpq 35a6 <_sk_load_565_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 376a <_sk_load_565_sse41+0x22>
PUBLIC _sk_load_565_dst_sse41
_sk_load_565_dst_sse41 LABEL PROC
@@ -17857,41 +18187,41 @@ _sk_load_565_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,80 ; jne 36aa <_sk_load_565_dst_sse41+0x6b>
+ DB 117,80 ; jne 386e <_sk_load_565_dst_sse41+0x6b>
DB 102,67,15,56,51,52,89 ; pmovzxwd (%r9,%r11,2),%xmm6
- DB 102,15,111,37,39,52,0,0 ; movdqa 0x3427(%rip),%xmm4 # 6a90 <_sk_callback_sse41+0xcd9>
+ DB 102,15,111,37,227,52,0,0 ; movdqa 0x34e3(%rip),%xmm4 # 6d10 <_sk_callback_sse41+0xd95>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,41,52,0,0 ; mulps 0x3429(%rip),%xmm4 # 6aa0 <_sk_callback_sse41+0xce9>
- DB 102,15,111,45,49,52,0,0 ; movdqa 0x3431(%rip),%xmm5 # 6ab0 <_sk_callback_sse41+0xcf9>
+ DB 15,89,37,229,52,0,0 ; mulps 0x34e5(%rip),%xmm4 # 6d20 <_sk_callback_sse41+0xda5>
+ DB 102,15,111,45,237,52,0,0 ; movdqa 0x34ed(%rip),%xmm5 # 6d30 <_sk_callback_sse41+0xdb5>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,51,52,0,0 ; mulps 0x3433(%rip),%xmm5 # 6ac0 <_sk_callback_sse41+0xd09>
- DB 102,15,219,53,59,52,0,0 ; pand 0x343b(%rip),%xmm6 # 6ad0 <_sk_callback_sse41+0xd19>
+ DB 15,89,45,239,52,0,0 ; mulps 0x34ef(%rip),%xmm5 # 6d40 <_sk_callback_sse41+0xdc5>
+ DB 102,15,219,53,247,52,0,0 ; pand 0x34f7(%rip),%xmm6 # 6d50 <_sk_callback_sse41+0xdd5>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,65,52,0,0 ; mulps 0x3441(%rip),%xmm6 # 6ae0 <_sk_callback_sse41+0xd29>
+ DB 15,89,53,253,52,0,0 ; mulps 0x34fd(%rip),%xmm6 # 6d60 <_sk_callback_sse41+0xde5>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,72,52,0,0 ; movaps 0x3448(%rip),%xmm7 # 6af0 <_sk_callback_sse41+0xd39>
+ DB 15,40,61,4,53,0,0 ; movaps 0x3504(%rip),%xmm7 # 6d70 <_sk_callback_sse41+0xdf5>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 36ec <_sk_load_565_dst_sse41+0xad>
+ DB 116,53 ; je 38b0 <_sk_load_565_dst_sse41+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 36d6 <_sk_load_565_dst_sse41+0x97>
+ DB 116,21 ; je 389a <_sk_load_565_dst_sse41+0x97>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 3661 <_sk_load_565_dst_sse41+0x22>
+ DB 117,154 ; jne 3825 <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,117,255,255,255 ; jmpq 3661 <_sk_load_565_dst_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 3825 <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,103,255,255,255 ; jmpq 3661 <_sk_load_565_dst_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 3825 <_sk_load_565_dst_sse41+0x22>
PUBLIC _sk_gather_565_sse41
_sk_gather_565_sse41 LABEL PROC
@@ -17917,19 +18247,19 @@ _sk_gather_565_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2
- DB 102,15,111,5,156,51,0,0 ; movdqa 0x339c(%rip),%xmm0 # 6b00 <_sk_callback_sse41+0xd49>
+ DB 102,15,111,5,88,52,0,0 ; movdqa 0x3458(%rip),%xmm0 # 6d80 <_sk_callback_sse41+0xe05>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,158,51,0,0 ; mulps 0x339e(%rip),%xmm0 # 6b10 <_sk_callback_sse41+0xd59>
- DB 102,15,111,13,166,51,0,0 ; movdqa 0x33a6(%rip),%xmm1 # 6b20 <_sk_callback_sse41+0xd69>
+ DB 15,89,5,90,52,0,0 ; mulps 0x345a(%rip),%xmm0 # 6d90 <_sk_callback_sse41+0xe15>
+ DB 102,15,111,13,98,52,0,0 ; movdqa 0x3462(%rip),%xmm1 # 6da0 <_sk_callback_sse41+0xe25>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,168,51,0,0 ; mulps 0x33a8(%rip),%xmm1 # 6b30 <_sk_callback_sse41+0xd79>
- DB 102,15,219,21,176,51,0,0 ; pand 0x33b0(%rip),%xmm2 # 6b40 <_sk_callback_sse41+0xd89>
+ DB 15,89,13,100,52,0,0 ; mulps 0x3464(%rip),%xmm1 # 6db0 <_sk_callback_sse41+0xe35>
+ DB 102,15,219,21,108,52,0,0 ; pand 0x346c(%rip),%xmm2 # 6dc0 <_sk_callback_sse41+0xe45>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,182,51,0,0 ; mulps 0x33b6(%rip),%xmm2 # 6b50 <_sk_callback_sse41+0xd99>
+ DB 15,89,21,114,52,0,0 ; mulps 0x3472(%rip),%xmm2 # 6dd0 <_sk_callback_sse41+0xe55>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,189,51,0,0 ; movaps 0x33bd(%rip),%xmm3 # 6b60 <_sk_callback_sse41+0xda9>
+ DB 15,40,29,121,52,0,0 ; movaps 0x3479(%rip),%xmm3 # 6de0 <_sk_callback_sse41+0xe65>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -17942,12 +18272,12 @@ _sk_store_565_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,172,51,0,0 ; movaps 0x33ac(%rip),%xmm8 # 6b70 <_sk_callback_sse41+0xdb9>
+ DB 68,15,40,5,104,52,0,0 ; movaps 0x3468(%rip),%xmm8 # 6df0 <_sk_callback_sse41+0xe75>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,161,51,0,0 ; movaps 0x33a1(%rip),%xmm10 # 6b80 <_sk_callback_sse41+0xdc9>
+ DB 68,15,40,21,93,52,0,0 ; movaps 0x345d(%rip),%xmm10 # 6e00 <_sk_callback_sse41+0xe85>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -17957,7 +18287,7 @@ _sk_store_565_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3816 <_sk_store_565_sse41+0x70>
+ DB 117,10 ; jne 39da <_sk_store_565_sse41+0x70>
DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -17965,17 +18295,17 @@ _sk_store_565_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,35 ; je 384c <_sk_store_565_sse41+0xa6>
+ DB 116,35 ; je 3a10 <_sk_store_565_sse41+0xa6>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 383e <_sk_store_565_sse41+0x98>
+ DB 116,15 ; je 3a02 <_sk_store_565_sse41+0x98>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,221 ; jne 3812 <_sk_store_565_sse41+0x6c>
+ DB 117,221 ; jne 39d6 <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2)
- DB 235,198 ; jmp 3812 <_sk_store_565_sse41+0x6c>
+ DB 235,198 ; jmp 39d6 <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2)
- DB 235,188 ; jmp 3812 <_sk_store_565_sse41+0x6c>
+ DB 235,188 ; jmp 39d6 <_sk_store_565_sse41+0x6c>
PUBLIC _sk_load_4444_sse41
_sk_load_4444_sse41 LABEL PROC
@@ -17987,44 +18317,44 @@ _sk_load_4444_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,95 ; jne 38d0 <_sk_load_4444_sse41+0x7a>
+ DB 117,95 ; jne 3a94 <_sk_load_4444_sse41+0x7a>
DB 102,67,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm3
- DB 102,15,111,5,16,51,0,0 ; movdqa 0x3310(%rip),%xmm0 # 6b90 <_sk_callback_sse41+0xdd9>
+ DB 102,15,111,5,204,51,0,0 ; movdqa 0x33cc(%rip),%xmm0 # 6e10 <_sk_callback_sse41+0xe95>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,18,51,0,0 ; mulps 0x3312(%rip),%xmm0 # 6ba0 <_sk_callback_sse41+0xde9>
- DB 102,15,111,13,26,51,0,0 ; movdqa 0x331a(%rip),%xmm1 # 6bb0 <_sk_callback_sse41+0xdf9>
+ DB 15,89,5,206,51,0,0 ; mulps 0x33ce(%rip),%xmm0 # 6e20 <_sk_callback_sse41+0xea5>
+ DB 102,15,111,13,214,51,0,0 ; movdqa 0x33d6(%rip),%xmm1 # 6e30 <_sk_callback_sse41+0xeb5>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,28,51,0,0 ; mulps 0x331c(%rip),%xmm1 # 6bc0 <_sk_callback_sse41+0xe09>
- DB 102,15,111,21,36,51,0,0 ; movdqa 0x3324(%rip),%xmm2 # 6bd0 <_sk_callback_sse41+0xe19>
+ DB 15,89,13,216,51,0,0 ; mulps 0x33d8(%rip),%xmm1 # 6e40 <_sk_callback_sse41+0xec5>
+ DB 102,15,111,21,224,51,0,0 ; movdqa 0x33e0(%rip),%xmm2 # 6e50 <_sk_callback_sse41+0xed5>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,38,51,0,0 ; mulps 0x3326(%rip),%xmm2 # 6be0 <_sk_callback_sse41+0xe29>
- DB 102,15,219,29,46,51,0,0 ; pand 0x332e(%rip),%xmm3 # 6bf0 <_sk_callback_sse41+0xe39>
+ DB 15,89,21,226,51,0,0 ; mulps 0x33e2(%rip),%xmm2 # 6e60 <_sk_callback_sse41+0xee5>
+ DB 102,15,219,29,234,51,0,0 ; pand 0x33ea(%rip),%xmm3 # 6e70 <_sk_callback_sse41+0xef5>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,52,51,0,0 ; mulps 0x3334(%rip),%xmm3 # 6c00 <_sk_callback_sse41+0xe49>
+ DB 15,89,29,240,51,0,0 ; mulps 0x33f0(%rip),%xmm3 # 6e80 <_sk_callback_sse41+0xf05>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 3912 <_sk_load_4444_sse41+0xbc>
+ DB 116,53 ; je 3ad6 <_sk_load_4444_sse41+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 38fc <_sk_load_4444_sse41+0xa6>
+ DB 116,21 ; je 3ac0 <_sk_load_4444_sse41+0xa6>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 3878 <_sk_load_4444_sse41+0x22>
+ DB 117,139 ; jne 3a3c <_sk_load_4444_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,102,255,255,255 ; jmpq 3878 <_sk_load_4444_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 3a3c <_sk_load_4444_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,88,255,255,255 ; jmpq 3878 <_sk_load_4444_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 3a3c <_sk_load_4444_sse41+0x22>
PUBLIC _sk_load_4444_dst_sse41
_sk_load_4444_dst_sse41 LABEL PROC
@@ -18036,44 +18366,44 @@ _sk_load_4444_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,95 ; jne 399a <_sk_load_4444_dst_sse41+0x7a>
+ DB 117,95 ; jne 3b5e <_sk_load_4444_dst_sse41+0x7a>
DB 102,67,15,56,51,60,89 ; pmovzxwd (%r9,%r11,2),%xmm7
- DB 102,15,111,37,198,50,0,0 ; movdqa 0x32c6(%rip),%xmm4 # 6c10 <_sk_callback_sse41+0xe59>
+ DB 102,15,111,37,130,51,0,0 ; movdqa 0x3382(%rip),%xmm4 # 6e90 <_sk_callback_sse41+0xf15>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,200,50,0,0 ; mulps 0x32c8(%rip),%xmm4 # 6c20 <_sk_callback_sse41+0xe69>
- DB 102,15,111,45,208,50,0,0 ; movdqa 0x32d0(%rip),%xmm5 # 6c30 <_sk_callback_sse41+0xe79>
+ DB 15,89,37,132,51,0,0 ; mulps 0x3384(%rip),%xmm4 # 6ea0 <_sk_callback_sse41+0xf25>
+ DB 102,15,111,45,140,51,0,0 ; movdqa 0x338c(%rip),%xmm5 # 6eb0 <_sk_callback_sse41+0xf35>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,210,50,0,0 ; mulps 0x32d2(%rip),%xmm5 # 6c40 <_sk_callback_sse41+0xe89>
- DB 102,15,111,53,218,50,0,0 ; movdqa 0x32da(%rip),%xmm6 # 6c50 <_sk_callback_sse41+0xe99>
+ DB 15,89,45,142,51,0,0 ; mulps 0x338e(%rip),%xmm5 # 6ec0 <_sk_callback_sse41+0xf45>
+ DB 102,15,111,53,150,51,0,0 ; movdqa 0x3396(%rip),%xmm6 # 6ed0 <_sk_callback_sse41+0xf55>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,220,50,0,0 ; mulps 0x32dc(%rip),%xmm6 # 6c60 <_sk_callback_sse41+0xea9>
- DB 102,15,219,61,228,50,0,0 ; pand 0x32e4(%rip),%xmm7 # 6c70 <_sk_callback_sse41+0xeb9>
+ DB 15,89,53,152,51,0,0 ; mulps 0x3398(%rip),%xmm6 # 6ee0 <_sk_callback_sse41+0xf65>
+ DB 102,15,219,61,160,51,0,0 ; pand 0x33a0(%rip),%xmm7 # 6ef0 <_sk_callback_sse41+0xf75>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,234,50,0,0 ; mulps 0x32ea(%rip),%xmm7 # 6c80 <_sk_callback_sse41+0xec9>
+ DB 15,89,61,166,51,0,0 ; mulps 0x33a6(%rip),%xmm7 # 6f00 <_sk_callback_sse41+0xf85>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 39dc <_sk_load_4444_dst_sse41+0xbc>
+ DB 116,53 ; je 3ba0 <_sk_load_4444_dst_sse41+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 39c6 <_sk_load_4444_dst_sse41+0xa6>
+ DB 116,21 ; je 3b8a <_sk_load_4444_dst_sse41+0xa6>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 3942 <_sk_load_4444_dst_sse41+0x22>
+ DB 117,139 ; jne 3b06 <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,102,255,255,255 ; jmpq 3942 <_sk_load_4444_dst_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 3b06 <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,88,255,255,255 ; jmpq 3942 <_sk_load_4444_dst_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 3b06 <_sk_load_4444_dst_sse41+0x22>
PUBLIC _sk_gather_4444_sse41
_sk_gather_4444_sse41 LABEL PROC
@@ -18099,21 +18429,21 @@ _sk_gather_4444_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3
- DB 102,15,111,5,60,50,0,0 ; movdqa 0x323c(%rip),%xmm0 # 6c90 <_sk_callback_sse41+0xed9>
+ DB 102,15,111,5,248,50,0,0 ; movdqa 0x32f8(%rip),%xmm0 # 6f10 <_sk_callback_sse41+0xf95>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,62,50,0,0 ; mulps 0x323e(%rip),%xmm0 # 6ca0 <_sk_callback_sse41+0xee9>
- DB 102,15,111,13,70,50,0,0 ; movdqa 0x3246(%rip),%xmm1 # 6cb0 <_sk_callback_sse41+0xef9>
+ DB 15,89,5,250,50,0,0 ; mulps 0x32fa(%rip),%xmm0 # 6f20 <_sk_callback_sse41+0xfa5>
+ DB 102,15,111,13,2,51,0,0 ; movdqa 0x3302(%rip),%xmm1 # 6f30 <_sk_callback_sse41+0xfb5>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,72,50,0,0 ; mulps 0x3248(%rip),%xmm1 # 6cc0 <_sk_callback_sse41+0xf09>
- DB 102,15,111,21,80,50,0,0 ; movdqa 0x3250(%rip),%xmm2 # 6cd0 <_sk_callback_sse41+0xf19>
+ DB 15,89,13,4,51,0,0 ; mulps 0x3304(%rip),%xmm1 # 6f40 <_sk_callback_sse41+0xfc5>
+ DB 102,15,111,21,12,51,0,0 ; movdqa 0x330c(%rip),%xmm2 # 6f50 <_sk_callback_sse41+0xfd5>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,82,50,0,0 ; mulps 0x3252(%rip),%xmm2 # 6ce0 <_sk_callback_sse41+0xf29>
- DB 102,15,219,29,90,50,0,0 ; pand 0x325a(%rip),%xmm3 # 6cf0 <_sk_callback_sse41+0xf39>
+ DB 15,89,21,14,51,0,0 ; mulps 0x330e(%rip),%xmm2 # 6f60 <_sk_callback_sse41+0xfe5>
+ DB 102,15,219,29,22,51,0,0 ; pand 0x3316(%rip),%xmm3 # 6f70 <_sk_callback_sse41+0xff5>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,96,50,0,0 ; mulps 0x3260(%rip),%xmm3 # 6d00 <_sk_callback_sse41+0xf49>
+ DB 15,89,29,28,51,0,0 ; mulps 0x331c(%rip),%xmm3 # 6f80 <_sk_callback_sse41+0x1005>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -18127,7 +18457,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,77,50,0,0 ; movaps 0x324d(%rip),%xmm8 # 6d10 <_sk_callback_sse41+0xf59>
+ DB 68,15,40,5,9,51,0,0 ; movaps 0x3309(%rip),%xmm8 # 6f90 <_sk_callback_sse41+0x1015>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -18147,7 +18477,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3b29 <_sk_store_4444_sse41+0x84>
+ DB 117,10 ; jne 3ced <_sk_store_4444_sse41+0x84>
DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -18155,17 +18485,17 @@ _sk_store_4444_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,35 ; je 3b5f <_sk_store_4444_sse41+0xba>
+ DB 116,35 ; je 3d23 <_sk_store_4444_sse41+0xba>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 3b51 <_sk_store_4444_sse41+0xac>
+ DB 116,15 ; je 3d15 <_sk_store_4444_sse41+0xac>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,221 ; jne 3b25 <_sk_store_4444_sse41+0x80>
+ DB 117,221 ; jne 3ce9 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2)
- DB 235,198 ; jmp 3b25 <_sk_store_4444_sse41+0x80>
+ DB 235,198 ; jmp 3ce9 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2)
- DB 235,188 ; jmp 3b25 <_sk_store_4444_sse41+0x80>
+ DB 235,188 ; jmp 3ce9 <_sk_store_4444_sse41+0x80>
PUBLIC _sk_load_8888_sse41
_sk_load_8888_sse41 LABEL PROC
@@ -18177,19 +18507,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 3bde <_sk_load_8888_sse41+0x75>
+ DB 117,89 ; jne 3da2 <_sk_load_8888_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,141,49,0,0 ; movdqa 0x318d(%rip),%xmm0 # 6d20 <_sk_callback_sse41+0xf69>
+ DB 102,15,111,5,73,50,0,0 ; movdqa 0x3249(%rip),%xmm0 # 6fa0 <_sk_callback_sse41+0x1025>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,142,49,0,0 ; movaps 0x318e(%rip),%xmm8 # 6d30 <_sk_callback_sse41+0xf79>
+ DB 68,15,40,5,74,50,0,0 ; movaps 0x324a(%rip),%xmm8 # 6fb0 <_sk_callback_sse41+0x1035>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,141,49,0,0 ; pshufb 0x318d(%rip),%xmm1 # 6d40 <_sk_callback_sse41+0xf89>
+ DB 102,15,56,0,13,73,50,0,0 ; pshufb 0x3249(%rip),%xmm1 # 6fc0 <_sk_callback_sse41+0x1045>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,137,49,0,0 ; pshufb 0x3189(%rip),%xmm2 # 6d50 <_sk_callback_sse41+0xf99>
+ DB 102,15,56,0,21,69,50,0,0 ; pshufb 0x3245(%rip),%xmm2 # 6fd0 <_sk_callback_sse41+0x1055>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -18200,19 +18530,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 3c18 <_sk_load_8888_sse41+0xaf>
+ DB 116,45 ; je 3ddc <_sk_load_8888_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 3c07 <_sk_load_8888_sse41+0x9e>
+ DB 116,18 ; je 3dcb <_sk_load_8888_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 3b8b <_sk_load_8888_sse41+0x22>
+ DB 117,144 ; jne 3d4f <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 3b8b <_sk_load_8888_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 3d4f <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 3b8b <_sk_load_8888_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 3d4f <_sk_load_8888_sse41+0x22>
PUBLIC _sk_load_8888_dst_sse41
_sk_load_8888_dst_sse41 LABEL PROC
@@ -18224,19 +18554,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 3c98 <_sk_load_8888_dst_sse41+0x75>
+ DB 117,89 ; jne 3e5c <_sk_load_8888_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,19,49,0,0 ; movdqa 0x3113(%rip),%xmm4 # 6d60 <_sk_callback_sse41+0xfa9>
+ DB 102,15,111,37,207,49,0,0 ; movdqa 0x31cf(%rip),%xmm4 # 6fe0 <_sk_callback_sse41+0x1065>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,20,49,0,0 ; movaps 0x3114(%rip),%xmm8 # 6d70 <_sk_callback_sse41+0xfb9>
+ DB 68,15,40,5,208,49,0,0 ; movaps 0x31d0(%rip),%xmm8 # 6ff0 <_sk_callback_sse41+0x1075>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,19,49,0,0 ; pshufb 0x3113(%rip),%xmm5 # 6d80 <_sk_callback_sse41+0xfc9>
+ DB 102,15,56,0,45,207,49,0,0 ; pshufb 0x31cf(%rip),%xmm5 # 7000 <_sk_callback_sse41+0x1085>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,15,49,0,0 ; pshufb 0x310f(%rip),%xmm6 # 6d90 <_sk_callback_sse41+0xfd9>
+ DB 102,15,56,0,53,203,49,0,0 ; pshufb 0x31cb(%rip),%xmm6 # 7010 <_sk_callback_sse41+0x1095>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -18247,19 +18577,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 3cd2 <_sk_load_8888_dst_sse41+0xaf>
+ DB 116,45 ; je 3e96 <_sk_load_8888_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 3cc1 <_sk_load_8888_dst_sse41+0x9e>
+ DB 116,18 ; je 3e85 <_sk_load_8888_dst_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 3c45 <_sk_load_8888_dst_sse41+0x22>
+ DB 117,144 ; jne 3e09 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 3c45 <_sk_load_8888_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 3e09 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 3c45 <_sk_load_8888_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 3e09 <_sk_load_8888_dst_sse41+0x22>
PUBLIC _sk_gather_8888_sse41
_sk_gather_8888_sse41 LABEL PROC
@@ -18282,17 +18612,17 @@ _sk_gather_8888_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,98,48,0,0 ; movdqa 0x3062(%rip),%xmm0 # 6da0 <_sk_callback_sse41+0xfe9>
+ DB 102,15,111,5,30,49,0,0 ; movdqa 0x311e(%rip),%xmm0 # 7020 <_sk_callback_sse41+0x10a5>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,99,48,0,0 ; movaps 0x3063(%rip),%xmm8 # 6db0 <_sk_callback_sse41+0xff9>
+ DB 68,15,40,5,31,49,0,0 ; movaps 0x311f(%rip),%xmm8 # 7030 <_sk_callback_sse41+0x10b5>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,98,48,0,0 ; pshufb 0x3062(%rip),%xmm1 # 6dc0 <_sk_callback_sse41+0x1009>
+ DB 102,15,56,0,13,30,49,0,0 ; pshufb 0x311e(%rip),%xmm1 # 7040 <_sk_callback_sse41+0x10c5>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,94,48,0,0 ; pshufb 0x305e(%rip),%xmm2 # 6dd0 <_sk_callback_sse41+0x1019>
+ DB 102,15,56,0,21,26,49,0,0 ; pshufb 0x311a(%rip),%xmm2 # 7050 <_sk_callback_sse41+0x10d5>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -18311,7 +18641,7 @@ _sk_store_8888_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,55,48,0,0 ; movaps 0x3037(%rip),%xmm8 # 6de0 <_sk_callback_sse41+0x1029>
+ DB 68,15,40,5,243,48,0,0 ; movaps 0x30f3(%rip),%xmm8 # 7060 <_sk_callback_sse41+0x10e5>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -18330,23 +18660,23 @@ _sk_store_8888_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3e09 <_sk_store_8888_sse41+0x7f>
+ DB 117,10 ; jne 3fcd <_sk_store_8888_sse41+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,29 ; je 3e33 <_sk_store_8888_sse41+0xa9>
+ DB 116,29 ; je 3ff7 <_sk_store_8888_sse41+0xa9>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 3e2b <_sk_store_8888_sse41+0xa1>
+ DB 116,15 ; je 3fef <_sk_store_8888_sse41+0xa1>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 3e05 <_sk_store_8888_sse41+0x7b>
+ DB 117,227 ; jne 3fc9 <_sk_store_8888_sse41+0x7b>
DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,210 ; jmp 3e05 <_sk_store_8888_sse41+0x7b>
+ DB 235,210 ; jmp 3fc9 <_sk_store_8888_sse41+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,202 ; jmp 3e05 <_sk_store_8888_sse41+0x7b>
+ DB 235,202 ; jmp 3fc9 <_sk_store_8888_sse41+0x7b>
PUBLIC _sk_load_bgra_sse41
_sk_load_bgra_sse41 LABEL PROC
@@ -18358,19 +18688,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 3eb0 <_sk_load_bgra_sse41+0x75>
+ DB 117,89 ; jne 4074 <_sk_load_bgra_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,139,47,0,0 ; movdqa 0x2f8b(%rip),%xmm0 # 6df0 <_sk_callback_sse41+0x1039>
+ DB 102,15,111,5,71,48,0,0 ; movdqa 0x3047(%rip),%xmm0 # 7070 <_sk_callback_sse41+0x10f5>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,140,47,0,0 ; movaps 0x2f8c(%rip),%xmm8 # 6e00 <_sk_callback_sse41+0x1049>
+ DB 68,15,40,5,72,48,0,0 ; movaps 0x3048(%rip),%xmm8 # 7080 <_sk_callback_sse41+0x1105>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,139,47,0,0 ; pshufb 0x2f8b(%rip),%xmm0 # 6e10 <_sk_callback_sse41+0x1059>
+ DB 102,15,56,0,5,71,48,0,0 ; pshufb 0x3047(%rip),%xmm0 # 7090 <_sk_callback_sse41+0x1115>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,135,47,0,0 ; pshufb 0x2f87(%rip),%xmm0 # 6e20 <_sk_callback_sse41+0x1069>
+ DB 102,15,56,0,5,67,48,0,0 ; pshufb 0x3043(%rip),%xmm0 # 70a0 <_sk_callback_sse41+0x1125>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -18381,19 +18711,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 3eea <_sk_load_bgra_sse41+0xaf>
+ DB 116,45 ; je 40ae <_sk_load_bgra_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 3ed9 <_sk_load_bgra_sse41+0x9e>
+ DB 116,18 ; je 409d <_sk_load_bgra_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 3e5d <_sk_load_bgra_sse41+0x22>
+ DB 117,144 ; jne 4021 <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 3e5d <_sk_load_bgra_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 4021 <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 3e5d <_sk_load_bgra_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 4021 <_sk_load_bgra_sse41+0x22>
PUBLIC _sk_load_bgra_dst_sse41
_sk_load_bgra_dst_sse41 LABEL PROC
@@ -18405,19 +18735,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 3f6a <_sk_load_bgra_dst_sse41+0x75>
+ DB 117,89 ; jne 412e <_sk_load_bgra_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,17,47,0,0 ; movdqa 0x2f11(%rip),%xmm4 # 6e30 <_sk_callback_sse41+0x1079>
+ DB 102,15,111,37,205,47,0,0 ; movdqa 0x2fcd(%rip),%xmm4 # 70b0 <_sk_callback_sse41+0x1135>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,244 ; cvtdq2ps %xmm4,%xmm6
- DB 68,15,40,5,18,47,0,0 ; movaps 0x2f12(%rip),%xmm8 # 6e40 <_sk_callback_sse41+0x1089>
+ DB 68,15,40,5,206,47,0,0 ; movaps 0x2fce(%rip),%xmm8 # 70c0 <_sk_callback_sse41+0x1145>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,17,47,0,0 ; pshufb 0x2f11(%rip),%xmm4 # 6e50 <_sk_callback_sse41+0x1099>
+ DB 102,15,56,0,37,205,47,0,0 ; pshufb 0x2fcd(%rip),%xmm4 # 70d0 <_sk_callback_sse41+0x1155>
DB 15,91,236 ; cvtdq2ps %xmm4,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,13,47,0,0 ; pshufb 0x2f0d(%rip),%xmm4 # 6e60 <_sk_callback_sse41+0x10a9>
+ DB 102,15,56,0,37,201,47,0,0 ; pshufb 0x2fc9(%rip),%xmm4 # 70e0 <_sk_callback_sse41+0x1165>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -18428,19 +18758,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 3fa4 <_sk_load_bgra_dst_sse41+0xaf>
+ DB 116,45 ; je 4168 <_sk_load_bgra_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 3f93 <_sk_load_bgra_dst_sse41+0x9e>
+ DB 116,18 ; je 4157 <_sk_load_bgra_dst_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 3f17 <_sk_load_bgra_dst_sse41+0x22>
+ DB 117,144 ; jne 40db <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 3f17 <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 40db <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 3f17 <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 40db <_sk_load_bgra_dst_sse41+0x22>
PUBLIC _sk_gather_bgra_sse41
_sk_gather_bgra_sse41 LABEL PROC
@@ -18463,17 +18793,17 @@ _sk_gather_bgra_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,96,46,0,0 ; movdqa 0x2e60(%rip),%xmm0 # 6e70 <_sk_callback_sse41+0x10b9>
+ DB 102,15,111,5,28,47,0,0 ; movdqa 0x2f1c(%rip),%xmm0 # 70f0 <_sk_callback_sse41+0x1175>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,97,46,0,0 ; movaps 0x2e61(%rip),%xmm8 # 6e80 <_sk_callback_sse41+0x10c9>
+ DB 68,15,40,5,29,47,0,0 ; movaps 0x2f1d(%rip),%xmm8 # 7100 <_sk_callback_sse41+0x1185>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,96,46,0,0 ; pshufb 0x2e60(%rip),%xmm0 # 6e90 <_sk_callback_sse41+0x10d9>
+ DB 102,15,56,0,5,28,47,0,0 ; pshufb 0x2f1c(%rip),%xmm0 # 7110 <_sk_callback_sse41+0x1195>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,92,46,0,0 ; pshufb 0x2e5c(%rip),%xmm0 # 6ea0 <_sk_callback_sse41+0x10e9>
+ DB 102,15,56,0,5,24,47,0,0 ; pshufb 0x2f18(%rip),%xmm0 # 7120 <_sk_callback_sse41+0x11a5>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -18492,7 +18822,7 @@ _sk_store_bgra_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,53,46,0,0 ; movaps 0x2e35(%rip),%xmm8 # 6eb0 <_sk_callback_sse41+0x10f9>
+ DB 68,15,40,5,241,46,0,0 ; movaps 0x2ef1(%rip),%xmm8 # 7130 <_sk_callback_sse41+0x11b5>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -18511,23 +18841,23 @@ _sk_store_bgra_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 40db <_sk_store_bgra_sse41+0x7f>
+ DB 117,10 ; jne 429f <_sk_store_bgra_sse41+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,29 ; je 4105 <_sk_store_bgra_sse41+0xa9>
+ DB 116,29 ; je 42c9 <_sk_store_bgra_sse41+0xa9>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 40fd <_sk_store_bgra_sse41+0xa1>
+ DB 116,15 ; je 42c1 <_sk_store_bgra_sse41+0xa1>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 40d7 <_sk_store_bgra_sse41+0x7b>
+ DB 117,227 ; jne 429b <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,210 ; jmp 40d7 <_sk_store_bgra_sse41+0x7b>
+ DB 235,210 ; jmp 429b <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,202 ; jmp 40d7 <_sk_store_bgra_sse41+0x7b>
+ DB 235,202 ; jmp 429b <_sk_store_bgra_sse41+0x7b>
PUBLIC _sk_load_f16_sse41
_sk_load_f16_sse41 LABEL PROC
@@ -18539,7 +18869,7 @@ _sk_load_f16_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,62,1,0,0 ; jne 426b <_sk_load_f16_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 442f <_sk_load_f16_sse41+0x15e>
DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0
DB 243,65,15,111,76,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm1
DB 102,68,15,40,200 ; movapd %xmm0,%xmm9
@@ -18549,18 +18879,18 @@ _sk_load_f16_sse41 LABEL PROC
DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,90,45,0,0 ; movdqa 0x2d5a(%rip),%xmm8 # 6ec0 <_sk_callback_sse41+0x1109>
+ DB 102,68,15,111,5,22,46,0,0 ; movdqa 0x2e16(%rip),%xmm8 # 7140 <_sk_callback_sse41+0x11c5>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,85,45,0,0 ; movdqa 0x2d55(%rip),%xmm3 # 6ed0 <_sk_callback_sse41+0x1119>
+ DB 102,15,111,29,17,46,0,0 ; movdqa 0x2e11(%rip),%xmm3 # 7150 <_sk_callback_sse41+0x11d5>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,65,45,0,0 ; movdqa 0x2d41(%rip),%xmm10 # 6ee0 <_sk_callback_sse41+0x1129>
+ DB 102,68,15,111,21,253,45,0,0 ; movdqa 0x2dfd(%rip),%xmm10 # 7160 <_sk_callback_sse41+0x11e5>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -18603,16 +18933,16 @@ _sk_load_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 4284 <_sk_load_f16_sse41+0x177>
+ DB 117,13 ; jne 4448 <_sk_load_f16_sse41+0x177>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,182,254,255,255 ; jmpq 413a <_sk_load_f16_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 42fe <_sk_load_f16_sse41+0x2d>
DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,161,254,255,255 ; jb 413a <_sk_load_f16_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 42fe <_sk_load_f16_sse41+0x2d>
DB 243,65,15,126,76,193,16 ; movq 0x10(%r9,%rax,8),%xmm1
- DB 233,149,254,255,255 ; jmpq 413a <_sk_load_f16_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 42fe <_sk_load_f16_sse41+0x2d>
PUBLIC _sk_load_f16_dst_sse41
_sk_load_f16_dst_sse41 LABEL PROC
@@ -18624,7 +18954,7 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,62,1,0,0 ; jne 4403 <_sk_load_f16_dst_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 45c7 <_sk_load_f16_dst_sse41+0x15e>
DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4
DB 243,65,15,111,108,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm5
DB 102,68,15,40,204 ; movapd %xmm4,%xmm9
@@ -18634,18 +18964,18 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 102,68,15,97,220 ; punpcklwd %xmm4,%xmm11
DB 102,68,15,105,204 ; punpckhwd %xmm4,%xmm9
DB 102,65,15,56,51,235 ; pmovzxwd %xmm11,%xmm5
- DB 102,68,15,111,5,242,43,0,0 ; movdqa 0x2bf2(%rip),%xmm8 # 6ef0 <_sk_callback_sse41+0x1139>
+ DB 102,68,15,111,5,174,44,0,0 ; movdqa 0x2cae(%rip),%xmm8 # 7170 <_sk_callback_sse41+0x11f5>
DB 102,15,111,245 ; movdqa %xmm5,%xmm6
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,239,238 ; pxor %xmm6,%xmm5
- DB 102,15,111,61,237,43,0,0 ; movdqa 0x2bed(%rip),%xmm7 # 6f00 <_sk_callback_sse41+0x1149>
+ DB 102,15,111,61,169,44,0,0 ; movdqa 0x2ca9(%rip),%xmm7 # 7180 <_sk_callback_sse41+0x1205>
DB 102,15,114,246,16 ; pslld $0x10,%xmm6
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,15,56,63,231 ; pmaxud %xmm7,%xmm4
DB 102,15,118,229 ; pcmpeqd %xmm5,%xmm4
DB 102,15,114,245,13 ; pslld $0xd,%xmm5
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,68,15,111,21,217,43,0,0 ; movdqa 0x2bd9(%rip),%xmm10 # 6f10 <_sk_callback_sse41+0x1159>
+ DB 102,68,15,111,21,149,44,0,0 ; movdqa 0x2c95(%rip),%xmm10 # 7190 <_sk_callback_sse41+0x1215>
DB 102,65,15,254,234 ; paddd %xmm10,%xmm5
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -18688,16 +19018,16 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 441c <_sk_load_f16_dst_sse41+0x177>
+ DB 117,13 ; jne 45e0 <_sk_load_f16_dst_sse41+0x177>
DB 243,15,126,228 ; movq %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
- DB 233,182,254,255,255 ; jmpq 42d2 <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 4496 <_sk_load_f16_dst_sse41+0x2d>
DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,161,254,255,255 ; jb 42d2 <_sk_load_f16_dst_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 4496 <_sk_load_f16_dst_sse41+0x2d>
DB 243,65,15,126,108,193,16 ; movq 0x10(%r9,%rax,8),%xmm5
- DB 233,149,254,255,255 ; jmpq 42d2 <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 4496 <_sk_load_f16_dst_sse41+0x2d>
PUBLIC _sk_gather_f16_sse41
_sk_gather_f16_sse41 LABEL PROC
@@ -18729,18 +19059,18 @@ _sk_gather_f16_sse41 LABEL PROC
DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11
DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,92,42,0,0 ; movdqa 0x2a5c(%rip),%xmm8 # 6f20 <_sk_callback_sse41+0x1169>
+ DB 102,68,15,111,5,24,43,0,0 ; movdqa 0x2b18(%rip),%xmm8 # 71a0 <_sk_callback_sse41+0x1225>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,87,42,0,0 ; movdqa 0x2a57(%rip),%xmm3 # 6f30 <_sk_callback_sse41+0x1179>
+ DB 102,15,111,29,19,43,0,0 ; movdqa 0x2b13(%rip),%xmm3 # 71b0 <_sk_callback_sse41+0x1235>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,67,42,0,0 ; movdqa 0x2a43(%rip),%xmm10 # 6f40 <_sk_callback_sse41+0x1189>
+ DB 102,68,15,111,21,255,42,0,0 ; movdqa 0x2aff(%rip),%xmm10 # 71c0 <_sk_callback_sse41+0x1245>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -18792,17 +19122,17 @@ _sk_store_f16_sse41 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,102,41,0,0 ; movdqa 0x2966(%rip),%xmm10 # 6f50 <_sk_callback_sse41+0x1199>
+ DB 102,68,15,111,21,34,42,0,0 ; movdqa 0x2a22(%rip),%xmm10 # 71d0 <_sk_callback_sse41+0x1255>
DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,235 ; pxor %xmm11,%xmm13
- DB 102,68,15,111,13,89,41,0,0 ; movdqa 0x2959(%rip),%xmm9 # 6f60 <_sk_callback_sse41+0x11a9>
+ DB 102,68,15,111,13,21,42,0,0 ; movdqa 0x2a15(%rip),%xmm9 # 71e0 <_sk_callback_sse41+0x1265>
DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,37,74,41,0,0 ; movdqa 0x294a(%rip),%xmm12 # 6f70 <_sk_callback_sse41+0x11b9>
+ DB 102,68,15,111,37,6,42,0,0 ; movdqa 0x2a06(%rip),%xmm12 # 71f0 <_sk_callback_sse41+0x1275>
DB 102,69,15,235,220 ; por %xmm12,%xmm11
DB 102,69,15,254,221 ; paddd %xmm13,%xmm11
DB 102,69,15,223,195 ; pandn %xmm11,%xmm8
@@ -18846,7 +19176,7 @@ _sk_store_f16_sse41 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,203 ; punpckldq %xmm11,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 471c <_sk_store_f16_sse41+0x152>
+ DB 117,21 ; jne 48e0 <_sk_store_f16_sse41+0x152>
DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8)
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8)
@@ -18854,13 +19184,13 @@ _sk_store_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4718 <_sk_store_f16_sse41+0x14e>
+ DB 116,240 ; je 48dc <_sk_store_f16_sse41+0x14e>
DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4718 <_sk_store_f16_sse41+0x14e>
+ DB 114,227 ; jb 48dc <_sk_store_f16_sse41+0x14e>
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8)
- DB 235,213 ; jmp 4718 <_sk_store_f16_sse41+0x14e>
+ DB 235,213 ; jmp 48dc <_sk_store_f16_sse41+0x14e>
PUBLIC _sk_load_u16_be_sse41
_sk_load_u16_be_sse41 LABEL PROC
@@ -18873,7 +19203,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,185,0,0,0 ; jne 4823 <_sk_load_u16_be_sse41+0xe0>
+ DB 15,133,185,0,0,0 ; jne 49e7 <_sk_load_u16_be_sse41+0xe0>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 243,65,15,111,76,65,16 ; movdqu 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -18889,7 +19219,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,202,39,0,0 ; movaps 0x27ca(%rip),%xmm8 # 6f80 <_sk_callback_sse41+0x11c9>
+ DB 68,15,40,5,134,40,0,0 ; movaps 0x2886(%rip),%xmm8 # 7200 <_sk_callback_sse41+0x1285>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -18917,16 +19247,16 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 483c <_sk_load_u16_be_sse41+0xf9>
+ DB 117,13 ; jne 4a00 <_sk_load_u16_be_sse41+0xf9>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,59,255,255,255 ; jmpq 4777 <_sk_load_u16_be_sse41+0x34>
+ DB 233,59,255,255,255 ; jmpq 493b <_sk_load_u16_be_sse41+0x34>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,38,255,255,255 ; jb 4777 <_sk_load_u16_be_sse41+0x34>
+ DB 15,130,38,255,255,255 ; jb 493b <_sk_load_u16_be_sse41+0x34>
DB 243,65,15,126,76,65,16 ; movq 0x10(%r9,%rax,2),%xmm1
- DB 233,26,255,255,255 ; jmpq 4777 <_sk_load_u16_be_sse41+0x34>
+ DB 233,26,255,255,255 ; jmpq 493b <_sk_load_u16_be_sse41+0x34>
PUBLIC _sk_load_rgb_u16_be_sse41
_sk_load_rgb_u16_be_sse41 LABEL PROC
@@ -18941,7 +19271,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,170,0,0,0 ; jne 4932 <_sk_load_rgb_u16_be_sse41+0xd5>
+ DB 15,133,170,0,0,0 ; jne 4af6 <_sk_load_rgb_u16_be_sse41+0xd5>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -18961,7 +19291,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,169,38,0,0 ; movaps 0x26a9(%rip),%xmm8 # 6f90 <_sk_callback_sse41+0x11d9>
+ DB 68,15,40,5,101,39,0,0 ; movaps 0x2765(%rip),%xmm8 # 7210 <_sk_callback_sse41+0x1295>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -18978,27 +19308,27 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,112,38,0,0 ; movaps 0x2670(%rip),%xmm3 # 6fa0 <_sk_callback_sse41+0x11e9>
+ DB 15,40,29,44,39,0,0 ; movaps 0x272c(%rip),%xmm3 # 7220 <_sk_callback_sse41+0x12a5>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 4957 <_sk_load_rgb_u16_be_sse41+0xfa>
+ DB 117,13 ; jne 4b1b <_sk_load_rgb_u16_be_sse41+0xfa>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,85,255,255,255 ; jmpq 48ac <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,85,255,255,255 ; jmpq 4a70 <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 4988 <_sk_load_rgb_u16_be_sse41+0x12b>
+ DB 114,24 ; jb 4b4c <_sk_load_rgb_u16_be_sse41+0x12b>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,36,255,255,255 ; jmpq 48ac <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,36,255,255,255 ; jmpq 4a70 <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,27,255,255,255 ; jmpq 48ac <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,27,255,255,255 ; jmpq 4a70 <_sk_load_rgb_u16_be_sse41+0x4f>
PUBLIC _sk_store_u16_be_sse41
_sk_store_u16_be_sse41 LABEL PROC
@@ -19010,7 +19340,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,249,37,0,0 ; movaps 0x25f9(%rip),%xmm10 # 6fb0 <_sk_callback_sse41+0x11f9>
+ DB 68,15,40,21,181,38,0,0 ; movaps 0x26b5(%rip),%xmm10 # 7230 <_sk_callback_sse41+0x12b5>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -19047,7 +19377,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 4a85 <_sk_store_u16_be_sse41+0xf4>
+ DB 117,21 ; jne 4c49 <_sk_store_u16_be_sse41+0xf4>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -19055,13 +19385,13 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4a81 <_sk_store_u16_be_sse41+0xf0>
+ DB 116,240 ; je 4c45 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4a81 <_sk_store_u16_be_sse41+0xf0>
+ DB 114,227 ; jb 4c45 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 4a81 <_sk_store_u16_be_sse41+0xf0>
+ DB 235,213 ; jmp 4c45 <_sk_store_u16_be_sse41+0xf0>
PUBLIC _sk_load_f32_sse41
_sk_load_f32_sse41 LABEL PROC
@@ -19075,7 +19405,7 @@ _sk_load_f32_sse41 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 4b17 <_sk_load_f32_sse41+0x6b>
+ DB 117,66 ; jne 4cdb <_sk_load_f32_sse41+0x6b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -19095,17 +19425,17 @@ _sk_load_f32_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 4b29 <_sk_load_f32_sse41+0x7d>
+ DB 117,8 ; jne 4ced <_sk_load_f32_sse41+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 4ae7 <_sk_load_f32_sse41+0x3b>
+ DB 235,190 ; jmp 4cab <_sk_load_f32_sse41+0x3b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 4b3d <_sk_load_f32_sse41+0x91>
+ DB 114,8 ; jb 4d01 <_sk_load_f32_sse41+0x91>
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
- DB 235,170 ; jmp 4ae7 <_sk_load_f32_sse41+0x3b>
+ DB 235,170 ; jmp 4cab <_sk_load_f32_sse41+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 4ae7 <_sk_load_f32_sse41+0x3b>
+ DB 235,165 ; jmp 4cab <_sk_load_f32_sse41+0x3b>
PUBLIC _sk_load_f32_dst_sse41
_sk_load_f32_dst_sse41 LABEL PROC
@@ -19119,7 +19449,7 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 4bad <_sk_load_f32_dst_sse41+0x6b>
+ DB 117,66 ; jne 4d71 <_sk_load_f32_dst_sse41+0x6b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -19139,17 +19469,17 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 4bbf <_sk_load_f32_dst_sse41+0x7d>
+ DB 117,8 ; jne 4d83 <_sk_load_f32_dst_sse41+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 4b7d <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,190 ; jmp 4d41 <_sk_load_f32_dst_sse41+0x3b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 4bd3 <_sk_load_f32_dst_sse41+0x91>
+ DB 114,8 ; jb 4d97 <_sk_load_f32_dst_sse41+0x91>
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
- DB 235,170 ; jmp 4b7d <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,170 ; jmp 4d41 <_sk_load_f32_dst_sse41+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 4b7d <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,165 ; jmp 4d41 <_sk_load_f32_dst_sse41+0x3b>
PUBLIC _sk_store_f32_sse41
_sk_store_f32_sse41 LABEL PROC
@@ -19176,7 +19506,7 @@ _sk_store_f32_sse41 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 4c55 <_sk_store_f32_sse41+0x7d>
+ DB 117,29 ; jne 4e19 <_sk_store_f32_sse41+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
@@ -19184,12 +19514,12 @@ _sk_store_f32_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 4c51 <_sk_store_f32_sse41+0x79>
+ DB 116,246 ; je 4e15 <_sk_store_f32_sse41+0x79>
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 4c51 <_sk_store_f32_sse41+0x79>
+ DB 114,234 ; jb 4e15 <_sk_store_f32_sse41+0x79>
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
- DB 235,225 ; jmp 4c51 <_sk_store_f32_sse41+0x79>
+ DB 235,225 ; jmp 4e15 <_sk_store_f32_sse41+0x79>
PUBLIC _sk_clamp_x_sse41
_sk_clamp_x_sse41 LABEL PROC
@@ -19269,7 +19599,7 @@ _sk_mirror_x_sse41 LABEL PROC
DB 65,15,92,194 ; subps %xmm10,%xmm0
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,163,38,0,0 ; mulss 0x26a3(%rip),%xmm9 # 7420 <_sk_callback_sse41+0x1669>
+ DB 243,68,15,89,13,95,39,0,0 ; mulss 0x275f(%rip),%xmm9 # 76a0 <_sk_callback_sse41+0x1725>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -19298,7 +19628,7 @@ _sk_mirror_y_sse41 LABEL PROC
DB 65,15,92,202 ; subps %xmm10,%xmm1
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,53,38,0,0 ; mulss 0x2635(%rip),%xmm9 # 7424 <_sk_callback_sse41+0x166d>
+ DB 243,68,15,89,13,241,38,0,0 ; mulss 0x26f1(%rip),%xmm9 # 76a4 <_sk_callback_sse41+0x1729>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,201 ; mulps %xmm1,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -19321,7 +19651,7 @@ PUBLIC _sk_clamp_x_1_sse41
_sk_clamp_x_1_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,124,33,0,0 ; minps 0x217c(%rip),%xmm8 # 6fc0 <_sk_callback_sse41+0x1209>
+ DB 68,15,93,5,56,34,0,0 ; minps 0x2238(%rip),%xmm8 # 7240 <_sk_callback_sse41+0x12c5>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19335,9 +19665,9 @@ _sk_repeat_x_1_sse41 LABEL PROC
PUBLIC _sk_mirror_x_1_sse41
_sk_mirror_x_1_sse41 LABEL PROC
- DB 68,15,40,5,109,33,0,0 ; movaps 0x216d(%rip),%xmm8 # 6fd0 <_sk_callback_sse41+0x1219>
+ DB 68,15,40,5,41,34,0,0 ; movaps 0x2229(%rip),%xmm8 # 7250 <_sk_callback_sse41+0x12d5>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,113,33,0,0 ; movaps 0x2171(%rip),%xmm9 # 6fe0 <_sk_callback_sse41+0x1229>
+ DB 68,15,40,13,45,34,0,0 ; movaps 0x222d(%rip),%xmm9 # 7260 <_sk_callback_sse41+0x12e5>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
DB 69,15,88,201 ; addps %xmm9,%xmm9
@@ -19352,10 +19682,10 @@ _sk_mirror_x_1_sse41 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse41
_sk_luminance_to_alpha_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,80,33,0,0 ; mulps 0x2150(%rip),%xmm0 # 6ff0 <_sk_callback_sse41+0x1239>
- DB 15,89,13,89,33,0,0 ; mulps 0x2159(%rip),%xmm1 # 7000 <_sk_callback_sse41+0x1249>
+ DB 15,89,5,12,34,0,0 ; mulps 0x220c(%rip),%xmm0 # 7270 <_sk_callback_sse41+0x12f5>
+ DB 15,89,13,21,34,0,0 ; mulps 0x2215(%rip),%xmm1 # 7280 <_sk_callback_sse41+0x1305>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,95,33,0,0 ; mulps 0x215f(%rip),%xmm3 # 7010 <_sk_callback_sse41+0x1259>
+ DB 15,89,29,27,34,0,0 ; mulps 0x221b(%rip),%xmm3 # 7290 <_sk_callback_sse41+0x1315>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -19652,9 +19982,9 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 5353 <_sk_evenly_spaced_gradient_sse41+0x1a>
+ DB 120,7 ; js 5517 <_sk_evenly_spaced_gradient_sse41+0x1a>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 5368 <_sk_evenly_spaced_gradient_sse41+0x2f>
+ DB 235,21 ; jmp 552c <_sk_evenly_spaced_gradient_sse41+0x2f>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -19742,15 +20072,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse41
_sk_gauss_a_to_rgba_sse41 LABEL PROC
- DB 15,40,5,10,27,0,0 ; movaps 0x1b0a(%rip),%xmm0 # 7020 <_sk_callback_sse41+0x1269>
+ DB 15,40,5,198,27,0,0 ; movaps 0x1bc6(%rip),%xmm0 # 72a0 <_sk_callback_sse41+0x1325>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,16,27,0,0 ; addps 0x1b10(%rip),%xmm0 # 7030 <_sk_callback_sse41+0x1279>
+ DB 15,88,5,204,27,0,0 ; addps 0x1bcc(%rip),%xmm0 # 72b0 <_sk_callback_sse41+0x1335>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,22,27,0,0 ; addps 0x1b16(%rip),%xmm0 # 7040 <_sk_callback_sse41+0x1289>
+ DB 15,88,5,210,27,0,0 ; addps 0x1bd2(%rip),%xmm0 # 72c0 <_sk_callback_sse41+0x1345>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,28,27,0,0 ; addps 0x1b1c(%rip),%xmm0 # 7050 <_sk_callback_sse41+0x1299>
+ DB 15,88,5,216,27,0,0 ; addps 0x1bd8(%rip),%xmm0 # 72d0 <_sk_callback_sse41+0x1355>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,34,27,0,0 ; addps 0x1b22(%rip),%xmm0 # 7060 <_sk_callback_sse41+0x12a9>
+ DB 15,88,5,222,27,0,0 ; addps 0x1bde(%rip),%xmm0 # 72e0 <_sk_callback_sse41+0x1365>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -19766,12 +20096,12 @@ _sk_gradient_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 5591 <_sk_gradient_sse41+0x46>
+ DB 114,50 ; jb 5755 <_sk_gradient_sse41+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,251,26,0,0 ; movaps 0x1afb(%rip),%xmm2 # 7070 <_sk_callback_sse41+0x12b9>
+ DB 15,40,21,183,27,0,0 ; movaps 0x1bb7(%rip),%xmm2 # 72f0 <_sk_callback_sse41+0x1375>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -19779,7 +20109,7 @@ _sk_gradient_sse41 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 5575 <_sk_gradient_sse41+0x2a>
+ DB 117,228 ; jne 5739 <_sk_gradient_sse41+0x2a>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -19905,26 +20235,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,237 ; mulps %xmm13,%xmm13
- DB 68,15,40,21,156,24,0,0 ; movaps 0x189c(%rip),%xmm10 # 7080 <_sk_callback_sse41+0x12c9>
+ DB 68,15,40,21,88,25,0,0 ; movaps 0x1958(%rip),%xmm10 # 7300 <_sk_callback_sse41+0x1385>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,160,24,0,0 ; addps 0x18a0(%rip),%xmm10 # 7090 <_sk_callback_sse41+0x12d9>
+ DB 68,15,88,21,92,25,0,0 ; addps 0x195c(%rip),%xmm10 # 7310 <_sk_callback_sse41+0x1395>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,164,24,0,0 ; addps 0x18a4(%rip),%xmm10 # 70a0 <_sk_callback_sse41+0x12e9>
+ DB 68,15,88,21,96,25,0,0 ; addps 0x1960(%rip),%xmm10 # 7320 <_sk_callback_sse41+0x13a5>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,168,24,0,0 ; addps 0x18a8(%rip),%xmm10 # 70b0 <_sk_callback_sse41+0x12f9>
+ DB 68,15,88,21,100,25,0,0 ; addps 0x1964(%rip),%xmm10 # 7330 <_sk_callback_sse41+0x13b5>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 68,15,40,29,167,24,0,0 ; movaps 0x18a7(%rip),%xmm11 # 70c0 <_sk_callback_sse41+0x1309>
+ DB 68,15,40,29,99,25,0,0 ; movaps 0x1963(%rip),%xmm11 # 7340 <_sk_callback_sse41+0x13c5>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,40,29,160,24,0,0 ; movaps 0x18a0(%rip),%xmm11 # 70d0 <_sk_callback_sse41+0x1319>
+ DB 68,15,40,29,92,25,0,0 ; movaps 0x195c(%rip),%xmm11 # 7350 <_sk_callback_sse41+0x13d5>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0
- DB 68,15,40,13,146,24,0,0 ; movaps 0x1892(%rip),%xmm9 # 70e0 <_sk_callback_sse41+0x1329>
+ DB 68,15,40,13,78,25,0,0 ; movaps 0x194e(%rip),%xmm9 # 7360 <_sk_callback_sse41+0x13e5>
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8
@@ -19954,7 +20284,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,59,24,0,0 ; mulps 0x183b(%rip),%xmm9 # 70f0 <_sk_callback_sse41+0x1339>
+ DB 68,15,89,13,247,24,0,0 ; mulps 0x18f7(%rip),%xmm9 # 7370 <_sk_callback_sse41+0x13f5>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -19962,7 +20292,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,38,24,0,0 ; mulps 0x1826(%rip),%xmm10 # 7100 <_sk_callback_sse41+0x1349>
+ DB 68,15,89,21,226,24,0,0 ; mulps 0x18e2(%rip),%xmm10 # 7380 <_sk_callback_sse41+0x1405>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -19971,8 +20301,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,14,24,0,0 ; xorps 0x180e(%rip),%xmm9 # 7110 <_sk_callback_sse41+0x1359>
- DB 68,15,89,5,22,24,0,0 ; mulps 0x1816(%rip),%xmm8 # 7120 <_sk_callback_sse41+0x1369>
+ DB 68,15,87,13,202,24,0,0 ; xorps 0x18ca(%rip),%xmm9 # 7390 <_sk_callback_sse41+0x1415>
+ DB 68,15,89,5,210,24,0,0 ; mulps 0x18d2(%rip),%xmm8 # 73a0 <_sk_callback_sse41+0x1425>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -19991,7 +20321,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,221,23,0,0 ; mulps 0x17dd(%rip),%xmm9 # 7130 <_sk_callback_sse41+0x1379>
+ DB 68,15,89,13,153,24,0,0 ; mulps 0x1899(%rip),%xmm9 # 73b0 <_sk_callback_sse41+0x1435>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -19999,7 +20329,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,200,23,0,0 ; mulps 0x17c8(%rip),%xmm10 # 7140 <_sk_callback_sse41+0x1389>
+ DB 68,15,89,21,132,24,0,0 ; mulps 0x1884(%rip),%xmm10 # 73c0 <_sk_callback_sse41+0x1445>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -20008,8 +20338,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,176,23,0,0 ; xorps 0x17b0(%rip),%xmm9 # 7150 <_sk_callback_sse41+0x1399>
- DB 68,15,89,5,184,23,0,0 ; mulps 0x17b8(%rip),%xmm8 # 7160 <_sk_callback_sse41+0x13a9>
+ DB 68,15,87,13,108,24,0,0 ; xorps 0x186c(%rip),%xmm9 # 73d0 <_sk_callback_sse41+0x1455>
+ DB 68,15,89,5,116,24,0,0 ; mulps 0x1874(%rip),%xmm8 # 73e0 <_sk_callback_sse41+0x1465>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -20025,7 +20355,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,144,23,0,0 ; mulps 0x1790(%rip),%xmm9 # 7170 <_sk_callback_sse41+0x13b9>
+ DB 68,15,89,13,76,24,0,0 ; mulps 0x184c(%rip),%xmm9 # 73f0 <_sk_callback_sse41+0x1475>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -20033,7 +20363,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,124,23,0,0 ; xorps 0x177c(%rip),%xmm0 # 7180 <_sk_callback_sse41+0x13c9>
+ DB 15,87,5,56,24,0,0 ; xorps 0x1838(%rip),%xmm0 # 7400 <_sk_callback_sse41+0x1485>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20070,7 +20400,7 @@ _sk_apply_vector_mask_sse41 LABEL PROC
PUBLIC _sk_save_xy_sse41
_sk_save_xy_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,34,23,0,0 ; movaps 0x1722(%rip),%xmm8 # 7190 <_sk_callback_sse41+0x13d9>
+ DB 68,15,40,5,222,23,0,0 ; movaps 0x17de(%rip),%xmm8 # 7410 <_sk_callback_sse41+0x1495>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -20110,8 +20440,8 @@ _sk_bilinear_nx_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,164,22,0,0 ; addps 0x16a4(%rip),%xmm0 # 71a0 <_sk_callback_sse41+0x13e9>
- DB 68,15,40,13,172,22,0,0 ; movaps 0x16ac(%rip),%xmm9 # 71b0 <_sk_callback_sse41+0x13f9>
+ DB 15,88,5,96,23,0,0 ; addps 0x1760(%rip),%xmm0 # 7420 <_sk_callback_sse41+0x14a5>
+ DB 68,15,40,13,104,23,0,0 ; movaps 0x1768(%rip),%xmm9 # 7430 <_sk_callback_sse41+0x14b5>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20122,7 +20452,7 @@ _sk_bilinear_px_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,155,22,0,0 ; addps 0x169b(%rip),%xmm0 # 71c0 <_sk_callback_sse41+0x1409>
+ DB 15,88,5,87,23,0,0 ; addps 0x1757(%rip),%xmm0 # 7440 <_sk_callback_sse41+0x14c5>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20132,8 +20462,8 @@ _sk_bilinear_ny_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,141,22,0,0 ; addps 0x168d(%rip),%xmm1 # 71d0 <_sk_callback_sse41+0x1419>
- DB 68,15,40,13,149,22,0,0 ; movaps 0x1695(%rip),%xmm9 # 71e0 <_sk_callback_sse41+0x1429>
+ DB 15,88,13,73,23,0,0 ; addps 0x1749(%rip),%xmm1 # 7450 <_sk_callback_sse41+0x14d5>
+ DB 68,15,40,13,81,23,0,0 ; movaps 0x1751(%rip),%xmm9 # 7460 <_sk_callback_sse41+0x14e5>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20144,7 +20474,7 @@ _sk_bilinear_py_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,131,22,0,0 ; addps 0x1683(%rip),%xmm1 # 71f0 <_sk_callback_sse41+0x1439>
+ DB 15,88,13,63,23,0,0 ; addps 0x173f(%rip),%xmm1 # 7470 <_sk_callback_sse41+0x14f5>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20154,13 +20484,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,118,22,0,0 ; addps 0x1676(%rip),%xmm0 # 7200 <_sk_callback_sse41+0x1449>
- DB 68,15,40,13,126,22,0,0 ; movaps 0x167e(%rip),%xmm9 # 7210 <_sk_callback_sse41+0x1459>
+ DB 15,88,5,50,23,0,0 ; addps 0x1732(%rip),%xmm0 # 7480 <_sk_callback_sse41+0x1505>
+ DB 68,15,40,13,58,23,0,0 ; movaps 0x173a(%rip),%xmm9 # 7490 <_sk_callback_sse41+0x1515>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,122,22,0,0 ; mulps 0x167a(%rip),%xmm9 # 7220 <_sk_callback_sse41+0x1469>
- DB 68,15,88,13,130,22,0,0 ; addps 0x1682(%rip),%xmm9 # 7230 <_sk_callback_sse41+0x1479>
+ DB 68,15,89,13,54,23,0,0 ; mulps 0x1736(%rip),%xmm9 # 74a0 <_sk_callback_sse41+0x1525>
+ DB 68,15,88,13,62,23,0,0 ; addps 0x173e(%rip),%xmm9 # 74b0 <_sk_callback_sse41+0x1535>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20171,16 +20501,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,113,22,0,0 ; addps 0x1671(%rip),%xmm0 # 7240 <_sk_callback_sse41+0x1489>
- DB 68,15,40,13,121,22,0,0 ; movaps 0x1679(%rip),%xmm9 # 7250 <_sk_callback_sse41+0x1499>
+ DB 15,88,5,45,23,0,0 ; addps 0x172d(%rip),%xmm0 # 74c0 <_sk_callback_sse41+0x1545>
+ DB 68,15,40,13,53,23,0,0 ; movaps 0x1735(%rip),%xmm9 # 74d0 <_sk_callback_sse41+0x1555>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,125,22,0,0 ; movaps 0x167d(%rip),%xmm8 # 7260 <_sk_callback_sse41+0x14a9>
+ DB 68,15,40,5,57,23,0,0 ; movaps 0x1739(%rip),%xmm8 # 74e0 <_sk_callback_sse41+0x1565>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,129,22,0,0 ; addps 0x1681(%rip),%xmm8 # 7270 <_sk_callback_sse41+0x14b9>
+ DB 68,15,88,5,61,23,0,0 ; addps 0x173d(%rip),%xmm8 # 74f0 <_sk_callback_sse41+0x1575>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,133,22,0,0 ; addps 0x1685(%rip),%xmm8 # 7280 <_sk_callback_sse41+0x14c9>
+ DB 68,15,88,5,65,23,0,0 ; addps 0x1741(%rip),%xmm8 # 7500 <_sk_callback_sse41+0x1585>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,137,22,0,0 ; addps 0x1689(%rip),%xmm8 # 7290 <_sk_callback_sse41+0x14d9>
+ DB 68,15,88,5,69,23,0,0 ; addps 0x1745(%rip),%xmm8 # 7510 <_sk_callback_sse41+0x1595>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20188,17 +20518,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse41
_sk_bicubic_p1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,131,22,0,0 ; movaps 0x1683(%rip),%xmm8 # 72a0 <_sk_callback_sse41+0x14e9>
+ DB 68,15,40,5,63,23,0,0 ; movaps 0x173f(%rip),%xmm8 # 7520 <_sk_callback_sse41+0x15a5>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,127,22,0,0 ; movaps 0x167f(%rip),%xmm10 # 72b0 <_sk_callback_sse41+0x14f9>
+ DB 68,15,40,21,59,23,0,0 ; movaps 0x173b(%rip),%xmm10 # 7530 <_sk_callback_sse41+0x15b5>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,131,22,0,0 ; addps 0x1683(%rip),%xmm10 # 72c0 <_sk_callback_sse41+0x1509>
+ DB 68,15,88,21,63,23,0,0 ; addps 0x173f(%rip),%xmm10 # 7540 <_sk_callback_sse41+0x15c5>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,127,22,0,0 ; addps 0x167f(%rip),%xmm10 # 72d0 <_sk_callback_sse41+0x1519>
+ DB 68,15,88,21,59,23,0,0 ; addps 0x173b(%rip),%xmm10 # 7550 <_sk_callback_sse41+0x15d5>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20208,11 +20538,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,114,22,0,0 ; addps 0x1672(%rip),%xmm0 # 72e0 <_sk_callback_sse41+0x1529>
+ DB 15,88,5,46,23,0,0 ; addps 0x172e(%rip),%xmm0 # 7560 <_sk_callback_sse41+0x15e5>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,114,22,0,0 ; mulps 0x1672(%rip),%xmm8 # 72f0 <_sk_callback_sse41+0x1539>
- DB 68,15,88,5,122,22,0,0 ; addps 0x167a(%rip),%xmm8 # 7300 <_sk_callback_sse41+0x1549>
+ DB 68,15,89,5,46,23,0,0 ; mulps 0x172e(%rip),%xmm8 # 7570 <_sk_callback_sse41+0x15f5>
+ DB 68,15,88,5,54,23,0,0 ; addps 0x1736(%rip),%xmm8 # 7580 <_sk_callback_sse41+0x1605>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20223,13 +20553,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,104,22,0,0 ; addps 0x1668(%rip),%xmm1 # 7310 <_sk_callback_sse41+0x1559>
- DB 68,15,40,13,112,22,0,0 ; movaps 0x1670(%rip),%xmm9 # 7320 <_sk_callback_sse41+0x1569>
+ DB 15,88,13,36,23,0,0 ; addps 0x1724(%rip),%xmm1 # 7590 <_sk_callback_sse41+0x1615>
+ DB 68,15,40,13,44,23,0,0 ; movaps 0x172c(%rip),%xmm9 # 75a0 <_sk_callback_sse41+0x1625>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,108,22,0,0 ; mulps 0x166c(%rip),%xmm9 # 7330 <_sk_callback_sse41+0x1579>
- DB 68,15,88,13,116,22,0,0 ; addps 0x1674(%rip),%xmm9 # 7340 <_sk_callback_sse41+0x1589>
+ DB 68,15,89,13,40,23,0,0 ; mulps 0x1728(%rip),%xmm9 # 75b0 <_sk_callback_sse41+0x1635>
+ DB 68,15,88,13,48,23,0,0 ; addps 0x1730(%rip),%xmm9 # 75c0 <_sk_callback_sse41+0x1645>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20240,16 +20570,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,98,22,0,0 ; addps 0x1662(%rip),%xmm1 # 7350 <_sk_callback_sse41+0x1599>
- DB 68,15,40,13,106,22,0,0 ; movaps 0x166a(%rip),%xmm9 # 7360 <_sk_callback_sse41+0x15a9>
+ DB 15,88,13,30,23,0,0 ; addps 0x171e(%rip),%xmm1 # 75d0 <_sk_callback_sse41+0x1655>
+ DB 68,15,40,13,38,23,0,0 ; movaps 0x1726(%rip),%xmm9 # 75e0 <_sk_callback_sse41+0x1665>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,110,22,0,0 ; movaps 0x166e(%rip),%xmm8 # 7370 <_sk_callback_sse41+0x15b9>
+ DB 68,15,40,5,42,23,0,0 ; movaps 0x172a(%rip),%xmm8 # 75f0 <_sk_callback_sse41+0x1675>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,114,22,0,0 ; addps 0x1672(%rip),%xmm8 # 7380 <_sk_callback_sse41+0x15c9>
+ DB 68,15,88,5,46,23,0,0 ; addps 0x172e(%rip),%xmm8 # 7600 <_sk_callback_sse41+0x1685>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,118,22,0,0 ; addps 0x1676(%rip),%xmm8 # 7390 <_sk_callback_sse41+0x15d9>
+ DB 68,15,88,5,50,23,0,0 ; addps 0x1732(%rip),%xmm8 # 7610 <_sk_callback_sse41+0x1695>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,122,22,0,0 ; addps 0x167a(%rip),%xmm8 # 73a0 <_sk_callback_sse41+0x15e9>
+ DB 68,15,88,5,54,23,0,0 ; addps 0x1736(%rip),%xmm8 # 7620 <_sk_callback_sse41+0x16a5>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20257,17 +20587,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse41
_sk_bicubic_p1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,116,22,0,0 ; movaps 0x1674(%rip),%xmm8 # 73b0 <_sk_callback_sse41+0x15f9>
+ DB 68,15,40,5,48,23,0,0 ; movaps 0x1730(%rip),%xmm8 # 7630 <_sk_callback_sse41+0x16b5>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,111,22,0,0 ; movaps 0x166f(%rip),%xmm10 # 73c0 <_sk_callback_sse41+0x1609>
+ DB 68,15,40,21,43,23,0,0 ; movaps 0x172b(%rip),%xmm10 # 7640 <_sk_callback_sse41+0x16c5>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,115,22,0,0 ; addps 0x1673(%rip),%xmm10 # 73d0 <_sk_callback_sse41+0x1619>
+ DB 68,15,88,21,47,23,0,0 ; addps 0x172f(%rip),%xmm10 # 7650 <_sk_callback_sse41+0x16d5>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,111,22,0,0 ; addps 0x166f(%rip),%xmm10 # 73e0 <_sk_callback_sse41+0x1629>
+ DB 68,15,88,21,43,23,0,0 ; addps 0x172b(%rip),%xmm10 # 7660 <_sk_callback_sse41+0x16e5>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20277,11 +20607,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,97,22,0,0 ; addps 0x1661(%rip),%xmm1 # 73f0 <_sk_callback_sse41+0x1639>
+ DB 15,88,13,29,23,0,0 ; addps 0x171d(%rip),%xmm1 # 7670 <_sk_callback_sse41+0x16f5>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,97,22,0,0 ; mulps 0x1661(%rip),%xmm8 # 7400 <_sk_callback_sse41+0x1649>
- DB 68,15,88,5,105,22,0,0 ; addps 0x1669(%rip),%xmm8 # 7410 <_sk_callback_sse41+0x1659>
+ DB 68,15,89,5,29,23,0,0 ; mulps 0x171d(%rip),%xmm8 # 7680 <_sk_callback_sse41+0x1705>
+ DB 68,15,88,5,37,23,0,0 ; addps 0x1725(%rip),%xmm8 # 7690 <_sk_callback_sse41+0x1715>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20511,9 +20841,9 @@ ALIGN 16
DB 128,191,0,0,224,64,0 ; cmpb $0x0,0x40e00000(%rdi)
DB 0,224 ; add %ah,%al
DB 64,0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 608c <.literal16+0x1fc>
+ DB 224,64 ; loopne 624c <.literal16+0x1fc>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 6090 <.literal16+0x200>
+ DB 224,64 ; loopne 6250 <.literal16+0x200>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -20533,13 +20863,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 60b1 <.literal16+0x221>
+ DB 71,225,61 ; rex.RXB loope 6271 <.literal16+0x221>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 60b5 <.literal16+0x225>
+ DB 71,225,61 ; rex.RXB loope 6275 <.literal16+0x225>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 60b9 <.literal16+0x229>
+ DB 71,225,61 ; rex.RXB loope 6279 <.literal16+0x229>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 60bd <.literal16+0x22d>
+ DB 71,225,61 ; rex.RXB loope 627d <.literal16+0x22d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -20564,13 +20894,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 60f1 <.literal16+0x261>
+ DB 71,225,61 ; rex.RXB loope 62b1 <.literal16+0x261>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 60f5 <.literal16+0x265>
+ DB 71,225,61 ; rex.RXB loope 62b5 <.literal16+0x265>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 60f9 <.literal16+0x269>
+ DB 71,225,61 ; rex.RXB loope 62b9 <.literal16+0x269>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 60fd <.literal16+0x26d>
+ DB 71,225,61 ; rex.RXB loope 62bd <.literal16+0x26d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -20595,13 +20925,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6131 <.literal16+0x2a1>
+ DB 71,225,61 ; rex.RXB loope 62f1 <.literal16+0x2a1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6135 <.literal16+0x2a5>
+ DB 71,225,61 ; rex.RXB loope 62f5 <.literal16+0x2a5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6139 <.literal16+0x2a9>
+ DB 71,225,61 ; rex.RXB loope 62f9 <.literal16+0x2a9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 613d <.literal16+0x2ad>
+ DB 71,225,61 ; rex.RXB loope 62fd <.literal16+0x2ad>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -20626,13 +20956,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6171 <.literal16+0x2e1>
+ DB 71,225,61 ; rex.RXB loope 6331 <.literal16+0x2e1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6175 <.literal16+0x2e5>
+ DB 71,225,61 ; rex.RXB loope 6335 <.literal16+0x2e5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6179 <.literal16+0x2e9>
+ DB 71,225,61 ; rex.RXB loope 6339 <.literal16+0x2e9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 617d <.literal16+0x2ed>
+ DB 71,225,61 ; rex.RXB loope 633d <.literal16+0x2ed>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -20649,10 +20979,10 @@ ALIGN 16
DB 0,1 ; add %al,(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006168 <_sk_callback_sse41+0xa0003b1>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006328 <_sk_callback_sse41+0xa0003ad>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006170 <_sk_callback_sse41+0x30003b9>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006330 <_sk_callback_sse41+0x30003b5>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -20671,11 +21001,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
DB 67,0,0 ; rex.XB add %al,(%r8)
- DB 127,67 ; jg 61db <.literal16+0x34b>
+ DB 127,67 ; jg 639b <.literal16+0x34b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 61df <.literal16+0x34f>
+ DB 127,67 ; jg 639f <.literal16+0x34f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 61e3 <.literal16+0x353>
+ DB 127,67 ; jg 63a3 <.literal16+0x353>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -20962,13 +21292,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6429 <.literal16+0x599>
+ DB 224,7 ; loopne 65e9 <.literal16+0x599>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 642d <.literal16+0x59d>
+ DB 224,7 ; loopne 65ed <.literal16+0x59d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6431 <.literal16+0x5a1>
+ DB 224,7 ; loopne 65f1 <.literal16+0x5a1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6435 <.literal16+0x5a5>
+ DB 224,7 ; loopne 65f5 <.literal16+0x5a5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -21002,10 +21332,10 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006478 <_sk_callback_sse41+0xa0006c1>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a006638 <_sk_callback_sse41+0xa0006bd>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006480 <_sk_callback_sse41+0x30006c9>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006640 <_sk_callback_sse41+0x30006c5>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -21060,11 +21390,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 654b <.literal16+0x6bb>
+ DB 127,67 ; jg 670b <.literal16+0x6bb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 654f <.literal16+0x6bf>
+ DB 127,67 ; jg 670f <.literal16+0x6bf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6553 <.literal16+0x6c3>
+ DB 127,67 ; jg 6713 <.literal16+0x6c3>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax)
@@ -21079,16 +21409,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6544 <.literal16+0x6b4>
+ DB 127,0 ; jg 6704 <.literal16+0x6b4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6548 <.literal16+0x6b8>
+ DB 127,0 ; jg 6708 <.literal16+0x6b8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 654c <.literal16+0x6bc>
+ DB 127,0 ; jg 670c <.literal16+0x6bc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6550 <.literal16+0x6c0>
+ DB 127,0 ; jg 6710 <.literal16+0x6c0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -21097,7 +21427,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 65d5 <.literal16+0x745>
+ DB 119,115 ; ja 6795 <.literal16+0x745>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -21108,7 +21438,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6539 <.literal16+0x6a9>
+ DB 117,191 ; jne 66f9 <.literal16+0x6a9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -21120,7 +21450,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3a57a <_sk_callback_sse41+0xffffffffe9a347c3>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3a73a <_sk_callback_sse41+0xffffffffe9a347bf>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -21175,16 +21505,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6614 <.literal16+0x784>
+ DB 127,0 ; jg 67d4 <.literal16+0x784>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6618 <.literal16+0x788>
+ DB 127,0 ; jg 67d8 <.literal16+0x788>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 661c <.literal16+0x78c>
+ DB 127,0 ; jg 67dc <.literal16+0x78c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6620 <.literal16+0x790>
+ DB 127,0 ; jg 67e0 <.literal16+0x790>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -21193,7 +21523,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 66a5 <.literal16+0x815>
+ DB 119,115 ; ja 6865 <.literal16+0x815>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -21204,7 +21534,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6609 <.literal16+0x779>
+ DB 117,191 ; jne 67c9 <.literal16+0x779>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -21216,7 +21546,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3a64a <_sk_callback_sse41+0xffffffffe9a34893>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3a80a <_sk_callback_sse41+0xffffffffe9a3488f>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -21271,16 +21601,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 66e4 <.literal16+0x854>
+ DB 127,0 ; jg 68a4 <.literal16+0x854>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 66e8 <.literal16+0x858>
+ DB 127,0 ; jg 68a8 <.literal16+0x858>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 66ec <.literal16+0x85c>
+ DB 127,0 ; jg 68ac <.literal16+0x85c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 66f0 <.literal16+0x860>
+ DB 127,0 ; jg 68b0 <.literal16+0x860>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -21289,7 +21619,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6775 <.literal16+0x8e5>
+ DB 119,115 ; ja 6935 <.literal16+0x8e5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -21300,7 +21630,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 66d9 <.literal16+0x849>
+ DB 117,191 ; jne 6899 <.literal16+0x849>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -21312,7 +21642,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3a71a <_sk_callback_sse41+0xffffffffe9a34963>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3a8da <_sk_callback_sse41+0xffffffffe9a3495f>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -21367,16 +21697,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 67b4 <.literal16+0x924>
+ DB 127,0 ; jg 6974 <.literal16+0x924>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 67b8 <.literal16+0x928>
+ DB 127,0 ; jg 6978 <.literal16+0x928>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 67bc <.literal16+0x92c>
+ DB 127,0 ; jg 697c <.literal16+0x92c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 67c0 <.literal16+0x930>
+ DB 127,0 ; jg 6980 <.literal16+0x930>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -21385,7 +21715,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6845 <.literal16+0x9b5>
+ DB 119,115 ; ja 6a05 <.literal16+0x9b5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -21396,7 +21726,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 67a9 <.literal16+0x919>
+ DB 117,191 ; jne 6969 <.literal16+0x919>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -21408,7 +21738,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3a7ea <_sk_callback_sse41+0xffffffffe9a34a33>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3a9aa <_sk_callback_sse41+0xffffffffe9a34a2f>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -21454,18 +21784,108 @@ ALIGN 16
DB 63 ; (bad)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
- DB 0,200 ; add %cl,%al
- DB 66,0,0 ; rex.X add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 52,0 ; xor $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 52,0 ; xor $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 52,0 ; xor $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 52,255 ; xor $0xff,%al
+ DB 255 ; (bad)
+ DB 127,0 ; jg 6a44 <.literal16+0x9f4>
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 6a48 <.literal16+0x9f8>
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 6a4c <.literal16+0x9fc>
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 6a50 <.literal16+0xa00>
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 119,115 ; ja 6ad5 <.literal16+0xa85>
+ DB 248 ; clc
+ DB 194,119,115 ; retq $0x7377
+ DB 248 ; clc
+ DB 194,119,115 ; retq $0x7377
+ DB 248 ; clc
+ DB 194,119,115 ; retq $0x7377
+ DB 248 ; clc
+ DB 194,117,191 ; retq $0xbf75
+ DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
+ DB 63 ; (bad)
+ DB 117,191 ; jne 6a39 <.literal16+0x9e9>
+ DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
+ DB 63 ; (bad)
+ DB 249 ; stc
+ DB 68,180,62 ; rex.R mov $0x3e,%spl
+ DB 249 ; stc
+ DB 68,180,62 ; rex.R mov $0x3e,%spl
+ DB 249 ; stc
+ DB 68,180,62 ; rex.R mov $0x3e,%spl
+ DB 249 ; stc
+ DB 68,180,62 ; rex.R mov $0x3e,%spl
+ DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3aa7a <_sk_callback_sse41+0xffffffffe9a34aff>
+ DB 220,63 ; fdivrl (%rdi)
+ DB 81 ; push %rcx
+ DB 140,242 ; mov %?,%edx
+ DB 66,81 ; rex.X push %rcx
+ DB 140,242 ; mov %?,%edx
+ DB 66,81 ; rex.X push %rcx
+ DB 140,242 ; mov %?,%edx
+ DB 66,81 ; rex.X push %rcx
+ DB 140,242 ; mov %?,%edx
+ DB 66,141,188,190,63,141,188,190 ; lea -0x414372c1(%rsi,%r15,4),%edi
+ DB 63 ; (bad)
+ DB 141,188,190,63,141,188,190 ; lea -0x414372c1(%rsi,%rdi,4),%edi
+ DB 63 ; (bad)
+ DB 248 ; clc
+ DB 245 ; cmc
+ DB 154 ; (bad)
+ DB 64,248 ; rex clc
+ DB 245 ; cmc
+ DB 154 ; (bad)
+ DB 64,248 ; rex clc
+ DB 245 ; cmc
+ DB 154 ; (bad)
+ DB 64,248 ; rex clc
+ DB 245 ; cmc
+ DB 154 ; (bad)
+ DB 64,254 ; rex (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,254 ; rex.B (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,254 ; rex.B (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,254 ; rex.B (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,0,0 ; add %al,(%r8)
+ DB 0,75,0 ; add %cl,0x0(%rbx)
+ DB 0,0 ; add %al,(%rax)
+ DB 75,0,0 ; rex.WXB add %al,(%r8)
+ DB 0,75,0 ; add %cl,0x0(%rbx)
+ DB 0,0 ; add %al,(%rax)
+ DB 75,0,0 ; rex.WXB add %al,(%r8)
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
- DB 127,67 ; jg 68c7 <.literal16+0xa37>
+ DB 200,66,0,0 ; enterq $0x42,$0x0
+ DB 127,67 ; jg 6b47 <.literal16+0xaf7>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 68cb <.literal16+0xa3b>
+ DB 127,67 ; jg 6b4b <.literal16+0xafb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 68cf <.literal16+0xa3f>
+ DB 127,67 ; jg 6b4f <.literal16+0xaff>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 68d3 <.literal16+0xa43>
+ DB 127,67 ; jg 6b53 <.literal16+0xb03>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -21512,16 +21932,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6953 <.literal16+0xac3>
+ DB 118,63 ; jbe 6bd3 <.literal16+0xb83>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6957 <.literal16+0xac7>
+ DB 118,63 ; jbe 6bd7 <.literal16+0xb87>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 695b <.literal16+0xacb>
+ DB 118,63 ; jbe 6bdb <.literal16+0xb8b>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 695f <.literal16+0xacf>
+ DB 118,63 ; jbe 6bdf <.literal16+0xb8f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -21550,11 +21970,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 69cb <.literal16+0xb3b>
+ DB 127,67 ; jg 6c4b <.literal16+0xbfb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 69cf <.literal16+0xb3f>
+ DB 127,67 ; jg 6c4f <.literal16+0xbff>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 69d3 <.literal16+0xb43>
+ DB 127,67 ; jg 6c53 <.literal16+0xc03>
DB 0,4,0 ; add %al,(%rax,%rax,1)
DB 0,0 ; add %al,(%rax)
DB 0,0 ; add %al,(%rax)
@@ -21614,13 +22034,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6a49 <.literal16+0xbb9>
+ DB 224,7 ; loopne 6cc9 <.literal16+0xc79>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6a4d <.literal16+0xbbd>
+ DB 224,7 ; loopne 6ccd <.literal16+0xc7d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6a51 <.literal16+0xbc1>
+ DB 224,7 ; loopne 6cd1 <.literal16+0xc81>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6a55 <.literal16+0xbc5>
+ DB 224,7 ; loopne 6cd5 <.literal16+0xc85>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -21666,13 +22086,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6ab9 <.literal16+0xc29>
+ DB 224,7 ; loopne 6d39 <.literal16+0xce9>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6abd <.literal16+0xc2d>
+ DB 224,7 ; loopne 6d3d <.literal16+0xced>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6ac1 <.literal16+0xc31>
+ DB 224,7 ; loopne 6d41 <.literal16+0xcf1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6ac5 <.literal16+0xc35>
+ DB 224,7 ; loopne 6d45 <.literal16+0xcf5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -21718,13 +22138,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6b29 <.literal16+0xc99>
+ DB 224,7 ; loopne 6da9 <.literal16+0xd59>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6b2d <.literal16+0xc9d>
+ DB 224,7 ; loopne 6dad <.literal16+0xd5d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6b31 <.literal16+0xca1>
+ DB 224,7 ; loopne 6db1 <.literal16+0xd61>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6b35 <.literal16+0xca5>
+ DB 224,7 ; loopne 6db5 <.literal16+0xd65>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -21762,13 +22182,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 6bc6 <.literal16+0xd36>
+ DB 124,66 ; jl 6e46 <.literal16+0xdf6>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 6bca <.literal16+0xd3a>
+ DB 124,66 ; jl 6e4a <.literal16+0xdfa>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 6bce <.literal16+0xd3e>
+ DB 124,66 ; jl 6e4e <.literal16+0xdfe>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 6bd2 <.literal16+0xd42>
+ DB 124,66 ; jl 6e52 <.literal16+0xe02>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -21902,13 +22322,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 6d55 <.literal16+0xec5>
+ DB 112,65 ; jo 6fd5 <.literal16+0xf85>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 6d59 <.literal16+0xec9>
+ DB 112,65 ; jo 6fd9 <.literal16+0xf89>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 6d5d <.literal16+0xecd>
+ DB 112,65 ; jo 6fdd <.literal16+0xf8d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 6d61 <.literal16+0xed1>
+ DB 112,65 ; jo 6fe1 <.literal16+0xf91>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -21923,7 +22343,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006d50 <_sk_callback_sse41+0x3000f99>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006fd0 <_sk_callback_sse41+0x3001055>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -21950,7 +22370,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006d90 <_sk_callback_sse41+0x3000fd9>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3007010 <_sk_callback_sse41+0x3001095>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -21977,7 +22397,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006dd0 <_sk_callback_sse41+0x3001019>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3007050 <_sk_callback_sse41+0x30010d5>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -21992,11 +22412,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6e2b <.literal16+0xf9b>
+ DB 127,67 ; jg 70ab <.literal16+0x105b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6e2f <.literal16+0xf9f>
+ DB 127,67 ; jg 70af <.literal16+0x105f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6e33 <.literal16+0xfa3>
+ DB 127,67 ; jg 70b3 <.literal16+0x1063>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -22011,7 +22431,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006e20 <_sk_callback_sse41+0x3001069>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30070a0 <_sk_callback_sse41+0x3001125>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -22038,7 +22458,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006e60 <_sk_callback_sse41+0x30010a9>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30070e0 <_sk_callback_sse41+0x3001165>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -22065,7 +22485,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3006ea0 <_sk_callback_sse41+0x30010e9>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3007120 <_sk_callback_sse41+0x30011a5>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -22080,11 +22500,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6efb <.literal16+0x106b>
+ DB 127,67 ; jg 717b <.literal16+0x112b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6eff <.literal16+0x106f>
+ DB 127,67 ; jg 717f <.literal16+0x112f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6f03 <.literal16+0x1073>
+ DB 127,67 ; jg 7183 <.literal16+0x1133>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -22179,13 +22599,13 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 6ffb <.literal16+0x116b>
+ DB 127,71 ; jg 727b <.literal16+0x122b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 6fff <.literal16+0x116f>
+ DB 127,71 ; jg 727f <.literal16+0x122f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 7003 <.literal16+0x1173>
+ DB 127,71 ; jg 7283 <.literal16+0x1233>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 7007 <.literal16+0x1177>
+ DB 127,71 ; jg 7287 <.literal16+0x1237>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -22231,10 +22651,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc0813a <_sk_callback_sse41+0x2dc02383>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc083ba <_sk_callback_sse41+0x2dc0243f>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 706c <.literal16+0x11dc>
+ DB 120,57 ; js 72ec <.literal16+0x129c>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -22415,11 +22835,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 7242 <.literal16+0x13b2>
+ DB 62,114,28 ; jb,pt 74c2 <.literal16+0x1472>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7246 <.literal16+0x13b6>
+ DB 62,114,28 ; jb,pt 74c6 <.literal16+0x1476>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 724a <.literal16+0x13ba>
+ DB 62,114,28 ; jb,pt 74ca <.literal16+0x147a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -22463,7 +22883,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6400d5 <_sk_callback_sse41+0x3d63a31e>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640355 <_sk_callback_sse41+0x3d63a3da>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -22489,7 +22909,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640115 <_sk_callback_sse41+0x3d63a35e>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640395 <_sk_callback_sse41+0x3d63a41a>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -22498,13 +22918,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 730e <.literal16+0x147e>
+ DB 114,28 ; jb 758e <.literal16+0x153e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7312 <.literal16+0x1482>
+ DB 62,114,28 ; jb,pt 7592 <.literal16+0x1542>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7316 <.literal16+0x1486>
+ DB 62,114,28 ; jb,pt 7596 <.literal16+0x1546>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 731a <.literal16+0x148a>
+ DB 62,114,28 ; jb,pt 759a <.literal16+0x154a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -22525,11 +22945,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 7352 <.literal16+0x14c2>
+ DB 62,114,28 ; jb,pt 75d2 <.literal16+0x1582>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7356 <.literal16+0x14c6>
+ DB 62,114,28 ; jb,pt 75d6 <.literal16+0x1586>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 735a <.literal16+0x14ca>
+ DB 62,114,28 ; jb,pt 75da <.literal16+0x158a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -22573,7 +22993,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6401e5 <_sk_callback_sse41+0x3d63a42e>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640465 <_sk_callback_sse41+0x3d63a4ea>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -22599,7 +23019,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640225 <_sk_callback_sse41+0x3d63a46e>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6404a5 <_sk_callback_sse41+0x3d63a52a>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -22608,13 +23028,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 741e <.literal16+0x158e>
+ DB 114,28 ; jb 769e <.literal16+0x164e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7422 <_sk_callback_sse41+0x166b>
+ DB 62,114,28 ; jb,pt 76a2 <_sk_callback_sse41+0x1727>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7426 <_sk_callback_sse41+0x166f>
+ DB 62,114,28 ; jb,pt 76a6 <_sk_callback_sse41+0x172b>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 742a <_sk_callback_sse41+0x1673>
+ DB 62,114,28 ; jb,pt 76aa <_sk_callback_sse41+0x172f>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -22722,7 +23142,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,11,98,0,0 ; movaps 0x620b(%rip),%xmm2 # 6360 <_sk_callback_sse2+0xd8>
+ DB 15,40,21,251,99,0,0 ; movaps 0x63fb(%rip),%xmm2 # 6550 <_sk_callback_sse2+0xce>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -22731,7 +23151,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,250,97,0,0 ; movaps 0x61fa(%rip),%xmm2 # 6370 <_sk_callback_sse2+0xe8>
+ DB 15,40,21,234,99,0,0 ; movaps 0x63ea(%rip),%xmm2 # 6560 <_sk_callback_sse2+0xde>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -22749,14 +23169,14 @@ _sk_dither_sse2 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,200,97,0,0 ; movdqa 0x61c8(%rip),%xmm10 # 6380 <_sk_callback_sse2+0xf8>
+ DB 102,68,15,111,21,184,99,0,0 ; movdqa 0x63b8(%rip),%xmm10 # 6570 <_sk_callback_sse2+0xee>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,180,97,0,0 ; movdqa 0x61b4(%rip),%xmm12 # 6390 <_sk_callback_sse2+0x108>
- DB 102,68,15,111,45,187,97,0,0 ; movdqa 0x61bb(%rip),%xmm13 # 63a0 <_sk_callback_sse2+0x118>
+ DB 102,68,15,111,37,164,99,0,0 ; movdqa 0x63a4(%rip),%xmm12 # 6580 <_sk_callback_sse2+0xfe>
+ DB 102,68,15,111,45,171,99,0,0 ; movdqa 0x63ab(%rip),%xmm13 # 6590 <_sk_callback_sse2+0x10e>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -22772,8 +23192,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,118,97,0,0 ; mulps 0x6176(%rip),%xmm8 # 63b0 <_sk_callback_sse2+0x128>
- DB 68,15,88,5,126,97,0,0 ; addps 0x617e(%rip),%xmm8 # 63c0 <_sk_callback_sse2+0x138>
+ DB 68,15,89,5,102,99,0,0 ; mulps 0x6366(%rip),%xmm8 # 65a0 <_sk_callback_sse2+0x11e>
+ DB 68,15,88,5,110,99,0,0 ; addps 0x636e(%rip),%xmm8 # 65b0 <_sk_callback_sse2+0x12e>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -22811,7 +23231,7 @@ _sk_uniform_color_sse2 LABEL PROC
PUBLIC _sk_black_color_sse2
_sk_black_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,20,97,0,0 ; movaps 0x6114(%rip),%xmm3 # 63d0 <_sk_callback_sse2+0x148>
+ DB 15,40,29,4,99,0,0 ; movaps 0x6304(%rip),%xmm3 # 65c0 <_sk_callback_sse2+0x13e>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -22820,7 +23240,7 @@ _sk_black_color_sse2 LABEL PROC
PUBLIC _sk_white_color_sse2
_sk_white_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,16,97,0,0 ; movaps 0x6110(%rip),%xmm0 # 63e0 <_sk_callback_sse2+0x158>
+ DB 15,40,5,0,99,0,0 ; movaps 0x6300(%rip),%xmm0 # 65d0 <_sk_callback_sse2+0x14e>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -22858,7 +23278,7 @@ _sk_clear_sse2 LABEL PROC
PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,208,96,0,0 ; movaps 0x60d0(%rip),%xmm8 # 63f0 <_sk_callback_sse2+0x168>
+ DB 68,15,40,5,192,98,0,0 ; movaps 0x62c0(%rip),%xmm8 # 65e0 <_sk_callback_sse2+0x15e>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -22881,7 +23301,7 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,147,96,0,0 ; movaps 0x6093(%rip),%xmm9 # 6400 <_sk_callback_sse2+0x178>
+ DB 68,15,40,13,131,98,0,0 ; movaps 0x6283(%rip),%xmm9 # 65f0 <_sk_callback_sse2+0x16e>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -22922,7 +23342,7 @@ _sk_dstin_sse2 LABEL PROC
PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
- DB 68,15,40,5,55,96,0,0 ; movaps 0x6037(%rip),%xmm8 # 6410 <_sk_callback_sse2+0x188>
+ DB 68,15,40,5,39,98,0,0 ; movaps 0x6227(%rip),%xmm8 # 6600 <_sk_callback_sse2+0x17e>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -22933,7 +23353,7 @@ _sk_srcout_sse2 LABEL PROC
PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
- DB 68,15,40,5,39,96,0,0 ; movaps 0x6027(%rip),%xmm8 # 6420 <_sk_callback_sse2+0x198>
+ DB 68,15,40,5,23,98,0,0 ; movaps 0x6217(%rip),%xmm8 # 6610 <_sk_callback_sse2+0x18e>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -22948,7 +23368,7 @@ _sk_dstout_sse2 LABEL PROC
PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
- DB 68,15,40,5,10,96,0,0 ; movaps 0x600a(%rip),%xmm8 # 6430 <_sk_callback_sse2+0x1a8>
+ DB 68,15,40,5,250,97,0,0 ; movaps 0x61fa(%rip),%xmm8 # 6620 <_sk_callback_sse2+0x19e>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -22966,7 +23386,7 @@ _sk_srcover_sse2 LABEL PROC
PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
- DB 68,15,40,5,222,95,0,0 ; movaps 0x5fde(%rip),%xmm8 # 6440 <_sk_callback_sse2+0x1b8>
+ DB 68,15,40,5,206,97,0,0 ; movaps 0x61ce(%rip),%xmm8 # 6630 <_sk_callback_sse2+0x1ae>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -22990,7 +23410,7 @@ _sk_modulate_sse2 LABEL PROC
PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
- DB 68,15,40,5,178,95,0,0 ; movaps 0x5fb2(%rip),%xmm8 # 6450 <_sk_callback_sse2+0x1c8>
+ DB 68,15,40,5,162,97,0,0 ; movaps 0x61a2(%rip),%xmm8 # 6640 <_sk_callback_sse2+0x1be>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -23059,7 +23479,7 @@ _sk_screen_sse2 LABEL PROC
PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,231,94,0,0 ; movaps 0x5ee7(%rip),%xmm3 # 6460 <_sk_callback_sse2+0x1d8>
+ DB 15,40,29,215,96,0,0 ; movaps 0x60d7(%rip),%xmm3 # 6650 <_sk_callback_sse2+0x1ce>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -23105,7 +23525,7 @@ _sk_darken_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,82,94,0,0 ; movaps 0x5e52(%rip),%xmm2 # 6470 <_sk_callback_sse2+0x1e8>
+ DB 15,40,21,66,96,0,0 ; movaps 0x6042(%rip),%xmm2 # 6660 <_sk_callback_sse2+0x1de>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -23137,7 +23557,7 @@ _sk_lighten_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,247,93,0,0 ; movaps 0x5df7(%rip),%xmm2 # 6480 <_sk_callback_sse2+0x1f8>
+ DB 15,40,21,231,95,0,0 ; movaps 0x5fe7(%rip),%xmm2 # 6670 <_sk_callback_sse2+0x1ee>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -23172,7 +23592,7 @@ _sk_difference_sse2 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,145,93,0,0 ; movaps 0x5d91(%rip),%xmm2 # 6490 <_sk_callback_sse2+0x208>
+ DB 15,40,21,129,95,0,0 ; movaps 0x5f81(%rip),%xmm2 # 6680 <_sk_callback_sse2+0x1fe>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -23198,7 +23618,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,81,93,0,0 ; movaps 0x5d51(%rip),%xmm2 # 64a0 <_sk_callback_sse2+0x218>
+ DB 15,40,21,65,95,0,0 ; movaps 0x5f41(%rip),%xmm2 # 6690 <_sk_callback_sse2+0x20e>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -23209,7 +23629,7 @@ _sk_exclusion_sse2 LABEL PROC
PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,68,93,0,0 ; movaps 0x5d44(%rip),%xmm10 # 64b0 <_sk_callback_sse2+0x228>
+ DB 68,15,40,21,52,95,0,0 ; movaps 0x5f34(%rip),%xmm10 # 66a0 <_sk_callback_sse2+0x21e>
DB 69,15,40,202 ; movaps %xmm10,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,217 ; movaps %xmm9,%xmm11
@@ -23301,7 +23721,7 @@ _sk_colorburn_sse2 LABEL PROC
PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,250,91,0,0 ; movaps 0x5bfa(%rip),%xmm10 # 64c0 <_sk_callback_sse2+0x238>
+ DB 68,15,40,21,234,93,0,0 ; movaps 0x5dea(%rip),%xmm10 # 66b0 <_sk_callback_sse2+0x22e>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -23394,7 +23814,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,41,52,36 ; movaps %xmm6,(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 68,15,40,29,172,90,0,0 ; movaps 0x5aac(%rip),%xmm11 # 64d0 <_sk_callback_sse2+0x248>
+ DB 68,15,40,29,156,92,0,0 ; movaps 0x5c9c(%rip),%xmm11 # 66c0 <_sk_callback_sse2+0x23e>
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,194 ; movaps %xmm10,%xmm8
@@ -23481,7 +23901,7 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 68,15,40,193 ; movaps %xmm1,%xmm8
DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,40,13,119,89,0,0 ; movaps 0x5977(%rip),%xmm9 # 64e0 <_sk_callback_sse2+0x258>
+ DB 68,15,40,13,103,91,0,0 ; movaps 0x5b67(%rip),%xmm9 # 66d0 <_sk_callback_sse2+0x24e>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -23571,7 +23991,7 @@ _sk_softlight_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 68,15,94,215 ; divps %xmm7,%xmm10
DB 69,15,84,212 ; andps %xmm12,%xmm10
- DB 68,15,40,13,49,88,0,0 ; movaps 0x5831(%rip),%xmm9 # 64f0 <_sk_callback_sse2+0x268>
+ DB 68,15,40,13,33,90,0,0 ; movaps 0x5a21(%rip),%xmm9 # 66e0 <_sk_callback_sse2+0x25e>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,92,250 ; subps %xmm10,%xmm15
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -23584,10 +24004,10 @@ _sk_softlight_sse2 LABEL PROC
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,53,11,88,0,0 ; movaps 0x580b(%rip),%xmm14 # 6500 <_sk_callback_sse2+0x278>
+ DB 68,15,40,53,251,89,0,0 ; movaps 0x59fb(%rip),%xmm14 # 66f0 <_sk_callback_sse2+0x26e>
DB 69,15,88,222 ; addps %xmm14,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
- DB 68,15,40,21,11,88,0,0 ; movaps 0x580b(%rip),%xmm10 # 6510 <_sk_callback_sse2+0x288>
+ DB 68,15,40,21,251,89,0,0 ; movaps 0x59fb(%rip),%xmm10 # 6700 <_sk_callback_sse2+0x27e>
DB 69,15,89,234 ; mulps %xmm10,%xmm13
DB 69,15,88,235 ; addps %xmm11,%xmm13
DB 15,88,228 ; addps %xmm4,%xmm4
@@ -23732,7 +24152,7 @@ _sk_hue_sse2 LABEL PROC
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,40,5,71,86,0,0 ; movaps 0x5647(%rip),%xmm8 # 6550 <_sk_callback_sse2+0x2c8>
+ DB 68,15,40,5,55,88,0,0 ; movaps 0x5837(%rip),%xmm8 # 6740 <_sk_callback_sse2+0x2be>
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 15,40,207 ; movaps %xmm7,%xmm1
DB 68,15,92,217 ; subps %xmm1,%xmm11
@@ -23780,12 +24200,12 @@ _sk_hue_sse2 LABEL PROC
DB 69,15,84,206 ; andps %xmm14,%xmm9
DB 69,15,84,214 ; andps %xmm14,%xmm10
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,61,84,85,0,0 ; movaps 0x5554(%rip),%xmm15 # 6520 <_sk_callback_sse2+0x298>
+ DB 68,15,40,61,68,87,0,0 ; movaps 0x5744(%rip),%xmm15 # 6710 <_sk_callback_sse2+0x28e>
DB 65,15,89,231 ; mulps %xmm15,%xmm4
- DB 15,40,5,89,85,0,0 ; movaps 0x5559(%rip),%xmm0 # 6530 <_sk_callback_sse2+0x2a8>
+ DB 15,40,5,73,87,0,0 ; movaps 0x5749(%rip),%xmm0 # 6720 <_sk_callback_sse2+0x29e>
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
- DB 68,15,40,53,91,85,0,0 ; movaps 0x555b(%rip),%xmm14 # 6540 <_sk_callback_sse2+0x2b8>
+ DB 68,15,40,53,75,87,0,0 ; movaps 0x574b(%rip),%xmm14 # 6730 <_sk_callback_sse2+0x2ae>
DB 68,15,40,239 ; movaps %xmm7,%xmm13
DB 69,15,89,238 ; mulps %xmm14,%xmm13
DB 68,15,88,238 ; addps %xmm6,%xmm13
@@ -23963,14 +24383,14 @@ _sk_saturation_sse2 LABEL PROC
DB 68,15,84,211 ; andps %xmm3,%xmm10
DB 68,15,84,203 ; andps %xmm3,%xmm9
DB 15,84,195 ; andps %xmm3,%xmm0
- DB 68,15,40,5,232,82,0,0 ; movaps 0x52e8(%rip),%xmm8 # 6560 <_sk_callback_sse2+0x2d8>
+ DB 68,15,40,5,216,84,0,0 ; movaps 0x54d8(%rip),%xmm8 # 6750 <_sk_callback_sse2+0x2ce>
DB 15,40,214 ; movaps %xmm6,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 15,40,13,234,82,0,0 ; movaps 0x52ea(%rip),%xmm1 # 6570 <_sk_callback_sse2+0x2e8>
+ DB 15,40,13,218,84,0,0 ; movaps 0x54da(%rip),%xmm1 # 6760 <_sk_callback_sse2+0x2de>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,217 ; mulps %xmm1,%xmm3
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 68,15,40,37,233,82,0,0 ; movaps 0x52e9(%rip),%xmm12 # 6580 <_sk_callback_sse2+0x2f8>
+ DB 68,15,40,37,217,84,0,0 ; movaps 0x54d9(%rip),%xmm12 # 6770 <_sk_callback_sse2+0x2ee>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
DB 65,15,40,210 ; movaps %xmm10,%xmm2
@@ -24015,7 +24435,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,40,223 ; movaps %xmm7,%xmm3
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 68,15,40,5,78,82,0,0 ; movaps 0x524e(%rip),%xmm8 # 6590 <_sk_callback_sse2+0x308>
+ DB 68,15,40,5,62,84,0,0 ; movaps 0x543e(%rip),%xmm8 # 6780 <_sk_callback_sse2+0x2fe>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 15,88,253 ; addps %xmm5,%xmm7
@@ -24116,14 +24536,14 @@ _sk_color_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 68,15,40,45,230,80,0,0 ; movaps 0x50e6(%rip),%xmm13 # 65a0 <_sk_callback_sse2+0x318>
+ DB 68,15,40,45,214,82,0,0 ; movaps 0x52d6(%rip),%xmm13 # 6790 <_sk_callback_sse2+0x30e>
DB 68,15,40,198 ; movaps %xmm6,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,40,53,230,80,0,0 ; movaps 0x50e6(%rip),%xmm14 # 65b0 <_sk_callback_sse2+0x328>
+ DB 68,15,40,53,214,82,0,0 ; movaps 0x52d6(%rip),%xmm14 # 67a0 <_sk_callback_sse2+0x31e>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,29,226,80,0,0 ; movaps 0x50e2(%rip),%xmm11 # 65c0 <_sk_callback_sse2+0x338>
+ DB 68,15,40,29,210,82,0,0 ; movaps 0x52d2(%rip),%xmm11 # 67b0 <_sk_callback_sse2+0x32e>
DB 69,15,89,227 ; mulps %xmm11,%xmm12
DB 68,15,88,224 ; addps %xmm0,%xmm12
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -24131,7 +24551,7 @@ _sk_color_sse2 LABEL PROC
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 68,15,40,5,206,80,0,0 ; movaps 0x50ce(%rip),%xmm8 # 65d0 <_sk_callback_sse2+0x348>
+ DB 68,15,40,5,190,82,0,0 ; movaps 0x52be(%rip),%xmm8 # 67c0 <_sk_callback_sse2+0x33e>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
DB 15,89,252 ; mulps %xmm4,%xmm7
@@ -24267,15 +24687,15 @@ _sk_luminosity_sse2 LABEL PROC
DB 68,15,40,205 ; movaps %xmm5,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 68,15,40,37,224,78,0,0 ; movaps 0x4ee0(%rip),%xmm12 # 65e0 <_sk_callback_sse2+0x358>
+ DB 68,15,40,37,208,80,0,0 ; movaps 0x50d0(%rip),%xmm12 # 67d0 <_sk_callback_sse2+0x34e>
DB 68,15,40,199 ; movaps %xmm7,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,224,78,0,0 ; movaps 0x4ee0(%rip),%xmm13 # 65f0 <_sk_callback_sse2+0x368>
+ DB 68,15,40,45,208,80,0,0 ; movaps 0x50d0(%rip),%xmm13 # 67e0 <_sk_callback_sse2+0x35e>
DB 68,15,40,241 ; movaps %xmm1,%xmm14
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 69,15,88,240 ; addps %xmm8,%xmm14
- DB 68,15,40,29,220,78,0,0 ; movaps 0x4edc(%rip),%xmm11 # 6600 <_sk_callback_sse2+0x378>
- DB 68,15,40,5,228,78,0,0 ; movaps 0x4ee4(%rip),%xmm8 # 6610 <_sk_callback_sse2+0x388>
+ DB 68,15,40,29,204,80,0,0 ; movaps 0x50cc(%rip),%xmm11 # 67f0 <_sk_callback_sse2+0x36e>
+ DB 68,15,40,5,212,80,0,0 ; movaps 0x50d4(%rip),%xmm8 # 6800 <_sk_callback_sse2+0x37e>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 68,15,92,248 ; subps %xmm0,%xmm15
@@ -24418,7 +24838,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,133,228,0,0,0 ; jne 1a19 <_sk_srcover_rgba_8888_sse2+0x104>
DB 243,69,15,111,4,129 ; movdqu (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,53,218,76,0,0 ; movdqa 0x4cda(%rip),%xmm6 # 6620 <_sk_callback_sse2+0x398>
+ DB 102,15,111,53,202,78,0,0 ; movdqa 0x4eca(%rip),%xmm6 # 6810 <_sk_callback_sse2+0x38e>
DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
@@ -24432,9 +24852,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7
- DB 68,15,40,5,170,76,0,0 ; movaps 0x4caa(%rip),%xmm8 # 6630 <_sk_callback_sse2+0x3a8>
+ DB 68,15,40,5,154,78,0,0 ; movaps 0x4e9a(%rip),%xmm8 # 6820 <_sk_callback_sse2+0x39e>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,174,76,0,0 ; movaps 0x4cae(%rip),%xmm12 # 6640 <_sk_callback_sse2+0x3b8>
+ DB 68,15,40,37,158,78,0,0 ; movaps 0x4e9e(%rip),%xmm12 # 6830 <_sk_callback_sse2+0x3ae>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24510,7 +24930,7 @@ _sk_clamp_0_sse2 LABEL PROC
PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
- DB 68,15,40,5,154,75,0,0 ; movaps 0x4b9a(%rip),%xmm8 # 6650 <_sk_callback_sse2+0x3c8>
+ DB 68,15,40,5,138,77,0,0 ; movaps 0x4d8a(%rip),%xmm8 # 6840 <_sk_callback_sse2+0x3be>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -24520,7 +24940,7 @@ _sk_clamp_1_sse2 LABEL PROC
PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
- DB 15,93,29,143,75,0,0 ; minps 0x4b8f(%rip),%xmm3 # 6660 <_sk_callback_sse2+0x3d8>
+ DB 15,93,29,127,77,0,0 ; minps 0x4d7f(%rip),%xmm3 # 6850 <_sk_callback_sse2+0x3ce>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -24529,7 +24949,7 @@ _sk_clamp_a_sse2 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse2
_sk_clamp_a_dst_sse2 LABEL PROC
- DB 15,93,61,139,75,0,0 ; minps 0x4b8b(%rip),%xmm7 # 6670 <_sk_callback_sse2+0x3e8>
+ DB 15,93,61,123,77,0,0 ; minps 0x4d7b(%rip),%xmm7 # 6860 <_sk_callback_sse2+0x3de>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -24558,7 +24978,7 @@ _sk_swap_rb_sse2 LABEL PROC
PUBLIC _sk_invert_sse2
_sk_invert_sse2 LABEL PROC
- DB 68,15,40,5,87,75,0,0 ; movaps 0x4b57(%rip),%xmm8 # 6680 <_sk_callback_sse2+0x3f8>
+ DB 68,15,40,5,71,77,0,0 ; movaps 0x4d47(%rip),%xmm8 # 6870 <_sk_callback_sse2+0x3ee>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -24610,7 +25030,7 @@ _sk_premul_dst_sse2 LABEL PROC
PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,241,74,0,0 ; movaps 0x4af1(%rip),%xmm9 # 6690 <_sk_callback_sse2+0x408>
+ DB 68,15,40,13,225,76,0,0 ; movaps 0x4ce1(%rip),%xmm9 # 6880 <_sk_callback_sse2+0x3fe>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -24622,20 +25042,20 @@ _sk_unpremul_sse2 LABEL PROC
PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
- DB 68,15,40,5,220,74,0,0 ; movaps 0x4adc(%rip),%xmm8 # 66a0 <_sk_callback_sse2+0x418>
+ DB 68,15,40,5,204,76,0,0 ; movaps 0x4ccc(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x40e>
DB 68,15,40,232 ; movaps %xmm0,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,216 ; movaps %xmm0,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,212,74,0,0 ; movaps 0x4ad4(%rip),%xmm9 # 66b0 <_sk_callback_sse2+0x428>
+ DB 68,15,40,13,196,76,0,0 ; movaps 0x4cc4(%rip),%xmm9 # 68a0 <_sk_callback_sse2+0x41e>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,212,74,0,0 ; movaps 0x4ad4(%rip),%xmm10 # 66c0 <_sk_callback_sse2+0x438>
+ DB 68,15,40,21,196,76,0,0 ; movaps 0x4cc4(%rip),%xmm10 # 68b0 <_sk_callback_sse2+0x42e>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,212,74,0,0 ; movaps 0x4ad4(%rip),%xmm11 # 66d0 <_sk_callback_sse2+0x448>
+ DB 68,15,40,29,196,76,0,0 ; movaps 0x4cc4(%rip),%xmm11 # 68c0 <_sk_callback_sse2+0x43e>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,216,74,0,0 ; movaps 0x4ad8(%rip),%xmm12 # 66e0 <_sk_callback_sse2+0x458>
+ DB 68,15,40,37,200,76,0,0 ; movaps 0x4cc8(%rip),%xmm12 # 68d0 <_sk_callback_sse2+0x44e>
DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0
DB 68,15,84,232 ; andps %xmm0,%xmm13
DB 65,15,85,198 ; andnps %xmm14,%xmm0
@@ -24669,20 +25089,20 @@ _sk_from_srgb_sse2 LABEL PROC
PUBLIC _sk_from_srgb_dst_sse2
_sk_from_srgb_dst_sse2 LABEL PROC
- DB 68,15,40,5,105,74,0,0 ; movaps 0x4a69(%rip),%xmm8 # 66f0 <_sk_callback_sse2+0x468>
+ DB 68,15,40,5,89,76,0,0 ; movaps 0x4c59(%rip),%xmm8 # 68e0 <_sk_callback_sse2+0x45e>
DB 68,15,40,236 ; movaps %xmm4,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,220 ; movaps %xmm4,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,97,74,0,0 ; movaps 0x4a61(%rip),%xmm9 # 6700 <_sk_callback_sse2+0x478>
+ DB 68,15,40,13,81,76,0,0 ; movaps 0x4c51(%rip),%xmm9 # 68f0 <_sk_callback_sse2+0x46e>
DB 68,15,40,244 ; movaps %xmm4,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,97,74,0,0 ; movaps 0x4a61(%rip),%xmm10 # 6710 <_sk_callback_sse2+0x488>
+ DB 68,15,40,21,81,76,0,0 ; movaps 0x4c51(%rip),%xmm10 # 6900 <_sk_callback_sse2+0x47e>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,97,74,0,0 ; movaps 0x4a61(%rip),%xmm11 # 6720 <_sk_callback_sse2+0x498>
+ DB 68,15,40,29,81,76,0,0 ; movaps 0x4c51(%rip),%xmm11 # 6910 <_sk_callback_sse2+0x48e>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,101,74,0,0 ; movaps 0x4a65(%rip),%xmm12 # 6730 <_sk_callback_sse2+0x4a8>
+ DB 68,15,40,37,85,76,0,0 ; movaps 0x4c55(%rip),%xmm12 # 6920 <_sk_callback_sse2+0x49e>
DB 65,15,194,228,1 ; cmpltps %xmm12,%xmm4
DB 68,15,84,236 ; andps %xmm4,%xmm13
DB 65,15,85,230 ; andnps %xmm14,%xmm4
@@ -24717,22 +25137,22 @@ _sk_from_srgb_dst_sse2 LABEL PROC
PUBLIC _sk_to_srgb_sse2
_sk_to_srgb_sse2 LABEL PROC
DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13
- DB 68,15,40,5,242,73,0,0 ; movaps 0x49f2(%rip),%xmm8 # 6740 <_sk_callback_sse2+0x4b8>
+ DB 68,15,40,5,226,75,0,0 ; movaps 0x4be2(%rip),%xmm8 # 6930 <_sk_callback_sse2+0x4ae>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,240 ; mulps %xmm8,%xmm14
- DB 68,15,40,13,242,73,0,0 ; movaps 0x49f2(%rip),%xmm9 # 6750 <_sk_callback_sse2+0x4c8>
+ DB 68,15,40,13,226,75,0,0 ; movaps 0x4be2(%rip),%xmm9 # 6940 <_sk_callback_sse2+0x4be>
DB 69,15,40,253 ; movaps %xmm13,%xmm15
DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 68,15,40,21,242,73,0,0 ; movaps 0x49f2(%rip),%xmm10 # 6760 <_sk_callback_sse2+0x4d8>
+ DB 68,15,40,21,226,75,0,0 ; movaps 0x4be2(%rip),%xmm10 # 6950 <_sk_callback_sse2+0x4ce>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 68,15,40,29,242,73,0,0 ; movaps 0x49f2(%rip),%xmm11 # 6770 <_sk_callback_sse2+0x4e8>
+ DB 68,15,40,29,226,75,0,0 ; movaps 0x4be2(%rip),%xmm11 # 6960 <_sk_callback_sse2+0x4de>
DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 68,15,40,37,246,73,0,0 ; movaps 0x49f6(%rip),%xmm12 # 6780 <_sk_callback_sse2+0x4f8>
+ DB 68,15,40,37,230,75,0,0 ; movaps 0x4be6(%rip),%xmm12 # 6970 <_sk_callback_sse2+0x4ee>
DB 69,15,88,236 ; addps %xmm12,%xmm13
DB 69,15,83,237 ; rcpps %xmm13,%xmm13
DB 69,15,89,239 ; mulps %xmm15,%xmm13
- DB 68,15,40,61,242,73,0,0 ; movaps 0x49f2(%rip),%xmm15 # 6790 <_sk_callback_sse2+0x508>
+ DB 68,15,40,61,226,75,0,0 ; movaps 0x4be2(%rip),%xmm15 # 6980 <_sk_callback_sse2+0x4fe>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,197 ; andnps %xmm13,%xmm0
@@ -24780,7 +25200,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 68,15,93,218 ; minps %xmm2,%xmm11
DB 65,15,40,202 ; movaps %xmm10,%xmm1
DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 68,15,40,45,75,73,0,0 ; movaps 0x494b(%rip),%xmm13 # 67a0 <_sk_callback_sse2+0x518>
+ DB 68,15,40,45,59,75,0,0 ; movaps 0x4b3b(%rip),%xmm13 # 6990 <_sk_callback_sse2+0x50e>
DB 68,15,94,233 ; divps %xmm1,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0
@@ -24789,30 +25209,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,40,241 ; movaps %xmm9,%xmm14
DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14
- DB 68,15,84,53,49,73,0,0 ; andps 0x4931(%rip),%xmm14 # 67b0 <_sk_callback_sse2+0x528>
+ DB 68,15,84,53,33,75,0,0 ; andps 0x4b21(%rip),%xmm14 # 69a0 <_sk_callback_sse2+0x51e>
DB 69,15,88,244 ; addps %xmm12,%xmm14
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 68,15,40,37,36,73,0,0 ; movaps 0x4924(%rip),%xmm12 # 67c0 <_sk_callback_sse2+0x538>
+ DB 68,15,40,37,20,75,0,0 ; movaps 0x4b14(%rip),%xmm12 # 69b0 <_sk_callback_sse2+0x52e>
DB 65,15,88,212 ; addps %xmm12,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,88,5,32,73,0,0 ; addps 0x4920(%rip),%xmm8 # 67d0 <_sk_callback_sse2+0x548>
+ DB 68,15,88,5,16,75,0,0 ; addps 0x4b10(%rip),%xmm8 # 69c0 <_sk_callback_sse2+0x53e>
DB 65,15,84,215 ; andps %xmm15,%xmm2
DB 69,15,85,248 ; andnps %xmm8,%xmm15
DB 68,15,86,250 ; orps %xmm2,%xmm15
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
DB 65,15,86,198 ; orps %xmm14,%xmm0
- DB 15,89,5,17,73,0,0 ; mulps 0x4911(%rip),%xmm0 # 67e0 <_sk_callback_sse2+0x558>
+ DB 15,89,5,1,75,0,0 ; mulps 0x4b01(%rip),%xmm0 # 69d0 <_sk_callback_sse2+0x54e>
DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8
DB 65,15,84,192 ; andps %xmm8,%xmm0
DB 69,15,92,226 ; subps %xmm10,%xmm12
DB 69,15,88,211 ; addps %xmm11,%xmm10
- DB 68,15,40,13,4,73,0,0 ; movaps 0x4904(%rip),%xmm9 # 67f0 <_sk_callback_sse2+0x568>
+ DB 68,15,40,13,244,74,0,0 ; movaps 0x4af4(%rip),%xmm9 # 69e0 <_sk_callback_sse2+0x55e>
DB 65,15,40,210 ; movaps %xmm10,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9
@@ -24835,7 +25255,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp)
DB 68,15,40,218 ; movaps %xmm2,%xmm11
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 68,15,40,13,191,72,0,0 ; movaps 0x48bf(%rip),%xmm9 # 6800 <_sk_callback_sse2+0x578>
+ DB 68,15,40,13,175,74,0,0 ; movaps 0x4aaf(%rip),%xmm9 # 69f0 <_sk_callback_sse2+0x56e>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
@@ -24852,28 +25272,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 69,15,88,211 ; addps %xmm11,%xmm10
DB 69,15,88,219 ; addps %xmm11,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 15,40,5,137,72,0,0 ; movaps 0x4889(%rip),%xmm0 # 6810 <_sk_callback_sse2+0x588>
+ DB 15,40,5,121,74,0,0 ; movaps 0x4a79(%rip),%xmm0 # 6a00 <_sk_callback_sse2+0x57e>
DB 15,88,198 ; addps %xmm6,%xmm0
DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,194,217,1 ; cmpltps %xmm1,%xmm3
- DB 15,84,29,129,72,0,0 ; andps 0x4881(%rip),%xmm3 # 6820 <_sk_callback_sse2+0x598>
+ DB 15,84,29,113,74,0,0 ; andps 0x4a71(%rip),%xmm3 # 6a10 <_sk_callback_sse2+0x58e>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 68,15,40,45,131,72,0,0 ; movaps 0x4883(%rip),%xmm13 # 6830 <_sk_callback_sse2+0x5a8>
+ DB 68,15,40,45,115,74,0,0 ; movaps 0x4a73(%rip),%xmm13 # 6a20 <_sk_callback_sse2+0x59e>
DB 69,15,40,197 ; movaps %xmm13,%xmm8
DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8
DB 69,15,40,242 ; movaps %xmm10,%xmm14
DB 69,15,92,243 ; subps %xmm11,%xmm14
DB 65,15,40,217 ; movaps %xmm9,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
- DB 15,40,21,147,72,0,0 ; movaps 0x4893(%rip),%xmm2 # 6860 <_sk_callback_sse2+0x5d8>
+ DB 15,40,21,131,74,0,0 ; movaps 0x4a83(%rip),%xmm2 # 6a50 <_sk_callback_sse2+0x5ce>
DB 68,15,40,250 ; movaps %xmm2,%xmm15
DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15
- DB 15,40,13,99,72,0,0 ; movaps 0x4863(%rip),%xmm1 # 6840 <_sk_callback_sse2+0x5b8>
+ DB 15,40,13,83,74,0,0 ; movaps 0x4a53(%rip),%xmm1 # 6a30 <_sk_callback_sse2+0x5ae>
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,45,105,72,0,0 ; movaps 0x4869(%rip),%xmm5 # 6850 <_sk_callback_sse2+0x5c8>
+ DB 15,40,45,89,74,0,0 ; movaps 0x4a59(%rip),%xmm5 # 6a40 <_sk_callback_sse2+0x5be>
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,92,224 ; subps %xmm0,%xmm4
DB 65,15,89,230 ; mulps %xmm14,%xmm4
@@ -24896,7 +25316,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,222,71,0,0 ; andps 0x47de(%rip),%xmm3 # 6820 <_sk_callback_sse2+0x598>
+ DB 15,84,29,206,73,0,0 ; andps 0x49ce(%rip),%xmm3 # 6a10 <_sk_callback_sse2+0x58e>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 68,15,40,230 ; movaps %xmm6,%xmm12
DB 68,15,92,224 ; subps %xmm0,%xmm12
@@ -24926,12 +25346,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,60,36 ; movaps (%rsp),%xmm7
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,88,53,183,71,0,0 ; addps 0x47b7(%rip),%xmm6 # 6870 <_sk_callback_sse2+0x5e8>
+ DB 15,88,53,167,73,0,0 ; addps 0x49a7(%rip),%xmm6 # 6a60 <_sk_callback_sse2+0x5de>
DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,82,71,0,0 ; andps 0x4752(%rip),%xmm3 # 6820 <_sk_callback_sse2+0x598>
+ DB 15,84,29,66,73,0,0 ; andps 0x4942(%rip),%xmm3 # 6a10 <_sk_callback_sse2+0x58e>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,89,206 ; mulps %xmm6,%xmm1
@@ -24996,9 +25416,9 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,209,70,0,0 ; pand 0x46d1(%rip),%xmm8 # 6880 <_sk_callback_sse2+0x5f8>
+ DB 102,68,15,219,5,193,72,0,0 ; pand 0x48c1(%rip),%xmm8 # 6a70 <_sk_callback_sse2+0x5ee>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,213,70,0,0 ; mulps 0x46d5(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x608>
+ DB 68,15,89,5,197,72,0,0 ; mulps 0x48c5(%rip),%xmm8 # 6a80 <_sk_callback_sse2+0x5fe>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -25061,9 +25481,9 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,11,70,0,0 ; pand 0x460b(%rip),%xmm8 # 68a0 <_sk_callback_sse2+0x618>
+ DB 102,68,15,219,5,251,71,0,0 ; pand 0x47fb(%rip),%xmm8 # 6a90 <_sk_callback_sse2+0x60e>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,15,70,0,0 ; mulps 0x460f(%rip),%xmm8 # 68b0 <_sk_callback_sse2+0x628>
+ DB 68,15,89,5,255,71,0,0 ; mulps 0x47ff(%rip),%xmm8 # 6aa0 <_sk_callback_sse2+0x61e>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -25113,17 +25533,17 @@ _sk_lerp_565_sse2 LABEL PROC
DB 15,133,156,0,0,0 ; jne 23e4 <_sk_lerp_565_sse2+0xbb>
DB 243,71,15,126,12,89 ; movq (%r9,%r11,2),%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
- DB 102,68,15,111,5,100,69,0,0 ; movdqa 0x4564(%rip),%xmm8 # 68c0 <_sk_callback_sse2+0x638>
+ DB 102,68,15,111,5,84,71,0,0 ; movdqa 0x4754(%rip),%xmm8 # 6ab0 <_sk_callback_sse2+0x62e>
DB 102,69,15,219,193 ; pand %xmm9,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,99,69,0,0 ; mulps 0x4563(%rip),%xmm8 # 68d0 <_sk_callback_sse2+0x648>
- DB 102,68,15,111,21,106,69,0,0 ; movdqa 0x456a(%rip),%xmm10 # 68e0 <_sk_callback_sse2+0x658>
+ DB 68,15,89,5,83,71,0,0 ; mulps 0x4753(%rip),%xmm8 # 6ac0 <_sk_callback_sse2+0x63e>
+ DB 102,68,15,111,21,90,71,0,0 ; movdqa 0x475a(%rip),%xmm10 # 6ad0 <_sk_callback_sse2+0x64e>
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,105,69,0,0 ; mulps 0x4569(%rip),%xmm10 # 68f0 <_sk_callback_sse2+0x668>
- DB 102,68,15,219,13,112,69,0,0 ; pand 0x4570(%rip),%xmm9 # 6900 <_sk_callback_sse2+0x678>
+ DB 68,15,89,21,89,71,0,0 ; mulps 0x4759(%rip),%xmm10 # 6ae0 <_sk_callback_sse2+0x65e>
+ DB 102,68,15,219,13,96,71,0,0 ; pand 0x4760(%rip),%xmm9 # 6af0 <_sk_callback_sse2+0x66e>
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,116,69,0,0 ; mulps 0x4574(%rip),%xmm9 # 6910 <_sk_callback_sse2+0x688>
+ DB 68,15,89,13,100,71,0,0 ; mulps 0x4764(%rip),%xmm9 # 6b00 <_sk_callback_sse2+0x67e>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -25175,7 +25595,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,68,15,111,5,195,68,0,0 ; movdqa 0x44c3(%rip),%xmm8 # 6920 <_sk_callback_sse2+0x698>
+ DB 102,68,15,111,5,179,70,0,0 ; movdqa 0x46b3(%rip),%xmm8 # 6b10 <_sk_callback_sse2+0x68e>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -25231,7 +25651,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9
DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3
- DB 15,89,29,204,67,0,0 ; mulps 0x43cc(%rip),%xmm3 # 6930 <_sk_callback_sse2+0x6a8>
+ DB 15,89,29,188,69,0,0 ; mulps 0x45bc(%rip),%xmm3 # 6b20 <_sk_callback_sse2+0x69e>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -25271,7 +25691,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,21,65,67,0,0 ; movdqa 0x4341(%rip),%xmm10 # 6940 <_sk_callback_sse2+0x6b8>
+ DB 102,68,15,111,21,49,69,0,0 ; movdqa 0x4531(%rip),%xmm10 # 6b30 <_sk_callback_sse2+0x6ae>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -25333,7 +25753,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,235,217 ; por %xmm9,%xmm3
DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,44,66,0,0 ; mulps 0x422c(%rip),%xmm3 # 6950 <_sk_callback_sse2+0x6c8>
+ DB 15,89,29,28,68,0,0 ; mulps 0x441c(%rip),%xmm3 # 6b40 <_sk_callback_sse2+0x6be>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -25374,7 +25794,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0
- DB 102,68,15,111,5,155,65,0,0 ; movdqa 0x419b(%rip),%xmm8 # 6960 <_sk_callback_sse2+0x6d8>
+ DB 102,68,15,111,5,139,67,0,0 ; movdqa 0x438b(%rip),%xmm8 # 6b50 <_sk_callback_sse2+0x6ce>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -25430,7 +25850,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,166,64,0,0 ; movaps 0x40a6(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x6e8>
+ DB 15,40,29,150,66,0,0 ; movaps 0x4296(%rip),%xmm3 # 6b60 <_sk_callback_sse2+0x6de>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -25462,7 +25882,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,63,64,0,0 ; movaps 0x403f(%rip),%xmm8 # 6980 <_sk_callback_sse2+0x6f8>
+ DB 68,15,40,5,47,66,0,0 ; movaps 0x422f(%rip),%xmm8 # 6b70 <_sk_callback_sse2+0x6ee>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -25490,7 +25910,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,217,63,0,0 ; movaps 0x3fd9(%rip),%xmm10 # 6990 <_sk_callback_sse2+0x708>
+ DB 68,15,40,21,201,65,0,0 ; movaps 0x41c9(%rip),%xmm10 # 6b80 <_sk_callback_sse2+0x6fe>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -25609,7 +26029,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,33,62,0,0 ; movaps 0x3e21(%rip),%xmm10 # 69a0 <_sk_callback_sse2+0x718>
+ DB 68,15,40,21,17,64,0,0 ; movaps 0x4011(%rip),%xmm10 # 6b90 <_sk_callback_sse2+0x70e>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -25806,15 +26226,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,85,59,0,0 ; mulps 0x3b55(%rip),%xmm9 # 69b0 <_sk_callback_sse2+0x728>
- DB 68,15,84,21,93,59,0,0 ; andps 0x3b5d(%rip),%xmm10 # 69c0 <_sk_callback_sse2+0x738>
- DB 68,15,86,21,101,59,0,0 ; orps 0x3b65(%rip),%xmm10 # 69d0 <_sk_callback_sse2+0x748>
- DB 68,15,88,13,109,59,0,0 ; addps 0x3b6d(%rip),%xmm9 # 69e0 <_sk_callback_sse2+0x758>
- DB 68,15,40,37,117,59,0,0 ; movaps 0x3b75(%rip),%xmm12 # 69f0 <_sk_callback_sse2+0x768>
+ DB 68,15,89,13,69,61,0,0 ; mulps 0x3d45(%rip),%xmm9 # 6ba0 <_sk_callback_sse2+0x71e>
+ DB 68,15,84,21,77,61,0,0 ; andps 0x3d4d(%rip),%xmm10 # 6bb0 <_sk_callback_sse2+0x72e>
+ DB 68,15,86,21,85,61,0,0 ; orps 0x3d55(%rip),%xmm10 # 6bc0 <_sk_callback_sse2+0x73e>
+ DB 68,15,88,13,93,61,0,0 ; addps 0x3d5d(%rip),%xmm9 # 6bd0 <_sk_callback_sse2+0x74e>
+ DB 68,15,40,37,101,61,0,0 ; movaps 0x3d65(%rip),%xmm12 # 6be0 <_sk_callback_sse2+0x75e>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,117,59,0,0 ; addps 0x3b75(%rip),%xmm10 # 6a00 <_sk_callback_sse2+0x778>
- DB 68,15,40,37,125,59,0,0 ; movaps 0x3b7d(%rip),%xmm12 # 6a10 <_sk_callback_sse2+0x788>
+ DB 68,15,88,21,101,61,0,0 ; addps 0x3d65(%rip),%xmm10 # 6bf0 <_sk_callback_sse2+0x76e>
+ DB 68,15,40,37,109,61,0,0 ; movaps 0x3d6d(%rip),%xmm12 # 6c00 <_sk_callback_sse2+0x77e>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -25822,22 +26242,22 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,103,59,0,0 ; movaps 0x3b67(%rip),%xmm10 # 6a20 <_sk_callback_sse2+0x798>
+ DB 68,15,40,21,87,61,0,0 ; movaps 0x3d57(%rip),%xmm10 # 6c10 <_sk_callback_sse2+0x78e>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,91,59,0,0 ; addps 0x3b5b(%rip),%xmm9 # 6a30 <_sk_callback_sse2+0x7a8>
- DB 68,15,40,37,99,59,0,0 ; movaps 0x3b63(%rip),%xmm12 # 6a40 <_sk_callback_sse2+0x7b8>
+ DB 68,15,88,13,75,61,0,0 ; addps 0x3d4b(%rip),%xmm9 # 6c20 <_sk_callback_sse2+0x79e>
+ DB 68,15,40,37,83,61,0,0 ; movaps 0x3d53(%rip),%xmm12 # 6c30 <_sk_callback_sse2+0x7ae>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,99,59,0,0 ; movaps 0x3b63(%rip),%xmm12 # 6a50 <_sk_callback_sse2+0x7c8>
+ DB 68,15,40,37,83,61,0,0 ; movaps 0x3d53(%rip),%xmm12 # 6c40 <_sk_callback_sse2+0x7be>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,103,59,0,0 ; movaps 0x3b67(%rip),%xmm13 # 6a60 <_sk_callback_sse2+0x7d8>
+ DB 68,15,40,45,87,61,0,0 ; movaps 0x3d57(%rip),%xmm13 # 6c50 <_sk_callback_sse2+0x7ce>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,103,59,0,0 ; mulps 0x3b67(%rip),%xmm13 # 6a70 <_sk_callback_sse2+0x7e8>
+ DB 68,15,89,45,87,61,0,0 ; mulps 0x3d57(%rip),%xmm13 # 6c60 <_sk_callback_sse2+0x7de>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -25871,15 +26291,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,231,58,0,0 ; mulps 0x3ae7(%rip),%xmm9 # 6a80 <_sk_callback_sse2+0x7f8>
- DB 68,15,84,21,239,58,0,0 ; andps 0x3aef(%rip),%xmm10 # 6a90 <_sk_callback_sse2+0x808>
- DB 68,15,86,21,247,58,0,0 ; orps 0x3af7(%rip),%xmm10 # 6aa0 <_sk_callback_sse2+0x818>
- DB 68,15,88,13,255,58,0,0 ; addps 0x3aff(%rip),%xmm9 # 6ab0 <_sk_callback_sse2+0x828>
- DB 68,15,40,37,7,59,0,0 ; movaps 0x3b07(%rip),%xmm12 # 6ac0 <_sk_callback_sse2+0x838>
+ DB 68,15,89,13,215,60,0,0 ; mulps 0x3cd7(%rip),%xmm9 # 6c70 <_sk_callback_sse2+0x7ee>
+ DB 68,15,84,21,223,60,0,0 ; andps 0x3cdf(%rip),%xmm10 # 6c80 <_sk_callback_sse2+0x7fe>
+ DB 68,15,86,21,231,60,0,0 ; orps 0x3ce7(%rip),%xmm10 # 6c90 <_sk_callback_sse2+0x80e>
+ DB 68,15,88,13,239,60,0,0 ; addps 0x3cef(%rip),%xmm9 # 6ca0 <_sk_callback_sse2+0x81e>
+ DB 68,15,40,37,247,60,0,0 ; movaps 0x3cf7(%rip),%xmm12 # 6cb0 <_sk_callback_sse2+0x82e>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,7,59,0,0 ; addps 0x3b07(%rip),%xmm10 # 6ad0 <_sk_callback_sse2+0x848>
- DB 68,15,40,37,15,59,0,0 ; movaps 0x3b0f(%rip),%xmm12 # 6ae0 <_sk_callback_sse2+0x858>
+ DB 68,15,88,21,247,60,0,0 ; addps 0x3cf7(%rip),%xmm10 # 6cc0 <_sk_callback_sse2+0x83e>
+ DB 68,15,40,37,255,60,0,0 ; movaps 0x3cff(%rip),%xmm12 # 6cd0 <_sk_callback_sse2+0x84e>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -25887,22 +26307,22 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,249,58,0,0 ; movaps 0x3af9(%rip),%xmm10 # 6af0 <_sk_callback_sse2+0x868>
+ DB 68,15,40,21,233,60,0,0 ; movaps 0x3ce9(%rip),%xmm10 # 6ce0 <_sk_callback_sse2+0x85e>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,237,58,0,0 ; addps 0x3aed(%rip),%xmm9 # 6b00 <_sk_callback_sse2+0x878>
- DB 68,15,40,37,245,58,0,0 ; movaps 0x3af5(%rip),%xmm12 # 6b10 <_sk_callback_sse2+0x888>
+ DB 68,15,88,13,221,60,0,0 ; addps 0x3cdd(%rip),%xmm9 # 6cf0 <_sk_callback_sse2+0x86e>
+ DB 68,15,40,37,229,60,0,0 ; movaps 0x3ce5(%rip),%xmm12 # 6d00 <_sk_callback_sse2+0x87e>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,245,58,0,0 ; movaps 0x3af5(%rip),%xmm12 # 6b20 <_sk_callback_sse2+0x898>
+ DB 68,15,40,37,229,60,0,0 ; movaps 0x3ce5(%rip),%xmm12 # 6d10 <_sk_callback_sse2+0x88e>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,249,58,0,0 ; movaps 0x3af9(%rip),%xmm13 # 6b30 <_sk_callback_sse2+0x8a8>
+ DB 68,15,40,45,233,60,0,0 ; movaps 0x3ce9(%rip),%xmm13 # 6d20 <_sk_callback_sse2+0x89e>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,249,58,0,0 ; mulps 0x3af9(%rip),%xmm13 # 6b40 <_sk_callback_sse2+0x8b8>
+ DB 68,15,89,45,233,60,0,0 ; mulps 0x3ce9(%rip),%xmm13 # 6d30 <_sk_callback_sse2+0x8ae>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -25936,15 +26356,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,121,58,0,0 ; mulps 0x3a79(%rip),%xmm9 # 6b50 <_sk_callback_sse2+0x8c8>
- DB 68,15,84,21,129,58,0,0 ; andps 0x3a81(%rip),%xmm10 # 6b60 <_sk_callback_sse2+0x8d8>
- DB 68,15,86,21,137,58,0,0 ; orps 0x3a89(%rip),%xmm10 # 6b70 <_sk_callback_sse2+0x8e8>
- DB 68,15,88,13,145,58,0,0 ; addps 0x3a91(%rip),%xmm9 # 6b80 <_sk_callback_sse2+0x8f8>
- DB 68,15,40,37,153,58,0,0 ; movaps 0x3a99(%rip),%xmm12 # 6b90 <_sk_callback_sse2+0x908>
+ DB 68,15,89,13,105,60,0,0 ; mulps 0x3c69(%rip),%xmm9 # 6d40 <_sk_callback_sse2+0x8be>
+ DB 68,15,84,21,113,60,0,0 ; andps 0x3c71(%rip),%xmm10 # 6d50 <_sk_callback_sse2+0x8ce>
+ DB 68,15,86,21,121,60,0,0 ; orps 0x3c79(%rip),%xmm10 # 6d60 <_sk_callback_sse2+0x8de>
+ DB 68,15,88,13,129,60,0,0 ; addps 0x3c81(%rip),%xmm9 # 6d70 <_sk_callback_sse2+0x8ee>
+ DB 68,15,40,37,137,60,0,0 ; movaps 0x3c89(%rip),%xmm12 # 6d80 <_sk_callback_sse2+0x8fe>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,153,58,0,0 ; addps 0x3a99(%rip),%xmm10 # 6ba0 <_sk_callback_sse2+0x918>
- DB 68,15,40,37,161,58,0,0 ; movaps 0x3aa1(%rip),%xmm12 # 6bb0 <_sk_callback_sse2+0x928>
+ DB 68,15,88,21,137,60,0,0 ; addps 0x3c89(%rip),%xmm10 # 6d90 <_sk_callback_sse2+0x90e>
+ DB 68,15,40,37,145,60,0,0 ; movaps 0x3c91(%rip),%xmm12 # 6da0 <_sk_callback_sse2+0x91e>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -25952,22 +26372,22 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,139,58,0,0 ; movaps 0x3a8b(%rip),%xmm10 # 6bc0 <_sk_callback_sse2+0x938>
+ DB 68,15,40,21,123,60,0,0 ; movaps 0x3c7b(%rip),%xmm10 # 6db0 <_sk_callback_sse2+0x92e>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,127,58,0,0 ; addps 0x3a7f(%rip),%xmm9 # 6bd0 <_sk_callback_sse2+0x948>
- DB 68,15,40,37,135,58,0,0 ; movaps 0x3a87(%rip),%xmm12 # 6be0 <_sk_callback_sse2+0x958>
+ DB 68,15,88,13,111,60,0,0 ; addps 0x3c6f(%rip),%xmm9 # 6dc0 <_sk_callback_sse2+0x93e>
+ DB 68,15,40,37,119,60,0,0 ; movaps 0x3c77(%rip),%xmm12 # 6dd0 <_sk_callback_sse2+0x94e>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,135,58,0,0 ; movaps 0x3a87(%rip),%xmm12 # 6bf0 <_sk_callback_sse2+0x968>
+ DB 68,15,40,37,119,60,0,0 ; movaps 0x3c77(%rip),%xmm12 # 6de0 <_sk_callback_sse2+0x95e>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,139,58,0,0 ; movaps 0x3a8b(%rip),%xmm13 # 6c00 <_sk_callback_sse2+0x978>
+ DB 68,15,40,45,123,60,0,0 ; movaps 0x3c7b(%rip),%xmm13 # 6df0 <_sk_callback_sse2+0x96e>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,139,58,0,0 ; mulps 0x3a8b(%rip),%xmm13 # 6c10 <_sk_callback_sse2+0x988>
+ DB 68,15,89,45,123,60,0,0 ; mulps 0x3c7b(%rip),%xmm13 # 6e00 <_sk_callback_sse2+0x97e>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -26001,15 +26421,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,11,58,0,0 ; mulps 0x3a0b(%rip),%xmm9 # 6c20 <_sk_callback_sse2+0x998>
- DB 68,15,84,21,19,58,0,0 ; andps 0x3a13(%rip),%xmm10 # 6c30 <_sk_callback_sse2+0x9a8>
- DB 68,15,86,21,27,58,0,0 ; orps 0x3a1b(%rip),%xmm10 # 6c40 <_sk_callback_sse2+0x9b8>
- DB 68,15,88,13,35,58,0,0 ; addps 0x3a23(%rip),%xmm9 # 6c50 <_sk_callback_sse2+0x9c8>
- DB 68,15,40,37,43,58,0,0 ; movaps 0x3a2b(%rip),%xmm12 # 6c60 <_sk_callback_sse2+0x9d8>
+ DB 68,15,89,13,251,59,0,0 ; mulps 0x3bfb(%rip),%xmm9 # 6e10 <_sk_callback_sse2+0x98e>
+ DB 68,15,84,21,3,60,0,0 ; andps 0x3c03(%rip),%xmm10 # 6e20 <_sk_callback_sse2+0x99e>
+ DB 68,15,86,21,11,60,0,0 ; orps 0x3c0b(%rip),%xmm10 # 6e30 <_sk_callback_sse2+0x9ae>
+ DB 68,15,88,13,19,60,0,0 ; addps 0x3c13(%rip),%xmm9 # 6e40 <_sk_callback_sse2+0x9be>
+ DB 68,15,40,37,27,60,0,0 ; movaps 0x3c1b(%rip),%xmm12 # 6e50 <_sk_callback_sse2+0x9ce>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,43,58,0,0 ; addps 0x3a2b(%rip),%xmm10 # 6c70 <_sk_callback_sse2+0x9e8>
- DB 68,15,40,37,51,58,0,0 ; movaps 0x3a33(%rip),%xmm12 # 6c80 <_sk_callback_sse2+0x9f8>
+ DB 68,15,88,21,27,60,0,0 ; addps 0x3c1b(%rip),%xmm10 # 6e60 <_sk_callback_sse2+0x9de>
+ DB 68,15,40,37,35,60,0,0 ; movaps 0x3c23(%rip),%xmm12 # 6e70 <_sk_callback_sse2+0x9ee>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -26017,22 +26437,22 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,29,58,0,0 ; movaps 0x3a1d(%rip),%xmm10 # 6c90 <_sk_callback_sse2+0xa08>
+ DB 68,15,40,21,13,60,0,0 ; movaps 0x3c0d(%rip),%xmm10 # 6e80 <_sk_callback_sse2+0x9fe>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,17,58,0,0 ; addps 0x3a11(%rip),%xmm9 # 6ca0 <_sk_callback_sse2+0xa18>
- DB 68,15,40,37,25,58,0,0 ; movaps 0x3a19(%rip),%xmm12 # 6cb0 <_sk_callback_sse2+0xa28>
+ DB 68,15,88,13,1,60,0,0 ; addps 0x3c01(%rip),%xmm9 # 6e90 <_sk_callback_sse2+0xa0e>
+ DB 68,15,40,37,9,60,0,0 ; movaps 0x3c09(%rip),%xmm12 # 6ea0 <_sk_callback_sse2+0xa1e>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,25,58,0,0 ; movaps 0x3a19(%rip),%xmm12 # 6cc0 <_sk_callback_sse2+0xa38>
+ DB 68,15,40,37,9,60,0,0 ; movaps 0x3c09(%rip),%xmm12 # 6eb0 <_sk_callback_sse2+0xa2e>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,29,58,0,0 ; movaps 0x3a1d(%rip),%xmm13 # 6cd0 <_sk_callback_sse2+0xa48>
+ DB 68,15,40,45,13,60,0,0 ; movaps 0x3c0d(%rip),%xmm13 # 6ec0 <_sk_callback_sse2+0xa3e>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,29,58,0,0 ; mulps 0x3a1d(%rip),%xmm13 # 6ce0 <_sk_callback_sse2+0xa58>
+ DB 68,15,89,45,13,60,0,0 ; mulps 0x3c0d(%rip),%xmm13 # 6ed0 <_sk_callback_sse2+0xa4e>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -26045,31 +26465,156 @@ _sk_parametric_a_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
+PUBLIC _sk_gamma_sse2
+_sk_gamma_sse2 LABEL PROC
+ DB 72,131,236,88 ; sub $0x58,%rsp
+ DB 15,41,124,36,64 ; movaps %xmm7,0x40(%rsp)
+ DB 15,41,116,36,48 ; movaps %xmm6,0x30(%rsp)
+ DB 15,41,108,36,32 ; movaps %xmm5,0x20(%rsp)
+ DB 15,41,100,36,16 ; movaps %xmm4,0x10(%rsp)
+ DB 15,41,28,36 ; movaps %xmm3,(%rsp)
+ DB 15,40,218 ; movaps %xmm2,%xmm3
+ DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
+ DB 15,89,5,197,59,0,0 ; mulps 0x3bc5(%rip),%xmm0 # 6ee0 <_sk_callback_sse2+0xa5e>
+ DB 15,84,21,206,59,0,0 ; andps 0x3bce(%rip),%xmm2 # 6ef0 <_sk_callback_sse2+0xa6e>
+ DB 68,15,40,53,214,59,0,0 ; movaps 0x3bd6(%rip),%xmm14 # 6f00 <_sk_callback_sse2+0xa7e>
+ DB 65,15,86,214 ; orps %xmm14,%xmm2
+ DB 68,15,40,37,218,59,0,0 ; movaps 0x3bda(%rip),%xmm12 # 6f10 <_sk_callback_sse2+0xa8e>
+ DB 65,15,88,196 ; addps %xmm12,%xmm0
+ DB 68,15,40,29,222,59,0,0 ; movaps 0x3bde(%rip),%xmm11 # 6f20 <_sk_callback_sse2+0xa9e>
+ DB 15,40,226 ; movaps %xmm2,%xmm4
+ DB 65,15,89,227 ; mulps %xmm11,%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 68,15,40,21,220,59,0,0 ; movaps 0x3bdc(%rip),%xmm10 # 6f30 <_sk_callback_sse2+0xaae>
+ DB 65,15,88,210 ; addps %xmm10,%xmm2
+ DB 68,15,40,45,224,59,0,0 ; movaps 0x3be0(%rip),%xmm13 # 6f40 <_sk_callback_sse2+0xabe>
+ DB 65,15,40,229 ; movaps %xmm13,%xmm4
+ DB 15,94,226 ; divps %xmm2,%xmm4
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 243,68,15,16,0 ; movss (%rax),%xmm8
+ DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
+ DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 243,15,91,208 ; cvttps2dq %xmm0,%xmm2
+ DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,194,226,1 ; cmpltps %xmm2,%xmm4
+ DB 68,15,40,13,192,59,0,0 ; movaps 0x3bc0(%rip),%xmm9 # 6f50 <_sk_callback_sse2+0xace>
+ DB 65,15,84,225 ; andps %xmm9,%xmm4
+ DB 15,92,212 ; subps %xmm4,%xmm2
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,92,226 ; subps %xmm2,%xmm4
+ DB 15,40,53,188,59,0,0 ; movaps 0x3bbc(%rip),%xmm6 # 6f60 <_sk_callback_sse2+0xade>
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 15,40,61,210,59,0,0 ; movaps 0x3bd2(%rip),%xmm7 # 6f80 <_sk_callback_sse2+0xafe>
+ DB 15,40,239 ; movaps %xmm7,%xmm5
+ DB 15,92,236 ; subps %xmm4,%xmm5
+ DB 15,40,212 ; movaps %xmm4,%xmm2
+ DB 15,40,37,178,59,0,0 ; movaps 0x3bb2(%rip),%xmm4 # 6f70 <_sk_callback_sse2+0xaee>
+ DB 15,89,212 ; mulps %xmm4,%xmm2
+ DB 15,92,194 ; subps %xmm2,%xmm0
+ DB 68,15,40,61,196,59,0,0 ; movaps 0x3bc4(%rip),%xmm15 # 6f90 <_sk_callback_sse2+0xb0e>
+ DB 65,15,40,215 ; movaps %xmm15,%xmm2
+ DB 15,94,213 ; divps %xmm5,%xmm2
+ DB 15,88,208 ; addps %xmm0,%xmm2
+ DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
+ DB 15,89,5,0,59,0,0 ; mulps 0x3b00(%rip),%xmm0 # 6ee0 <_sk_callback_sse2+0xa5e>
+ DB 15,84,13,9,59,0,0 ; andps 0x3b09(%rip),%xmm1 # 6ef0 <_sk_callback_sse2+0xa6e>
+ DB 65,15,86,206 ; orps %xmm14,%xmm1
+ DB 65,15,88,196 ; addps %xmm12,%xmm0
+ DB 15,40,233 ; movaps %xmm1,%xmm5
+ DB 65,15,89,235 ; mulps %xmm11,%xmm5
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 65,15,88,202 ; addps %xmm10,%xmm1
+ DB 69,15,40,242 ; movaps %xmm10,%xmm14
+ DB 65,15,40,237 ; movaps %xmm13,%xmm5
+ DB 15,94,233 ; divps %xmm1,%xmm5
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
+ DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,194,233,1 ; cmpltps %xmm1,%xmm5
+ DB 65,15,84,233 ; andps %xmm9,%xmm5
+ DB 15,92,205 ; subps %xmm5,%xmm1
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,92,233 ; subps %xmm1,%xmm5
+ DB 15,88,198 ; addps %xmm6,%xmm0
+ DB 68,15,40,214 ; movaps %xmm6,%xmm10
+ DB 15,40,247 ; movaps %xmm7,%xmm6
+ DB 15,92,245 ; subps %xmm5,%xmm6
+ DB 15,89,236 ; mulps %xmm4,%xmm5
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 65,15,40,207 ; movaps %xmm15,%xmm1
+ DB 15,94,206 ; divps %xmm6,%xmm1
+ DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
+ DB 15,89,5,143,58,0,0 ; mulps 0x3a8f(%rip),%xmm0 # 6ee0 <_sk_callback_sse2+0xa5e>
+ DB 15,84,29,152,58,0,0 ; andps 0x3a98(%rip),%xmm3 # 6ef0 <_sk_callback_sse2+0xa6e>
+ DB 15,86,29,161,58,0,0 ; orps 0x3aa1(%rip),%xmm3 # 6f00 <_sk_callback_sse2+0xa7e>
+ DB 65,15,88,196 ; addps %xmm12,%xmm0
+ DB 68,15,89,219 ; mulps %xmm3,%xmm11
+ DB 65,15,92,195 ; subps %xmm11,%xmm0
+ DB 65,15,88,222 ; addps %xmm14,%xmm3
+ DB 68,15,94,235 ; divps %xmm3,%xmm13
+ DB 65,15,92,197 ; subps %xmm13,%xmm0
+ DB 65,15,89,192 ; mulps %xmm8,%xmm0
+ DB 243,15,91,216 ; cvttps2dq %xmm0,%xmm3
+ DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,194,235,1 ; cmpltps %xmm3,%xmm5
+ DB 65,15,84,233 ; andps %xmm9,%xmm5
+ DB 15,92,221 ; subps %xmm5,%xmm3
+ DB 15,40,232 ; movaps %xmm0,%xmm5
+ DB 15,92,235 ; subps %xmm3,%xmm5
+ DB 65,15,88,194 ; addps %xmm10,%xmm0
+ DB 15,89,229 ; mulps %xmm5,%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,92,253 ; subps %xmm5,%xmm7
+ DB 68,15,94,255 ; divps %xmm7,%xmm15
+ DB 68,15,88,248 ; addps %xmm0,%xmm15
+ DB 15,40,5,238,58,0,0 ; movaps 0x3aee(%rip),%xmm0 # 6fa0 <_sk_callback_sse2+0xb1e>
+ DB 15,89,208 ; mulps %xmm0,%xmm2
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 68,15,89,248 ; mulps %xmm0,%xmm15
+ DB 102,15,91,194 ; cvtps2dq %xmm2,%xmm0
+ DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
+ DB 102,65,15,91,215 ; cvtps2dq %xmm15,%xmm2
+ DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 15,40,28,36 ; movaps (%rsp),%xmm3
+ DB 15,40,100,36,16 ; movaps 0x10(%rsp),%xmm4
+ DB 15,40,108,36,32 ; movaps 0x20(%rsp),%xmm5
+ DB 15,40,116,36,48 ; movaps 0x30(%rsp),%xmm6
+ DB 15,40,124,36,64 ; movaps 0x40(%rsp),%xmm7
+ DB 72,131,196,88 ; add $0x58,%rsp
+ DB 255,224 ; jmpq *%rax
+
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
- DB 15,89,5,250,57,0,0 ; mulps 0x39fa(%rip),%xmm0 # 6cf0 <_sk_callback_sse2+0xa68>
- DB 68,15,40,5,2,58,0,0 ; movaps 0x3a02(%rip),%xmm8 # 6d00 <_sk_callback_sse2+0xa78>
+ DB 15,89,5,192,58,0,0 ; mulps 0x3ac0(%rip),%xmm0 # 6fb0 <_sk_callback_sse2+0xb2e>
+ DB 68,15,40,5,200,58,0,0 ; movaps 0x3ac8(%rip),%xmm8 # 6fc0 <_sk_callback_sse2+0xb3e>
DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 68,15,40,13,6,58,0,0 ; movaps 0x3a06(%rip),%xmm9 # 6d10 <_sk_callback_sse2+0xa88>
+ DB 68,15,40,13,204,58,0,0 ; movaps 0x3acc(%rip),%xmm9 # 6fd0 <_sk_callback_sse2+0xb4e>
DB 65,15,88,201 ; addps %xmm9,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 15,88,5,3,58,0,0 ; addps 0x3a03(%rip),%xmm0 # 6d20 <_sk_callback_sse2+0xa98>
- DB 15,89,5,12,58,0,0 ; mulps 0x3a0c(%rip),%xmm0 # 6d30 <_sk_callback_sse2+0xaa8>
- DB 15,89,13,21,58,0,0 ; mulps 0x3a15(%rip),%xmm1 # 6d40 <_sk_callback_sse2+0xab8>
+ DB 15,88,5,201,58,0,0 ; addps 0x3ac9(%rip),%xmm0 # 6fe0 <_sk_callback_sse2+0xb5e>
+ DB 15,89,5,210,58,0,0 ; mulps 0x3ad2(%rip),%xmm0 # 6ff0 <_sk_callback_sse2+0xb6e>
+ DB 15,89,13,219,58,0,0 ; mulps 0x3adb(%rip),%xmm1 # 7000 <_sk_callback_sse2+0xb7e>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,21,27,58,0,0 ; mulps 0x3a1b(%rip),%xmm2 # 6d50 <_sk_callback_sse2+0xac8>
+ DB 15,89,21,225,58,0,0 ; mulps 0x3ae1(%rip),%xmm2 # 7010 <_sk_callback_sse2+0xb8e>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 68,15,92,202 ; subps %xmm2,%xmm9
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
DB 68,15,89,225 ; mulps %xmm1,%xmm12
- DB 15,40,21,16,58,0,0 ; movaps 0x3a10(%rip),%xmm2 # 6d60 <_sk_callback_sse2+0xad8>
+ DB 15,40,21,214,58,0,0 ; movaps 0x3ad6(%rip),%xmm2 # 7020 <_sk_callback_sse2+0xb9e>
DB 68,15,40,194 ; movaps %xmm2,%xmm8
DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8
- DB 68,15,40,21,15,58,0,0 ; movaps 0x3a0f(%rip),%xmm10 # 6d70 <_sk_callback_sse2+0xae8>
+ DB 68,15,40,21,213,58,0,0 ; movaps 0x3ad5(%rip),%xmm10 # 7030 <_sk_callback_sse2+0xbae>
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,40,29,19,58,0,0 ; movaps 0x3a13(%rip),%xmm11 # 6d80 <_sk_callback_sse2+0xaf8>
+ DB 68,15,40,29,217,58,0,0 ; movaps 0x3ad9(%rip),%xmm11 # 7040 <_sk_callback_sse2+0xbbe>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 69,15,84,224 ; andps %xmm8,%xmm12
DB 68,15,85,193 ; andnps %xmm1,%xmm8
@@ -26093,8 +26638,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,84,194 ; andps %xmm2,%xmm0
DB 65,15,85,209 ; andnps %xmm9,%xmm2
DB 15,86,208 ; orps %xmm0,%xmm2
- DB 68,15,89,5,195,57,0,0 ; mulps 0x39c3(%rip),%xmm8 # 6d90 <_sk_callback_sse2+0xb08>
- DB 15,89,21,204,57,0,0 ; mulps 0x39cc(%rip),%xmm2 # 6da0 <_sk_callback_sse2+0xb18>
+ DB 68,15,89,5,137,58,0,0 ; mulps 0x3a89(%rip),%xmm8 # 7050 <_sk_callback_sse2+0xbce>
+ DB 15,89,21,146,58,0,0 ; mulps 0x3a92(%rip),%xmm2 # 7060 <_sk_callback_sse2+0xbde>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -26108,13 +26653,13 @@ _sk_load_a8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,46 ; jne 3422 <_sk_load_a8_sse2+0x46>
+ DB 117,46 ; jne 361c <_sk_load_a8_sse2+0x46>
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,166,57,0,0 ; pand 0x39a6(%rip),%xmm0 # 6db0 <_sk_callback_sse2+0xb28>
+ DB 102,15,219,5,108,58,0,0 ; pand 0x3a6c(%rip),%xmm0 # 7070 <_sk_callback_sse2+0xbee>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,172,57,0,0 ; mulps 0x39ac(%rip),%xmm3 # 6dc0 <_sk_callback_sse2+0xb38>
+ DB 15,89,29,114,58,0,0 ; mulps 0x3a72(%rip),%xmm3 # 7080 <_sk_callback_sse2+0xbfe>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
@@ -26123,12 +26668,12 @@ _sk_load_a8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 3465 <_sk_load_a8_sse2+0x89>
+ DB 116,54 ; je 365f <_sk_load_a8_sse2+0x89>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 344e <_sk_load_a8_sse2+0x72>
+ DB 116,21 ; je 3648 <_sk_load_a8_sse2+0x72>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 3402 <_sk_load_a8_sse2+0x26>
+ DB 117,195 ; jne 35fc <_sk_load_a8_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -26137,10 +26682,10 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,157 ; jmp 3402 <_sk_load_a8_sse2+0x26>
+ DB 235,157 ; jmp 35fc <_sk_load_a8_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,146 ; jmp 3402 <_sk_load_a8_sse2+0x26>
+ DB 235,146 ; jmp 35fc <_sk_load_a8_sse2+0x26>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -26151,13 +26696,13 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,46 ; jne 34b6 <_sk_load_a8_dst_sse2+0x46>
+ DB 117,46 ; jne 36b0 <_sk_load_a8_dst_sse2+0x46>
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,50,57,0,0 ; pand 0x3932(%rip),%xmm4 # 6dd0 <_sk_callback_sse2+0xb48>
+ DB 102,15,219,37,248,57,0,0 ; pand 0x39f8(%rip),%xmm4 # 7090 <_sk_callback_sse2+0xc0e>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,56,57,0,0 ; mulps 0x3938(%rip),%xmm7 # 6de0 <_sk_callback_sse2+0xb58>
+ DB 15,89,61,254,57,0,0 ; mulps 0x39fe(%rip),%xmm7 # 70a0 <_sk_callback_sse2+0xc1e>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
@@ -26166,12 +26711,12 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 34f9 <_sk_load_a8_dst_sse2+0x89>
+ DB 116,54 ; je 36f3 <_sk_load_a8_dst_sse2+0x89>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 34e2 <_sk_load_a8_dst_sse2+0x72>
+ DB 116,21 ; je 36dc <_sk_load_a8_dst_sse2+0x72>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 3496 <_sk_load_a8_dst_sse2+0x26>
+ DB 117,195 ; jne 3690 <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -26180,10 +26725,10 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,157 ; jmp 3496 <_sk_load_a8_dst_sse2+0x26>
+ DB 235,157 ; jmp 3690 <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,146 ; jmp 3496 <_sk_load_a8_dst_sse2+0x26>
+ DB 235,146 ; jmp 3690 <_sk_load_a8_dst_sse2+0x26>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -26223,7 +26768,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,89,56,0,0 ; mulps 0x3859(%rip),%xmm3 # 6df0 <_sk_callback_sse2+0xb68>
+ DB 15,89,29,31,57,0,0 ; mulps 0x391f(%rip),%xmm3 # 70b0 <_sk_callback_sse2+0xc2e>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -26241,7 +26786,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,57,56,0,0 ; movaps 0x3839(%rip),%xmm8 # 6e00 <_sk_callback_sse2+0xb78>
+ DB 68,15,40,5,255,56,0,0 ; movaps 0x38ff(%rip),%xmm8 # 70c0 <_sk_callback_sse2+0xc3e>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8
@@ -26249,7 +26794,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 35fc <_sk_store_a8_sse2+0x54>
+ DB 117,17 ; jne 37f6 <_sk_store_a8_sse2+0x54>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,25 ; mov %eax,(%r9,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -26260,24 +26805,24 @@ _sk_store_a8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 364e <_sk_store_a8_sse2+0xa6>
+ DB 116,59 ; je 3848 <_sk_store_a8_sse2+0xa6>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,22 ; je 362f <_sk_store_a8_sse2+0x87>
+ DB 116,22 ; je 3829 <_sk_store_a8_sse2+0x87>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,213 ; jne 35f4 <_sk_store_a8_sse2+0x4c>
+ DB 117,213 ; jne 37ee <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp)
DB 138,68,36,24 ; mov 0x18(%rsp),%al
DB 67,136,68,25,2 ; mov %al,0x2(%r9,%r11,1)
- DB 102,68,15,219,5,216,55,0,0 ; pand 0x37d8(%rip),%xmm8 # 6e10 <_sk_callback_sse2+0xb88>
+ DB 102,68,15,219,5,158,56,0,0 ; pand 0x389e(%rip),%xmm8 # 70d0 <_sk_callback_sse2+0xc4e>
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,25 ; mov %ax,(%r9,%r11,1)
- DB 235,166 ; jmp 35f4 <_sk_store_a8_sse2+0x4c>
+ DB 235,166 ; jmp 37ee <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 67,136,4,25 ; mov %al,(%r9,%r11,1)
- DB 235,151 ; jmp 35f4 <_sk_store_a8_sse2+0x4c>
+ DB 235,151 ; jmp 37ee <_sk_store_a8_sse2+0x4c>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -26288,27 +26833,27 @@ _sk_load_g8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 36a6 <_sk_load_g8_sse2+0x49>
+ DB 117,49 ; jne 38a0 <_sk_load_g8_sse2+0x49>
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,149,55,0,0 ; pand 0x3795(%rip),%xmm0 # 6e20 <_sk_callback_sse2+0xb98>
+ DB 102,15,219,5,91,56,0,0 ; pand 0x385b(%rip),%xmm0 # 70e0 <_sk_callback_sse2+0xc5e>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,155,55,0,0 ; mulps 0x379b(%rip),%xmm0 # 6e30 <_sk_callback_sse2+0xba8>
+ DB 15,89,5,97,56,0,0 ; mulps 0x3861(%rip),%xmm0 # 70f0 <_sk_callback_sse2+0xc6e>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,162,55,0,0 ; movaps 0x37a2(%rip),%xmm3 # 6e40 <_sk_callback_sse2+0xbb8>
+ DB 15,40,29,104,56,0,0 ; movaps 0x3868(%rip),%xmm3 # 7100 <_sk_callback_sse2+0xc7e>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 36e9 <_sk_load_g8_sse2+0x8c>
+ DB 116,54 ; je 38e3 <_sk_load_g8_sse2+0x8c>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 36d2 <_sk_load_g8_sse2+0x75>
+ DB 116,21 ; je 38cc <_sk_load_g8_sse2+0x75>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 3683 <_sk_load_g8_sse2+0x26>
+ DB 117,192 ; jne 387d <_sk_load_g8_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -26317,10 +26862,10 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,154 ; jmp 3683 <_sk_load_g8_sse2+0x26>
+ DB 235,154 ; jmp 387d <_sk_load_g8_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,143 ; jmp 3683 <_sk_load_g8_sse2+0x26>
+ DB 235,143 ; jmp 387d <_sk_load_g8_sse2+0x26>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -26331,27 +26876,27 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 373d <_sk_load_g8_dst_sse2+0x49>
+ DB 117,49 ; jne 3937 <_sk_load_g8_dst_sse2+0x49>
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,46,55,0,0 ; pand 0x372e(%rip),%xmm4 # 6e50 <_sk_callback_sse2+0xbc8>
+ DB 102,15,219,37,244,55,0,0 ; pand 0x37f4(%rip),%xmm4 # 7110 <_sk_callback_sse2+0xc8e>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,52,55,0,0 ; mulps 0x3734(%rip),%xmm4 # 6e60 <_sk_callback_sse2+0xbd8>
+ DB 15,89,37,250,55,0,0 ; mulps 0x37fa(%rip),%xmm4 # 7120 <_sk_callback_sse2+0xc9e>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,59,55,0,0 ; movaps 0x373b(%rip),%xmm7 # 6e70 <_sk_callback_sse2+0xbe8>
+ DB 15,40,61,1,56,0,0 ; movaps 0x3801(%rip),%xmm7 # 7130 <_sk_callback_sse2+0xcae>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 3780 <_sk_load_g8_dst_sse2+0x8c>
+ DB 116,54 ; je 397a <_sk_load_g8_dst_sse2+0x8c>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 3769 <_sk_load_g8_dst_sse2+0x75>
+ DB 116,21 ; je 3963 <_sk_load_g8_dst_sse2+0x75>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 371a <_sk_load_g8_dst_sse2+0x26>
+ DB 117,192 ; jne 3914 <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -26360,10 +26905,10 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,154 ; jmp 371a <_sk_load_g8_dst_sse2+0x26>
+ DB 235,154 ; jmp 3914 <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,143 ; jmp 371a <_sk_load_g8_dst_sse2+0x26>
+ DB 235,143 ; jmp 3914 <_sk_load_g8_dst_sse2+0x26>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -26403,9 +26948,9 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,98,54,0,0 ; mulps 0x3662(%rip),%xmm0 # 6e80 <_sk_callback_sse2+0xbf8>
+ DB 15,89,5,40,55,0,0 ; mulps 0x3728(%rip),%xmm0 # 7140 <_sk_callback_sse2+0xcbe>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,105,54,0,0 ; movaps 0x3669(%rip),%xmm3 # 6e90 <_sk_callback_sse2+0xc08>
+ DB 15,40,29,47,55,0,0 ; movaps 0x372f(%rip),%xmm3 # 7150 <_sk_callback_sse2+0xcce>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -26422,42 +26967,42 @@ _sk_load_565_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,83 ; jne 389f <_sk_load_565_sse2+0x6e>
+ DB 117,83 ; jne 3a99 <_sk_load_565_sse2+0x6e>
DB 243,67,15,126,20,89 ; movq (%r9,%r11,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,66,54,0,0 ; movdqa 0x3642(%rip),%xmm0 # 6ea0 <_sk_callback_sse2+0xc18>
+ DB 102,15,111,5,8,55,0,0 ; movdqa 0x3708(%rip),%xmm0 # 7160 <_sk_callback_sse2+0xcde>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,68,54,0,0 ; mulps 0x3644(%rip),%xmm0 # 6eb0 <_sk_callback_sse2+0xc28>
- DB 102,15,111,13,76,54,0,0 ; movdqa 0x364c(%rip),%xmm1 # 6ec0 <_sk_callback_sse2+0xc38>
+ DB 15,89,5,10,55,0,0 ; mulps 0x370a(%rip),%xmm0 # 7170 <_sk_callback_sse2+0xcee>
+ DB 102,15,111,13,18,55,0,0 ; movdqa 0x3712(%rip),%xmm1 # 7180 <_sk_callback_sse2+0xcfe>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,78,54,0,0 ; mulps 0x364e(%rip),%xmm1 # 6ed0 <_sk_callback_sse2+0xc48>
- DB 102,15,219,21,86,54,0,0 ; pand 0x3656(%rip),%xmm2 # 6ee0 <_sk_callback_sse2+0xc58>
+ DB 15,89,13,20,55,0,0 ; mulps 0x3714(%rip),%xmm1 # 7190 <_sk_callback_sse2+0xd0e>
+ DB 102,15,219,21,28,55,0,0 ; pand 0x371c(%rip),%xmm2 # 71a0 <_sk_callback_sse2+0xd1e>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,92,54,0,0 ; mulps 0x365c(%rip),%xmm2 # 6ef0 <_sk_callback_sse2+0xc68>
+ DB 15,89,21,34,55,0,0 ; mulps 0x3722(%rip),%xmm2 # 71b0 <_sk_callback_sse2+0xd2e>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,99,54,0,0 ; movaps 0x3663(%rip),%xmm3 # 6f00 <_sk_callback_sse2+0xc78>
+ DB 15,40,29,41,55,0,0 ; movaps 0x3729(%rip),%xmm3 # 71c0 <_sk_callback_sse2+0xd3e>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 38de <_sk_load_565_sse2+0xad>
+ DB 116,50 ; je 3ad8 <_sk_load_565_sse2+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 38cb <_sk_load_565_sse2+0x9a>
+ DB 116,21 ; je 3ac5 <_sk_load_565_sse2+0x9a>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 3856 <_sk_load_565_sse2+0x25>
+ DB 117,154 ; jne 3a50 <_sk_load_565_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,120,255,255,255 ; jmpq 3856 <_sk_load_565_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 3a50 <_sk_load_565_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,106,255,255,255 ; jmpq 3856 <_sk_load_565_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 3a50 <_sk_load_565_sse2+0x25>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -26469,42 +27014,42 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,83 ; jne 395a <_sk_load_565_dst_sse2+0x6e>
+ DB 117,83 ; jne 3b54 <_sk_load_565_dst_sse2+0x6e>
DB 243,67,15,126,52,89 ; movq (%r9,%r11,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,37,247,53,0,0 ; movdqa 0x35f7(%rip),%xmm4 # 6f10 <_sk_callback_sse2+0xc88>
+ DB 102,15,111,37,189,54,0,0 ; movdqa 0x36bd(%rip),%xmm4 # 71d0 <_sk_callback_sse2+0xd4e>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,249,53,0,0 ; mulps 0x35f9(%rip),%xmm4 # 6f20 <_sk_callback_sse2+0xc98>
- DB 102,15,111,45,1,54,0,0 ; movdqa 0x3601(%rip),%xmm5 # 6f30 <_sk_callback_sse2+0xca8>
+ DB 15,89,37,191,54,0,0 ; mulps 0x36bf(%rip),%xmm4 # 71e0 <_sk_callback_sse2+0xd5e>
+ DB 102,15,111,45,199,54,0,0 ; movdqa 0x36c7(%rip),%xmm5 # 71f0 <_sk_callback_sse2+0xd6e>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,3,54,0,0 ; mulps 0x3603(%rip),%xmm5 # 6f40 <_sk_callback_sse2+0xcb8>
- DB 102,15,219,53,11,54,0,0 ; pand 0x360b(%rip),%xmm6 # 6f50 <_sk_callback_sse2+0xcc8>
+ DB 15,89,45,201,54,0,0 ; mulps 0x36c9(%rip),%xmm5 # 7200 <_sk_callback_sse2+0xd7e>
+ DB 102,15,219,53,209,54,0,0 ; pand 0x36d1(%rip),%xmm6 # 7210 <_sk_callback_sse2+0xd8e>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,17,54,0,0 ; mulps 0x3611(%rip),%xmm6 # 6f60 <_sk_callback_sse2+0xcd8>
+ DB 15,89,53,215,54,0,0 ; mulps 0x36d7(%rip),%xmm6 # 7220 <_sk_callback_sse2+0xd9e>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,24,54,0,0 ; movaps 0x3618(%rip),%xmm7 # 6f70 <_sk_callback_sse2+0xce8>
+ DB 15,40,61,222,54,0,0 ; movaps 0x36de(%rip),%xmm7 # 7230 <_sk_callback_sse2+0xdae>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 3999 <_sk_load_565_dst_sse2+0xad>
+ DB 116,50 ; je 3b93 <_sk_load_565_dst_sse2+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 3986 <_sk_load_565_dst_sse2+0x9a>
+ DB 116,21 ; je 3b80 <_sk_load_565_dst_sse2+0x9a>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 3911 <_sk_load_565_dst_sse2+0x25>
+ DB 117,154 ; jne 3b0b <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,244 ; movsd %xmm4,%xmm6
- DB 233,120,255,255,255 ; jmpq 3911 <_sk_load_565_dst_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 3b0b <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,106,255,255,255 ; jmpq 3911 <_sk_load_565_dst_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 3b0b <_sk_load_565_dst_sse2+0x25>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -26537,19 +27082,19 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,83,53,0,0 ; movdqa 0x3553(%rip),%xmm0 # 6f80 <_sk_callback_sse2+0xcf8>
+ DB 102,15,111,5,25,54,0,0 ; movdqa 0x3619(%rip),%xmm0 # 7240 <_sk_callback_sse2+0xdbe>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,85,53,0,0 ; mulps 0x3555(%rip),%xmm0 # 6f90 <_sk_callback_sse2+0xd08>
- DB 102,15,111,13,93,53,0,0 ; movdqa 0x355d(%rip),%xmm1 # 6fa0 <_sk_callback_sse2+0xd18>
+ DB 15,89,5,27,54,0,0 ; mulps 0x361b(%rip),%xmm0 # 7250 <_sk_callback_sse2+0xdce>
+ DB 102,15,111,13,35,54,0,0 ; movdqa 0x3623(%rip),%xmm1 # 7260 <_sk_callback_sse2+0xdde>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,95,53,0,0 ; mulps 0x355f(%rip),%xmm1 # 6fb0 <_sk_callback_sse2+0xd28>
- DB 102,15,219,21,103,53,0,0 ; pand 0x3567(%rip),%xmm2 # 6fc0 <_sk_callback_sse2+0xd38>
+ DB 15,89,13,37,54,0,0 ; mulps 0x3625(%rip),%xmm1 # 7270 <_sk_callback_sse2+0xdee>
+ DB 102,15,219,21,45,54,0,0 ; pand 0x362d(%rip),%xmm2 # 7280 <_sk_callback_sse2+0xdfe>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,109,53,0,0 ; mulps 0x356d(%rip),%xmm2 # 6fd0 <_sk_callback_sse2+0xd48>
+ DB 15,89,21,51,54,0,0 ; mulps 0x3633(%rip),%xmm2 # 7290 <_sk_callback_sse2+0xe0e>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,116,53,0,0 ; movaps 0x3574(%rip),%xmm3 # 6fe0 <_sk_callback_sse2+0xd58>
+ DB 15,40,29,58,54,0,0 ; movaps 0x363a(%rip),%xmm3 # 72a0 <_sk_callback_sse2+0xe1e>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -26562,12 +27107,12 @@ _sk_store_565_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,99,53,0,0 ; movaps 0x3563(%rip),%xmm8 # 6ff0 <_sk_callback_sse2+0xd68>
+ DB 68,15,40,5,41,54,0,0 ; movaps 0x3629(%rip),%xmm8 # 72b0 <_sk_callback_sse2+0xe2e>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,88,53,0,0 ; movaps 0x3558(%rip),%xmm10 # 7000 <_sk_callback_sse2+0xd78>
+ DB 68,15,40,21,30,54,0,0 ; movaps 0x361e(%rip),%xmm10 # 72c0 <_sk_callback_sse2+0xe3e>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -26579,7 +27124,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3aea <_sk_store_565_sse2+0x7b>
+ DB 117,10 ; jne 3ce4 <_sk_store_565_sse2+0x7b>
DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -26587,19 +27132,19 @@ _sk_store_565_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,38 ; je 3b22 <_sk_store_565_sse2+0xb3>
+ DB 116,38 ; je 3d1c <_sk_store_565_sse2+0xb3>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 3b14 <_sk_store_565_sse2+0xa5>
+ DB 116,18 ; je 3d0e <_sk_store_565_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,222 ; jne 3ae6 <_sk_store_565_sse2+0x77>
+ DB 117,222 ; jne 3ce0 <_sk_store_565_sse2+0x77>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2)
- DB 235,196 ; jmp 3ae6 <_sk_store_565_sse2+0x77>
+ DB 235,196 ; jmp 3ce0 <_sk_store_565_sse2+0x77>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2)
- DB 235,184 ; jmp 3ae6 <_sk_store_565_sse2+0x77>
+ DB 235,184 ; jmp 3ce0 <_sk_store_565_sse2+0x77>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -26611,45 +27156,45 @@ _sk_load_4444_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 3bab <_sk_load_4444_sse2+0x7d>
+ DB 117,98 ; jne 3da5 <_sk_load_4444_sse2+0x7d>
DB 243,67,15,126,28,89 ; movq (%r9,%r11,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,181,52,0,0 ; movdqa 0x34b5(%rip),%xmm0 # 7010 <_sk_callback_sse2+0xd88>
+ DB 102,15,111,5,123,53,0,0 ; movdqa 0x357b(%rip),%xmm0 # 72d0 <_sk_callback_sse2+0xe4e>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,183,52,0,0 ; mulps 0x34b7(%rip),%xmm0 # 7020 <_sk_callback_sse2+0xd98>
- DB 102,15,111,13,191,52,0,0 ; movdqa 0x34bf(%rip),%xmm1 # 7030 <_sk_callback_sse2+0xda8>
+ DB 15,89,5,125,53,0,0 ; mulps 0x357d(%rip),%xmm0 # 72e0 <_sk_callback_sse2+0xe5e>
+ DB 102,15,111,13,133,53,0,0 ; movdqa 0x3585(%rip),%xmm1 # 72f0 <_sk_callback_sse2+0xe6e>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,193,52,0,0 ; mulps 0x34c1(%rip),%xmm1 # 7040 <_sk_callback_sse2+0xdb8>
- DB 102,15,111,21,201,52,0,0 ; movdqa 0x34c9(%rip),%xmm2 # 7050 <_sk_callback_sse2+0xdc8>
+ DB 15,89,13,135,53,0,0 ; mulps 0x3587(%rip),%xmm1 # 7300 <_sk_callback_sse2+0xe7e>
+ DB 102,15,111,21,143,53,0,0 ; movdqa 0x358f(%rip),%xmm2 # 7310 <_sk_callback_sse2+0xe8e>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,203,52,0,0 ; mulps 0x34cb(%rip),%xmm2 # 7060 <_sk_callback_sse2+0xdd8>
- DB 102,15,219,29,211,52,0,0 ; pand 0x34d3(%rip),%xmm3 # 7070 <_sk_callback_sse2+0xde8>
+ DB 15,89,21,145,53,0,0 ; mulps 0x3591(%rip),%xmm2 # 7320 <_sk_callback_sse2+0xe9e>
+ DB 102,15,219,29,153,53,0,0 ; pand 0x3599(%rip),%xmm3 # 7330 <_sk_callback_sse2+0xeae>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,217,52,0,0 ; mulps 0x34d9(%rip),%xmm3 # 7080 <_sk_callback_sse2+0xdf8>
+ DB 15,89,29,159,53,0,0 ; mulps 0x359f(%rip),%xmm3 # 7340 <_sk_callback_sse2+0xebe>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 3bea <_sk_load_4444_sse2+0xbc>
+ DB 116,50 ; je 3de4 <_sk_load_4444_sse2+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 3bd7 <_sk_load_4444_sse2+0xa9>
+ DB 116,21 ; je 3dd1 <_sk_load_4444_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 3b53 <_sk_load_4444_sse2+0x25>
+ DB 117,139 ; jne 3d4d <_sk_load_4444_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,105,255,255,255 ; jmpq 3b53 <_sk_load_4444_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 3d4d <_sk_load_4444_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,91,255,255,255 ; jmpq 3b53 <_sk_load_4444_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 3d4d <_sk_load_4444_sse2+0x25>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -26661,45 +27206,45 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 3c75 <_sk_load_4444_dst_sse2+0x7d>
+ DB 117,98 ; jne 3e6f <_sk_load_4444_dst_sse2+0x7d>
DB 243,67,15,126,60,89 ; movq (%r9,%r11,2),%xmm7
DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
- DB 102,15,111,37,107,52,0,0 ; movdqa 0x346b(%rip),%xmm4 # 7090 <_sk_callback_sse2+0xe08>
+ DB 102,15,111,37,49,53,0,0 ; movdqa 0x3531(%rip),%xmm4 # 7350 <_sk_callback_sse2+0xece>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,109,52,0,0 ; mulps 0x346d(%rip),%xmm4 # 70a0 <_sk_callback_sse2+0xe18>
- DB 102,15,111,45,117,52,0,0 ; movdqa 0x3475(%rip),%xmm5 # 70b0 <_sk_callback_sse2+0xe28>
+ DB 15,89,37,51,53,0,0 ; mulps 0x3533(%rip),%xmm4 # 7360 <_sk_callback_sse2+0xede>
+ DB 102,15,111,45,59,53,0,0 ; movdqa 0x353b(%rip),%xmm5 # 7370 <_sk_callback_sse2+0xeee>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,119,52,0,0 ; mulps 0x3477(%rip),%xmm5 # 70c0 <_sk_callback_sse2+0xe38>
- DB 102,15,111,53,127,52,0,0 ; movdqa 0x347f(%rip),%xmm6 # 70d0 <_sk_callback_sse2+0xe48>
+ DB 15,89,45,61,53,0,0 ; mulps 0x353d(%rip),%xmm5 # 7380 <_sk_callback_sse2+0xefe>
+ DB 102,15,111,53,69,53,0,0 ; movdqa 0x3545(%rip),%xmm6 # 7390 <_sk_callback_sse2+0xf0e>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,129,52,0,0 ; mulps 0x3481(%rip),%xmm6 # 70e0 <_sk_callback_sse2+0xe58>
- DB 102,15,219,61,137,52,0,0 ; pand 0x3489(%rip),%xmm7 # 70f0 <_sk_callback_sse2+0xe68>
+ DB 15,89,53,71,53,0,0 ; mulps 0x3547(%rip),%xmm6 # 73a0 <_sk_callback_sse2+0xf1e>
+ DB 102,15,219,61,79,53,0,0 ; pand 0x354f(%rip),%xmm7 # 73b0 <_sk_callback_sse2+0xf2e>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,143,52,0,0 ; mulps 0x348f(%rip),%xmm7 # 7100 <_sk_callback_sse2+0xe78>
+ DB 15,89,61,85,53,0,0 ; mulps 0x3555(%rip),%xmm7 # 73c0 <_sk_callback_sse2+0xf3e>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 3cb4 <_sk_load_4444_dst_sse2+0xbc>
+ DB 116,50 ; je 3eae <_sk_load_4444_dst_sse2+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 3ca1 <_sk_load_4444_dst_sse2+0xa9>
+ DB 116,21 ; je 3e9b <_sk_load_4444_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 3c1d <_sk_load_4444_dst_sse2+0x25>
+ DB 117,139 ; jne 3e17 <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,252 ; movsd %xmm4,%xmm7
- DB 233,105,255,255,255 ; jmpq 3c1d <_sk_load_4444_dst_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 3e17 <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,91,255,255,255 ; jmpq 3c1d <_sk_load_4444_dst_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 3e17 <_sk_load_4444_dst_sse2+0x25>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -26732,21 +27277,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,200,51,0,0 ; movdqa 0x33c8(%rip),%xmm0 # 7110 <_sk_callback_sse2+0xe88>
+ DB 102,15,111,5,142,52,0,0 ; movdqa 0x348e(%rip),%xmm0 # 73d0 <_sk_callback_sse2+0xf4e>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,202,51,0,0 ; mulps 0x33ca(%rip),%xmm0 # 7120 <_sk_callback_sse2+0xe98>
- DB 102,15,111,13,210,51,0,0 ; movdqa 0x33d2(%rip),%xmm1 # 7130 <_sk_callback_sse2+0xea8>
+ DB 15,89,5,144,52,0,0 ; mulps 0x3490(%rip),%xmm0 # 73e0 <_sk_callback_sse2+0xf5e>
+ DB 102,15,111,13,152,52,0,0 ; movdqa 0x3498(%rip),%xmm1 # 73f0 <_sk_callback_sse2+0xf6e>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,212,51,0,0 ; mulps 0x33d4(%rip),%xmm1 # 7140 <_sk_callback_sse2+0xeb8>
- DB 102,15,111,21,220,51,0,0 ; movdqa 0x33dc(%rip),%xmm2 # 7150 <_sk_callback_sse2+0xec8>
+ DB 15,89,13,154,52,0,0 ; mulps 0x349a(%rip),%xmm1 # 7400 <_sk_callback_sse2+0xf7e>
+ DB 102,15,111,21,162,52,0,0 ; movdqa 0x34a2(%rip),%xmm2 # 7410 <_sk_callback_sse2+0xf8e>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,222,51,0,0 ; mulps 0x33de(%rip),%xmm2 # 7160 <_sk_callback_sse2+0xed8>
- DB 102,15,219,29,230,51,0,0 ; pand 0x33e6(%rip),%xmm3 # 7170 <_sk_callback_sse2+0xee8>
+ DB 15,89,21,164,52,0,0 ; mulps 0x34a4(%rip),%xmm2 # 7420 <_sk_callback_sse2+0xf9e>
+ DB 102,15,219,29,172,52,0,0 ; pand 0x34ac(%rip),%xmm3 # 7430 <_sk_callback_sse2+0xfae>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,236,51,0,0 ; mulps 0x33ec(%rip),%xmm3 # 7180 <_sk_callback_sse2+0xef8>
+ DB 15,89,29,178,52,0,0 ; mulps 0x34b2(%rip),%xmm3 # 7440 <_sk_callback_sse2+0xfbe>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -26760,7 +27305,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,217,51,0,0 ; movaps 0x33d9(%rip),%xmm8 # 7190 <_sk_callback_sse2+0xf08>
+ DB 68,15,40,5,159,52,0,0 ; movaps 0x349f(%rip),%xmm8 # 7450 <_sk_callback_sse2+0xfce>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -26782,7 +27327,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3e28 <_sk_store_4444_sse2+0x8f>
+ DB 117,10 ; jne 4022 <_sk_store_4444_sse2+0x8f>
DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -26790,19 +27335,19 @@ _sk_store_4444_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,38 ; je 3e60 <_sk_store_4444_sse2+0xc7>
+ DB 116,38 ; je 405a <_sk_store_4444_sse2+0xc7>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 3e52 <_sk_store_4444_sse2+0xb9>
+ DB 116,18 ; je 404c <_sk_store_4444_sse2+0xb9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,222 ; jne 3e24 <_sk_store_4444_sse2+0x8b>
+ DB 117,222 ; jne 401e <_sk_store_4444_sse2+0x8b>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2)
- DB 235,196 ; jmp 3e24 <_sk_store_4444_sse2+0x8b>
+ DB 235,196 ; jmp 401e <_sk_store_4444_sse2+0x8b>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2)
- DB 235,184 ; jmp 3e24 <_sk_store_4444_sse2+0x8b>
+ DB 235,184 ; jmp 401e <_sk_store_4444_sse2+0x8b>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -26814,13 +27359,13 @@ _sk_load_8888_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 3eea <_sk_load_8888_sse2+0x7e>
+ DB 117,98 ; jne 40e4 <_sk_load_8888_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,21,10,51,0,0 ; movdqa 0x330a(%rip),%xmm2 # 71a0 <_sk_callback_sse2+0xf18>
+ DB 102,15,111,21,208,51,0,0 ; movdqa 0x33d0(%rip),%xmm2 # 7460 <_sk_callback_sse2+0xfde>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,6,51,0,0 ; movaps 0x3306(%rip),%xmm8 # 71b0 <_sk_callback_sse2+0xf28>
+ DB 68,15,40,5,204,51,0,0 ; movaps 0x33cc(%rip),%xmm8 # 7470 <_sk_callback_sse2+0xfee>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -26840,18 +27385,18 @@ _sk_load_8888_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 3f20 <_sk_load_8888_sse2+0xb4>
+ DB 116,41 ; je 411a <_sk_load_8888_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 3f15 <_sk_load_8888_sse2+0xa9>
+ DB 116,19 ; je 410f <_sk_load_8888_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 3e8e <_sk_load_8888_sse2+0x22>
+ DB 117,134 ; jne 4088 <_sk_load_8888_sse2+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 3e8e <_sk_load_8888_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 4088 <_sk_load_8888_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 3e8e <_sk_load_8888_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 4088 <_sk_load_8888_sse2+0x22>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -26863,13 +27408,13 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 3fa9 <_sk_load_8888_dst_sse2+0x7e>
+ DB 117,98 ; jne 41a3 <_sk_load_8888_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,53,107,50,0,0 ; movdqa 0x326b(%rip),%xmm6 # 71c0 <_sk_callback_sse2+0xf38>
+ DB 102,15,111,53,49,51,0,0 ; movdqa 0x3331(%rip),%xmm6 # 7480 <_sk_callback_sse2+0xffe>
DB 102,65,15,111,225 ; movdqa %xmm9,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,103,50,0,0 ; movaps 0x3267(%rip),%xmm8 # 71d0 <_sk_callback_sse2+0xf48>
+ DB 68,15,40,5,45,51,0,0 ; movaps 0x332d(%rip),%xmm8 # 7490 <_sk_callback_sse2+0x100e>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -26889,18 +27434,18 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 3fdf <_sk_load_8888_dst_sse2+0xb4>
+ DB 116,41 ; je 41d9 <_sk_load_8888_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 3fd4 <_sk_load_8888_dst_sse2+0xa9>
+ DB 116,19 ; je 41ce <_sk_load_8888_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 3f4d <_sk_load_8888_dst_sse2+0x22>
+ DB 117,134 ; jne 4147 <_sk_load_8888_dst_sse2+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 3f4d <_sk_load_8888_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 4147 <_sk_load_8888_dst_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 3f4d <_sk_load_8888_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 4147 <_sk_load_8888_dst_sse2+0x22>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -26932,11 +27477,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,116,49,0,0 ; movdqa 0x3174(%rip),%xmm2 # 71e0 <_sk_callback_sse2+0xf58>
+ DB 102,15,111,21,58,50,0,0 ; movdqa 0x323a(%rip),%xmm2 # 74a0 <_sk_callback_sse2+0x101e>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,112,49,0,0 ; movaps 0x3170(%rip),%xmm8 # 71f0 <_sk_callback_sse2+0xf68>
+ DB 68,15,40,5,54,50,0,0 ; movaps 0x3236(%rip),%xmm8 # 74b0 <_sk_callback_sse2+0x102e>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -26964,7 +27509,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,32,49,0,0 ; movaps 0x3120(%rip),%xmm8 # 7200 <_sk_callback_sse2+0xf78>
+ DB 68,15,40,5,230,49,0,0 ; movaps 0x31e6(%rip),%xmm8 # 74c0 <_sk_callback_sse2+0x103e>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -26983,24 +27528,24 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 4140 <_sk_store_8888_sse2+0x7f>
+ DB 117,10 ; jne 433a <_sk_store_8888_sse2+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,33 ; je 416e <_sk_store_8888_sse2+0xad>
+ DB 116,33 ; je 4368 <_sk_store_8888_sse2+0xad>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 4166 <_sk_store_8888_sse2+0xa5>
+ DB 116,19 ; je 4360 <_sk_store_8888_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 413c <_sk_store_8888_sse2+0x7b>
+ DB 117,227 ; jne 4336 <_sk_store_8888_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,206 ; jmp 413c <_sk_store_8888_sse2+0x7b>
+ DB 235,206 ; jmp 4336 <_sk_store_8888_sse2+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,198 ; jmp 413c <_sk_store_8888_sse2+0x7b>
+ DB 235,198 ; jmp 4336 <_sk_store_8888_sse2+0x7b>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -27012,13 +27557,13 @@ _sk_load_bgra_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 41f4 <_sk_load_bgra_sse2+0x7e>
+ DB 117,98 ; jne 43ee <_sk_load_bgra_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,5,112,48,0,0 ; movdqa 0x3070(%rip),%xmm0 # 7210 <_sk_callback_sse2+0xf88>
+ DB 102,15,111,5,54,49,0,0 ; movdqa 0x3136(%rip),%xmm0 # 74d0 <_sk_callback_sse2+0x104e>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,108,48,0,0 ; movaps 0x306c(%rip),%xmm8 # 7220 <_sk_callback_sse2+0xf98>
+ DB 68,15,40,5,50,49,0,0 ; movaps 0x3132(%rip),%xmm8 # 74e0 <_sk_callback_sse2+0x105e>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -27038,18 +27583,18 @@ _sk_load_bgra_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 422a <_sk_load_bgra_sse2+0xb4>
+ DB 116,41 ; je 4424 <_sk_load_bgra_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 421f <_sk_load_bgra_sse2+0xa9>
+ DB 116,19 ; je 4419 <_sk_load_bgra_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 4198 <_sk_load_bgra_sse2+0x22>
+ DB 117,134 ; jne 4392 <_sk_load_bgra_sse2+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 4198 <_sk_load_bgra_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 4392 <_sk_load_bgra_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 4198 <_sk_load_bgra_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 4392 <_sk_load_bgra_sse2+0x22>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -27061,13 +27606,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 42b3 <_sk_load_bgra_dst_sse2+0x7e>
+ DB 117,98 ; jne 44ad <_sk_load_bgra_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,37,209,47,0,0 ; movdqa 0x2fd1(%rip),%xmm4 # 7230 <_sk_callback_sse2+0xfa8>
+ DB 102,15,111,37,151,48,0,0 ; movdqa 0x3097(%rip),%xmm4 # 74f0 <_sk_callback_sse2+0x106e>
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 68,15,40,5,205,47,0,0 ; movaps 0x2fcd(%rip),%xmm8 # 7240 <_sk_callback_sse2+0xfb8>
+ DB 68,15,40,5,147,48,0,0 ; movaps 0x3093(%rip),%xmm8 # 7500 <_sk_callback_sse2+0x107e>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -27087,18 +27632,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 42e9 <_sk_load_bgra_dst_sse2+0xb4>
+ DB 116,41 ; je 44e3 <_sk_load_bgra_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 42de <_sk_load_bgra_dst_sse2+0xa9>
+ DB 116,19 ; je 44d8 <_sk_load_bgra_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 4257 <_sk_load_bgra_dst_sse2+0x22>
+ DB 117,134 ; jne 4451 <_sk_load_bgra_dst_sse2+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 4257 <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 4451 <_sk_load_bgra_dst_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 4257 <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 4451 <_sk_load_bgra_dst_sse2+0x22>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
@@ -27130,11 +27675,11 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,5,218,46,0,0 ; movdqa 0x2eda(%rip),%xmm0 # 7250 <_sk_callback_sse2+0xfc8>
+ DB 102,15,111,5,160,47,0,0 ; movdqa 0x2fa0(%rip),%xmm0 # 7510 <_sk_callback_sse2+0x108e>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,214,46,0,0 ; movaps 0x2ed6(%rip),%xmm8 # 7260 <_sk_callback_sse2+0xfd8>
+ DB 68,15,40,5,156,47,0,0 ; movaps 0x2f9c(%rip),%xmm8 # 7520 <_sk_callback_sse2+0x109e>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -27162,7 +27707,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,134,46,0,0 ; movaps 0x2e86(%rip),%xmm8 # 7270 <_sk_callback_sse2+0xfe8>
+ DB 68,15,40,5,76,47,0,0 ; movaps 0x2f4c(%rip),%xmm8 # 7530 <_sk_callback_sse2+0x10ae>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -27181,24 +27726,24 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 444a <_sk_store_bgra_sse2+0x7f>
+ DB 117,10 ; jne 4644 <_sk_store_bgra_sse2+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,33 ; je 4478 <_sk_store_bgra_sse2+0xad>
+ DB 116,33 ; je 4672 <_sk_store_bgra_sse2+0xad>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 4470 <_sk_store_bgra_sse2+0xa5>
+ DB 116,19 ; je 466a <_sk_store_bgra_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 4446 <_sk_store_bgra_sse2+0x7b>
+ DB 117,227 ; jne 4640 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,206 ; jmp 4446 <_sk_store_bgra_sse2+0x7b>
+ DB 235,206 ; jmp 4640 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,198 ; jmp 4446 <_sk_store_bgra_sse2+0x7b>
+ DB 235,198 ; jmp 4640 <_sk_store_bgra_sse2+0x7b>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -27210,7 +27755,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,98,1,0,0 ; jne 4602 <_sk_load_f16_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 47fc <_sk_load_f16_sse2+0x182>
DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0
DB 102,65,15,16,76,193,16 ; movupd 0x10(%r9,%rax,8),%xmm1
DB 102,68,15,40,192 ; movapd %xmm0,%xmm8
@@ -27222,7 +27767,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,158,45,0,0 ; movdqa 0x2d9e(%rip),%xmm9 # 7280 <_sk_callback_sse2+0xff8>
+ DB 102,68,15,111,13,100,46,0,0 ; movdqa 0x2e64(%rip),%xmm9 # 7540 <_sk_callback_sse2+0x10be>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -27230,11 +27775,11 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,131,45,0,0 ; movdqa 0x2d83(%rip),%xmm11 # 7290 <_sk_callback_sse2+0x1008>
+ DB 102,68,15,111,29,73,46,0,0 ; movdqa 0x2e49(%rip),%xmm11 # 7550 <_sk_callback_sse2+0x10ce>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,133,45,0,0 ; movdqa 0x2d85(%rip),%xmm12 # 72a0 <_sk_callback_sse2+0x1018>
+ DB 102,68,15,111,37,75,46,0,0 ; movdqa 0x2e4b(%rip),%xmm12 # 7560 <_sk_callback_sse2+0x10de>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,136,45,0,0 ; movdqa 0x2d88(%rip),%xmm3 # 72b0 <_sk_callback_sse2+0x1028>
+ DB 102,15,111,29,78,46,0,0 ; movdqa 0x2e4e(%rip),%xmm3 # 7570 <_sk_callback_sse2+0x10ee>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -27282,17 +27827,17 @@ _sk_load_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 461f <_sk_load_f16_sse2+0x19f>
+ DB 117,17 ; jne 4819 <_sk_load_f16_sse2+0x19f>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,142,254,255,255 ; jmpq 44ad <_sk_load_f16_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 46a7 <_sk_load_f16_sse2+0x2d>
DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,121,254,255,255 ; jb 44ad <_sk_load_f16_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 46a7 <_sk_load_f16_sse2+0x2d>
DB 242,65,15,16,76,193,16 ; movsd 0x10(%r9,%rax,8),%xmm1
- DB 233,109,254,255,255 ; jmpq 44ad <_sk_load_f16_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 46a7 <_sk_load_f16_sse2+0x2d>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -27304,7 +27849,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,98,1,0,0 ; jne 47c2 <_sk_load_f16_dst_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 49bc <_sk_load_f16_dst_sse2+0x182>
DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4
DB 102,65,15,16,108,193,16 ; movupd 0x10(%r9,%rax,8),%xmm5
DB 102,68,15,40,196 ; movapd %xmm4,%xmm8
@@ -27316,7 +27861,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,238 ; movdqa %xmm14,%xmm5
DB 102,65,15,97,234 ; punpcklwd %xmm10,%xmm5
- DB 102,68,15,111,13,30,44,0,0 ; movdqa 0x2c1e(%rip),%xmm9 # 72c0 <_sk_callback_sse2+0x1038>
+ DB 102,68,15,111,13,228,44,0,0 ; movdqa 0x2ce4(%rip),%xmm9 # 7580 <_sk_callback_sse2+0x10fe>
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,65,15,219,225 ; pand %xmm9,%xmm4
DB 102,15,239,236 ; pxor %xmm4,%xmm5
@@ -27324,11 +27869,11 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,68,15,111,237 ; movdqa %xmm5,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,236 ; por %xmm4,%xmm13
- DB 102,68,15,111,29,3,44,0,0 ; movdqa 0x2c03(%rip),%xmm11 # 72d0 <_sk_callback_sse2+0x1048>
+ DB 102,68,15,111,29,201,44,0,0 ; movdqa 0x2cc9(%rip),%xmm11 # 7590 <_sk_callback_sse2+0x110e>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,5,44,0,0 ; movdqa 0x2c05(%rip),%xmm12 # 72e0 <_sk_callback_sse2+0x1058>
+ DB 102,68,15,111,37,203,44,0,0 ; movdqa 0x2ccb(%rip),%xmm12 # 75a0 <_sk_callback_sse2+0x111e>
DB 102,65,15,239,236 ; pxor %xmm12,%xmm5
- DB 102,15,111,61,8,44,0,0 ; movdqa 0x2c08(%rip),%xmm7 # 72f0 <_sk_callback_sse2+0x1068>
+ DB 102,15,111,61,206,44,0,0 ; movdqa 0x2cce(%rip),%xmm7 # 75b0 <_sk_callback_sse2+0x112e>
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,102,229 ; pcmpgtd %xmm5,%xmm4
DB 102,65,15,223,229 ; pandn %xmm13,%xmm4
@@ -27376,17 +27921,17 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 47df <_sk_load_f16_dst_sse2+0x19f>
+ DB 117,17 ; jne 49d9 <_sk_load_f16_dst_sse2+0x19f>
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 102,15,20,229 ; unpcklpd %xmm5,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
- DB 233,142,254,255,255 ; jmpq 466d <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 4867 <_sk_load_f16_dst_sse2+0x2d>
DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,121,254,255,255 ; jb 466d <_sk_load_f16_dst_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 4867 <_sk_load_f16_dst_sse2+0x2d>
DB 242,65,15,16,108,193,16 ; movsd 0x10(%r9,%rax,8),%xmm5
- DB 233,109,254,255,255 ; jmpq 466d <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 4867 <_sk_load_f16_dst_sse2+0x2d>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -27426,7 +27971,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,87,42,0,0 ; movdqa 0x2a57(%rip),%xmm9 # 7300 <_sk_callback_sse2+0x1078>
+ DB 102,68,15,111,13,29,43,0,0 ; movdqa 0x2b1d(%rip),%xmm9 # 75c0 <_sk_callback_sse2+0x113e>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -27434,11 +27979,11 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,60,42,0,0 ; movdqa 0x2a3c(%rip),%xmm11 # 7310 <_sk_callback_sse2+0x1088>
+ DB 102,68,15,111,29,2,43,0,0 ; movdqa 0x2b02(%rip),%xmm11 # 75d0 <_sk_callback_sse2+0x114e>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,62,42,0,0 ; movdqa 0x2a3e(%rip),%xmm12 # 7320 <_sk_callback_sse2+0x1098>
+ DB 102,68,15,111,37,4,43,0,0 ; movdqa 0x2b04(%rip),%xmm12 # 75e0 <_sk_callback_sse2+0x115e>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,65,42,0,0 ; movdqa 0x2a41(%rip),%xmm3 # 7330 <_sk_callback_sse2+0x10a8>
+ DB 102,15,111,29,7,43,0,0 ; movdqa 0x2b07(%rip),%xmm3 # 75f0 <_sk_callback_sse2+0x116e>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -27495,17 +28040,17 @@ _sk_store_f16_sse2 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,86,41,0,0 ; movdqa 0x2956(%rip),%xmm10 # 7340 <_sk_callback_sse2+0x10b8>
+ DB 102,68,15,111,21,28,42,0,0 ; movdqa 0x2a1c(%rip),%xmm10 # 7600 <_sk_callback_sse2+0x117e>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,69,15,219,226 ; pand %xmm10,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,236 ; pxor %xmm12,%xmm13
- DB 102,68,15,111,13,73,41,0,0 ; movdqa 0x2949(%rip),%xmm9 # 7350 <_sk_callback_sse2+0x10c8>
+ DB 102,68,15,111,13,15,42,0,0 ; movdqa 0x2a0f(%rip),%xmm9 # 7610 <_sk_callback_sse2+0x118e>
DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,29,58,41,0,0 ; movdqa 0x293a(%rip),%xmm11 # 7360 <_sk_callback_sse2+0x10d8>
+ DB 102,68,15,111,29,0,42,0,0 ; movdqa 0x2a00(%rip),%xmm11 # 7620 <_sk_callback_sse2+0x119e>
DB 102,69,15,235,227 ; por %xmm11,%xmm12
DB 102,69,15,254,229 ; paddd %xmm13,%xmm12
DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12
@@ -27557,7 +28102,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,204 ; punpckldq %xmm12,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 4b48 <_sk_store_f16_sse2+0x17e>
+ DB 117,21 ; jne 4d42 <_sk_store_f16_sse2+0x17e>
DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8)
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8)
@@ -27565,13 +28110,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4b44 <_sk_store_f16_sse2+0x17a>
+ DB 116,240 ; je 4d3e <_sk_store_f16_sse2+0x17a>
DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4b44 <_sk_store_f16_sse2+0x17a>
+ DB 114,227 ; jb 4d3e <_sk_store_f16_sse2+0x17a>
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8)
- DB 235,213 ; jmp 4b44 <_sk_store_f16_sse2+0x17a>
+ DB 235,213 ; jmp 4d3e <_sk_store_f16_sse2+0x17a>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -27584,7 +28129,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,190,0,0,0 ; jne 4c54 <_sk_load_u16_be_sse2+0xe5>
+ DB 15,133,190,0,0,0 ; jne 4e4e <_sk_load_u16_be_sse2+0xe5>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 102,65,15,16,76,65,16 ; movupd 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -27601,7 +28146,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,5,137,39,0,0 ; movaps 0x2789(%rip),%xmm8 # 7370 <_sk_callback_sse2+0x10e8>
+ DB 68,15,40,5,79,40,0,0 ; movaps 0x284f(%rip),%xmm8 # 7630 <_sk_callback_sse2+0x11ae>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -27629,17 +28174,17 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 4c71 <_sk_load_u16_be_sse2+0x102>
+ DB 117,17 ; jne 4e6b <_sk_load_u16_be_sse2+0x102>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,50,255,255,255 ; jmpq 4ba3 <_sk_load_u16_be_sse2+0x34>
+ DB 233,50,255,255,255 ; jmpq 4d9d <_sk_load_u16_be_sse2+0x34>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,29,255,255,255 ; jb 4ba3 <_sk_load_u16_be_sse2+0x34>
+ DB 15,130,29,255,255,255 ; jb 4d9d <_sk_load_u16_be_sse2+0x34>
DB 242,65,15,16,76,65,16 ; movsd 0x10(%r9,%rax,2),%xmm1
- DB 233,17,255,255,255 ; jmpq 4ba3 <_sk_load_u16_be_sse2+0x34>
+ DB 233,17,255,255,255 ; jmpq 4d9d <_sk_load_u16_be_sse2+0x34>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -27654,7 +28199,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,175,0,0,0 ; jne 4d6c <_sk_load_rgb_u16_be_sse2+0xda>
+ DB 15,133,175,0,0,0 ; jne 4f66 <_sk_load_rgb_u16_be_sse2+0xda>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -27675,7 +28220,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,13,95,38,0,0 ; movaps 0x265f(%rip),%xmm9 # 7380 <_sk_callback_sse2+0x10f8>
+ DB 68,15,40,13,37,39,0,0 ; movaps 0x2725(%rip),%xmm9 # 7640 <_sk_callback_sse2+0x11be>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -27692,27 +28237,27 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,38,38,0,0 ; movaps 0x2626(%rip),%xmm3 # 7390 <_sk_callback_sse2+0x1108>
+ DB 15,40,29,236,38,0,0 ; movaps 0x26ec(%rip),%xmm3 # 7650 <_sk_callback_sse2+0x11ce>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 4d91 <_sk_load_rgb_u16_be_sse2+0xff>
+ DB 117,13 ; jne 4f8b <_sk_load_rgb_u16_be_sse2+0xff>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,80,255,255,255 ; jmpq 4ce1 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,80,255,255,255 ; jmpq 4edb <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 4dc2 <_sk_load_rgb_u16_be_sse2+0x130>
+ DB 114,24 ; jb 4fbc <_sk_load_rgb_u16_be_sse2+0x130>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,31,255,255,255 ; jmpq 4ce1 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,31,255,255,255 ; jmpq 4edb <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,22,255,255,255 ; jmpq 4ce1 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,22,255,255,255 ; jmpq 4edb <_sk_load_rgb_u16_be_sse2+0x4f>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
@@ -27724,7 +28269,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,175,37,0,0 ; movaps 0x25af(%rip),%xmm10 # 73a0 <_sk_callback_sse2+0x1118>
+ DB 68,15,40,21,117,38,0,0 ; movaps 0x2675(%rip),%xmm10 # 7660 <_sk_callback_sse2+0x11de>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -27769,7 +28314,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 4eeb <_sk_store_u16_be_sse2+0x120>
+ DB 117,21 ; jne 50e5 <_sk_store_u16_be_sse2+0x120>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -27777,13 +28322,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4ee7 <_sk_store_u16_be_sse2+0x11c>
+ DB 116,240 ; je 50e1 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4ee7 <_sk_store_u16_be_sse2+0x11c>
+ DB 114,227 ; jb 50e1 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 4ee7 <_sk_store_u16_be_sse2+0x11c>
+ DB 235,213 ; jmp 50e1 <_sk_store_u16_be_sse2+0x11c>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -27797,7 +28342,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 4f7d <_sk_load_f32_sse2+0x6b>
+ DB 117,66 ; jne 5177 <_sk_load_f32_sse2+0x6b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -27817,17 +28362,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 4f8f <_sk_load_f32_sse2+0x7d>
+ DB 117,8 ; jne 5189 <_sk_load_f32_sse2+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 4f4d <_sk_load_f32_sse2+0x3b>
+ DB 235,190 ; jmp 5147 <_sk_load_f32_sse2+0x3b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 4fa3 <_sk_load_f32_sse2+0x91>
+ DB 114,8 ; jb 519d <_sk_load_f32_sse2+0x91>
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
- DB 235,170 ; jmp 4f4d <_sk_load_f32_sse2+0x3b>
+ DB 235,170 ; jmp 5147 <_sk_load_f32_sse2+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 4f4d <_sk_load_f32_sse2+0x3b>
+ DB 235,165 ; jmp 5147 <_sk_load_f32_sse2+0x3b>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
@@ -27841,7 +28386,7 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 5013 <_sk_load_f32_dst_sse2+0x6b>
+ DB 117,66 ; jne 520d <_sk_load_f32_dst_sse2+0x6b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -27861,17 +28406,17 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 5025 <_sk_load_f32_dst_sse2+0x7d>
+ DB 117,8 ; jne 521f <_sk_load_f32_dst_sse2+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 4fe3 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,190 ; jmp 51dd <_sk_load_f32_dst_sse2+0x3b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 5039 <_sk_load_f32_dst_sse2+0x91>
+ DB 114,8 ; jb 5233 <_sk_load_f32_dst_sse2+0x91>
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
- DB 235,170 ; jmp 4fe3 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,170 ; jmp 51dd <_sk_load_f32_dst_sse2+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 4fe3 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,165 ; jmp 51dd <_sk_load_f32_dst_sse2+0x3b>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -27898,7 +28443,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 50bb <_sk_store_f32_sse2+0x7d>
+ DB 117,29 ; jne 52b5 <_sk_store_f32_sse2+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
@@ -27906,12 +28451,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 50b7 <_sk_store_f32_sse2+0x79>
+ DB 116,246 ; je 52b1 <_sk_store_f32_sse2+0x79>
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 50b7 <_sk_store_f32_sse2+0x79>
+ DB 114,234 ; jb 52b1 <_sk_store_f32_sse2+0x79>
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
- DB 235,225 ; jmp 50b7 <_sk_store_f32_sse2+0x79>
+ DB 235,225 ; jmp 52b1 <_sk_store_f32_sse2+0x79>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -27951,7 +28496,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,92,34,0,0 ; andps 0x225c(%rip),%xmm10 # 73b0 <_sk_callback_sse2+0x1128>
+ DB 68,15,84,21,34,35,0,0 ; andps 0x2322(%rip),%xmm10 # 7670 <_sk_callback_sse2+0x11ee>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -27975,7 +28520,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,18,34,0,0 ; andps 0x2212(%rip),%xmm10 # 73c0 <_sk_callback_sse2+0x1138>
+ DB 68,15,84,21,216,34,0,0 ; andps 0x22d8(%rip),%xmm10 # 7680 <_sk_callback_sse2+0x11fe>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -27999,13 +28544,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 65,15,92,193 ; subps %xmm9,%xmm0
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,119,38,0,0 ; mulss 0x2677(%rip),%xmm11 # 7880 <_sk_callback_sse2+0x15f8>
+ DB 243,68,15,89,29,61,39,0,0 ; mulss 0x273d(%rip),%xmm11 # 7b40 <_sk_callback_sse2+0x16be>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,168,33,0,0 ; andps 0x21a8(%rip),%xmm11 # 73d0 <_sk_callback_sse2+0x1148>
+ DB 68,15,84,29,110,34,0,0 ; andps 0x226e(%rip),%xmm11 # 7690 <_sk_callback_sse2+0x120e>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -28032,13 +28577,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 65,15,92,201 ; subps %xmm9,%xmm1
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,246,37,0,0 ; mulss 0x25f6(%rip),%xmm11 # 7884 <_sk_callback_sse2+0x15fc>
+ DB 243,68,15,89,29,188,38,0,0 ; mulss 0x26bc(%rip),%xmm11 # 7b44 <_sk_callback_sse2+0x16c2>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,51,33,0,0 ; andps 0x2133(%rip),%xmm11 # 73e0 <_sk_callback_sse2+0x1158>
+ DB 68,15,84,29,249,33,0,0 ; andps 0x21f9(%rip),%xmm11 # 76a0 <_sk_callback_sse2+0x121e>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -28059,7 +28604,7 @@ PUBLIC _sk_clamp_x_1_sse2
_sk_clamp_x_1_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,250,32,0,0 ; minps 0x20fa(%rip),%xmm8 # 73f0 <_sk_callback_sse2+0x1168>
+ DB 68,15,93,5,192,33,0,0 ; minps 0x21c0(%rip),%xmm8 # 76b0 <_sk_callback_sse2+0x122e>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -28070,7 +28615,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,84,13,232,32,0,0 ; andps 0x20e8(%rip),%xmm9 # 7400 <_sk_callback_sse2+0x1178>
+ DB 68,15,84,13,174,33,0,0 ; andps 0x21ae(%rip),%xmm9 # 76c0 <_sk_callback_sse2+0x123e>
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -28078,14 +28623,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
PUBLIC _sk_mirror_x_1_sse2
_sk_mirror_x_1_sse2 LABEL PROC
- DB 68,15,40,5,228,32,0,0 ; movaps 0x20e4(%rip),%xmm8 # 7410 <_sk_callback_sse2+0x1188>
+ DB 68,15,40,5,170,33,0,0 ; movaps 0x21aa(%rip),%xmm8 # 76d0 <_sk_callback_sse2+0x124e>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,232,32,0,0 ; movaps 0x20e8(%rip),%xmm9 # 7420 <_sk_callback_sse2+0x1198>
+ DB 68,15,40,13,174,33,0,0 ; movaps 0x21ae(%rip),%xmm9 # 76e0 <_sk_callback_sse2+0x125e>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,222,32,0,0 ; andps 0x20de(%rip),%xmm9 # 7430 <_sk_callback_sse2+0x11a8>
+ DB 68,15,84,13,164,33,0,0 ; andps 0x21a4(%rip),%xmm9 # 76f0 <_sk_callback_sse2+0x126e>
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,88,210 ; addps %xmm10,%xmm10
@@ -28099,10 +28644,10 @@ _sk_mirror_x_1_sse2 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,196,32,0,0 ; mulps 0x20c4(%rip),%xmm0 # 7440 <_sk_callback_sse2+0x11b8>
- DB 15,89,13,205,32,0,0 ; mulps 0x20cd(%rip),%xmm1 # 7450 <_sk_callback_sse2+0x11c8>
+ DB 15,89,5,138,33,0,0 ; mulps 0x218a(%rip),%xmm0 # 7700 <_sk_callback_sse2+0x127e>
+ DB 15,89,13,147,33,0,0 ; mulps 0x2193(%rip),%xmm1 # 7710 <_sk_callback_sse2+0x128e>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,211,32,0,0 ; mulps 0x20d3(%rip),%xmm3 # 7460 <_sk_callback_sse2+0x11d8>
+ DB 15,89,29,153,33,0,0 ; mulps 0x2199(%rip),%xmm3 # 7720 <_sk_callback_sse2+0x129e>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -28398,9 +28943,9 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 582d <_sk_evenly_spaced_gradient_sse2+0x18>
+ DB 120,7 ; js 5a27 <_sk_evenly_spaced_gradient_sse2+0x18>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 5842 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ DB 235,21 ; jmp 5a3c <_sk_evenly_spaced_gradient_sse2+0x2d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -28496,15 +29041,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse2
_sk_gauss_a_to_rgba_sse2 LABEL PROC
- DB 15,40,5,162,26,0,0 ; movaps 0x1aa2(%rip),%xmm0 # 7470 <_sk_callback_sse2+0x11e8>
+ DB 15,40,5,104,27,0,0 ; movaps 0x1b68(%rip),%xmm0 # 7730 <_sk_callback_sse2+0x12ae>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,168,26,0,0 ; addps 0x1aa8(%rip),%xmm0 # 7480 <_sk_callback_sse2+0x11f8>
+ DB 15,88,5,110,27,0,0 ; addps 0x1b6e(%rip),%xmm0 # 7740 <_sk_callback_sse2+0x12be>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,174,26,0,0 ; addps 0x1aae(%rip),%xmm0 # 7490 <_sk_callback_sse2+0x1208>
+ DB 15,88,5,116,27,0,0 ; addps 0x1b74(%rip),%xmm0 # 7750 <_sk_callback_sse2+0x12ce>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,180,26,0,0 ; addps 0x1ab4(%rip),%xmm0 # 74a0 <_sk_callback_sse2+0x1218>
+ DB 15,88,5,122,27,0,0 ; addps 0x1b7a(%rip),%xmm0 # 7760 <_sk_callback_sse2+0x12de>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,186,26,0,0 ; addps 0x1aba(%rip),%xmm0 # 74b0 <_sk_callback_sse2+0x1228>
+ DB 15,88,5,128,27,0,0 ; addps 0x1b80(%rip),%xmm0 # 7770 <_sk_callback_sse2+0x12ee>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -28520,12 +29065,12 @@ _sk_gradient_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 5a49 <_sk_gradient_sse2+0x46>
+ DB 114,50 ; jb 5c43 <_sk_gradient_sse2+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,147,26,0,0 ; movaps 0x1a93(%rip),%xmm2 # 74c0 <_sk_callback_sse2+0x1238>
+ DB 15,40,21,89,27,0,0 ; movaps 0x1b59(%rip),%xmm2 # 7780 <_sk_callback_sse2+0x12fe>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -28533,7 +29078,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 5a2d <_sk_gradient_sse2+0x2a>
+ DB 117,228 ; jne 5c27 <_sk_gradient_sse2+0x2a>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,211 ; movq %xmm2,%r11
DB 69,137,217 ; mov %r11d,%r9d
@@ -28668,29 +29213,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 69,15,94,220 ; divps %xmm12,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
- DB 68,15,40,45,84,24,0,0 ; movaps 0x1854(%rip),%xmm13 # 74d0 <_sk_callback_sse2+0x1248>
+ DB 68,15,40,45,26,25,0,0 ; movaps 0x191a(%rip),%xmm13 # 7790 <_sk_callback_sse2+0x130e>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,88,24,0,0 ; addps 0x1858(%rip),%xmm13 # 74e0 <_sk_callback_sse2+0x1258>
+ DB 68,15,88,45,30,25,0,0 ; addps 0x191e(%rip),%xmm13 # 77a0 <_sk_callback_sse2+0x131e>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,92,24,0,0 ; addps 0x185c(%rip),%xmm13 # 74f0 <_sk_callback_sse2+0x1268>
+ DB 68,15,88,45,34,25,0,0 ; addps 0x1922(%rip),%xmm13 # 77b0 <_sk_callback_sse2+0x132e>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,96,24,0,0 ; addps 0x1860(%rip),%xmm13 # 7500 <_sk_callback_sse2+0x1278>
+ DB 68,15,88,45,38,25,0,0 ; addps 0x1926(%rip),%xmm13 # 77c0 <_sk_callback_sse2+0x133e>
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,40,21,95,24,0,0 ; movaps 0x185f(%rip),%xmm10 # 7510 <_sk_callback_sse2+0x1288>
+ DB 68,15,40,21,37,25,0,0 ; movaps 0x1925(%rip),%xmm10 # 77d0 <_sk_callback_sse2+0x134e>
DB 69,15,92,213 ; subps %xmm13,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,205 ; andnps %xmm13,%xmm9
DB 69,15,86,202 ; orps %xmm10,%xmm9
DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8
- DB 68,15,40,21,82,24,0,0 ; movaps 0x1852(%rip),%xmm10 # 7520 <_sk_callback_sse2+0x1298>
+ DB 68,15,40,21,24,25,0,0 ; movaps 0x1918(%rip),%xmm10 # 77e0 <_sk_callback_sse2+0x135e>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,84,208 ; andps %xmm8,%xmm10
DB 69,15,85,193 ; andnps %xmm9,%xmm8
DB 69,15,86,194 ; orps %xmm10,%xmm8
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9
- DB 68,15,40,21,65,24,0,0 ; movaps 0x1841(%rip),%xmm10 # 7530 <_sk_callback_sse2+0x12a8>
+ DB 68,15,40,21,7,25,0,0 ; movaps 0x1907(%rip),%xmm10 # 77f0 <_sk_callback_sse2+0x136e>
DB 69,15,92,208 ; subps %xmm8,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,200 ; andnps %xmm8,%xmm9
@@ -28721,7 +29266,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,232,23,0,0 ; mulps 0x17e8(%rip),%xmm9 # 7540 <_sk_callback_sse2+0x12b8>
+ DB 68,15,89,13,174,24,0,0 ; mulps 0x18ae(%rip),%xmm9 # 7800 <_sk_callback_sse2+0x137e>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -28729,7 +29274,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,211,23,0,0 ; mulps 0x17d3(%rip),%xmm10 # 7550 <_sk_callback_sse2+0x12c8>
+ DB 68,15,89,21,153,24,0,0 ; mulps 0x1899(%rip),%xmm10 # 7810 <_sk_callback_sse2+0x138e>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -28738,8 +29283,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,187,23,0,0 ; xorps 0x17bb(%rip),%xmm9 # 7560 <_sk_callback_sse2+0x12d8>
- DB 68,15,89,5,195,23,0,0 ; mulps 0x17c3(%rip),%xmm8 # 7570 <_sk_callback_sse2+0x12e8>
+ DB 68,15,87,13,129,24,0,0 ; xorps 0x1881(%rip),%xmm9 # 7820 <_sk_callback_sse2+0x139e>
+ DB 68,15,89,5,137,24,0,0 ; mulps 0x1889(%rip),%xmm8 # 7830 <_sk_callback_sse2+0x13ae>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -28758,7 +29303,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,138,23,0,0 ; mulps 0x178a(%rip),%xmm9 # 7580 <_sk_callback_sse2+0x12f8>
+ DB 68,15,89,13,80,24,0,0 ; mulps 0x1850(%rip),%xmm9 # 7840 <_sk_callback_sse2+0x13be>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -28766,7 +29311,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,117,23,0,0 ; mulps 0x1775(%rip),%xmm10 # 7590 <_sk_callback_sse2+0x1308>
+ DB 68,15,89,21,59,24,0,0 ; mulps 0x183b(%rip),%xmm10 # 7850 <_sk_callback_sse2+0x13ce>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -28775,8 +29320,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,93,23,0,0 ; xorps 0x175d(%rip),%xmm9 # 75a0 <_sk_callback_sse2+0x1318>
- DB 68,15,89,5,101,23,0,0 ; mulps 0x1765(%rip),%xmm8 # 75b0 <_sk_callback_sse2+0x1328>
+ DB 68,15,87,13,35,24,0,0 ; xorps 0x1823(%rip),%xmm9 # 7860 <_sk_callback_sse2+0x13de>
+ DB 68,15,89,5,43,24,0,0 ; mulps 0x182b(%rip),%xmm8 # 7870 <_sk_callback_sse2+0x13ee>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -28792,7 +29337,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,61,23,0,0 ; mulps 0x173d(%rip),%xmm9 # 75c0 <_sk_callback_sse2+0x1338>
+ DB 68,15,89,13,3,24,0,0 ; mulps 0x1803(%rip),%xmm9 # 7880 <_sk_callback_sse2+0x13fe>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -28800,7 +29345,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,41,23,0,0 ; xorps 0x1729(%rip),%xmm0 # 75d0 <_sk_callback_sse2+0x1348>
+ DB 15,87,5,239,23,0,0 ; xorps 0x17ef(%rip),%xmm0 # 7890 <_sk_callback_sse2+0x140e>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28837,7 +29382,7 @@ _sk_apply_vector_mask_sse2 LABEL PROC
PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,207,22,0,0 ; movaps 0x16cf(%rip),%xmm8 # 75e0 <_sk_callback_sse2+0x1358>
+ DB 68,15,40,5,149,23,0,0 ; movaps 0x1795(%rip),%xmm8 # 78a0 <_sk_callback_sse2+0x141e>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -28845,7 +29390,7 @@ _sk_save_xy_sse2 LABEL PROC
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,40,217 ; movaps %xmm9,%xmm11
DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11
- DB 68,15,40,37,186,22,0,0 ; movaps 0x16ba(%rip),%xmm12 # 75f0 <_sk_callback_sse2+0x1368>
+ DB 68,15,40,37,128,23,0,0 ; movaps 0x1780(%rip),%xmm12 # 78b0 <_sk_callback_sse2+0x142e>
DB 69,15,84,220 ; andps %xmm12,%xmm11
DB 69,15,92,211 ; subps %xmm11,%xmm10
DB 69,15,92,202 ; subps %xmm10,%xmm9
@@ -28888,8 +29433,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,51,22,0,0 ; addps 0x1633(%rip),%xmm0 # 7600 <_sk_callback_sse2+0x1378>
- DB 68,15,40,13,59,22,0,0 ; movaps 0x163b(%rip),%xmm9 # 7610 <_sk_callback_sse2+0x1388>
+ DB 15,88,5,249,22,0,0 ; addps 0x16f9(%rip),%xmm0 # 78c0 <_sk_callback_sse2+0x143e>
+ DB 68,15,40,13,1,23,0,0 ; movaps 0x1701(%rip),%xmm9 # 78d0 <_sk_callback_sse2+0x144e>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -28900,7 +29445,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,42,22,0,0 ; addps 0x162a(%rip),%xmm0 # 7620 <_sk_callback_sse2+0x1398>
+ DB 15,88,5,240,22,0,0 ; addps 0x16f0(%rip),%xmm0 # 78e0 <_sk_callback_sse2+0x145e>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28910,8 +29455,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,28,22,0,0 ; addps 0x161c(%rip),%xmm1 # 7630 <_sk_callback_sse2+0x13a8>
- DB 68,15,40,13,36,22,0,0 ; movaps 0x1624(%rip),%xmm9 # 7640 <_sk_callback_sse2+0x13b8>
+ DB 15,88,13,226,22,0,0 ; addps 0x16e2(%rip),%xmm1 # 78f0 <_sk_callback_sse2+0x146e>
+ DB 68,15,40,13,234,22,0,0 ; movaps 0x16ea(%rip),%xmm9 # 7900 <_sk_callback_sse2+0x147e>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -28922,7 +29467,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,18,22,0,0 ; addps 0x1612(%rip),%xmm1 # 7650 <_sk_callback_sse2+0x13c8>
+ DB 15,88,13,216,22,0,0 ; addps 0x16d8(%rip),%xmm1 # 7910 <_sk_callback_sse2+0x148e>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28932,13 +29477,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,5,22,0,0 ; addps 0x1605(%rip),%xmm0 # 7660 <_sk_callback_sse2+0x13d8>
- DB 68,15,40,13,13,22,0,0 ; movaps 0x160d(%rip),%xmm9 # 7670 <_sk_callback_sse2+0x13e8>
+ DB 15,88,5,203,22,0,0 ; addps 0x16cb(%rip),%xmm0 # 7920 <_sk_callback_sse2+0x149e>
+ DB 68,15,40,13,211,22,0,0 ; movaps 0x16d3(%rip),%xmm9 # 7930 <_sk_callback_sse2+0x14ae>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,9,22,0,0 ; mulps 0x1609(%rip),%xmm9 # 7680 <_sk_callback_sse2+0x13f8>
- DB 68,15,88,13,17,22,0,0 ; addps 0x1611(%rip),%xmm9 # 7690 <_sk_callback_sse2+0x1408>
+ DB 68,15,89,13,207,22,0,0 ; mulps 0x16cf(%rip),%xmm9 # 7940 <_sk_callback_sse2+0x14be>
+ DB 68,15,88,13,215,22,0,0 ; addps 0x16d7(%rip),%xmm9 # 7950 <_sk_callback_sse2+0x14ce>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -28949,16 +29494,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,0,22,0,0 ; addps 0x1600(%rip),%xmm0 # 76a0 <_sk_callback_sse2+0x1418>
- DB 68,15,40,13,8,22,0,0 ; movaps 0x1608(%rip),%xmm9 # 76b0 <_sk_callback_sse2+0x1428>
+ DB 15,88,5,198,22,0,0 ; addps 0x16c6(%rip),%xmm0 # 7960 <_sk_callback_sse2+0x14de>
+ DB 68,15,40,13,206,22,0,0 ; movaps 0x16ce(%rip),%xmm9 # 7970 <_sk_callback_sse2+0x14ee>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,12,22,0,0 ; movaps 0x160c(%rip),%xmm8 # 76c0 <_sk_callback_sse2+0x1438>
+ DB 68,15,40,5,210,22,0,0 ; movaps 0x16d2(%rip),%xmm8 # 7980 <_sk_callback_sse2+0x14fe>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,16,22,0,0 ; addps 0x1610(%rip),%xmm8 # 76d0 <_sk_callback_sse2+0x1448>
+ DB 68,15,88,5,214,22,0,0 ; addps 0x16d6(%rip),%xmm8 # 7990 <_sk_callback_sse2+0x150e>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,20,22,0,0 ; addps 0x1614(%rip),%xmm8 # 76e0 <_sk_callback_sse2+0x1458>
+ DB 68,15,88,5,218,22,0,0 ; addps 0x16da(%rip),%xmm8 # 79a0 <_sk_callback_sse2+0x151e>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,24,22,0,0 ; addps 0x1618(%rip),%xmm8 # 76f0 <_sk_callback_sse2+0x1468>
+ DB 68,15,88,5,222,22,0,0 ; addps 0x16de(%rip),%xmm8 # 79b0 <_sk_callback_sse2+0x152e>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28966,17 +29511,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,18,22,0,0 ; movaps 0x1612(%rip),%xmm8 # 7700 <_sk_callback_sse2+0x1478>
+ DB 68,15,40,5,216,22,0,0 ; movaps 0x16d8(%rip),%xmm8 # 79c0 <_sk_callback_sse2+0x153e>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,14,22,0,0 ; movaps 0x160e(%rip),%xmm10 # 7710 <_sk_callback_sse2+0x1488>
+ DB 68,15,40,21,212,22,0,0 ; movaps 0x16d4(%rip),%xmm10 # 79d0 <_sk_callback_sse2+0x154e>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,18,22,0,0 ; addps 0x1612(%rip),%xmm10 # 7720 <_sk_callback_sse2+0x1498>
+ DB 68,15,88,21,216,22,0,0 ; addps 0x16d8(%rip),%xmm10 # 79e0 <_sk_callback_sse2+0x155e>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,14,22,0,0 ; addps 0x160e(%rip),%xmm10 # 7730 <_sk_callback_sse2+0x14a8>
+ DB 68,15,88,21,212,22,0,0 ; addps 0x16d4(%rip),%xmm10 # 79f0 <_sk_callback_sse2+0x156e>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28986,11 +29531,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,1,22,0,0 ; addps 0x1601(%rip),%xmm0 # 7740 <_sk_callback_sse2+0x14b8>
+ DB 15,88,5,199,22,0,0 ; addps 0x16c7(%rip),%xmm0 # 7a00 <_sk_callback_sse2+0x157e>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,1,22,0,0 ; mulps 0x1601(%rip),%xmm8 # 7750 <_sk_callback_sse2+0x14c8>
- DB 68,15,88,5,9,22,0,0 ; addps 0x1609(%rip),%xmm8 # 7760 <_sk_callback_sse2+0x14d8>
+ DB 68,15,89,5,199,22,0,0 ; mulps 0x16c7(%rip),%xmm8 # 7a10 <_sk_callback_sse2+0x158e>
+ DB 68,15,88,5,207,22,0,0 ; addps 0x16cf(%rip),%xmm8 # 7a20 <_sk_callback_sse2+0x159e>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29001,13 +29546,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,247,21,0,0 ; addps 0x15f7(%rip),%xmm1 # 7770 <_sk_callback_sse2+0x14e8>
- DB 68,15,40,13,255,21,0,0 ; movaps 0x15ff(%rip),%xmm9 # 7780 <_sk_callback_sse2+0x14f8>
+ DB 15,88,13,189,22,0,0 ; addps 0x16bd(%rip),%xmm1 # 7a30 <_sk_callback_sse2+0x15ae>
+ DB 68,15,40,13,197,22,0,0 ; movaps 0x16c5(%rip),%xmm9 # 7a40 <_sk_callback_sse2+0x15be>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,251,21,0,0 ; mulps 0x15fb(%rip),%xmm9 # 7790 <_sk_callback_sse2+0x1508>
- DB 68,15,88,13,3,22,0,0 ; addps 0x1603(%rip),%xmm9 # 77a0 <_sk_callback_sse2+0x1518>
+ DB 68,15,89,13,193,22,0,0 ; mulps 0x16c1(%rip),%xmm9 # 7a50 <_sk_callback_sse2+0x15ce>
+ DB 68,15,88,13,201,22,0,0 ; addps 0x16c9(%rip),%xmm9 # 7a60 <_sk_callback_sse2+0x15de>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29018,16 +29563,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,241,21,0,0 ; addps 0x15f1(%rip),%xmm1 # 77b0 <_sk_callback_sse2+0x1528>
- DB 68,15,40,13,249,21,0,0 ; movaps 0x15f9(%rip),%xmm9 # 77c0 <_sk_callback_sse2+0x1538>
+ DB 15,88,13,183,22,0,0 ; addps 0x16b7(%rip),%xmm1 # 7a70 <_sk_callback_sse2+0x15ee>
+ DB 68,15,40,13,191,22,0,0 ; movaps 0x16bf(%rip),%xmm9 # 7a80 <_sk_callback_sse2+0x15fe>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,253,21,0,0 ; movaps 0x15fd(%rip),%xmm8 # 77d0 <_sk_callback_sse2+0x1548>
+ DB 68,15,40,5,195,22,0,0 ; movaps 0x16c3(%rip),%xmm8 # 7a90 <_sk_callback_sse2+0x160e>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,1,22,0,0 ; addps 0x1601(%rip),%xmm8 # 77e0 <_sk_callback_sse2+0x1558>
+ DB 68,15,88,5,199,22,0,0 ; addps 0x16c7(%rip),%xmm8 # 7aa0 <_sk_callback_sse2+0x161e>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,5,22,0,0 ; addps 0x1605(%rip),%xmm8 # 77f0 <_sk_callback_sse2+0x1568>
+ DB 68,15,88,5,203,22,0,0 ; addps 0x16cb(%rip),%xmm8 # 7ab0 <_sk_callback_sse2+0x162e>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,9,22,0,0 ; addps 0x1609(%rip),%xmm8 # 7800 <_sk_callback_sse2+0x1578>
+ DB 68,15,88,5,207,22,0,0 ; addps 0x16cf(%rip),%xmm8 # 7ac0 <_sk_callback_sse2+0x163e>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -29035,17 +29580,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,3,22,0,0 ; movaps 0x1603(%rip),%xmm8 # 7810 <_sk_callback_sse2+0x1588>
+ DB 68,15,40,5,201,22,0,0 ; movaps 0x16c9(%rip),%xmm8 # 7ad0 <_sk_callback_sse2+0x164e>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,254,21,0,0 ; movaps 0x15fe(%rip),%xmm10 # 7820 <_sk_callback_sse2+0x1598>
+ DB 68,15,40,21,196,22,0,0 ; movaps 0x16c4(%rip),%xmm10 # 7ae0 <_sk_callback_sse2+0x165e>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,2,22,0,0 ; addps 0x1602(%rip),%xmm10 # 7830 <_sk_callback_sse2+0x15a8>
+ DB 68,15,88,21,200,22,0,0 ; addps 0x16c8(%rip),%xmm10 # 7af0 <_sk_callback_sse2+0x166e>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,254,21,0,0 ; addps 0x15fe(%rip),%xmm10 # 7840 <_sk_callback_sse2+0x15b8>
+ DB 68,15,88,21,196,22,0,0 ; addps 0x16c4(%rip),%xmm10 # 7b00 <_sk_callback_sse2+0x167e>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -29055,11 +29600,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,240,21,0,0 ; addps 0x15f0(%rip),%xmm1 # 7850 <_sk_callback_sse2+0x15c8>
+ DB 15,88,13,182,22,0,0 ; addps 0x16b6(%rip),%xmm1 # 7b10 <_sk_callback_sse2+0x168e>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,240,21,0,0 ; mulps 0x15f0(%rip),%xmm8 # 7860 <_sk_callback_sse2+0x15d8>
- DB 68,15,88,5,248,21,0,0 ; addps 0x15f8(%rip),%xmm8 # 7870 <_sk_callback_sse2+0x15e8>
+ DB 68,15,89,5,182,22,0,0 ; mulps 0x16b6(%rip),%xmm8 # 7b20 <_sk_callback_sse2+0x169e>
+ DB 68,15,88,5,190,22,0,0 ; addps 0x16be(%rip),%xmm8 # 7b30 <_sk_callback_sse2+0x16ae>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29289,9 +29834,9 @@ ALIGN 16
DB 128,191,0,0,224,64,0 ; cmpb $0x0,0x40e00000(%rdi)
DB 0,224 ; add %ah,%al
DB 64,0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 655c <.literal16+0x1fc>
+ DB 224,64 ; loopne 674c <.literal16+0x1fc>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 6560 <.literal16+0x200>
+ DB 224,64 ; loopne 6750 <.literal16+0x200>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -29311,13 +29856,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6581 <.literal16+0x221>
+ DB 71,225,61 ; rex.RXB loope 6771 <.literal16+0x221>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6585 <.literal16+0x225>
+ DB 71,225,61 ; rex.RXB loope 6775 <.literal16+0x225>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6589 <.literal16+0x229>
+ DB 71,225,61 ; rex.RXB loope 6779 <.literal16+0x229>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 658d <.literal16+0x22d>
+ DB 71,225,61 ; rex.RXB loope 677d <.literal16+0x22d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -29342,13 +29887,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 65c1 <.literal16+0x261>
+ DB 71,225,61 ; rex.RXB loope 67b1 <.literal16+0x261>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 65c5 <.literal16+0x265>
+ DB 71,225,61 ; rex.RXB loope 67b5 <.literal16+0x265>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 65c9 <.literal16+0x269>
+ DB 71,225,61 ; rex.RXB loope 67b9 <.literal16+0x269>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 65cd <.literal16+0x26d>
+ DB 71,225,61 ; rex.RXB loope 67bd <.literal16+0x26d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -29373,13 +29918,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6601 <.literal16+0x2a1>
+ DB 71,225,61 ; rex.RXB loope 67f1 <.literal16+0x2a1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6605 <.literal16+0x2a5>
+ DB 71,225,61 ; rex.RXB loope 67f5 <.literal16+0x2a5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6609 <.literal16+0x2a9>
+ DB 71,225,61 ; rex.RXB loope 67f9 <.literal16+0x2a9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 660d <.literal16+0x2ad>
+ DB 71,225,61 ; rex.RXB loope 67fd <.literal16+0x2ad>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -29404,13 +29949,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6641 <.literal16+0x2e1>
+ DB 71,225,61 ; rex.RXB loope 6831 <.literal16+0x2e1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6645 <.literal16+0x2e5>
+ DB 71,225,61 ; rex.RXB loope 6835 <.literal16+0x2e5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 6649 <.literal16+0x2e9>
+ DB 71,225,61 ; rex.RXB loope 6839 <.literal16+0x2e9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 664d <.literal16+0x2ed>
+ DB 71,225,61 ; rex.RXB loope 683d <.literal16+0x2ed>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -29431,11 +29976,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
DB 67,0,0 ; rex.XB add %al,(%r8)
- DB 127,67 ; jg 668b <.literal16+0x32b>
+ DB 127,67 ; jg 687b <.literal16+0x32b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 668f <.literal16+0x32f>
+ DB 127,67 ; jg 687f <.literal16+0x32f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6693 <.literal16+0x333>
+ DB 127,67 ; jg 6883 <.literal16+0x333>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -29727,13 +30272,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 68e9 <.literal16+0x589>
+ DB 224,7 ; loopne 6ad9 <.literal16+0x589>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 68ed <.literal16+0x58d>
+ DB 224,7 ; loopne 6add <.literal16+0x58d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 68f1 <.literal16+0x591>
+ DB 224,7 ; loopne 6ae1 <.literal16+0x591>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 68f5 <.literal16+0x595>
+ DB 224,7 ; loopne 6ae5 <.literal16+0x595>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -29798,11 +30343,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 69cb <.literal16+0x66b>
+ DB 127,67 ; jg 6bbb <.literal16+0x66b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 69cf <.literal16+0x66f>
+ DB 127,67 ; jg 6bbf <.literal16+0x66f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 69d3 <.literal16+0x673>
+ DB 127,67 ; jg 6bc3 <.literal16+0x673>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax)
@@ -29817,16 +30362,111 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 69c4 <.literal16+0x664>
+ DB 127,0 ; jg 6bb4 <.literal16+0x664>
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 6bb8 <.literal16+0x668>
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 6bbc <.literal16+0x66c>
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 6bc0 <.literal16+0x670>
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,63 ; add %bh,(%rdi)
+ DB 119,115 ; ja 6c45 <.literal16+0x6f5>
+ DB 248 ; clc
+ DB 194,119,115 ; retq $0x7377
+ DB 248 ; clc
+ DB 194,119,115 ; retq $0x7377
+ DB 248 ; clc
+ DB 194,119,115 ; retq $0x7377
+ DB 248 ; clc
+ DB 194,117,191 ; retq $0xbf75
+ DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
+ DB 63 ; (bad)
+ DB 117,191 ; jne 6ba9 <.literal16+0x659>
+ DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
+ DB 63 ; (bad)
+ DB 249 ; stc
+ DB 68,180,62 ; rex.R mov $0x3e,%spl
+ DB 249 ; stc
+ DB 68,180,62 ; rex.R mov $0x3e,%spl
+ DB 249 ; stc
+ DB 68,180,62 ; rex.R mov $0x3e,%spl
+ DB 249 ; stc
+ DB 68,180,62 ; rex.R mov $0x3e,%spl
+ DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3abea <_sk_callback_sse2+0xffffffffe9a34768>
+ DB 220,63 ; fdivrl (%rdi)
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,0 ; cmpb $0x0,(%rdi)
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
+ DB 63 ; (bad)
+ DB 0,0 ; add %al,(%rax)
+ DB 128,63,81 ; cmpb $0x51,(%rdi)
+ DB 140,242 ; mov %?,%edx
+ DB 66,81 ; rex.X push %rcx
+ DB 140,242 ; mov %?,%edx
+ DB 66,81 ; rex.X push %rcx
+ DB 140,242 ; mov %?,%edx
+ DB 66,81 ; rex.X push %rcx
+ DB 140,242 ; mov %?,%edx
+ DB 66,141,188,190,63,141,188,190 ; lea -0x414372c1(%rsi,%r15,4),%edi
+ DB 63 ; (bad)
+ DB 141,188,190,63,141,188,190 ; lea -0x414372c1(%rsi,%rdi,4),%edi
+ DB 63 ; (bad)
+ DB 248 ; clc
+ DB 245 ; cmc
+ DB 154 ; (bad)
+ DB 64,248 ; rex clc
+ DB 245 ; cmc
+ DB 154 ; (bad)
+ DB 64,248 ; rex clc
+ DB 245 ; cmc
+ DB 154 ; (bad)
+ DB 64,248 ; rex clc
+ DB 245 ; cmc
+ DB 154 ; (bad)
+ DB 64,254 ; rex (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,254 ; rex.B (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,254 ; rex.B (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,254 ; rex.B (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65,0,0 ; add %al,(%r8)
+ DB 0,75,0 ; add %cl,0x0(%rbx)
+ DB 0,0 ; add %al,(%rax)
+ DB 75,0,0 ; rex.WXB add %al,(%r8)
+ DB 0,75,0 ; add %cl,0x0(%rbx)
+ DB 0,0 ; add %al,(%rax)
+ DB 75,0,0 ; rex.WXB add %al,(%r8)
+ DB 0,52,0 ; add %dh,(%rax,%rax,1)
+ DB 0,0 ; add %al,(%rax)
+ DB 52,0 ; xor $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 52,0 ; xor $0x0,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 52,255 ; xor $0xff,%al
+ DB 255 ; (bad)
+ DB 127,0 ; jg 6c84 <.literal16+0x734>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 69c8 <.literal16+0x668>
+ DB 127,0 ; jg 6c88 <.literal16+0x738>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 69cc <.literal16+0x66c>
+ DB 127,0 ; jg 6c8c <.literal16+0x73c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 69d0 <.literal16+0x670>
+ DB 127,0 ; jg 6c90 <.literal16+0x740>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -29835,7 +30475,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6a55 <.literal16+0x6f5>
+ DB 119,115 ; ja 6d15 <.literal16+0x7c5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -29846,7 +30486,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 69b9 <.literal16+0x659>
+ DB 117,191 ; jne 6c79 <.literal16+0x729>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -29858,7 +30498,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3a9fa <_sk_callback_sse2+0xffffffffe9a34772>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3acba <_sk_callback_sse2+0xffffffffe9a34838>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -29912,16 +30552,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6a94 <.literal16+0x734>
+ DB 127,0 ; jg 6d54 <.literal16+0x804>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6a98 <.literal16+0x738>
+ DB 127,0 ; jg 6d58 <.literal16+0x808>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6a9c <.literal16+0x73c>
+ DB 127,0 ; jg 6d5c <.literal16+0x80c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6aa0 <.literal16+0x740>
+ DB 127,0 ; jg 6d60 <.literal16+0x810>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -29930,7 +30570,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6b25 <.literal16+0x7c5>
+ DB 119,115 ; ja 6de5 <.literal16+0x895>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -29941,7 +30581,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6a89 <.literal16+0x729>
+ DB 117,191 ; jne 6d49 <.literal16+0x7f9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -29953,7 +30593,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3aaca <_sk_callback_sse2+0xffffffffe9a34842>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3ad8a <_sk_callback_sse2+0xffffffffe9a34908>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -30007,16 +30647,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6b64 <.literal16+0x804>
+ DB 127,0 ; jg 6e24 <.literal16+0x8d4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6b68 <.literal16+0x808>
+ DB 127,0 ; jg 6e28 <.literal16+0x8d8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6b6c <.literal16+0x80c>
+ DB 127,0 ; jg 6e2c <.literal16+0x8dc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6b70 <.literal16+0x810>
+ DB 127,0 ; jg 6e30 <.literal16+0x8e0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -30025,7 +30665,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6bf5 <.literal16+0x895>
+ DB 119,115 ; ja 6eb5 <.literal16+0x965>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -30036,7 +30676,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6b59 <.literal16+0x7f9>
+ DB 117,191 ; jne 6e19 <.literal16+0x8c9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -30048,7 +30688,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3ab9a <_sk_callback_sse2+0xffffffffe9a34912>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3ae5a <_sk_callback_sse2+0xffffffffe9a349d8>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -30102,16 +30742,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6c34 <.literal16+0x8d4>
+ DB 127,0 ; jg 6ef4 <.literal16+0x9a4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6c38 <.literal16+0x8d8>
+ DB 127,0 ; jg 6ef8 <.literal16+0x9a8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6c3c <.literal16+0x8dc>
+ DB 127,0 ; jg 6efc <.literal16+0x9ac>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 6c40 <.literal16+0x8e0>
+ DB 127,0 ; jg 6f00 <.literal16+0x9b0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -30120,7 +30760,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6cc5 <.literal16+0x965>
+ DB 119,115 ; ja 6f85 <.literal16+0xa35>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -30131,7 +30771,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 6c29 <.literal16+0x8c9>
+ DB 117,191 ; jne 6ee9 <.literal16+0x999>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -30143,7 +30783,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3ac6a <_sk_callback_sse2+0xffffffffe9a349e2>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3af2a <_sk_callback_sse2+0xffffffffe9a34aa8>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -30193,13 +30833,13 @@ ALIGN 16
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
- DB 127,67 ; jg 6d47 <.literal16+0x9e7>
+ DB 127,67 ; jg 7007 <.literal16+0xab7>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6d4b <.literal16+0x9eb>
+ DB 127,67 ; jg 700b <.literal16+0xabb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6d4f <.literal16+0x9ef>
+ DB 127,67 ; jg 700f <.literal16+0xabf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6d53 <.literal16+0x9f3>
+ DB 127,67 ; jg 7013 <.literal16+0xac3>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -30246,16 +30886,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6dd3 <.literal16+0xa73>
+ DB 118,63 ; jbe 7093 <.literal16+0xb43>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6dd7 <.literal16+0xa77>
+ DB 118,63 ; jbe 7097 <.literal16+0xb47>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6ddb <.literal16+0xa7b>
+ DB 118,63 ; jbe 709b <.literal16+0xb4b>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6ddf <.literal16+0xa7f>
+ DB 118,63 ; jbe 709f <.literal16+0xb4f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -30284,11 +30924,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6e4b <.literal16+0xaeb>
+ DB 127,67 ; jg 710b <.literal16+0xbbb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6e4f <.literal16+0xaef>
+ DB 127,67 ; jg 710f <.literal16+0xbbf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6e53 <.literal16+0xaf3>
+ DB 127,67 ; jg 7113 <.literal16+0xbc3>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -30350,13 +30990,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6ec9 <.literal16+0xb69>
+ DB 224,7 ; loopne 7189 <.literal16+0xc39>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6ecd <.literal16+0xb6d>
+ DB 224,7 ; loopne 718d <.literal16+0xc3d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6ed1 <.literal16+0xb71>
+ DB 224,7 ; loopne 7191 <.literal16+0xc41>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6ed5 <.literal16+0xb75>
+ DB 224,7 ; loopne 7195 <.literal16+0xc45>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -30402,13 +31042,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6f39 <.literal16+0xbd9>
+ DB 224,7 ; loopne 71f9 <.literal16+0xca9>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6f3d <.literal16+0xbdd>
+ DB 224,7 ; loopne 71fd <.literal16+0xcad>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6f41 <.literal16+0xbe1>
+ DB 224,7 ; loopne 7201 <.literal16+0xcb1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6f45 <.literal16+0xbe5>
+ DB 224,7 ; loopne 7205 <.literal16+0xcb5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -30454,13 +31094,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6fa9 <.literal16+0xc49>
+ DB 224,7 ; loopne 7269 <.literal16+0xd19>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6fad <.literal16+0xc4d>
+ DB 224,7 ; loopne 726d <.literal16+0xd1d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6fb1 <.literal16+0xc51>
+ DB 224,7 ; loopne 7271 <.literal16+0xd21>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6fb5 <.literal16+0xc55>
+ DB 224,7 ; loopne 7275 <.literal16+0xd25>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -30498,13 +31138,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 7046 <.literal16+0xce6>
+ DB 124,66 ; jl 7306 <.literal16+0xdb6>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 704a <.literal16+0xcea>
+ DB 124,66 ; jl 730a <.literal16+0xdba>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 704e <.literal16+0xcee>
+ DB 124,66 ; jl 730e <.literal16+0xdbe>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 7052 <.literal16+0xcf2>
+ DB 124,66 ; jl 7312 <.literal16+0xdc2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -30638,13 +31278,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 71d5 <.literal16+0xe75>
+ DB 112,65 ; jo 7495 <.literal16+0xf45>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 71d9 <.literal16+0xe79>
+ DB 112,65 ; jo 7499 <.literal16+0xf49>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 71dd <.literal16+0xe7d>
+ DB 112,65 ; jo 749d <.literal16+0xf4d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 71e1 <.literal16+0xe81>
+ DB 112,65 ; jo 74a1 <.literal16+0xf51>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -30675,11 +31315,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%rax)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 724b <.literal16+0xeeb>
+ DB 127,67 ; jg 750b <.literal16+0xfbb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 724f <.literal16+0xeef>
+ DB 127,67 ; jg 750f <.literal16+0xfbf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 7253 <.literal16+0xef3>
+ DB 127,67 ; jg 7513 <.literal16+0xfc3>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -30710,11 +31350,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%rax)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 72bb <.literal16+0xf5b>
+ DB 127,67 ; jg 757b <.literal16+0x102b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 72bf <.literal16+0xf5f>
+ DB 127,67 ; jg 757f <.literal16+0x102f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 72c3 <.literal16+0xf63>
+ DB 127,67 ; jg 7583 <.literal16+0x1033>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -30810,13 +31450,13 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 73eb <.literal16+0x108b>
+ DB 127,71 ; jg 76ab <.literal16+0x115b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 73ef <.literal16+0x108f>
+ DB 127,71 ; jg 76af <.literal16+0x115f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 73f3 <.literal16+0x1093>
+ DB 127,71 ; jg 76b3 <.literal16+0x1163>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 73f7 <.literal16+0x1097>
+ DB 127,71 ; jg 76b7 <.literal16+0x1167>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -30893,10 +31533,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc0858a <_sk_callback_sse2+0x2dc02302>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc0884a <_sk_callback_sse2+0x2dc023c8>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 74bc <.literal16+0x115c>
+ DB 120,57 ; js 777c <.literal16+0x122c>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -31083,11 +31723,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 76a2 <.literal16+0x1342>
+ DB 62,114,28 ; jb,pt 7962 <.literal16+0x1412>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 76a6 <.literal16+0x1346>
+ DB 62,114,28 ; jb,pt 7966 <.literal16+0x1416>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 76aa <.literal16+0x134a>
+ DB 62,114,28 ; jb,pt 796a <.literal16+0x141a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -31131,7 +31771,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640535 <_sk_callback_sse2+0x3d63a2ad>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d6407f5 <_sk_callback_sse2+0x3d63a373>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -31157,7 +31797,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640575 <_sk_callback_sse2+0x3d63a2ed>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640835 <_sk_callback_sse2+0x3d63a3b3>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -31166,13 +31806,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 776e <.literal16+0x140e>
+ DB 114,28 ; jb 7a2e <.literal16+0x14de>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7772 <.literal16+0x1412>
+ DB 62,114,28 ; jb,pt 7a32 <.literal16+0x14e2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7776 <.literal16+0x1416>
+ DB 62,114,28 ; jb,pt 7a36 <.literal16+0x14e6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 777a <.literal16+0x141a>
+ DB 62,114,28 ; jb,pt 7a3a <.literal16+0x14ea>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -31193,11 +31833,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 77b2 <.literal16+0x1452>
+ DB 62,114,28 ; jb,pt 7a72 <.literal16+0x1522>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 77b6 <.literal16+0x1456>
+ DB 62,114,28 ; jb,pt 7a76 <.literal16+0x1526>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 77ba <.literal16+0x145a>
+ DB 62,114,28 ; jb,pt 7a7a <.literal16+0x152a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -31241,7 +31881,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640645 <_sk_callback_sse2+0x3d63a3bd>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640905 <_sk_callback_sse2+0x3d63a483>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -31267,7 +31907,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640685 <_sk_callback_sse2+0x3d63a3fd>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d640945 <_sk_callback_sse2+0x3d63a4c3>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -31276,13 +31916,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 787e <.literal16+0x151e>
+ DB 114,28 ; jb 7b3e <.literal16+0x15ee>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7882 <_sk_callback_sse2+0x15fa>
+ DB 62,114,28 ; jb,pt 7b42 <_sk_callback_sse2+0x16c0>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 7886 <_sk_callback_sse2+0x15fe>
+ DB 62,114,28 ; jb,pt 7b46 <_sk_callback_sse2+0x16c4>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 788a <_sk_callback_sse2+0x1602>
+ DB 62,114,28 ; jb,pt 7b4a <_sk_callback_sse2+0x16c8>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -36052,7 +36692,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,2 ; movd (%edx),%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,144,66,110,0,0 ; movaps 0x6e42(%eax),%xmm2
+ DB 15,40,144,34,112,0,0 ; movaps 0x7022(%eax),%xmm2
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -36067,7 +36707,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,41,82,32 ; movaps %xmm2,0x20(%edx)
DB 15,41,82,16 ; movaps %xmm2,0x10(%edx)
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,144,82,110,0,0 ; movaps 0x6e52(%eax),%xmm2
+ DB 15,40,144,50,112,0,0 ; movaps 0x7032(%eax),%xmm2
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 86 ; push %esi
DB 82 ; push %edx
@@ -36098,16 +36738,16 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,110,96,4 ; movd 0x4(%eax),%xmm4
DB 102,15,112,252,0 ; pshufd $0x0,%xmm4,%xmm7
DB 102,15,239,253 ; pxor %xmm5,%xmm7
- DB 102,15,111,177,229,109,0,0 ; movdqa 0x6de5(%ecx),%xmm6
+ DB 102,15,111,177,197,111,0,0 ; movdqa 0x6fc5(%ecx),%xmm6
DB 102,15,111,207 ; movdqa %xmm7,%xmm1
DB 102,15,219,206 ; pand %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
- DB 102,15,111,129,5,110,0,0 ; movdqa 0x6e05(%ecx),%xmm0
+ DB 102,15,111,129,229,111,0,0 ; movdqa 0x6fe5(%ecx),%xmm0
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,219,224 ; pand %xmm0,%xmm4
DB 102,15,219,197 ; pand %xmm5,%xmm0
- DB 102,15,219,185,245,109,0,0 ; pand 0x6df5(%ecx),%xmm7
- DB 102,15,219,169,245,109,0,0 ; pand 0x6df5(%ecx),%xmm5
+ DB 102,15,219,185,213,111,0,0 ; pand 0x6fd5(%ecx),%xmm7
+ DB 102,15,219,169,213,111,0,0 ; pand 0x6fd5(%ecx),%xmm5
DB 102,15,114,246,4 ; pslld $0x4,%xmm6
DB 102,15,254,192 ; paddd %xmm0,%xmm0
DB 102,15,235,198 ; por %xmm6,%xmm0
@@ -36122,8 +36762,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,15,114,215,1 ; psrld $0x1,%xmm7
DB 102,15,235,231 ; por %xmm7,%xmm4
DB 15,91,196 ; cvtdq2ps %xmm4,%xmm0
- DB 15,89,129,21,110,0,0 ; mulps 0x6e15(%ecx),%xmm0
- DB 15,88,129,37,110,0,0 ; addps 0x6e25(%ecx),%xmm0
+ DB 15,89,129,245,111,0,0 ; mulps 0x6ff5(%ecx),%xmm0
+ DB 15,88,129,5,112,0,0 ; addps 0x7005(%ecx),%xmm0
DB 243,15,16,14 ; movss (%esi),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -36187,7 +36827,7 @@ _sk_black_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,152,245,108,0,0 ; movaps 0x6cf5(%eax),%xmm3
+ DB 15,40,152,213,110,0,0 ; movaps 0x6ed5(%eax),%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -36208,7 +36848,7 @@ _sk_white_color_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,128,213,108,0,0 ; movaps 0x6cd5(%eax),%xmm0
+ DB 15,40,128,181,110,0,0 ; movaps 0x6eb5(%eax),%xmm0
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -36290,7 +36930,7 @@ _sk_srcatop_sse2 LABEL PROC
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,97,64 ; movaps 0x40(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,170,54,108,0,0 ; movaps 0x6c36(%edx),%xmm5
+ DB 15,40,170,22,110,0,0 ; movaps 0x6e16(%edx),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
@@ -36327,7 +36967,7 @@ _sk_dstatop_sse2 LABEL PROC
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
DB 15,40,113,16 ; movaps 0x10(%ecx),%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
- DB 15,40,162,231,107,0,0 ; movaps 0x6be7(%edx),%xmm4
+ DB 15,40,162,199,109,0,0 ; movaps 0x6dc7(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,198 ; addps %xmm6,%xmm0
@@ -36405,7 +37045,7 @@ _sk_srcout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,54,107,0,0 ; movaps 0x6b36(%eax),%xmm4
+ DB 15,40,160,22,109,0,0 ; movaps 0x6d16(%eax),%xmm4
DB 15,92,98,64 ; subps 0x40(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
@@ -36429,7 +37069,7 @@ _sk_dstout_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,14,107,0,0 ; movaps 0x6b0e(%eax),%xmm4
+ DB 15,40,160,238,108,0,0 ; movaps 0x6cee(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,66,16 ; movaps 0x10(%edx),%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -36457,7 +37097,7 @@ _sk_srcover_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
- DB 15,40,160,215,106,0,0 ; movaps 0x6ad7(%eax),%xmm4
+ DB 15,40,160,183,108,0,0 ; movaps 0x6cb7(%eax),%xmm4
DB 15,92,227 ; subps %xmm3,%xmm4
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -36489,7 +37129,7 @@ _sk_dstover_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,106,64 ; movaps 0x40(%edx),%xmm5
- DB 15,40,160,151,106,0,0 ; movaps 0x6a97(%eax),%xmm4
+ DB 15,40,160,119,108,0,0 ; movaps 0x6c77(%eax),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,88,66,16 ; addps 0x10(%edx),%xmm0
@@ -36541,7 +37181,7 @@ _sk_multiply_sse2 LABEL PROC
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,200 ; movaps %xmm2,-0x38(%ebp)
- DB 15,40,129,40,106,0,0 ; movaps 0x6a28(%ecx),%xmm0
+ DB 15,40,129,8,108,0,0 ; movaps 0x6c08(%ecx),%xmm0
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
@@ -36660,7 +37300,7 @@ _sk_xor__sse2 LABEL PROC
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 15,40,105,64 ; movaps 0x40(%ecx),%xmm5
- DB 15,40,154,253,104,0,0 ; movaps 0x68fd(%edx),%xmm3
+ DB 15,40,154,221,106,0,0 ; movaps 0x6add(%edx),%xmm3
DB 15,40,243 ; movaps %xmm3,%xmm6
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,89,198 ; mulps %xmm6,%xmm0
@@ -36720,7 +37360,7 @@ _sk_darken_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,95,209 ; maxps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,165,104,0,0 ; movaps 0x68a5(%edx),%xmm1
+ DB 15,40,138,133,106,0,0 ; movaps 0x6a85(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -36767,7 +37407,7 @@ _sk_lighten_sse2 LABEL PROC
DB 15,89,203 ; mulps %xmm3,%xmm1
DB 15,93,209 ; minps %xmm1,%xmm2
DB 15,92,234 ; subps %xmm2,%xmm5
- DB 15,40,138,53,104,0,0 ; movaps 0x6835(%edx),%xmm1
+ DB 15,40,138,21,106,0,0 ; movaps 0x6a15(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -36818,7 +37458,7 @@ _sk_difference_sse2 LABEL PROC
DB 15,93,214 ; minps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,146,194,103,0,0 ; movaps 0x67c2(%edx),%xmm2
+ DB 15,40,146,162,105,0,0 ; movaps 0x69a2(%edx),%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -36860,7 +37500,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,202 ; mulps %xmm2,%xmm1
DB 15,88,201 ; addps %xmm1,%xmm1
DB 15,92,233 ; subps %xmm1,%xmm5
- DB 15,40,138,76,103,0,0 ; movaps 0x674c(%edx),%xmm1
+ DB 15,40,138,44,105,0,0 ; movaps 0x692c(%edx),%xmm1
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,89,73,64 ; mulps 0x40(%ecx),%xmm1
DB 15,88,217 ; addps %xmm1,%xmm3
@@ -36899,7 +37539,7 @@ _sk_colorburn_sse2 LABEL PROC
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,92,238 ; subps %xmm6,%xmm5
- DB 15,40,177,217,102,0,0 ; movaps 0x66d9(%ecx),%xmm6
+ DB 15,40,177,185,104,0,0 ; movaps 0x68b9(%ecx),%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
@@ -37019,7 +37659,7 @@ _sk_colordodge_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
- DB 15,40,177,83,101,0,0 ; movaps 0x6553(%ecx),%xmm6
+ DB 15,40,177,51,103,0,0 ; movaps 0x6733(%ecx),%xmm6
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,41,117,184 ; movaps %xmm6,-0x48(%ebp)
@@ -37136,7 +37776,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
- DB 15,40,145,247,99,0,0 ; movaps 0x63f7(%ecx),%xmm2
+ DB 15,40,145,215,101,0,0 ; movaps 0x65d7(%ecx),%xmm2
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,40,225 ; movaps %xmm1,%xmm4
@@ -37244,7 +37884,7 @@ _sk_overlay_sse2 LABEL PROC
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
- DB 15,40,161,188,98,0,0 ; movaps 0x62bc(%ecx),%xmm4
+ DB 15,40,161,156,100,0,0 ; movaps 0x649c(%ecx),%xmm4
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,92,242 ; subps %xmm2,%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
@@ -37370,17 +38010,17 @@ _sk_softlight_sse2 LABEL PROC
DB 232,0,0,0,0 ; call f44 <_sk_softlight_sse2+0x52>
DB 89 ; pop %ecx
DB 15,40,194 ; movaps %xmm2,%xmm0
- DB 15,40,137,76,97,0,0 ; movaps 0x614c(%ecx),%xmm1
+ DB 15,40,137,44,99,0,0 ; movaps 0x632c(%ecx),%xmm1
DB 15,41,141,104,255,255,255 ; movaps %xmm1,-0x98(%ebp)
DB 15,88,193 ; addps %xmm1,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,185,60,97,0,0 ; movaps 0x613c(%ecx),%xmm7
+ DB 15,40,185,28,99,0,0 ; movaps 0x631c(%ecx),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,82,242 ; rsqrtps %xmm2,%xmm6
DB 15,83,206 ; rcpps %xmm6,%xmm1
DB 15,92,202 ; subps %xmm2,%xmm1
- DB 15,40,161,92,97,0,0 ; movaps 0x615c(%ecx),%xmm4
+ DB 15,40,161,60,99,0,0 ; movaps 0x633c(%ecx),%xmm4
DB 15,41,101,152 ; movaps %xmm4,-0x68(%ebp)
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
@@ -37584,7 +38224,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 15,40,72,64 ; movaps 0x40(%eax),%xmm1
DB 15,41,77,216 ; movaps %xmm1,-0x28(%ebp)
- DB 15,40,169,219,94,0,0 ; movaps 0x5edb(%ecx),%xmm5
+ DB 15,40,169,187,96,0,0 ; movaps 0x60bb(%ecx),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
@@ -37617,17 +38257,17 @@ _sk_hue_sse2 LABEL PROC
DB 15,89,233 ; mulps %xmm1,%xmm5
DB 15,41,173,120,255,255,255 ; movaps %xmm5,-0x88(%ebp)
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,153,171,94,0,0 ; movaps 0x5eab(%ecx),%xmm3
+ DB 15,40,153,139,96,0,0 ; movaps 0x608b(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,117,152 ; movaps -0x68(%ebp),%xmm6
DB 15,40,206 ; movaps %xmm6,%xmm1
DB 15,89,203 ; mulps %xmm3,%xmm1
- DB 15,40,153,187,94,0,0 ; movaps 0x5ebb(%ecx),%xmm3
+ DB 15,40,153,155,96,0,0 ; movaps 0x609b(%ecx),%xmm3
DB 15,40,109,136 ; movaps -0x78(%ebp),%xmm5
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,89,251 ; mulps %xmm3,%xmm7
DB 15,88,249 ; addps %xmm1,%xmm7
- DB 15,40,137,219,94,0,0 ; movaps 0x5edb(%ecx),%xmm1
+ DB 15,40,137,187,96,0,0 ; movaps 0x60bb(%ecx),%xmm1
DB 15,92,77,184 ; subps -0x48(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,152 ; movaps %xmm6,-0x68(%ebp)
@@ -37637,7 +38277,7 @@ _sk_hue_sse2 LABEL PROC
DB 15,40,77,200 ; movaps -0x38(%ebp),%xmm1
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 15,41,117,168 ; movaps %xmm6,-0x58(%ebp)
- DB 15,40,169,203,94,0,0 ; movaps 0x5ecb(%ecx),%xmm5
+ DB 15,40,169,171,96,0,0 ; movaps 0x60ab(%ecx),%xmm5
DB 15,89,205 ; mulps %xmm5,%xmm1
DB 15,88,207 ; addps %xmm7,%xmm1
DB 15,94,212 ; divps %xmm4,%xmm2
@@ -37828,17 +38468,17 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,253 ; mulps %xmm5,%xmm7
DB 232,0,0,0,0 ; call 1559 <_sk_saturation_sse2+0xb0>
DB 89 ; pop %ecx
- DB 15,40,153,151,91,0,0 ; movaps 0x5b97(%ecx),%xmm3
+ DB 15,40,153,119,93,0,0 ; movaps 0x5d77(%ecx),%xmm3
DB 15,41,157,88,255,255,255 ; movaps %xmm3,-0xa8(%ebp)
DB 15,40,77,184 ; movaps -0x48(%ebp),%xmm1
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,40,153,167,91,0,0 ; movaps 0x5ba7(%ecx),%xmm3
+ DB 15,40,153,135,93,0,0 ; movaps 0x5d87(%ecx),%xmm3
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,129,199,91,0,0 ; movaps 0x5bc7(%ecx),%xmm0
+ DB 15,40,129,167,93,0,0 ; movaps 0x5da7(%ecx),%xmm0
DB 15,41,133,104,255,255,255 ; movaps %xmm0,-0x98(%ebp)
DB 15,92,69,216 ; subps -0x28(%ebp),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
@@ -37850,7 +38490,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,41,141,120,255,255,255 ; movaps %xmm1,-0x88(%ebp)
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 15,40,129,183,91,0,0 ; movaps 0x5bb7(%ecx),%xmm0
+ DB 15,40,129,151,93,0,0 ; movaps 0x5d97(%ecx),%xmm0
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,40,109,168 ; movaps -0x58(%ebp),%xmm5
@@ -38007,16 +38647,16 @@ _sk_color_sse2 LABEL PROC
DB 139,69,8 ; mov 0x8(%ebp),%eax
DB 15,40,80,16 ; movaps 0x10(%eax),%xmm2
DB 15,40,72,32 ; movaps 0x20(%eax),%xmm1
- DB 15,40,177,124,89,0,0 ; movaps 0x597c(%ecx),%xmm6
+ DB 15,40,177,92,91,0,0 ; movaps 0x5b5c(%ecx),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
- DB 15,40,153,140,89,0,0 ; movaps 0x598c(%ecx),%xmm3
+ DB 15,40,153,108,91,0,0 ; movaps 0x5b6c(%ecx),%xmm3
DB 15,41,93,184 ; movaps %xmm3,-0x48(%ebp)
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,243 ; mulps %xmm3,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 15,40,129,172,89,0,0 ; movaps 0x59ac(%ecx),%xmm0
+ DB 15,40,129,140,91,0,0 ; movaps 0x5b8c(%ecx),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,69,200 ; subps -0x38(%ebp),%xmm0
DB 15,89,208 ; mulps %xmm0,%xmm2
@@ -38026,7 +38666,7 @@ _sk_color_sse2 LABEL PROC
DB 15,40,80,48 ; movaps 0x30(%eax),%xmm2
DB 15,89,194 ; mulps %xmm2,%xmm0
DB 15,41,133,72,255,255,255 ; movaps %xmm0,-0xb8(%ebp)
- DB 15,40,137,156,89,0,0 ; movaps 0x599c(%ecx),%xmm1
+ DB 15,40,137,124,91,0,0 ; movaps 0x5b7c(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,40,88,64 ; movaps 0x40(%eax),%xmm3
@@ -38183,18 +38823,18 @@ _sk_luminosity_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1a17 <_sk_luminosity_sse2+0x11>
DB 89 ; pop %ecx
DB 139,69,8 ; mov 0x8(%ebp),%eax
- DB 15,40,161,89,87,0,0 ; movaps 0x5759(%ecx),%xmm4
+ DB 15,40,161,57,89,0,0 ; movaps 0x5939(%ecx),%xmm4
DB 15,41,101,232 ; movaps %xmm4,-0x18(%ebp)
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,212 ; mulps %xmm4,%xmm2
- DB 15,40,161,105,87,0,0 ; movaps 0x5769(%ecx),%xmm4
+ DB 15,40,161,73,89,0,0 ; movaps 0x5949(%ecx),%xmm4
DB 15,41,101,216 ; movaps %xmm4,-0x28(%ebp)
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
DB 15,40,80,64 ; movaps 0x40(%eax),%xmm2
DB 15,41,85,184 ; movaps %xmm2,-0x48(%ebp)
- DB 15,40,161,137,87,0,0 ; movaps 0x5789(%ecx),%xmm4
+ DB 15,40,161,105,89,0,0 ; movaps 0x5969(%ecx),%xmm4
DB 15,40,252 ; movaps %xmm4,%xmm7
DB 15,92,250 ; subps %xmm2,%xmm7
DB 15,89,199 ; mulps %xmm7,%xmm0
@@ -38204,7 +38844,7 @@ _sk_luminosity_sse2 LABEL PROC
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,41,189,104,255,255,255 ; movaps %xmm7,-0x98(%ebp)
DB 15,40,214 ; movaps %xmm6,%xmm2
- DB 15,40,137,121,87,0,0 ; movaps 0x5779(%ecx),%xmm1
+ DB 15,40,137,89,89,0,0 ; movaps 0x5959(%ecx),%xmm1
DB 15,89,209 ; mulps %xmm1,%xmm2
DB 15,88,213 ; addps %xmm5,%xmm2
DB 15,40,104,16 ; movaps 0x10(%eax),%xmm5
@@ -38378,7 +39018,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 139,49 ; mov (%ecx),%esi
DB 15,133,224,0,0,0 ; jne 1d84 <_sk_srcover_rgba_8888_sse2+0x119>
DB 243,15,111,20,178 ; movdqu (%edx,%esi,4),%xmm2
- DB 102,15,111,167,46,85,0,0 ; movdqa 0x552e(%edi),%xmm4
+ DB 102,15,111,167,14,87,0,0 ; movdqa 0x570e(%edi),%xmm4
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,242 ; movdqa %xmm2,%xmm6
@@ -38389,9 +39029,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,219,252 ; pand %xmm4,%xmm7
DB 15,91,229 ; cvtdq2ps %xmm5,%xmm4
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,175,62,85,0,0 ; movaps 0x553e(%edi),%xmm5
+ DB 15,40,175,30,87,0,0 ; movaps 0x571e(%edi),%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
- DB 15,40,143,78,85,0,0 ; movaps 0x554e(%edi),%xmm1
+ DB 15,40,143,46,87,0,0 ; movaps 0x572e(%edi),%xmm1
DB 15,89,193 ; mulps %xmm1,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,88,224 ; addps %xmm0,%xmm4
@@ -38501,7 +39141,7 @@ _sk_clamp_1_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1e2e <_sk_clamp_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,178,83,0,0 ; movaps 0x53b2(%eax),%xmm4
+ DB 15,40,160,146,85,0,0 ; movaps 0x5592(%eax),%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
DB 15,93,204 ; minps %xmm4,%xmm1
DB 15,93,212 ; minps %xmm4,%xmm2
@@ -38523,7 +39163,7 @@ _sk_clamp_a_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1e61 <_sk_clamp_a_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,93,152,143,83,0,0 ; minps 0x538f(%eax),%xmm3
+ DB 15,93,152,111,85,0,0 ; minps 0x556f(%eax),%xmm3
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -38546,7 +39186,7 @@ _sk_clamp_a_dst_sse2 LABEL PROC
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 139,85,8 ; mov 0x8(%ebp),%edx
DB 15,40,98,64 ; movaps 0x40(%edx),%xmm4
- DB 15,93,160,111,83,0,0 ; minps 0x536f(%eax),%xmm4
+ DB 15,93,160,79,85,0,0 ; minps 0x554f(%eax),%xmm4
DB 15,41,98,64 ; movaps %xmm4,0x40(%edx)
DB 15,40,106,16 ; movaps 0x10(%edx),%xmm5
DB 15,93,236 ; minps %xmm4,%xmm5
@@ -38614,7 +39254,7 @@ _sk_invert_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 1f3c <_sk_invert_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,160,212,82,0,0 ; movaps 0x52d4(%eax),%xmm4
+ DB 15,40,160,180,84,0,0 ; movaps 0x54b4(%eax),%xmm4
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,92,232 ; subps %xmm0,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
@@ -38727,7 +39367,7 @@ _sk_unpremul_sse2 LABEL PROC
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 15,40,168,230,81,0,0 ; movaps 0x51e6(%eax),%xmm5
+ DB 15,40,168,198,83,0,0 ; movaps 0x53c6(%eax),%xmm5
DB 15,94,235 ; divps %xmm3,%xmm5
DB 15,194,227,4 ; cmpneqps %xmm3,%xmm4
DB 15,84,229 ; andps %xmm5,%xmm4
@@ -38756,19 +39396,19 @@ _sk_from_srgb_sse2 LABEL PROC
DB 88 ; pop %eax
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,201 ; mulps %xmm1,%xmm1
- DB 15,40,160,188,81,0,0 ; movaps 0x51bc(%eax),%xmm4
+ DB 15,40,160,156,83,0,0 ; movaps 0x539c(%eax),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,176,204,81,0,0 ; movaps 0x51cc(%eax),%xmm6
+ DB 15,40,176,172,83,0,0 ; movaps 0x53ac(%eax),%xmm6
DB 15,41,117,216 ; movaps %xmm6,-0x28(%ebp)
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,176,172,81,0,0 ; movaps 0x51ac(%eax),%xmm6
+ DB 15,40,176,140,83,0,0 ; movaps 0x538c(%eax),%xmm6
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,184,220,81,0,0 ; movaps 0x51dc(%eax),%xmm7
+ DB 15,40,184,188,83,0,0 ; movaps 0x53bc(%eax),%xmm7
DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,184,236,81,0,0 ; movaps 0x51ec(%eax),%xmm7
+ DB 15,40,184,204,83,0,0 ; movaps 0x53cc(%eax),%xmm7
DB 15,194,215,1 ; cmpltps %xmm7,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -38826,18 +39466,18 @@ _sk_from_srgb_dst_sse2 LABEL PROC
DB 15,40,72,16 ; movaps 0x10(%eax),%xmm1
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,40,161,49,81,0,0 ; movaps 0x5131(%ecx),%xmm4
+ DB 15,40,161,17,83,0,0 ; movaps 0x5311(%ecx),%xmm4
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
- DB 15,40,177,65,81,0,0 ; movaps 0x5141(%ecx),%xmm6
+ DB 15,40,177,33,83,0,0 ; movaps 0x5321(%ecx),%xmm6
DB 15,88,198 ; addps %xmm6,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,169,33,81,0,0 ; movaps 0x5121(%ecx),%xmm5
+ DB 15,40,169,1,83,0,0 ; movaps 0x5301(%ecx),%xmm5
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
- DB 15,40,185,81,81,0,0 ; movaps 0x5151(%ecx),%xmm7
+ DB 15,40,185,49,83,0,0 ; movaps 0x5331(%ecx),%xmm7
DB 15,88,199 ; addps %xmm7,%xmm0
- DB 15,40,153,97,81,0,0 ; movaps 0x5161(%ecx),%xmm3
+ DB 15,40,153,65,83,0,0 ; movaps 0x5341(%ecx),%xmm3
DB 15,194,203,1 ; cmpltps %xmm3,%xmm1
DB 15,84,209 ; andps %xmm1,%xmm2
DB 15,85,200 ; andnps %xmm0,%xmm1
@@ -38897,25 +39537,25 @@ _sk_to_srgb_sse2 LABEL PROC
DB 232,0,0,0,0 ; call 224a <_sk_to_srgb_sse2+0x18>
DB 88 ; pop %eax
DB 15,82,218 ; rsqrtps %xmm2,%xmm3
- DB 15,40,160,150,80,0,0 ; movaps 0x5096(%eax),%xmm4
+ DB 15,40,160,118,82,0,0 ; movaps 0x5276(%eax),%xmm4
DB 15,40,235 ; movaps %xmm3,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
- DB 15,40,128,166,80,0,0 ; movaps 0x50a6(%eax),%xmm0
+ DB 15,40,128,134,82,0,0 ; movaps 0x5286(%eax),%xmm0
DB 15,41,69,232 ; movaps %xmm0,-0x18(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,89,235 ; mulps %xmm3,%xmm5
- DB 15,40,128,182,80,0,0 ; movaps 0x50b6(%eax),%xmm0
+ DB 15,40,128,150,82,0,0 ; movaps 0x5296(%eax),%xmm0
DB 15,41,69,200 ; movaps %xmm0,-0x38(%ebp)
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,40,128,198,80,0,0 ; movaps 0x50c6(%eax),%xmm0
+ DB 15,40,128,166,82,0,0 ; movaps 0x52a6(%eax),%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
DB 15,88,216 ; addps %xmm0,%xmm3
DB 15,83,195 ; rcpps %xmm3,%xmm0
DB 15,89,197 ; mulps %xmm5,%xmm0
- DB 15,40,168,134,80,0,0 ; movaps 0x5086(%eax),%xmm5
+ DB 15,40,168,102,82,0,0 ; movaps 0x5266(%eax),%xmm5
DB 15,40,202 ; movaps %xmm2,%xmm1
DB 15,89,205 ; mulps %xmm5,%xmm1
- DB 15,40,152,214,80,0,0 ; movaps 0x50d6(%eax),%xmm3
+ DB 15,40,152,182,82,0,0 ; movaps 0x52b6(%eax),%xmm3
DB 15,194,211,1 ; cmpltps %xmm3,%xmm2
DB 15,84,202 ; andps %xmm2,%xmm1
DB 15,85,208 ; andnps %xmm0,%xmm2
@@ -38982,14 +39622,14 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,41,69,216 ; movaps %xmm0,-0x28(%ebp)
- DB 15,40,152,239,79,0,0 ; movaps 0x4fef(%eax),%xmm3
+ DB 15,40,152,207,81,0,0 ; movaps 0x51cf(%eax),%xmm3
DB 15,94,216 ; divps %xmm0,%xmm3
DB 15,40,199 ; movaps %xmm7,%xmm0
DB 15,92,194 ; subps %xmm2,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,194,234,1 ; cmpltps %xmm2,%xmm5
- DB 15,84,168,255,79,0,0 ; andps 0x4fff(%eax),%xmm5
+ DB 15,84,168,223,81,0,0 ; andps 0x51df(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,194,196,0 ; cmpeqps %xmm4,%xmm0
@@ -38999,9 +39639,9 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,92,231 ; subps %xmm7,%xmm4
DB 15,89,211 ; mulps %xmm3,%xmm2
DB 15,89,227 ; mulps %xmm3,%xmm4
- DB 15,40,152,15,80,0,0 ; movaps 0x500f(%eax),%xmm3
+ DB 15,40,152,239,81,0,0 ; movaps 0x51ef(%eax),%xmm3
DB 15,88,211 ; addps %xmm3,%xmm2
- DB 15,88,160,31,80,0,0 ; addps 0x501f(%eax),%xmm4
+ DB 15,88,160,255,81,0,0 ; addps 0x51ff(%eax),%xmm4
DB 15,84,214 ; andps %xmm6,%xmm2
DB 15,85,244 ; andnps %xmm4,%xmm6
DB 15,86,242 ; orps %xmm2,%xmm6
@@ -39013,7 +39653,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,194,226,4 ; cmpneqps %xmm2,%xmm4
DB 15,92,217 ; subps %xmm1,%xmm3
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,40,168,63,80,0,0 ; movaps 0x503f(%eax),%xmm5
+ DB 15,40,168,31,82,0,0 ; movaps 0x521f(%eax),%xmm5
DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,89,213 ; mulps %xmm5,%xmm2
@@ -39023,7 +39663,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 15,86,235 ; orps %xmm3,%xmm5
DB 15,40,77,216 ; movaps -0x28(%ebp),%xmm1
DB 15,94,205 ; divps %xmm5,%xmm1
- DB 15,89,128,47,80,0,0 ; mulps 0x502f(%eax),%xmm0
+ DB 15,89,128,15,82,0,0 ; mulps 0x520f(%eax),%xmm0
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,84,204 ; andps %xmm4,%xmm1
DB 139,69,12 ; mov 0xc(%ebp),%eax
@@ -39046,7 +39686,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
DB 232,0,0,0,0 ; call 2436 <_sk_hsl_to_rgb_sse2+0x19>
DB 88 ; pop %eax
- DB 15,40,160,90,79,0,0 ; movaps 0x4f5a(%eax),%xmm4
+ DB 15,40,160,58,81,0,0 ; movaps 0x513a(%eax),%xmm4
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 15,41,165,104,255,255,255 ; movaps %xmm4,-0x98(%ebp)
DB 15,194,218,2 ; cmpleps %xmm2,%xmm3
@@ -39059,13 +39699,13 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,84,243 ; andps %xmm3,%xmm6
DB 15,85,217 ; andnps %xmm1,%xmm3
DB 15,86,222 ; orps %xmm6,%xmm3
- DB 15,40,168,106,79,0,0 ; movaps 0x4f6a(%eax),%xmm5
+ DB 15,40,168,74,81,0,0 ; movaps 0x514a(%eax),%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
DB 243,15,91,205 ; cvttps2dq %xmm5,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,193,1 ; cmpltps %xmm1,%xmm0
- DB 15,40,176,122,79,0,0 ; movaps 0x4f7a(%eax),%xmm6
+ DB 15,40,176,90,81,0,0 ; movaps 0x515a(%eax),%xmm6
DB 15,41,117,136 ; movaps %xmm6,-0x78(%ebp)
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,200 ; subps %xmm0,%xmm1
@@ -39075,19 +39715,19 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 15,88,210 ; addps %xmm2,%xmm2
DB 15,92,211 ; subps %xmm3,%xmm2
- DB 15,40,184,138,79,0,0 ; movaps 0x4f8a(%eax),%xmm7
+ DB 15,40,184,106,81,0,0 ; movaps 0x516a(%eax),%xmm7
DB 15,41,189,88,255,255,255 ; movaps %xmm7,-0xa8(%ebp)
DB 15,194,253,2 ; cmpleps %xmm5,%xmm7
DB 15,92,218 ; subps %xmm2,%xmm3
DB 15,41,93,200 ; movaps %xmm3,-0x38(%ebp)
DB 15,40,204 ; movaps %xmm4,%xmm1
DB 15,194,205,2 ; cmpleps %xmm5,%xmm1
- DB 15,40,160,186,79,0,0 ; movaps 0x4fba(%eax),%xmm4
+ DB 15,40,160,154,81,0,0 ; movaps 0x519a(%eax),%xmm4
DB 15,41,165,120,255,255,255 ; movaps %xmm4,-0x88(%ebp)
DB 15,194,229,2 ; cmpleps %xmm5,%xmm4
- DB 15,40,176,154,79,0,0 ; movaps 0x4f9a(%eax),%xmm6
+ DB 15,40,176,122,81,0,0 ; movaps 0x517a(%eax),%xmm6
DB 15,89,238 ; mulps %xmm6,%xmm5
- DB 15,40,128,170,79,0,0 ; movaps 0x4faa(%eax),%xmm0
+ DB 15,40,128,138,81,0,0 ; movaps 0x518a(%eax),%xmm0
DB 15,41,69,168 ; movaps %xmm0,-0x58(%ebp)
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
@@ -39113,18 +39753,18 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,194,200,1 ; cmpltps %xmm0,%xmm1
- DB 15,84,136,122,79,0,0 ; andps 0x4f7a(%eax),%xmm1
+ DB 15,84,136,90,81,0,0 ; andps 0x515a(%eax),%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
DB 15,92,200 ; subps %xmm0,%xmm1
- DB 15,40,128,138,79,0,0 ; movaps 0x4f8a(%eax),%xmm0
+ DB 15,40,128,106,81,0,0 ; movaps 0x516a(%eax),%xmm0
DB 15,194,193,2 ; cmpleps %xmm1,%xmm0
- DB 15,40,152,90,79,0,0 ; movaps 0x4f5a(%eax),%xmm3
+ DB 15,40,152,58,81,0,0 ; movaps 0x513a(%eax),%xmm3
DB 15,194,217,2 ; cmpleps %xmm1,%xmm3
- DB 15,40,160,186,79,0,0 ; movaps 0x4fba(%eax),%xmm4
+ DB 15,40,160,154,81,0,0 ; movaps 0x519a(%eax),%xmm4
DB 15,194,225,2 ; cmpleps %xmm1,%xmm4
DB 15,89,206 ; mulps %xmm6,%xmm1
- DB 15,40,168,170,79,0,0 ; movaps 0x4faa(%eax),%xmm5
+ DB 15,40,168,138,81,0,0 ; movaps 0x518a(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,89,239 ; mulps %xmm7,%xmm5
DB 15,88,234 ; addps %xmm2,%xmm5
@@ -39144,7 +39784,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,125,232 ; movaps -0x18(%ebp),%xmm7
DB 15,85,252 ; andnps %xmm4,%xmm7
DB 15,40,93,184 ; movaps -0x48(%ebp),%xmm3
- DB 15,88,152,202,79,0,0 ; addps 0x4fca(%eax),%xmm3
+ DB 15,88,152,170,81,0,0 ; addps 0x51aa(%eax),%xmm3
DB 243,15,91,195 ; cvttps2dq %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,203 ; movaps %xmm3,%xmm1
@@ -39242,9 +39882,9 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,96,77,0,0 ; pand 0x4d60(%edx),%xmm4
+ DB 102,15,219,162,64,79,0,0 ; pand 0x4f40(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,112,77,0,0 ; mulps 0x4d70(%edx),%xmm4
+ DB 15,89,162,80,79,0,0 ; mulps 0x4f50(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 15,89,212 ; mulps %xmm4,%xmm2
@@ -39340,9 +39980,9 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,120,76,0,0 ; pand 0x4c78(%edx),%xmm4
+ DB 102,15,219,162,88,78,0,0 ; pand 0x4e58(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,136,76,0,0 ; mulps 0x4c88(%edx),%xmm4
+ DB 15,89,162,104,78,0,0 ; mulps 0x4e68(%edx),%xmm4
DB 15,40,105,16 ; movaps 0x10(%ecx),%xmm5
DB 15,40,113,32 ; movaps 0x20(%ecx),%xmm6
DB 15,92,197 ; subps %xmm5,%xmm0
@@ -39414,17 +40054,17 @@ _sk_lerp_565_sse2 LABEL PROC
DB 15,133,163,0,0,0 ; jne 2955 <_sk_lerp_565_sse2+0xd2>
DB 243,15,126,52,126 ; movq (%esi,%edi,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,162,191,75,0,0 ; movdqa 0x4bbf(%edx),%xmm4
+ DB 102,15,111,162,159,77,0,0 ; movdqa 0x4d9f(%edx),%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,207,75,0,0 ; mulps 0x4bcf(%edx),%xmm4
- DB 102,15,111,170,223,75,0,0 ; movdqa 0x4bdf(%edx),%xmm5
+ DB 15,89,162,175,77,0,0 ; mulps 0x4daf(%edx),%xmm4
+ DB 102,15,111,170,191,77,0,0 ; movdqa 0x4dbf(%edx),%xmm5
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,239,75,0,0 ; mulps 0x4bef(%edx),%xmm5
- DB 102,15,219,178,255,75,0,0 ; pand 0x4bff(%edx),%xmm6
+ DB 15,89,170,207,77,0,0 ; mulps 0x4dcf(%edx),%xmm5
+ DB 102,15,219,178,223,77,0,0 ; pand 0x4ddf(%edx),%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,178,15,76,0,0 ; mulps 0x4c0f(%edx),%xmm6
+ DB 15,89,178,239,77,0,0 ; mulps 0x4def(%edx),%xmm6
DB 15,40,121,16 ; movaps 0x10(%ecx),%xmm7
DB 15,92,199 ; subps %xmm7,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -39497,7 +40137,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 139,30 ; mov (%esi),%ebx
DB 15,133,19,1,0,0 ; jne 2ad5 <_sk_load_tables_sse2+0x139>
DB 243,15,111,28,187 ; movdqu (%ebx,%edi,4),%xmm3
- DB 102,15,111,146,6,75,0,0 ; movdqa 0x4b06(%edx),%xmm2
+ DB 102,15,111,146,230,76,0,0 ; movdqa 0x4ce6(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
@@ -39553,7 +40193,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 15,20,215 ; unpcklps %xmm7,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,22,75,0,0 ; mulps 0x4b16(%edx),%xmm3
+ DB 15,89,154,246,76,0,0 ; mulps 0x4cf6(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,194 ; mov %eax,%edx
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -39698,7 +40338,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 243,15,126,93,208 ; movq -0x30(%ebp),%xmm3
DB 102,15,97,223 ; punpcklwd %xmm7,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,184,73,0,0 ; mulps 0x49b8(%edx),%xmm3
+ DB 15,89,154,152,75,0,0 ; mulps 0x4b98(%edx),%xmm3
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 137,193 ; mov %eax,%ecx
DB 141,65,8 ; lea 0x8(%ecx),%eax
@@ -39835,7 +40475,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 141,65,8 ; lea 0x8(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 139,85,240 ; mov -0x10(%ebp),%edx
- DB 15,40,162,200,71,0,0 ; movaps 0x47c8(%edx),%xmm4
+ DB 15,40,162,168,73,0,0 ; movaps 0x49a8(%edx),%xmm4
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,40,220 ; movaps %xmm4,%xmm3
DB 80 ; push %eax
@@ -39878,7 +40518,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,8 ; mov (%eax),%ecx
- DB 15,40,162,201,69,0,0 ; movaps 0x45c9(%edx),%xmm4
+ DB 15,40,162,169,71,0,0 ; movaps 0x47a9(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
@@ -39900,7 +40540,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,15,196,192,0 ; pinsrw $0x0,%eax,%xmm0
DB 139,65,4 ; mov 0x4(%ecx),%eax
DB 102,15,196,195,1 ; pinsrw $0x1,%ebx,%xmm0
- DB 15,40,170,217,69,0,0 ; movaps 0x45d9(%edx),%xmm5
+ DB 15,40,170,185,71,0,0 ; movaps 0x47b9(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -40028,7 +40668,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,15,196,199,0 ; pinsrw $0x0,%edi,%xmm0
DB 139,121,4 ; mov 0x4(%ecx),%edi
DB 102,15,196,198,1 ; pinsrw $0x1,%esi,%xmm0
- DB 15,40,170,233,67,0,0 ; movaps 0x43e9(%edx),%xmm5
+ DB 15,40,170,201,69,0,0 ; movaps 0x45c9(%edx),%xmm5
DB 15,89,204 ; mulps %xmm4,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
DB 102,15,112,241,78 ; pshufd $0x4e,%xmm1,%xmm6
@@ -40274,15 +40914,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,42,65,0,0 ; mulps 0x412a(%edx),%xmm5
- DB 15,84,178,58,65,0,0 ; andps 0x413a(%edx),%xmm6
- DB 15,86,178,74,65,0,0 ; orps 0x414a(%edx),%xmm6
- DB 15,88,170,90,65,0,0 ; addps 0x415a(%edx),%xmm5
- DB 15,40,186,106,65,0,0 ; movaps 0x416a(%edx),%xmm7
+ DB 15,89,170,10,67,0,0 ; mulps 0x430a(%edx),%xmm5
+ DB 15,84,178,26,67,0,0 ; andps 0x431a(%edx),%xmm6
+ DB 15,86,178,42,67,0,0 ; orps 0x432a(%edx),%xmm6
+ DB 15,88,170,58,67,0,0 ; addps 0x433a(%edx),%xmm5
+ DB 15,40,186,74,67,0,0 ; movaps 0x434a(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,122,65,0,0 ; addps 0x417a(%edx),%xmm6
- DB 15,40,186,138,65,0,0 ; movaps 0x418a(%edx),%xmm7
+ DB 15,88,178,90,67,0,0 ; addps 0x435a(%edx),%xmm6
+ DB 15,40,186,106,67,0,0 ; movaps 0x436a(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -40292,21 +40932,21 @@ _sk_parametric_r_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,154,65,0,0 ; movaps 0x419a(%edx),%xmm6
+ DB 15,40,178,122,67,0,0 ; movaps 0x437a(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,170,65,0,0 ; addps 0x41aa(%edx),%xmm5
- DB 15,40,186,186,65,0,0 ; movaps 0x41ba(%edx),%xmm7
+ DB 15,88,170,138,67,0,0 ; addps 0x438a(%edx),%xmm5
+ DB 15,40,186,154,67,0,0 ; movaps 0x439a(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,202,65,0,0 ; movaps 0x41ca(%edx),%xmm7
+ DB 15,40,186,170,67,0,0 ; movaps 0x43aa(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,218,65,0,0 ; movaps 0x41da(%edx),%xmm0
+ DB 15,40,130,186,67,0,0 ; movaps 0x43ba(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,234,65,0,0 ; mulps 0x41ea(%edx),%xmm0
+ DB 15,89,130,202,67,0,0 ; mulps 0x43ca(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -40358,15 +40998,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,195,64,0,0 ; mulps 0x40c3(%edx),%xmm5
- DB 15,84,178,211,64,0,0 ; andps 0x40d3(%edx),%xmm6
- DB 15,86,178,227,64,0,0 ; orps 0x40e3(%edx),%xmm6
- DB 15,88,170,243,64,0,0 ; addps 0x40f3(%edx),%xmm5
- DB 15,40,186,3,65,0,0 ; movaps 0x4103(%edx),%xmm7
+ DB 15,89,170,163,66,0,0 ; mulps 0x42a3(%edx),%xmm5
+ DB 15,84,178,179,66,0,0 ; andps 0x42b3(%edx),%xmm6
+ DB 15,86,178,195,66,0,0 ; orps 0x42c3(%edx),%xmm6
+ DB 15,88,170,211,66,0,0 ; addps 0x42d3(%edx),%xmm5
+ DB 15,40,186,227,66,0,0 ; movaps 0x42e3(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,19,65,0,0 ; addps 0x4113(%edx),%xmm6
- DB 15,40,186,35,65,0,0 ; movaps 0x4123(%edx),%xmm7
+ DB 15,88,178,243,66,0,0 ; addps 0x42f3(%edx),%xmm6
+ DB 15,40,186,3,67,0,0 ; movaps 0x4303(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -40376,21 +41016,21 @@ _sk_parametric_g_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,51,65,0,0 ; movaps 0x4133(%edx),%xmm6
+ DB 15,40,178,19,67,0,0 ; movaps 0x4313(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,67,65,0,0 ; addps 0x4143(%edx),%xmm5
- DB 15,40,186,83,65,0,0 ; movaps 0x4153(%edx),%xmm7
+ DB 15,88,170,35,67,0,0 ; addps 0x4323(%edx),%xmm5
+ DB 15,40,186,51,67,0,0 ; movaps 0x4333(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,99,65,0,0 ; movaps 0x4163(%edx),%xmm7
+ DB 15,40,186,67,67,0,0 ; movaps 0x4343(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,115,65,0,0 ; movaps 0x4173(%edx),%xmm0
+ DB 15,40,130,83,67,0,0 ; movaps 0x4353(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,131,65,0,0 ; mulps 0x4183(%edx),%xmm0
+ DB 15,89,130,99,67,0,0 ; mulps 0x4363(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -40441,15 +41081,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,95,64,0,0 ; mulps 0x405f(%edx),%xmm5
- DB 15,84,178,111,64,0,0 ; andps 0x406f(%edx),%xmm6
- DB 15,86,178,127,64,0,0 ; orps 0x407f(%edx),%xmm6
- DB 15,88,170,143,64,0,0 ; addps 0x408f(%edx),%xmm5
- DB 15,40,186,159,64,0,0 ; movaps 0x409f(%edx),%xmm7
+ DB 15,89,170,63,66,0,0 ; mulps 0x423f(%edx),%xmm5
+ DB 15,84,178,79,66,0,0 ; andps 0x424f(%edx),%xmm6
+ DB 15,86,178,95,66,0,0 ; orps 0x425f(%edx),%xmm6
+ DB 15,88,170,111,66,0,0 ; addps 0x426f(%edx),%xmm5
+ DB 15,40,186,127,66,0,0 ; movaps 0x427f(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,175,64,0,0 ; addps 0x40af(%edx),%xmm6
- DB 15,40,186,191,64,0,0 ; movaps 0x40bf(%edx),%xmm7
+ DB 15,88,178,143,66,0,0 ; addps 0x428f(%edx),%xmm6
+ DB 15,40,186,159,66,0,0 ; movaps 0x429f(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -40459,21 +41099,21 @@ _sk_parametric_b_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,207,64,0,0 ; movaps 0x40cf(%edx),%xmm6
+ DB 15,40,178,175,66,0,0 ; movaps 0x42af(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,223,64,0,0 ; addps 0x40df(%edx),%xmm5
- DB 15,40,186,239,64,0,0 ; movaps 0x40ef(%edx),%xmm7
+ DB 15,88,170,191,66,0,0 ; addps 0x42bf(%edx),%xmm5
+ DB 15,40,186,207,66,0,0 ; movaps 0x42cf(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,255,64,0,0 ; movaps 0x40ff(%edx),%xmm7
+ DB 15,40,186,223,66,0,0 ; movaps 0x42df(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,15,65,0,0 ; movaps 0x410f(%edx),%xmm0
+ DB 15,40,130,239,66,0,0 ; movaps 0x42ef(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,31,65,0,0 ; mulps 0x411f(%edx),%xmm0
+ DB 15,89,130,255,66,0,0 ; mulps 0x42ff(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -40524,15 +41164,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,245 ; addps %xmm5,%xmm6
DB 15,91,238 ; cvtdq2ps %xmm6,%xmm5
- DB 15,89,170,251,63,0,0 ; mulps 0x3ffb(%edx),%xmm5
- DB 15,84,178,11,64,0,0 ; andps 0x400b(%edx),%xmm6
- DB 15,86,178,27,64,0,0 ; orps 0x401b(%edx),%xmm6
- DB 15,88,170,43,64,0,0 ; addps 0x402b(%edx),%xmm5
- DB 15,40,186,59,64,0,0 ; movaps 0x403b(%edx),%xmm7
+ DB 15,89,170,219,65,0,0 ; mulps 0x41db(%edx),%xmm5
+ DB 15,84,178,235,65,0,0 ; andps 0x41eb(%edx),%xmm6
+ DB 15,86,178,251,65,0,0 ; orps 0x41fb(%edx),%xmm6
+ DB 15,88,170,11,66,0,0 ; addps 0x420b(%edx),%xmm5
+ DB 15,40,186,27,66,0,0 ; movaps 0x421b(%edx),%xmm7
DB 15,89,254 ; mulps %xmm6,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,88,178,75,64,0,0 ; addps 0x404b(%edx),%xmm6
- DB 15,40,186,91,64,0,0 ; movaps 0x405b(%edx),%xmm7
+ DB 15,88,178,43,66,0,0 ; addps 0x422b(%edx),%xmm6
+ DB 15,40,186,59,66,0,0 ; movaps 0x423b(%edx),%xmm7
DB 15,94,254 ; divps %xmm6,%xmm7
DB 243,15,16,49 ; movss (%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
@@ -40542,21 +41182,21 @@ _sk_parametric_a_sse2 LABEL PROC
DB 15,91,254 ; cvtdq2ps %xmm6,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
- DB 15,40,178,107,64,0,0 ; movaps 0x406b(%edx),%xmm6
+ DB 15,40,178,75,66,0,0 ; movaps 0x424b(%edx),%xmm6
DB 15,84,198 ; andps %xmm6,%xmm0
DB 15,92,248 ; subps %xmm0,%xmm7
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,199 ; subps %xmm7,%xmm0
- DB 15,88,170,123,64,0,0 ; addps 0x407b(%edx),%xmm5
- DB 15,40,186,139,64,0,0 ; movaps 0x408b(%edx),%xmm7
+ DB 15,88,170,91,66,0,0 ; addps 0x425b(%edx),%xmm5
+ DB 15,40,186,107,66,0,0 ; movaps 0x426b(%edx),%xmm7
DB 15,89,248 ; mulps %xmm0,%xmm7
DB 15,92,239 ; subps %xmm7,%xmm5
- DB 15,40,186,155,64,0,0 ; movaps 0x409b(%edx),%xmm7
+ DB 15,40,186,123,66,0,0 ; movaps 0x427b(%edx),%xmm7
DB 15,92,248 ; subps %xmm0,%xmm7
- DB 15,40,130,171,64,0,0 ; movaps 0x40ab(%edx),%xmm0
+ DB 15,40,130,139,66,0,0 ; movaps 0x428b(%edx),%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 15,88,197 ; addps %xmm5,%xmm0
- DB 15,89,130,187,64,0,0 ; mulps 0x40bb(%edx),%xmm0
+ DB 15,89,130,155,66,0,0 ; mulps 0x429b(%edx),%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 243,15,16,105,20 ; movss 0x14(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -40579,6 +41219,125 @@ _sk_parametric_a_sse2 LABEL PROC
DB 93 ; pop %ebp
DB 195 ; ret
+PUBLIC _sk_gamma_sse2
+_sk_gamma_sse2 LABEL PROC
+ DB 85 ; push %ebp
+ DB 137,229 ; mov %esp,%ebp
+ DB 131,236,40 ; sub $0x28,%esp
+ DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
+ DB 15,40,216 ; movaps %xmm0,%xmm3
+ DB 232,0,0,0,0 ; call 38c6 <_sk_gamma_sse2+0x12>
+ DB 88 ; pop %eax
+ DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
+ DB 15,89,128,122,65,0,0 ; mulps 0x417a(%eax),%xmm0
+ DB 15,84,152,138,65,0,0 ; andps 0x418a(%eax),%xmm3
+ DB 15,86,152,154,65,0,0 ; orps 0x419a(%eax),%xmm3
+ DB 15,88,128,170,65,0,0 ; addps 0x41aa(%eax),%xmm0
+ DB 15,40,227 ; movaps %xmm3,%xmm4
+ DB 15,89,160,186,65,0,0 ; mulps 0x41ba(%eax),%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,88,152,202,65,0,0 ; addps 0x41ca(%eax),%xmm3
+ DB 15,40,160,218,65,0,0 ; movaps 0x41da(%eax),%xmm4
+ DB 15,94,227 ; divps %xmm3,%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 139,77,12 ; mov 0xc(%ebp),%ecx
+ DB 139,17 ; mov (%ecx),%edx
+ DB 243,15,16,58 ; movss (%edx),%xmm7
+ DB 15,198,255,0 ; shufps $0x0,%xmm7,%xmm7
+ DB 15,89,199 ; mulps %xmm7,%xmm0
+ DB 15,41,125,232 ; movaps %xmm7,-0x18(%ebp)
+ DB 243,15,91,216 ; cvttps2dq %xmm0,%xmm3
+ DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,194,227,1 ; cmpltps %xmm3,%xmm4
+ DB 15,84,160,234,65,0,0 ; andps 0x41ea(%eax),%xmm4
+ DB 15,92,220 ; subps %xmm4,%xmm3
+ DB 15,40,224 ; movaps %xmm0,%xmm4
+ DB 15,92,227 ; subps %xmm3,%xmm4
+ DB 15,88,128,250,65,0,0 ; addps 0x41fa(%eax),%xmm0
+ DB 15,40,176,26,66,0,0 ; movaps 0x421a(%eax),%xmm6
+ DB 15,92,244 ; subps %xmm4,%xmm6
+ DB 15,40,168,10,66,0,0 ; movaps 0x420a(%eax),%xmm5
+ DB 15,89,229 ; mulps %xmm5,%xmm4
+ DB 15,92,196 ; subps %xmm4,%xmm0
+ DB 15,40,152,42,66,0,0 ; movaps 0x422a(%eax),%xmm3
+ DB 15,40,227 ; movaps %xmm3,%xmm4
+ DB 15,94,230 ; divps %xmm6,%xmm4
+ DB 15,88,224 ; addps %xmm0,%xmm4
+ DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
+ DB 15,89,128,122,65,0,0 ; mulps 0x417a(%eax),%xmm0
+ DB 15,84,136,138,65,0,0 ; andps 0x418a(%eax),%xmm1
+ DB 15,86,136,154,65,0,0 ; orps 0x419a(%eax),%xmm1
+ DB 15,88,128,170,65,0,0 ; addps 0x41aa(%eax),%xmm0
+ DB 15,40,241 ; movaps %xmm1,%xmm6
+ DB 15,89,176,186,65,0,0 ; mulps 0x41ba(%eax),%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,88,136,202,65,0,0 ; addps 0x41ca(%eax),%xmm1
+ DB 15,40,176,218,65,0,0 ; movaps 0x41da(%eax),%xmm6
+ DB 15,94,241 ; divps %xmm1,%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,89,199 ; mulps %xmm7,%xmm0
+ DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
+ DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,194,241,1 ; cmpltps %xmm1,%xmm6
+ DB 15,84,176,234,65,0,0 ; andps 0x41ea(%eax),%xmm6
+ DB 15,92,206 ; subps %xmm6,%xmm1
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,92,241 ; subps %xmm1,%xmm6
+ DB 15,88,128,250,65,0,0 ; addps 0x41fa(%eax),%xmm0
+ DB 15,40,184,26,66,0,0 ; movaps 0x421a(%eax),%xmm7
+ DB 15,92,254 ; subps %xmm6,%xmm7
+ DB 15,89,245 ; mulps %xmm5,%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,40,203 ; movaps %xmm3,%xmm1
+ DB 15,94,207 ; divps %xmm7,%xmm1
+ DB 15,88,200 ; addps %xmm0,%xmm1
+ DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
+ DB 15,89,128,122,65,0,0 ; mulps 0x417a(%eax),%xmm0
+ DB 15,84,144,138,65,0,0 ; andps 0x418a(%eax),%xmm2
+ DB 15,86,144,154,65,0,0 ; orps 0x419a(%eax),%xmm2
+ DB 15,88,128,170,65,0,0 ; addps 0x41aa(%eax),%xmm0
+ DB 15,40,176,186,65,0,0 ; movaps 0x41ba(%eax),%xmm6
+ DB 15,89,242 ; mulps %xmm2,%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,88,144,202,65,0,0 ; addps 0x41ca(%eax),%xmm2
+ DB 15,40,176,218,65,0,0 ; movaps 0x41da(%eax),%xmm6
+ DB 15,94,242 ; divps %xmm2,%xmm6
+ DB 15,92,198 ; subps %xmm6,%xmm0
+ DB 15,89,69,232 ; mulps -0x18(%ebp),%xmm0
+ DB 243,15,91,208 ; cvttps2dq %xmm0,%xmm2
+ DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,194,242,1 ; cmpltps %xmm2,%xmm6
+ DB 15,84,176,234,65,0,0 ; andps 0x41ea(%eax),%xmm6
+ DB 15,92,214 ; subps %xmm6,%xmm2
+ DB 15,40,240 ; movaps %xmm0,%xmm6
+ DB 15,92,242 ; subps %xmm2,%xmm6
+ DB 15,88,128,250,65,0,0 ; addps 0x41fa(%eax),%xmm0
+ DB 15,89,238 ; mulps %xmm6,%xmm5
+ DB 15,92,197 ; subps %xmm5,%xmm0
+ DB 15,40,144,26,66,0,0 ; movaps 0x421a(%eax),%xmm2
+ DB 15,92,214 ; subps %xmm6,%xmm2
+ DB 15,94,218 ; divps %xmm2,%xmm3
+ DB 15,88,216 ; addps %xmm0,%xmm3
+ DB 15,40,128,58,66,0,0 ; movaps 0x423a(%eax),%xmm0
+ DB 15,89,224 ; mulps %xmm0,%xmm4
+ DB 15,89,200 ; mulps %xmm0,%xmm1
+ DB 15,89,216 ; mulps %xmm0,%xmm3
+ DB 102,15,91,196 ; cvtps2dq %xmm4,%xmm0
+ DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
+ DB 102,15,91,211 ; cvtps2dq %xmm3,%xmm2
+ DB 141,65,8 ; lea 0x8(%ecx),%eax
+ DB 131,236,8 ; sub $0x8,%esp
+ DB 15,40,93,216 ; movaps -0x28(%ebp),%xmm3
+ DB 80 ; push %eax
+ DB 255,117,8 ; pushl 0x8(%ebp)
+ DB 255,81,4 ; call *0x4(%ecx)
+ DB 131,196,56 ; add $0x38,%esp
+ DB 93 ; pop %ebp
+ DB 195 ; ret
+
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
DB 85 ; push %ebp
@@ -40587,31 +41346,31 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
- DB 232,0,0,0,0 ; call 38c9 <_sk_lab_to_xyz_sse2+0x15>
+ DB 232,0,0,0,0 ; call 3aae <_sk_lab_to_xyz_sse2+0x15>
DB 88 ; pop %eax
- DB 15,89,144,151,63,0,0 ; mulps 0x3f97(%eax),%xmm2
- DB 15,40,160,167,63,0,0 ; movaps 0x3fa7(%eax),%xmm4
+ DB 15,89,144,98,64,0,0 ; mulps 0x4062(%eax),%xmm2
+ DB 15,40,160,114,64,0,0 ; movaps 0x4072(%eax),%xmm4
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 15,40,168,183,63,0,0 ; movaps 0x3fb7(%eax),%xmm5
+ DB 15,40,168,130,64,0,0 ; movaps 0x4082(%eax),%xmm5
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,89,220 ; mulps %xmm4,%xmm3
DB 15,88,221 ; addps %xmm5,%xmm3
- DB 15,88,144,199,63,0,0 ; addps 0x3fc7(%eax),%xmm2
- DB 15,89,144,215,63,0,0 ; mulps 0x3fd7(%eax),%xmm2
- DB 15,89,136,231,63,0,0 ; mulps 0x3fe7(%eax),%xmm1
+ DB 15,88,144,146,64,0,0 ; addps 0x4092(%eax),%xmm2
+ DB 15,89,144,162,64,0,0 ; mulps 0x40a2(%eax),%xmm2
+ DB 15,89,136,178,64,0,0 ; mulps 0x40b2(%eax),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 15,89,152,247,63,0,0 ; mulps 0x3ff7(%eax),%xmm3
+ DB 15,89,152,194,64,0,0 ; mulps 0x40c2(%eax),%xmm3
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,92,235 ; subps %xmm3,%xmm5
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,152,7,64,0,0 ; movaps 0x4007(%eax),%xmm3
+ DB 15,40,152,210,64,0,0 ; movaps 0x40d2(%eax),%xmm3
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 15,194,224,1 ; cmpltps %xmm0,%xmm4
- DB 15,40,176,23,64,0,0 ; movaps 0x4017(%eax),%xmm6
+ DB 15,40,176,226,64,0,0 ; movaps 0x40e2(%eax),%xmm6
DB 15,88,206 ; addps %xmm6,%xmm1
- DB 15,40,184,39,64,0,0 ; movaps 0x4027(%eax),%xmm7
+ DB 15,40,184,242,64,0,0 ; movaps 0x40f2(%eax),%xmm7
DB 15,89,207 ; mulps %xmm7,%xmm1
DB 15,84,196 ; andps %xmm4,%xmm0
DB 15,85,225 ; andnps %xmm1,%xmm4
@@ -40636,8 +41395,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,85,221 ; andnps %xmm5,%xmm3
DB 15,86,216 ; orps %xmm0,%xmm3
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,160,55,64,0,0 ; mulps 0x4037(%eax),%xmm4
- DB 15,89,152,71,64,0,0 ; mulps 0x4047(%eax),%xmm3
+ DB 15,89,160,2,65,0,0 ; mulps 0x4102(%eax),%xmm4
+ DB 15,89,152,18,65,0,0 ; mulps 0x4112(%eax),%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -40658,7 +41417,7 @@ _sk_load_a8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 39b9 <_sk_load_a8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3b9e <_sk_load_a8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -40669,13 +41428,13 @@ _sk_load_a8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,60 ; jne 3a10 <_sk_load_a8_sse2+0x65>
+ DB 117,60 ; jne 3bf5 <_sk_load_a8_sse2+0x65>
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,103,63,0,0 ; pand 0x3f67(%edx),%xmm0
+ DB 102,15,219,130,50,64,0,0 ; pand 0x4032(%edx),%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,154,119,63,0,0 ; mulps 0x3f77(%edx),%xmm3
+ DB 15,89,154,66,64,0,0 ; mulps 0x4042(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -40692,12 +41451,12 @@ _sk_load_a8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3a4a <_sk_load_a8_sse2+0x9f>
+ DB 116,50 ; je 3c2f <_sk_load_a8_sse2+0x9f>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3a34 <_sk_load_a8_sse2+0x89>
+ DB 116,19 ; je 3c19 <_sk_load_a8_sse2+0x89>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,187 ; jne 39e1 <_sk_load_a8_sse2+0x36>
+ DB 117,187 ; jne 3bc6 <_sk_load_a8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -40706,10 +41465,10 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,151 ; jmp 39e1 <_sk_load_a8_sse2+0x36>
+ DB 235,151 ; jmp 3bc6 <_sk_load_a8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,198 ; movd %esi,%xmm0
- DB 235,141 ; jmp 39e1 <_sk_load_a8_sse2+0x36>
+ DB 235,141 ; jmp 3bc6 <_sk_load_a8_sse2+0x36>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -40732,15 +41491,15 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,127,97,32 ; movdqa %xmm4,0x20(%ecx)
DB 102,15,127,97,16 ; movdqa %xmm4,0x10(%ecx)
DB 133,219 ; test %ebx,%ebx
- DB 232,0,0,0,0 ; call 3a8d <_sk_load_a8_dst_sse2+0x39>
+ DB 232,0,0,0,0 ; call 3c72 <_sk_load_a8_dst_sse2+0x39>
DB 90 ; pop %edx
- DB 117,54 ; jne 3ac6 <_sk_load_a8_dst_sse2+0x72>
+ DB 117,54 ; jne 3cab <_sk_load_a8_dst_sse2+0x72>
DB 102,15,110,36,55 ; movd (%edi,%esi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,179,62,0,0 ; pand 0x3eb3(%edx),%xmm4
+ DB 102,15,219,162,126,63,0,0 ; pand 0x3f7e(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,195,62,0,0 ; mulps 0x3ec3(%edx),%xmm4
+ DB 15,89,162,142,63,0,0 ; mulps 0x3f8e(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -40755,11 +41514,11 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 3afc <_sk_load_a8_dst_sse2+0xa8>
+ DB 116,46 ; je 3ce1 <_sk_load_a8_dst_sse2+0xa8>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3ae6 <_sk_load_a8_dst_sse2+0x92>
+ DB 116,19 ; je 3ccb <_sk_load_a8_dst_sse2+0x92>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,197 ; jne 3a9d <_sk_load_a8_dst_sse2+0x49>
+ DB 117,197 ; jne 3c82 <_sk_load_a8_dst_sse2+0x49>
DB 15,182,92,55,2 ; movzbl 0x2(%edi,%esi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -40768,10 +41527,10 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,161 ; jmp 3a9d <_sk_load_a8_dst_sse2+0x49>
+ DB 235,161 ; jmp 3c82 <_sk_load_a8_dst_sse2+0x49>
DB 15,182,52,55 ; movzbl (%edi,%esi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,151 ; jmp 3a9d <_sk_load_a8_dst_sse2+0x49>
+ DB 235,151 ; jmp 3c82 <_sk_load_a8_dst_sse2+0x49>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -40810,13 +41569,13 @@ _sk_gather_a8_sse2 LABEL PROC
DB 9,202 ; or %ecx,%edx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
- DB 232,0,0,0,0 ; call 3b8b <_sk_gather_a8_sse2+0x85>
+ DB 232,0,0,0,0 ; call 3d70 <_sk_gather_a8_sse2+0x85>
DB 89 ; pop %ecx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,153,213,61,0,0 ; mulps 0x3dd5(%ecx),%xmm3
+ DB 15,89,153,160,62,0,0 ; mulps 0x3ea0(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -40839,7 +41598,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
- DB 232,0,0,0,0 ; call 3bcf <_sk_store_a8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3db4 <_sk_store_a8_sse2+0xe>
DB 94 ; pop %esi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -40848,7 +41607,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 15,175,81,4 ; imul 0x4(%ecx),%edx
DB 3,23 ; add (%edi),%edx
DB 139,89,8 ; mov 0x8(%ecx),%ebx
- DB 15,40,166,161,61,0,0 ; movaps 0x3da1(%esi),%xmm4
+ DB 15,40,166,108,62,0,0 ; movaps 0x3e6c(%esi),%xmm4
DB 15,89,227 ; mulps %xmm3,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
DB 102,15,114,244,16 ; pslld $0x10,%xmm4
@@ -40857,7 +41616,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,26 ; jne 3c24 <_sk_store_a8_sse2+0x63>
+ DB 117,26 ; jne 3e09 <_sk_store_a8_sse2+0x63>
DB 102,15,126,230 ; movd %xmm4,%esi
DB 137,52,58 ; mov %esi,(%edx,%edi,1)
DB 141,80,8 ; lea 0x8(%eax),%edx
@@ -40875,26 +41634,26 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,57 ; je 3c6d <_sk_store_a8_sse2+0xac>
+ DB 116,57 ; je 3e52 <_sk_store_a8_sse2+0xac>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,17 ; je 3c4a <_sk_store_a8_sse2+0x89>
+ DB 116,17 ; je 3e2f <_sk_store_a8_sse2+0x89>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,211 ; jne 3c11 <_sk_store_a8_sse2+0x50>
+ DB 117,211 ; jne 3df6 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,200 ; movdqa %xmm4,-0x38(%ebp)
DB 138,93,208 ; mov -0x30(%ebp),%bl
DB 136,92,58,2 ; mov %bl,0x2(%edx,%edi,1)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
- DB 102,15,219,166,177,61,0,0 ; pand 0x3db1(%esi),%xmm4
+ DB 102,15,219,166,124,62,0,0 ; pand 0x3e7c(%esi),%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,230 ; movd %xmm4,%esi
DB 102,137,52,58 ; mov %si,(%edx,%edi,1)
- DB 235,164 ; jmp 3c11 <_sk_store_a8_sse2+0x50>
+ DB 235,164 ; jmp 3df6 <_sk_store_a8_sse2+0x50>
DB 102,15,127,101,216 ; movdqa %xmm4,-0x28(%ebp)
DB 138,93,216 ; mov -0x28(%ebp),%bl
DB 136,28,58 ; mov %bl,(%edx,%edi,1)
- DB 235,151 ; jmp 3c11 <_sk_store_a8_sse2+0x50>
+ DB 235,151 ; jmp 3df6 <_sk_store_a8_sse2+0x50>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -40904,7 +41663,7 @@ _sk_load_g8_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3c88 <_sk_load_g8_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3e6d <_sk_load_g8_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -40915,16 +41674,16 @@ _sk_load_g8_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,63 ; jne 3ce2 <_sk_load_g8_sse2+0x68>
+ DB 117,63 ; jne 3ec7 <_sk_load_g8_sse2+0x68>
DB 102,15,110,4,62 ; movd (%esi,%edi,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,130,8,61,0,0 ; pand 0x3d08(%edx),%xmm0
+ DB 102,15,219,130,211,61,0,0 ; pand 0x3dd3(%edx),%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,24,61,0,0 ; mulps 0x3d18(%edx),%xmm0
+ DB 15,89,130,227,61,0,0 ; mulps 0x3de3(%edx),%xmm0
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,40,61,0,0 ; movaps 0x3d28(%edx),%xmm3
+ DB 15,40,154,243,61,0,0 ; movaps 0x3df3(%edx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 86 ; push %esi
@@ -40938,12 +41697,12 @@ _sk_load_g8_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3d1c <_sk_load_g8_sse2+0xa2>
+ DB 116,50 ; je 3f01 <_sk_load_g8_sse2+0xa2>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3d06 <_sk_load_g8_sse2+0x8c>
+ DB 116,19 ; je 3eeb <_sk_load_g8_sse2+0x8c>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,184 ; jne 3cb0 <_sk_load_g8_sse2+0x36>
+ DB 117,184 ; jne 3e95 <_sk_load_g8_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -40952,10 +41711,10 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,148 ; jmp 3cb0 <_sk_load_g8_sse2+0x36>
+ DB 235,148 ; jmp 3e95 <_sk_load_g8_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,198 ; movd %esi,%xmm0
- DB 235,138 ; jmp 3cb0 <_sk_load_g8_sse2+0x36>
+ DB 235,138 ; jmp 3e95 <_sk_load_g8_sse2+0x36>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -40965,7 +41724,7 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3d34 <_sk_load_g8_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 3f19 <_sk_load_g8_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -40976,17 +41735,17 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,73 ; jne 3d98 <_sk_load_g8_dst_sse2+0x72>
+ DB 117,73 ; jne 3f7d <_sk_load_g8_dst_sse2+0x72>
DB 102,15,110,36,62 ; movd (%esi,%edi,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,162,140,60,0,0 ; pand 0x3c8c(%edx),%xmm4
+ DB 102,15,219,162,87,61,0,0 ; pand 0x3d57(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,156,60,0,0 ; mulps 0x3c9c(%edx),%xmm4
+ DB 15,89,162,103,61,0,0 ; mulps 0x3d67(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
DB 15,41,97,32 ; movaps %xmm4,0x20(%ecx)
DB 15,41,97,16 ; movaps %xmm4,0x10(%ecx)
- DB 15,40,162,172,60,0,0 ; movaps 0x3cac(%edx),%xmm4
+ DB 15,40,162,119,61,0,0 ; movaps 0x3d77(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -41001,12 +41760,12 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 3dd2 <_sk_load_g8_dst_sse2+0xac>
+ DB 116,50 ; je 3fb7 <_sk_load_g8_dst_sse2+0xac>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3dbc <_sk_load_g8_dst_sse2+0x96>
+ DB 116,19 ; je 3fa1 <_sk_load_g8_dst_sse2+0x96>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,174 ; jne 3d5c <_sk_load_g8_dst_sse2+0x36>
+ DB 117,174 ; jne 3f41 <_sk_load_g8_dst_sse2+0x36>
DB 15,182,92,62,2 ; movzbl 0x2(%esi,%edi,1),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -41015,10 +41774,10 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,138 ; jmp 3d5c <_sk_load_g8_dst_sse2+0x36>
+ DB 235,138 ; jmp 3f41 <_sk_load_g8_dst_sse2+0x36>
DB 15,182,52,62 ; movzbl (%esi,%edi,1),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 235,128 ; jmp 3d5c <_sk_load_g8_dst_sse2+0x36>
+ DB 235,128 ; jmp 3f41 <_sk_load_g8_dst_sse2+0x36>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -41056,17 +41815,17 @@ _sk_gather_g8_sse2 LABEL PROC
DB 193,226,8 ; shl $0x8,%edx
DB 9,202 ; or %ecx,%edx
DB 102,15,196,194,0 ; pinsrw $0x0,%edx,%xmm0
- DB 232,0,0,0,0 ; call 3e5c <_sk_gather_g8_sse2+0x80>
+ DB 232,0,0,0,0 ; call 4041 <_sk_gather_g8_sse2+0x80>
DB 89 ; pop %ecx
DB 102,15,196,199,1 ; pinsrw $0x1,%edi,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,148,59,0,0 ; mulps 0x3b94(%ecx),%xmm0
+ DB 15,89,129,95,60,0,0 ; mulps 0x3c5f(%ecx),%xmm0
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,153,164,59,0,0 ; movaps 0x3ba4(%ecx),%xmm3
+ DB 15,40,153,111,60,0,0 ; movaps 0x3c6f(%ecx),%xmm3
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 82 ; push %edx
@@ -41086,7 +41845,7 @@ _sk_load_565_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3ea7 <_sk_load_565_sse2+0xe>
+ DB 232,0,0,0,0 ; call 408c <_sk_load_565_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41098,23 +41857,23 @@ _sk_load_565_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,97 ; jne 3f25 <_sk_load_565_sse2+0x8c>
+ DB 117,97 ; jne 410a <_sk_load_565_sse2+0x8c>
DB 243,15,126,20,126 ; movq (%esi,%edi,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,105,59,0,0 ; movdqa 0x3b69(%edx),%xmm0
+ DB 102,15,111,130,52,60,0,0 ; movdqa 0x3c34(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,121,59,0,0 ; mulps 0x3b79(%edx),%xmm0
- DB 102,15,111,138,137,59,0,0 ; movdqa 0x3b89(%edx),%xmm1
+ DB 15,89,130,68,60,0,0 ; mulps 0x3c44(%edx),%xmm0
+ DB 102,15,111,138,84,60,0,0 ; movdqa 0x3c54(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,153,59,0,0 ; mulps 0x3b99(%edx),%xmm1
- DB 102,15,219,146,169,59,0,0 ; pand 0x3ba9(%edx),%xmm2
+ DB 15,89,138,100,60,0,0 ; mulps 0x3c64(%edx),%xmm1
+ DB 102,15,219,146,116,60,0,0 ; pand 0x3c74(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,185,59,0,0 ; mulps 0x3bb9(%edx),%xmm2
+ DB 15,89,146,132,60,0,0 ; mulps 0x3c84(%edx),%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,201,59,0,0 ; movaps 0x3bc9(%edx),%xmm3
+ DB 15,40,154,148,60,0,0 ; movaps 0x3c94(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -41126,22 +41885,22 @@ _sk_load_565_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 3f5b <_sk_load_565_sse2+0xc2>
+ DB 116,46 ; je 4140 <_sk_load_565_sse2+0xc2>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 3f49 <_sk_load_565_sse2+0xb0>
+ DB 116,19 ; je 412e <_sk_load_565_sse2+0xb0>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,146 ; jne 3ecd <_sk_load_565_sse2+0x34>
+ DB 117,146 ; jne 40b2 <_sk_load_565_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,114,255,255,255 ; jmp 3ecd <_sk_load_565_sse2+0x34>
+ DB 233,114,255,255,255 ; jmp 40b2 <_sk_load_565_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,214 ; movd %esi,%xmm2
- DB 233,101,255,255,255 ; jmp 3ecd <_sk_load_565_sse2+0x34>
+ DB 233,101,255,255,255 ; jmp 40b2 <_sk_load_565_sse2+0x34>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -41151,7 +41910,7 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 3f76 <_sk_load_565_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 415b <_sk_load_565_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41163,24 +41922,24 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,113 ; jne 4004 <_sk_load_565_dst_sse2+0x9c>
+ DB 117,113 ; jne 41e9 <_sk_load_565_dst_sse2+0x9c>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,10,59,0,0 ; movdqa 0x3b0a(%edx),%xmm5
+ DB 102,15,111,170,213,59,0,0 ; movdqa 0x3bd5(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,26,59,0,0 ; mulps 0x3b1a(%edx),%xmm5
+ DB 15,89,170,229,59,0,0 ; mulps 0x3be5(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,42,59,0,0 ; movdqa 0x3b2a(%edx),%xmm5
+ DB 102,15,111,170,245,59,0,0 ; movdqa 0x3bf5(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,58,59,0,0 ; mulps 0x3b3a(%edx),%xmm5
+ DB 15,89,170,5,60,0,0 ; mulps 0x3c05(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,219,162,74,59,0,0 ; pand 0x3b4a(%edx),%xmm4
+ DB 102,15,219,162,21,60,0,0 ; pand 0x3c15(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,90,59,0,0 ; mulps 0x3b5a(%edx),%xmm4
+ DB 15,89,162,37,60,0,0 ; mulps 0x3c25(%edx),%xmm4
DB 15,41,97,48 ; movaps %xmm4,0x30(%ecx)
- DB 15,40,162,106,59,0,0 ; movaps 0x3b6a(%edx),%xmm4
+ DB 15,40,162,53,60,0,0 ; movaps 0x3c35(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -41195,22 +41954,22 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 403a <_sk_load_565_dst_sse2+0xd2>
+ DB 116,46 ; je 421f <_sk_load_565_dst_sse2+0xd2>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 4028 <_sk_load_565_dst_sse2+0xc0>
+ DB 116,19 ; je 420d <_sk_load_565_dst_sse2+0xc0>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,130 ; jne 3f9c <_sk_load_565_dst_sse2+0x34>
+ DB 117,130 ; jne 4181 <_sk_load_565_dst_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,98,255,255,255 ; jmp 3f9c <_sk_load_565_dst_sse2+0x34>
+ DB 233,98,255,255,255 ; jmp 4181 <_sk_load_565_dst_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,85,255,255,255 ; jmp 3f9c <_sk_load_565_dst_sse2+0x34>
+ DB 233,85,255,255,255 ; jmp 4181 <_sk_load_565_dst_sse2+0x34>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -41243,25 +42002,25 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,209,2 ; pinsrw $0x2,%ecx,%xmm2
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
- DB 232,0,0,0,0 ; call 40c2 <_sk_gather_565_sse2+0x7b>
+ DB 232,0,0,0,0 ; call 42a7 <_sk_gather_565_sse2+0x7b>
DB 90 ; pop %edx
DB 102,15,196,209,3 ; pinsrw $0x3,%ecx,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,130,46,58,0,0 ; movdqa 0x3a2e(%edx),%xmm0
+ DB 102,15,111,130,249,58,0,0 ; movdqa 0x3af9(%edx),%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,62,58,0,0 ; mulps 0x3a3e(%edx),%xmm0
- DB 102,15,111,138,78,58,0,0 ; movdqa 0x3a4e(%edx),%xmm1
+ DB 15,89,130,9,59,0,0 ; mulps 0x3b09(%edx),%xmm0
+ DB 102,15,111,138,25,59,0,0 ; movdqa 0x3b19(%edx),%xmm1
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,94,58,0,0 ; mulps 0x3a5e(%edx),%xmm1
- DB 102,15,219,146,110,58,0,0 ; pand 0x3a6e(%edx),%xmm2
+ DB 15,89,138,41,59,0,0 ; mulps 0x3b29(%edx),%xmm1
+ DB 102,15,219,146,57,59,0,0 ; pand 0x3b39(%edx),%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,126,58,0,0 ; mulps 0x3a7e(%edx),%xmm2
+ DB 15,89,146,73,59,0,0 ; mulps 0x3b49(%edx),%xmm2
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,142,58,0,0 ; movaps 0x3a8e(%edx),%xmm3
+ DB 15,40,154,89,59,0,0 ; movaps 0x3b59(%edx),%xmm3
DB 81 ; push %ecx
DB 255,117,8 ; pushl 0x8(%ebp)
DB 255,80,4 ; call *0x4(%eax)
@@ -41277,7 +42036,7 @@ _sk_store_565_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4135 <_sk_store_565_sse2+0xe>
+ DB 232,0,0,0,0 ; call 431a <_sk_store_565_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41287,8 +42046,8 @@ _sk_store_565_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,43,58,0,0 ; movaps 0x3a2b(%edi),%xmm4
- DB 15,40,175,59,58,0,0 ; movaps 0x3a3b(%edi),%xmm5
+ DB 15,40,167,246,58,0,0 ; movaps 0x3af6(%edi),%xmm4
+ DB 15,40,175,6,59,0,0 ; movaps 0x3b06(%edi),%xmm5
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,240 ; movaps %xmm0,%xmm6
DB 15,89,244 ; mulps %xmm4,%xmm6
@@ -41308,7 +42067,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
DB 133,219 ; test %ebx,%ebx
- DB 117,34 ; jne 41c9 <_sk_store_565_sse2+0xa2>
+ DB 117,34 ; jne 43ae <_sk_store_565_sse2+0xa2>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,15,126,235 ; movd %xmm5,%ebx
DB 137,60,114 ; mov %edi,(%edx,%esi,2)
@@ -41328,20 +42087,20 @@ _sk_store_565_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,37 ; je 41ff <_sk_store_565_sse2+0xd8>
+ DB 116,37 ; je 43e4 <_sk_store_565_sse2+0xd8>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,15 ; je 41ee <_sk_store_565_sse2+0xc7>
+ DB 116,15 ; je 43d3 <_sk_store_565_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,210 ; jne 41b6 <_sk_store_565_sse2+0x8f>
+ DB 117,210 ; jne 439b <_sk_store_565_sse2+0x8f>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
- DB 235,183 ; jmp 41b6 <_sk_store_565_sse2+0x8f>
+ DB 235,183 ; jmp 439b <_sk_store_565_sse2+0x8f>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
- DB 235,173 ; jmp 41b6 <_sk_store_565_sse2+0x8f>
+ DB 235,173 ; jmp 439b <_sk_store_565_sse2+0x8f>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -41351,7 +42110,7 @@ _sk_load_4444_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4217 <_sk_load_4444_sse2+0xe>
+ DB 232,0,0,0,0 ; call 43fc <_sk_load_4444_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41363,24 +42122,24 @@ _sk_load_4444_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,112 ; jne 42a4 <_sk_load_4444_sse2+0x9b>
+ DB 117,112 ; jne 4489 <_sk_load_4444_sse2+0x9b>
DB 243,15,126,28,126 ; movq (%esi,%edi,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,130,105,57,0,0 ; movdqa 0x3969(%edx),%xmm0
+ DB 102,15,111,130,52,58,0,0 ; movdqa 0x3a34(%edx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,130,121,57,0,0 ; mulps 0x3979(%edx),%xmm0
- DB 102,15,111,138,137,57,0,0 ; movdqa 0x3989(%edx),%xmm1
+ DB 15,89,130,68,58,0,0 ; mulps 0x3a44(%edx),%xmm0
+ DB 102,15,111,138,84,58,0,0 ; movdqa 0x3a54(%edx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,138,153,57,0,0 ; mulps 0x3999(%edx),%xmm1
- DB 102,15,111,146,169,57,0,0 ; movdqa 0x39a9(%edx),%xmm2
+ DB 15,89,138,100,58,0,0 ; mulps 0x3a64(%edx),%xmm1
+ DB 102,15,111,146,116,58,0,0 ; movdqa 0x3a74(%edx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,146,185,57,0,0 ; mulps 0x39b9(%edx),%xmm2
- DB 102,15,219,154,201,57,0,0 ; pand 0x39c9(%edx),%xmm3
+ DB 15,89,146,132,58,0,0 ; mulps 0x3a84(%edx),%xmm2
+ DB 102,15,219,154,148,58,0,0 ; pand 0x3a94(%edx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,154,217,57,0,0 ; mulps 0x39d9(%edx),%xmm3
+ DB 15,89,154,164,58,0,0 ; mulps 0x3aa4(%edx),%xmm3
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
DB 82 ; push %edx
@@ -41394,22 +42153,22 @@ _sk_load_4444_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,46 ; je 42da <_sk_load_4444_sse2+0xd1>
+ DB 116,46 ; je 44bf <_sk_load_4444_sse2+0xd1>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,19 ; je 42c8 <_sk_load_4444_sse2+0xbf>
+ DB 116,19 ; je 44ad <_sk_load_4444_sse2+0xbf>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,131 ; jne 423d <_sk_load_4444_sse2+0x34>
+ DB 117,131 ; jne 4422 <_sk_load_4444_sse2+0x34>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,195 ; movd %ebx,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,110,4,126 ; movd (%esi,%edi,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,99,255,255,255 ; jmp 423d <_sk_load_4444_sse2+0x34>
+ DB 233,99,255,255,255 ; jmp 4422 <_sk_load_4444_sse2+0x34>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,222 ; movd %esi,%xmm3
- DB 233,86,255,255,255 ; jmp 423d <_sk_load_4444_sse2+0x34>
+ DB 233,86,255,255,255 ; jmp 4422 <_sk_load_4444_sse2+0x34>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -41419,7 +42178,7 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 42f5 <_sk_load_4444_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 44da <_sk_load_4444_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41431,27 +42190,27 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,128,0,0,0 ; jne 4396 <_sk_load_4444_dst_sse2+0xaf>
+ DB 15,133,128,0,0,0 ; jne 457b <_sk_load_4444_dst_sse2+0xaf>
DB 243,15,126,36,126 ; movq (%esi,%edi,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,111,170,11,57,0,0 ; movdqa 0x390b(%edx),%xmm5
+ DB 102,15,111,170,214,57,0,0 ; movdqa 0x39d6(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,27,57,0,0 ; mulps 0x391b(%edx),%xmm5
+ DB 15,89,170,230,57,0,0 ; mulps 0x39e6(%edx),%xmm5
DB 15,41,105,16 ; movaps %xmm5,0x10(%ecx)
- DB 102,15,111,170,43,57,0,0 ; movdqa 0x392b(%edx),%xmm5
+ DB 102,15,111,170,246,57,0,0 ; movdqa 0x39f6(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,59,57,0,0 ; mulps 0x393b(%edx),%xmm5
+ DB 15,89,170,6,58,0,0 ; mulps 0x3a06(%edx),%xmm5
DB 15,41,105,32 ; movaps %xmm5,0x20(%ecx)
- DB 102,15,111,170,75,57,0,0 ; movdqa 0x394b(%edx),%xmm5
+ DB 102,15,111,170,22,58,0,0 ; movdqa 0x3a16(%edx),%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,170,91,57,0,0 ; mulps 0x395b(%edx),%xmm5
+ DB 15,89,170,38,58,0,0 ; mulps 0x3a26(%edx),%xmm5
DB 15,41,105,48 ; movaps %xmm5,0x30(%ecx)
- DB 102,15,219,162,107,57,0,0 ; pand 0x396b(%edx),%xmm4
+ DB 102,15,219,162,54,58,0,0 ; pand 0x3a36(%edx),%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,162,123,57,0,0 ; mulps 0x397b(%edx),%xmm4
+ DB 15,89,162,70,58,0,0 ; mulps 0x3a46(%edx),%xmm4
DB 15,41,97,64 ; movaps %xmm4,0x40(%ecx)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -41466,22 +42225,22 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,50 ; je 43d0 <_sk_load_4444_dst_sse2+0xe9>
+ DB 116,50 ; je 45b5 <_sk_load_4444_dst_sse2+0xe9>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,23 ; je 43be <_sk_load_4444_dst_sse2+0xd7>
+ DB 116,23 ; je 45a3 <_sk_load_4444_dst_sse2+0xd7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,111,255,255,255 ; jne 431f <_sk_load_4444_dst_sse2+0x38>
+ DB 15,133,111,255,255,255 ; jne 4504 <_sk_load_4444_dst_sse2+0x38>
DB 15,183,92,126,4 ; movzwl 0x4(%esi,%edi,2),%ebx
DB 102,15,110,227 ; movd %ebx,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,110,44,126 ; movd (%esi,%edi,2),%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,79,255,255,255 ; jmp 431f <_sk_load_4444_dst_sse2+0x38>
+ DB 233,79,255,255,255 ; jmp 4504 <_sk_load_4444_dst_sse2+0x38>
DB 15,183,52,126 ; movzwl (%esi,%edi,2),%esi
DB 102,15,110,230 ; movd %esi,%xmm4
- DB 233,66,255,255,255 ; jmp 431f <_sk_load_4444_dst_sse2+0x38>
+ DB 233,66,255,255,255 ; jmp 4504 <_sk_load_4444_dst_sse2+0x38>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -41515,25 +42274,25 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 15,183,12,74 ; movzwl (%edx,%ecx,2),%ecx
DB 102,15,196,217,3 ; pinsrw $0x3,%ecx,%xmm3
- DB 232,0,0,0,0 ; call 445d <_sk_gather_4444_sse2+0x80>
+ DB 232,0,0,0,0 ; call 4642 <_sk_gather_4444_sse2+0x80>
DB 89 ; pop %ecx
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,129,35,56,0,0 ; movdqa 0x3823(%ecx),%xmm0
+ DB 102,15,111,129,238,56,0,0 ; movdqa 0x38ee(%ecx),%xmm0
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,129,51,56,0,0 ; mulps 0x3833(%ecx),%xmm0
- DB 102,15,111,137,67,56,0,0 ; movdqa 0x3843(%ecx),%xmm1
+ DB 15,89,129,254,56,0,0 ; mulps 0x38fe(%ecx),%xmm0
+ DB 102,15,111,137,14,57,0,0 ; movdqa 0x390e(%ecx),%xmm1
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,137,83,56,0,0 ; mulps 0x3853(%ecx),%xmm1
- DB 102,15,111,145,99,56,0,0 ; movdqa 0x3863(%ecx),%xmm2
+ DB 15,89,137,30,57,0,0 ; mulps 0x391e(%ecx),%xmm1
+ DB 102,15,111,145,46,57,0,0 ; movdqa 0x392e(%ecx),%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,145,115,56,0,0 ; mulps 0x3873(%ecx),%xmm2
- DB 102,15,219,153,131,56,0,0 ; pand 0x3883(%ecx),%xmm3
+ DB 15,89,145,62,57,0,0 ; mulps 0x393e(%ecx),%xmm2
+ DB 102,15,219,153,78,57,0,0 ; pand 0x394e(%ecx),%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,153,147,56,0,0 ; mulps 0x3893(%ecx),%xmm3
+ DB 15,89,153,94,57,0,0 ; mulps 0x395e(%ecx),%xmm3
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
DB 81 ; push %ecx
@@ -41551,7 +42310,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 44da <_sk_store_4444_sse2+0xe>
+ DB 232,0,0,0,0 ; call 46bf <_sk_store_4444_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41561,7 +42320,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 1,210 ; add %edx,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,38,56,0,0 ; movaps 0x3826(%edi),%xmm4
+ DB 15,40,167,241,56,0,0 ; movaps 0x38f1(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -41587,7 +42346,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,15,112,236,229 ; pshufd $0xe5,%xmm4,%xmm5
DB 102,15,126,109,236 ; movd %xmm5,-0x14(%ebp)
DB 133,219 ; test %ebx,%ebx
- DB 117,34 ; jne 457d <_sk_store_4444_sse2+0xb1>
+ DB 117,34 ; jne 4762 <_sk_store_4444_sse2+0xb1>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,15,126,235 ; movd %xmm5,%ebx
DB 137,60,114 ; mov %edi,(%edx,%esi,2)
@@ -41607,20 +42366,20 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,37 ; je 45b3 <_sk_store_4444_sse2+0xe7>
+ DB 116,37 ; je 4798 <_sk_store_4444_sse2+0xe7>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,15 ; je 45a2 <_sk_store_4444_sse2+0xd6>
+ DB 116,15 ; je 4787 <_sk_store_4444_sse2+0xd6>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,210 ; jne 456a <_sk_store_4444_sse2+0x9e>
+ DB 117,210 ; jne 474f <_sk_store_4444_sse2+0x9e>
DB 102,15,197,252,4 ; pextrw $0x4,%xmm4,%edi
DB 102,137,124,114,4 ; mov %di,0x4(%edx,%esi,2)
DB 102,15,112,228,212 ; pshufd $0xd4,%xmm4,%xmm4
DB 242,15,112,228,232 ; pshuflw $0xe8,%xmm4,%xmm4
DB 102,15,126,36,114 ; movd %xmm4,(%edx,%esi,2)
- DB 235,183 ; jmp 456a <_sk_store_4444_sse2+0x9e>
+ DB 235,183 ; jmp 474f <_sk_store_4444_sse2+0x9e>
DB 102,15,126,231 ; movd %xmm4,%edi
DB 102,137,60,114 ; mov %di,(%edx,%esi,2)
- DB 235,173 ; jmp 456a <_sk_store_4444_sse2+0x9e>
+ DB 235,173 ; jmp 474f <_sk_store_4444_sse2+0x9e>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -41630,7 +42389,7 @@ _sk_load_8888_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 45cb <_sk_load_8888_sse2+0xe>
+ DB 232,0,0,0,0 ; call 47b0 <_sk_load_8888_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41642,13 +42401,13 @@ _sk_load_8888_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 464f <_sk_load_8888_sse2+0x92>
+ DB 117,102 ; jne 4834 <_sk_load_8888_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,146,69,55,0,0 ; movdqa 0x3745(%edx),%xmm2
+ DB 102,15,111,146,16,56,0,0 ; movdqa 0x3810(%edx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,85,55,0,0 ; movaps 0x3755(%edx),%xmm4
+ DB 15,40,162,32,56,0,0 ; movaps 0x3820(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -41676,18 +42435,18 @@ _sk_load_8888_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,35 ; je 467a <_sk_load_8888_sse2+0xbd>
+ DB 116,35 ; je 485f <_sk_load_8888_sse2+0xbd>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4670 <_sk_load_8888_sse2+0xb3>
+ DB 116,16 ; je 4855 <_sk_load_8888_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,137 ; jne 45ee <_sk_load_8888_sse2+0x31>
+ DB 117,137 ; jne 47d3 <_sk_load_8888_sse2+0x31>
DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
- DB 233,116,255,255,255 ; jmp 45ee <_sk_load_8888_sse2+0x31>
+ DB 233,116,255,255,255 ; jmp 47d3 <_sk_load_8888_sse2+0x31>
DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
- DB 233,106,255,255,255 ; jmp 45ee <_sk_load_8888_sse2+0x31>
+ DB 233,106,255,255,255 ; jmp 47d3 <_sk_load_8888_sse2+0x31>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -41697,7 +42456,7 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4692 <_sk_load_8888_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4877 <_sk_load_8888_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41709,13 +42468,13 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,118 ; jne 4726 <_sk_load_8888_dst_sse2+0xa2>
+ DB 117,118 ; jne 490b <_sk_load_8888_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,158,54,0,0 ; movdqa 0x369e(%edx),%xmm5
+ DB 102,15,111,170,105,55,0,0 ; movdqa 0x3769(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,174,54,0,0 ; movaps 0x36ae(%edx),%xmm7
+ DB 15,40,186,121,55,0,0 ; movaps 0x3779(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,16 ; movaps %xmm6,0x10(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -41747,18 +42506,18 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,39 ; je 4755 <_sk_load_8888_dst_sse2+0xd1>
+ DB 116,39 ; je 493a <_sk_load_8888_dst_sse2+0xd1>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,20 ; je 474b <_sk_load_8888_dst_sse2+0xc7>
+ DB 116,20 ; je 4930 <_sk_load_8888_dst_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,117,255,255,255 ; jne 46b5 <_sk_load_8888_dst_sse2+0x31>
+ DB 15,133,117,255,255,255 ; jne 489a <_sk_load_8888_dst_sse2+0x31>
DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
- DB 233,96,255,255,255 ; jmp 46b5 <_sk_load_8888_dst_sse2+0x31>
+ DB 233,96,255,255,255 ; jmp 489a <_sk_load_8888_dst_sse2+0x31>
DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
- DB 233,86,255,255,255 ; jmp 46b5 <_sk_load_8888_dst_sse2+0x31>
+ DB 233,86,255,255,255 ; jmp 489a <_sk_load_8888_dst_sse2+0x31>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -41790,16 +42549,16 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
- DB 232,0,0,0,0 ; call 47d5 <_sk_gather_8888_sse2+0x76>
+ DB 232,0,0,0,0 ; call 49ba <_sk_gather_8888_sse2+0x76>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,145,123,53,0,0 ; movdqa 0x357b(%ecx),%xmm2
+ DB 102,15,111,145,70,54,0,0 ; movdqa 0x3646(%ecx),%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,161,139,53,0,0 ; movaps 0x358b(%ecx),%xmm4
+ DB 15,40,161,86,54,0,0 ; movaps 0x3656(%ecx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -41831,7 +42590,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4850 <_sk_store_8888_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4a35 <_sk_store_8888_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41841,7 +42600,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,32,53,0,0 ; movaps 0x3520(%edi),%xmm4
+ DB 15,40,167,235,53,0,0 ; movaps 0x35eb(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -41861,7 +42620,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,15,235,229 ; por %xmm5,%xmm4
DB 102,15,235,230 ; por %xmm6,%xmm4
DB 133,219 ; test %ebx,%ebx
- DB 117,24 ; jne 48cd <_sk_store_8888_sse2+0x8b>
+ DB 117,24 ; jne 4ab2 <_sk_store_8888_sse2+0x8b>
DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -41876,17 +42635,17 @@ _sk_store_8888_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,28 ; je 48f1 <_sk_store_8888_sse2+0xaf>
+ DB 116,28 ; je 4ad6 <_sk_store_8888_sse2+0xaf>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 48ea <_sk_store_8888_sse2+0xa8>
+ DB 116,16 ; je 4acf <_sk_store_8888_sse2+0xa8>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,219 ; jne 48ba <_sk_store_8888_sse2+0x78>
+ DB 117,219 ; jne 4a9f <_sk_store_8888_sse2+0x78>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
- DB 235,201 ; jmp 48ba <_sk_store_8888_sse2+0x78>
+ DB 235,201 ; jmp 4a9f <_sk_store_8888_sse2+0x78>
DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
- DB 235,194 ; jmp 48ba <_sk_store_8888_sse2+0x78>
+ DB 235,194 ; jmp 4a9f <_sk_store_8888_sse2+0x78>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -41896,7 +42655,7 @@ _sk_load_bgra_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4906 <_sk_load_bgra_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4aeb <_sk_load_bgra_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41908,13 +42667,13 @@ _sk_load_bgra_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,102 ; jne 498a <_sk_load_bgra_sse2+0x92>
+ DB 117,102 ; jne 4b6f <_sk_load_bgra_sse2+0x92>
DB 243,15,111,28,190 ; movdqu (%esi,%edi,4),%xmm3
- DB 102,15,111,130,122,52,0,0 ; movdqa 0x347a(%edx),%xmm0
+ DB 102,15,111,130,69,53,0,0 ; movdqa 0x3545(%edx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,162,138,52,0,0 ; movaps 0x348a(%edx),%xmm4
+ DB 15,40,162,85,53,0,0 ; movaps 0x3555(%edx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -41942,18 +42701,18 @@ _sk_load_bgra_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,35 ; je 49b5 <_sk_load_bgra_sse2+0xbd>
+ DB 116,35 ; je 4b9a <_sk_load_bgra_sse2+0xbd>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 49ab <_sk_load_bgra_sse2+0xb3>
+ DB 116,16 ; je 4b90 <_sk_load_bgra_sse2+0xb3>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,137 ; jne 4929 <_sk_load_bgra_sse2+0x31>
+ DB 117,137 ; jne 4b0e <_sk_load_bgra_sse2+0x31>
DB 102,15,110,68,190,8 ; movd 0x8(%esi,%edi,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,15,18,28,190 ; movlpd (%esi,%edi,4),%xmm3
- DB 233,116,255,255,255 ; jmp 4929 <_sk_load_bgra_sse2+0x31>
+ DB 233,116,255,255,255 ; jmp 4b0e <_sk_load_bgra_sse2+0x31>
DB 102,15,110,28,190 ; movd (%esi,%edi,4),%xmm3
- DB 233,106,255,255,255 ; jmp 4929 <_sk_load_bgra_sse2+0x31>
+ DB 233,106,255,255,255 ; jmp 4b0e <_sk_load_bgra_sse2+0x31>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -41963,7 +42722,7 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 49cd <_sk_load_bgra_dst_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4bb2 <_sk_load_bgra_dst_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -41975,13 +42734,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 117,118 ; jne 4a61 <_sk_load_bgra_dst_sse2+0xa2>
+ DB 117,118 ; jne 4c46 <_sk_load_bgra_dst_sse2+0xa2>
DB 243,15,111,36,190 ; movdqu (%esi,%edi,4),%xmm4
- DB 102,15,111,170,211,51,0,0 ; movdqa 0x33d3(%edx),%xmm5
+ DB 102,15,111,170,158,52,0,0 ; movdqa 0x349e(%edx),%xmm5
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,40,186,227,51,0,0 ; movaps 0x33e3(%edx),%xmm7
+ DB 15,40,186,174,52,0,0 ; movaps 0x34ae(%edx),%xmm7
DB 15,89,247 ; mulps %xmm7,%xmm6
DB 15,41,113,48 ; movaps %xmm6,0x30(%ecx)
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
@@ -42013,18 +42772,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,39 ; je 4a90 <_sk_load_bgra_dst_sse2+0xd1>
+ DB 116,39 ; je 4c75 <_sk_load_bgra_dst_sse2+0xd1>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,20 ; je 4a86 <_sk_load_bgra_dst_sse2+0xc7>
+ DB 116,20 ; je 4c6b <_sk_load_bgra_dst_sse2+0xc7>
DB 128,251,3 ; cmp $0x3,%bl
- DB 15,133,117,255,255,255 ; jne 49f0 <_sk_load_bgra_dst_sse2+0x31>
+ DB 15,133,117,255,255,255 ; jne 4bd5 <_sk_load_bgra_dst_sse2+0x31>
DB 102,15,110,100,190,8 ; movd 0x8(%esi,%edi,4),%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
DB 102,15,18,36,190 ; movlpd (%esi,%edi,4),%xmm4
- DB 233,96,255,255,255 ; jmp 49f0 <_sk_load_bgra_dst_sse2+0x31>
+ DB 233,96,255,255,255 ; jmp 4bd5 <_sk_load_bgra_dst_sse2+0x31>
DB 102,15,110,36,190 ; movd (%esi,%edi,4),%xmm4
- DB 233,86,255,255,255 ; jmp 49f0 <_sk_load_bgra_dst_sse2+0x31>
+ DB 233,86,255,255,255 ; jmp 4bd5 <_sk_load_bgra_dst_sse2+0x31>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
@@ -42056,16 +42815,16 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,15,110,28,138 ; movd (%edx,%ecx,4),%xmm3
DB 102,15,126,193 ; movd %xmm0,%ecx
DB 102,15,110,4,138 ; movd (%edx,%ecx,4),%xmm0
- DB 232,0,0,0,0 ; call 4b10 <_sk_gather_bgra_sse2+0x76>
+ DB 232,0,0,0,0 ; call 4cf5 <_sk_gather_bgra_sse2+0x76>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,216 ; punpckldq %xmm0,%xmm3
DB 102,15,98,217 ; punpckldq %xmm1,%xmm3
- DB 102,15,111,129,176,50,0,0 ; movdqa 0x32b0(%ecx),%xmm0
+ DB 102,15,111,129,123,51,0,0 ; movdqa 0x337b(%ecx),%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 15,40,161,192,50,0,0 ; movaps 0x32c0(%ecx),%xmm4
+ DB 15,40,161,139,51,0,0 ; movaps 0x338b(%ecx),%xmm4
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -42097,7 +42856,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,12 ; sub $0xc,%esp
- DB 232,0,0,0,0 ; call 4b8b <_sk_store_bgra_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4d70 <_sk_store_bgra_sse2+0xe>
DB 95 ; pop %edi
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -42107,7 +42866,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 193,226,2 ; shl $0x2,%edx
DB 3,22 ; add (%esi),%edx
DB 139,49 ; mov (%ecx),%esi
- DB 15,40,167,85,50,0,0 ; movaps 0x3255(%edi),%xmm4
+ DB 15,40,167,32,51,0,0 ; movaps 0x3320(%edi),%xmm4
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 15,40,234 ; movaps %xmm2,%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
@@ -42127,7 +42886,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,15,235,229 ; por %xmm5,%xmm4
DB 102,15,235,230 ; por %xmm6,%xmm4
DB 133,219 ; test %ebx,%ebx
- DB 117,24 ; jne 4c08 <_sk_store_bgra_sse2+0x8b>
+ DB 117,24 ; jne 4ded <_sk_store_bgra_sse2+0x8b>
DB 243,15,127,36,178 ; movdqu %xmm4,(%edx,%esi,4)
DB 141,80,8 ; lea 0x8(%eax),%edx
DB 131,236,8 ; sub $0x8,%esp
@@ -42142,17 +42901,17 @@ _sk_store_bgra_sse2 LABEL PROC
DB 195 ; ret
DB 128,227,3 ; and $0x3,%bl
DB 128,251,1 ; cmp $0x1,%bl
- DB 116,28 ; je 4c2c <_sk_store_bgra_sse2+0xaf>
+ DB 116,28 ; je 4e11 <_sk_store_bgra_sse2+0xaf>
DB 128,251,2 ; cmp $0x2,%bl
- DB 116,16 ; je 4c25 <_sk_store_bgra_sse2+0xa8>
+ DB 116,16 ; je 4e0a <_sk_store_bgra_sse2+0xa8>
DB 128,251,3 ; cmp $0x3,%bl
- DB 117,219 ; jne 4bf5 <_sk_store_bgra_sse2+0x78>
+ DB 117,219 ; jne 4dda <_sk_store_bgra_sse2+0x78>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,15,126,108,178,8 ; movd %xmm5,0x8(%edx,%esi,4)
DB 102,15,214,36,178 ; movq %xmm4,(%edx,%esi,4)
- DB 235,201 ; jmp 4bf5 <_sk_store_bgra_sse2+0x78>
+ DB 235,201 ; jmp 4dda <_sk_store_bgra_sse2+0x78>
DB 102,15,126,36,178 ; movd %xmm4,(%edx,%esi,4)
- DB 235,194 ; jmp 4bf5 <_sk_store_bgra_sse2+0x78>
+ DB 235,194 ; jmp 4dda <_sk_store_bgra_sse2+0x78>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -42162,7 +42921,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,92 ; sub $0x5c,%esp
- DB 232,0,0,0,0 ; call 4c41 <_sk_load_f16_sse2+0xe>
+ DB 232,0,0,0,0 ; call 4e26 <_sk_load_f16_sse2+0xe>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -42174,7 +42933,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,160,1,0,0 ; jne 4e03 <_sk_load_f16_sse2+0x1d0>
+ DB 15,133,160,1,0,0 ; jne 4fe8 <_sk_load_f16_sse2+0x1d0>
DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
DB 102,15,40,216 ; movapd %xmm0,%xmm3
@@ -42202,7 +42961,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,126,69,232 ; movd %xmm0,-0x18(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,154,175,49,0,0 ; movdqa 0x31af(%edx),%xmm3
+ DB 102,15,111,154,122,50,0,0 ; movdqa 0x327a(%edx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -42235,15 +42994,15 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,154,191,49,0,0 ; movdqa 0x31bf(%edx),%xmm3
+ DB 102,15,111,154,138,50,0,0 ; movdqa 0x328a(%edx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,154,207,49,0,0 ; movdqa 0x31cf(%edx),%xmm3
+ DB 102,15,111,154,154,50,0,0 ; movdqa 0x329a(%edx),%xmm3
DB 102,15,127,93,184 ; movdqa %xmm3,-0x48(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,154,223,49,0,0 ; movdqa 0x31df(%edx),%xmm3
+ DB 102,15,111,154,170,50,0,0 ; movdqa 0x32aa(%edx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -42275,12 +43034,12 @@ _sk_load_f16_sse2 LABEL PROC
DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,89,254,255,255 ; je 4c6e <_sk_load_f16_sse2+0x3b>
+ DB 15,132,89,254,255,255 ; je 4e53 <_sk_load_f16_sse2+0x3b>
DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,74,254,255,255 ; jb 4c6e <_sk_load_f16_sse2+0x3b>
+ DB 15,130,74,254,255,255 ; jb 4e53 <_sk_load_f16_sse2+0x3b>
DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
- DB 233,63,254,255,255 ; jmp 4c6e <_sk_load_f16_sse2+0x3b>
+ DB 233,63,254,255,255 ; jmp 4e53 <_sk_load_f16_sse2+0x3b>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -42294,7 +43053,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 15,41,149,120,255,255,255 ; movaps %xmm2,-0x88(%ebp)
DB 102,15,127,77,136 ; movdqa %xmm1,-0x78(%ebp)
DB 15,41,69,152 ; movaps %xmm0,-0x68(%ebp)
- DB 232,0,0,0,0 ; call 4e57 <_sk_load_f16_dst_sse2+0x28>
+ DB 232,0,0,0,0 ; call 503c <_sk_load_f16_dst_sse2+0x28>
DB 90 ; pop %edx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
@@ -42306,7 +43065,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 133,219 ; test %ebx,%ebx
DB 139,57 ; mov (%ecx),%edi
- DB 15,133,206,1,0,0 ; jne 5047 <_sk_load_f16_dst_sse2+0x218>
+ DB 15,133,206,1,0,0 ; jne 522c <_sk_load_f16_dst_sse2+0x218>
DB 102,15,16,4,254 ; movupd (%esi,%edi,8),%xmm0
DB 243,15,111,76,254,16 ; movdqu 0x10(%esi,%edi,8),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -42334,7 +43093,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,126,85,232 ; movd %xmm2,-0x18(%ebp)
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
- DB 102,15,111,154,217,47,0,0 ; movdqa 0x2fd9(%edx),%xmm3
+ DB 102,15,111,154,164,48,0,0 ; movdqa 0x30a4(%edx),%xmm3
DB 102,15,111,212 ; movdqa %xmm4,%xmm2
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 102,15,239,226 ; pxor %xmm2,%xmm4
@@ -42342,13 +43101,13 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,15,111,146,249,47,0,0 ; movdqa 0x2ff9(%edx),%xmm2
+ DB 102,15,111,146,196,48,0,0 ; movdqa 0x30c4(%edx),%xmm2
DB 102,15,127,85,168 ; movdqa %xmm2,-0x58(%ebp)
DB 102,15,239,226 ; pxor %xmm2,%xmm4
- DB 102,15,111,178,9,48,0,0 ; movdqa 0x3009(%edx),%xmm6
+ DB 102,15,111,178,212,48,0,0 ; movdqa 0x30d4(%edx),%xmm6
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,15,102,252 ; pcmpgtd %xmm4,%xmm7
- DB 102,15,111,146,233,47,0,0 ; movdqa 0x2fe9(%edx),%xmm2
+ DB 102,15,111,146,180,48,0,0 ; movdqa 0x30b4(%edx),%xmm2
DB 102,15,127,85,184 ; movdqa %xmm2,-0x48(%ebp)
DB 102,15,254,202 ; paddd %xmm2,%xmm1
DB 102,15,223,249 ; pandn %xmm1,%xmm7
@@ -42416,12 +43175,12 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 242,15,16,4,254 ; movsd (%esi,%edi,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,43,254,255,255 ; je 4e84 <_sk_load_f16_dst_sse2+0x55>
+ DB 15,132,43,254,255,255 ; je 5069 <_sk_load_f16_dst_sse2+0x55>
DB 102,15,22,68,254,8 ; movhpd 0x8(%esi,%edi,8),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,28,254,255,255 ; jb 4e84 <_sk_load_f16_dst_sse2+0x55>
+ DB 15,130,28,254,255,255 ; jb 5069 <_sk_load_f16_dst_sse2+0x55>
DB 243,15,126,76,254,16 ; movq 0x10(%esi,%edi,8),%xmm1
- DB 233,17,254,255,255 ; jmp 4e84 <_sk_load_f16_dst_sse2+0x55>
+ DB 233,17,254,255,255 ; jmp 5069 <_sk_load_f16_dst_sse2+0x55>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -42457,7 +43216,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,194 ; movd %xmm0,%edx
DB 102,15,110,68,209,4 ; movd 0x4(%ecx,%edx,8),%xmm0
DB 102,15,110,60,209 ; movd (%ecx,%edx,8),%xmm7
- DB 232,0,0,0,0 ; call 5101 <_sk_gather_f16_sse2+0x8e>
+ DB 232,0,0,0,0 ; call 52e6 <_sk_gather_f16_sse2+0x8e>
DB 89 ; pop %ecx
DB 102,15,98,202 ; punpckldq %xmm2,%xmm1
DB 102,15,98,227 ; punpckldq %xmm3,%xmm4
@@ -42490,7 +43249,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,126,69,248 ; movd %xmm0,-0x8(%ebp)
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
- DB 102,15,111,153,111,45,0,0 ; movdqa 0x2d6f(%ecx),%xmm3
+ DB 102,15,111,153,58,46,0,0 ; movdqa 0x2e3a(%ecx),%xmm3
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,219,227 ; pand %xmm3,%xmm4
DB 102,15,239,204 ; pxor %xmm4,%xmm1
@@ -42523,15 +43282,15 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,114,240,13 ; pslld $0xd,%xmm0
DB 102,15,235,195 ; por %xmm3,%xmm0
- DB 102,15,111,153,127,45,0,0 ; movdqa 0x2d7f(%ecx),%xmm3
+ DB 102,15,111,153,74,46,0,0 ; movdqa 0x2e4a(%ecx),%xmm3
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,254,243 ; paddd %xmm3,%xmm6
DB 102,15,254,235 ; paddd %xmm3,%xmm5
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,153,143,45,0,0 ; movdqa 0x2d8f(%ecx),%xmm3
+ DB 102,15,111,153,90,46,0,0 ; movdqa 0x2e5a(%ecx),%xmm3
DB 102,15,127,93,200 ; movdqa %xmm3,-0x38(%ebp)
DB 102,15,239,203 ; pxor %xmm3,%xmm1
- DB 102,15,111,153,159,45,0,0 ; movdqa 0x2d9f(%ecx),%xmm3
+ DB 102,15,111,153,106,46,0,0 ; movdqa 0x2e6a(%ecx),%xmm3
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
DB 102,15,102,225 ; pcmpgtd %xmm1,%xmm4
DB 102,15,223,226 ; pandn %xmm2,%xmm4
@@ -42568,20 +43327,20 @@ _sk_store_f16_sse2 LABEL PROC
DB 131,236,80 ; sub $0x50,%esp
DB 15,41,93,216 ; movaps %xmm3,-0x28(%ebp)
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 52c4 <_sk_store_f16_sse2+0x15>
+ DB 232,0,0,0,0 ; call 54a9 <_sk_store_f16_sse2+0x15>
DB 88 ; pop %eax
- DB 102,15,111,176,236,43,0,0 ; movdqa 0x2bec(%eax),%xmm6
+ DB 102,15,111,176,183,44,0,0 ; movdqa 0x2cb7(%eax),%xmm6
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,15,219,214 ; pand %xmm6,%xmm2
DB 102,15,127,69,200 ; movdqa %xmm0,-0x38(%ebp)
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 102,15,239,234 ; pxor %xmm2,%xmm5
- DB 102,15,111,160,252,43,0,0 ; movdqa 0x2bfc(%eax),%xmm4
+ DB 102,15,111,160,199,44,0,0 ; movdqa 0x2cc7(%eax),%xmm4
DB 102,15,114,210,16 ; psrld $0x10,%xmm2
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,15,102,197 ; pcmpgtd %xmm5,%xmm0
DB 102,15,114,213,13 ; psrld $0xd,%xmm5
- DB 102,15,111,184,12,44,0,0 ; movdqa 0x2c0c(%eax),%xmm7
+ DB 102,15,111,184,215,44,0,0 ; movdqa 0x2cd7(%eax),%xmm7
DB 102,15,254,215 ; paddd %xmm7,%xmm2
DB 102,15,127,125,232 ; movdqa %xmm7,-0x18(%ebp)
DB 102,15,254,213 ; paddd %xmm5,%xmm2
@@ -42643,7 +43402,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 3,55 ; add (%edi),%esi
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,53 ; jne 5436 <_sk_store_f16_sse2+0x187>
+ DB 117,53 ; jne 561b <_sk_store_f16_sse2+0x187>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,98,197 ; punpckldq %xmm5,%xmm0
DB 243,15,127,4,214 ; movdqu %xmm0,(%esi,%edx,8)
@@ -42666,13 +43425,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,15,98,213 ; punpckldq %xmm5,%xmm2
DB 102,15,214,20,214 ; movq %xmm2,(%esi,%edx,8)
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,208 ; je 5418 <_sk_store_f16_sse2+0x169>
+ DB 116,208 ; je 55fd <_sk_store_f16_sse2+0x169>
DB 102,15,23,84,214,8 ; movhpd %xmm2,0x8(%esi,%edx,8)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,197 ; jb 5418 <_sk_store_f16_sse2+0x169>
+ DB 114,197 ; jb 55fd <_sk_store_f16_sse2+0x169>
DB 102,15,106,205 ; punpckhdq %xmm5,%xmm1
DB 102,15,214,76,214,16 ; movq %xmm1,0x10(%esi,%edx,8)
- DB 235,185 ; jmp 5418 <_sk_store_f16_sse2+0x169>
+ DB 235,185 ; jmp 55fd <_sk_store_f16_sse2+0x169>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -42693,9 +43452,9 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 139,89,8 ; mov 0x8(%ecx),%ebx
DB 193,230,2 ; shl $0x2,%esi
DB 133,219 ; test %ebx,%ebx
- DB 232,0,0,0,0 ; call 548a <_sk_load_u16_be_sse2+0x2b>
+ DB 232,0,0,0,0 ; call 566f <_sk_load_u16_be_sse2+0x2b>
DB 90 ; pop %edx
- DB 15,133,11,1,0,0 ; jne 559c <_sk_load_u16_be_sse2+0x13d>
+ DB 15,133,11,1,0,0 ; jne 5781 <_sk_load_u16_be_sse2+0x13d>
DB 102,15,16,4,119 ; movupd (%edi,%esi,2),%xmm0
DB 243,15,111,76,119,16 ; movdqu 0x10(%edi,%esi,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -42716,7 +43475,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,162,86,42,0,0 ; movaps 0x2a56(%edx),%xmm4
+ DB 15,40,162,33,43,0,0 ; movaps 0x2b21(%edx),%xmm4
DB 15,89,196 ; mulps %xmm4,%xmm0
DB 102,15,111,205 ; movdqa %xmm5,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -42766,12 +43525,12 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 242,15,16,4,119 ; movsd (%edi,%esi,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,251,1 ; cmp $0x1,%ebx
- DB 15,132,238,254,255,255 ; je 549c <_sk_load_u16_be_sse2+0x3d>
+ DB 15,132,238,254,255,255 ; je 5681 <_sk_load_u16_be_sse2+0x3d>
DB 102,15,22,68,119,8 ; movhpd 0x8(%edi,%esi,2),%xmm0
DB 131,251,3 ; cmp $0x3,%ebx
- DB 15,130,223,254,255,255 ; jb 549c <_sk_load_u16_be_sse2+0x3d>
+ DB 15,130,223,254,255,255 ; jb 5681 <_sk_load_u16_be_sse2+0x3d>
DB 243,15,126,76,119,16 ; movq 0x10(%edi,%esi,2),%xmm1
- DB 233,212,254,255,255 ; jmp 549c <_sk_load_u16_be_sse2+0x3d>
+ DB 233,212,254,255,255 ; jmp 5681 <_sk_load_u16_be_sse2+0x3d>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -42791,9 +43550,9 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 3,50 ; add (%edx),%esi
DB 107,25,3 ; imul $0x3,(%ecx),%ebx
DB 133,255 ; test %edi,%edi
- DB 232,0,0,0,0 ; call 55f1 <_sk_load_rgb_u16_be_sse2+0x29>
+ DB 232,0,0,0,0 ; call 57d6 <_sk_load_rgb_u16_be_sse2+0x29>
DB 90 ; pop %edx
- DB 15,133,240,0,0,0 ; jne 56e8 <_sk_load_rgb_u16_be_sse2+0x120>
+ DB 15,133,240,0,0,0 ; jne 58cd <_sk_load_rgb_u16_be_sse2+0x120>
DB 243,15,111,20,94 ; movdqu (%esi,%ebx,2),%xmm2
DB 243,15,111,92,94,8 ; movdqu 0x8(%esi,%ebx,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -42818,7 +43577,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,97,195 ; punpcklwd %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,40,170,255,40,0,0 ; movaps 0x28ff(%edx),%xmm5
+ DB 15,40,170,202,41,0,0 ; movaps 0x29ca(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 102,15,111,204 ; movdqa %xmm4,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -42844,7 +43603,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,89,213 ; mulps %xmm5,%xmm2
DB 141,112,8 ; lea 0x8(%eax),%esi
DB 131,236,8 ; sub $0x8,%esp
- DB 15,40,154,15,41,0,0 ; movaps 0x290f(%edx),%xmm3
+ DB 15,40,154,218,41,0,0 ; movaps 0x29da(%edx),%xmm3
DB 86 ; push %esi
DB 81 ; push %ecx
DB 255,80,4 ; call *0x4(%eax)
@@ -42858,20 +43617,20 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,15,196,84,94,4,2 ; pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,13 ; jne 570a <_sk_load_rgb_u16_be_sse2+0x142>
+ DB 117,13 ; jne 58ef <_sk_load_rgb_u16_be_sse2+0x142>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,16,255,255,255 ; jmp 561a <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,16,255,255,255 ; jmp 57ff <_sk_load_rgb_u16_be_sse2+0x52>
DB 102,15,110,68,94,6 ; movd 0x6(%esi,%ebx,2),%xmm0
DB 102,15,196,68,94,10,2 ; pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,18 ; jb 5732 <_sk_load_rgb_u16_be_sse2+0x16a>
+ DB 114,18 ; jb 5917 <_sk_load_rgb_u16_be_sse2+0x16a>
DB 102,15,110,92,94,12 ; movd 0xc(%esi,%ebx,2),%xmm3
DB 102,15,196,92,94,16,2 ; pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
- DB 233,232,254,255,255 ; jmp 561a <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,232,254,255,255 ; jmp 57ff <_sk_load_rgb_u16_be_sse2+0x52>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,223,254,255,255 ; jmp 561a <_sk_load_rgb_u16_be_sse2+0x52>
+ DB 233,223,254,255,255 ; jmp 57ff <_sk_load_rgb_u16_be_sse2+0x52>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
@@ -42881,9 +43640,9 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 86 ; push %esi
DB 131,236,16 ; sub $0x10,%esp
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
- DB 232,0,0,0,0 ; call 574c <_sk_store_u16_be_sse2+0x11>
+ DB 232,0,0,0,0 ; call 5931 <_sk_store_u16_be_sse2+0x11>
DB 88 ; pop %eax
- DB 15,40,176,196,39,0,0 ; movaps 0x27c4(%eax),%xmm6
+ DB 15,40,176,143,40,0,0 ; movaps 0x288f(%eax),%xmm6
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,89,230 ; mulps %xmm6,%xmm4
DB 102,15,91,228 ; cvtps2dq %xmm4,%xmm4
@@ -42936,7 +43695,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 193,226,2 ; shl $0x2,%edx
DB 133,255 ; test %edi,%edi
- DB 117,45 ; jne 584e <_sk_store_u16_be_sse2+0x113>
+ DB 117,45 ; jne 5a33 <_sk_store_u16_be_sse2+0x113>
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,98,221 ; punpckldq %xmm5,%xmm3
DB 243,15,127,28,86 ; movdqu %xmm3,(%esi,%edx,2)
@@ -42957,13 +43716,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,15,98,245 ; punpckldq %xmm5,%xmm6
DB 102,15,214,52,86 ; movq %xmm6,(%esi,%edx,2)
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,216 ; je 5838 <_sk_store_u16_be_sse2+0xfd>
+ DB 116,216 ; je 5a1d <_sk_store_u16_be_sse2+0xfd>
DB 102,15,23,116,86,8 ; movhpd %xmm6,0x8(%esi,%edx,2)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,205 ; jb 5838 <_sk_store_u16_be_sse2+0xfd>
+ DB 114,205 ; jb 5a1d <_sk_store_u16_be_sse2+0xfd>
DB 102,15,106,229 ; punpckhdq %xmm5,%xmm4
DB 102,15,214,100,86,16 ; movq %xmm4,0x10(%esi,%edx,2)
- DB 235,193 ; jmp 5838 <_sk_store_u16_be_sse2+0xfd>
+ DB 235,193 ; jmp 5a1d <_sk_store_u16_be_sse2+0xfd>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -42984,7 +43743,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 15,16,36,23 ; movups (%edi,%edx,1),%xmm4
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,71 ; jne 58ee <_sk_load_f32_sse2+0x77>
+ DB 117,71 ; jne 5ad3 <_sk_load_f32_sse2+0x77>
DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
DB 15,16,68,178,48 ; movups 0x30(%edx,%esi,4),%xmm0
@@ -43012,17 +43771,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 195 ; ret
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 58fe <_sk_load_f32_sse2+0x87>
+ DB 117,8 ; jne 5ae3 <_sk_load_f32_sse2+0x87>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,210 ; xorps %xmm2,%xmm2
- DB 235,184 ; jmp 58b6 <_sk_load_f32_sse2+0x3f>
+ DB 235,184 ; jmp 5a9b <_sk_load_f32_sse2+0x3f>
DB 15,16,84,178,16 ; movups 0x10(%edx,%esi,4),%xmm2
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,7 ; jb 590f <_sk_load_f32_sse2+0x98>
+ DB 114,7 ; jb 5af4 <_sk_load_f32_sse2+0x98>
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
- DB 235,167 ; jmp 58b6 <_sk_load_f32_sse2+0x3f>
+ DB 235,167 ; jmp 5a9b <_sk_load_f32_sse2+0x3f>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,162 ; jmp 58b6 <_sk_load_f32_sse2+0x3f>
+ DB 235,162 ; jmp 5a9b <_sk_load_f32_sse2+0x3f>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
@@ -43046,7 +43805,7 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 15,16,52,23 ; movups (%edi,%edx,1),%xmm6
DB 139,121,8 ; mov 0x8(%ecx),%edi
DB 133,255 ; test %edi,%edi
- DB 117,97 ; jne 59b0 <_sk_load_f32_dst_sse2+0x9c>
+ DB 117,97 ; jne 5b95 <_sk_load_f32_dst_sse2+0x9c>
DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
DB 15,16,84,178,48 ; movups 0x30(%edx,%esi,4),%xmm2
@@ -43080,17 +43839,17 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 195 ; ret
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 131,255,1 ; cmp $0x1,%edi
- DB 117,8 ; jne 59c0 <_sk_load_f32_dst_sse2+0xac>
+ DB 117,8 ; jne 5ba5 <_sk_load_f32_dst_sse2+0xac>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,158 ; jmp 595e <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,158 ; jmp 5b43 <_sk_load_f32_dst_sse2+0x4a>
DB 15,16,124,178,16 ; movups 0x10(%edx,%esi,4),%xmm7
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,7 ; jb 59d1 <_sk_load_f32_dst_sse2+0xbd>
+ DB 114,7 ; jb 5bb6 <_sk_load_f32_dst_sse2+0xbd>
DB 15,16,92,178,32 ; movups 0x20(%edx,%esi,4),%xmm3
- DB 235,141 ; jmp 595e <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,141 ; jmp 5b43 <_sk_load_f32_dst_sse2+0x4a>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,136 ; jmp 595e <_sk_load_f32_dst_sse2+0x4a>
+ DB 235,136 ; jmp 5b43 <_sk_load_f32_dst_sse2+0x4a>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -43126,7 +43885,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 15,40,238 ; movaps %xmm6,%xmm5
DB 102,15,20,239 ; unpcklpd %xmm7,%xmm5
DB 133,255 ; test %edi,%edi
- DB 117,40 ; jne 5a5c <_sk_store_f32_sse2+0x86>
+ DB 117,40 ; jne 5c41 <_sk_store_f32_sse2+0x86>
DB 102,15,21,247 ; unpckhpd %xmm7,%xmm6
DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
@@ -43143,12 +43902,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 93 ; pop %ebp
DB 195 ; ret
DB 131,255,1 ; cmp $0x1,%edi
- DB 116,232 ; je 5a49 <_sk_store_f32_sse2+0x73>
+ DB 116,232 ; je 5c2e <_sk_store_f32_sse2+0x73>
DB 15,17,100,178,16 ; movups %xmm4,0x10(%edx,%esi,4)
DB 131,255,3 ; cmp $0x3,%edi
- DB 114,222 ; jb 5a49 <_sk_store_f32_sse2+0x73>
+ DB 114,222 ; jb 5c2e <_sk_store_f32_sse2+0x73>
DB 102,15,17,108,178,32 ; movupd %xmm5,0x20(%edx,%esi,4)
- DB 235,214 ; jmp 5a49 <_sk_store_f32_sse2+0x73>
+ DB 235,214 ; jmp 5c2e <_sk_store_f32_sse2+0x73>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -43203,7 +43962,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5af0 <_sk_repeat_x_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5cd5 <_sk_repeat_x_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -43214,7 +43973,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,48,36,0,0 ; andps 0x2430(%ecx),%xmm6
+ DB 15,84,177,251,36,0,0 ; andps 0x24fb(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -43239,7 +43998,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5b56 <_sk_repeat_y_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5d3b <_sk_repeat_y_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -43250,7 +44009,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,15,91,230 ; cvttps2dq %xmm6,%xmm4
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,218,35,0,0 ; andps 0x23da(%ecx),%xmm6
+ DB 15,84,177,165,36,0,0 ; andps 0x24a5(%ecx),%xmm6
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,92,254 ; subps %xmm6,%xmm7
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -43275,7 +44034,7 @@ _sk_mirror_x_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5bbc <_sk_mirror_x_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5da1 <_sk_mirror_x_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -43284,13 +44043,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 243,15,89,177,116,40,0,0 ; mulss 0x2874(%ecx),%xmm6
+ DB 243,15,89,177,63,41,0,0 ; mulss 0x293f(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,132,35,0,0 ; andps 0x2384(%ecx),%xmm6
+ DB 15,84,177,79,36,0,0 ; andps 0x244f(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -43319,7 +44078,7 @@ _sk_mirror_y_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5c41 <_sk_mirror_y_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5e26 <_sk_mirror_y_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -43328,13 +44087,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,204 ; subps %xmm4,%xmm1
- DB 243,15,89,177,243,39,0,0 ; mulss 0x27f3(%ecx),%xmm6
+ DB 243,15,89,177,190,40,0,0 ; mulss 0x28be(%ecx),%xmm6
DB 15,198,246,0 ; shufps $0x0,%xmm6,%xmm6
DB 15,89,241 ; mulps %xmm1,%xmm6
DB 243,15,91,254 ; cvttps2dq %xmm6,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
DB 15,194,247,1 ; cmpltps %xmm7,%xmm6
- DB 15,84,177,15,35,0,0 ; andps 0x230f(%ecx),%xmm6
+ DB 15,84,177,218,35,0,0 ; andps 0x23da(%ecx),%xmm6
DB 15,92,254 ; subps %xmm6,%xmm7
DB 243,15,88,237 ; addss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
@@ -43363,12 +44122,12 @@ _sk_clamp_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5cc6 <_sk_clamp_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5eab <_sk_clamp_x_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,95,224 ; maxps %xmm0,%xmm4
- DB 15,93,160,154,34,0,0 ; minps 0x229a(%eax),%xmm4
+ DB 15,93,160,101,35,0,0 ; minps 0x2365(%eax),%xmm4
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,196 ; movaps %xmm4,%xmm0
@@ -43384,14 +44143,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5cf6 <_sk_repeat_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5edb <_sk_repeat_x_1_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 243,15,91,224 ; cvttps2dq %xmm0,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,84,168,122,34,0,0 ; andps 0x227a(%eax),%xmm5
+ DB 15,84,168,69,35,0,0 ; andps 0x2345(%eax),%xmm5
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -43408,17 +44167,17 @@ _sk_mirror_x_1_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 5d31 <_sk_mirror_x_1_sse2+0xb>
+ DB 232,0,0,0,0 ; call 5f16 <_sk_mirror_x_1_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
- DB 15,40,161,79,34,0,0 ; movaps 0x224f(%ecx),%xmm4
+ DB 15,40,161,26,35,0,0 ; movaps 0x231a(%ecx),%xmm4
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,169,95,34,0,0 ; movaps 0x225f(%ecx),%xmm5
+ DB 15,40,169,42,35,0,0 ; movaps 0x232a(%ecx),%xmm5
DB 15,89,232 ; mulps %xmm0,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,194,238,1 ; cmpltps %xmm6,%xmm5
- DB 15,84,169,111,34,0,0 ; andps 0x226f(%ecx),%xmm5
+ DB 15,84,169,58,35,0,0 ; andps 0x233a(%ecx),%xmm5
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,92,245 ; subps %xmm5,%xmm6
DB 15,88,246 ; addps %xmm6,%xmm6
@@ -43441,13 +44200,13 @@ _sk_luminance_to_alpha_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 5d8f <_sk_luminance_to_alpha_sse2+0xe>
+ DB 232,0,0,0,0 ; call 5f74 <_sk_luminance_to_alpha_sse2+0xe>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,89,128,33,34,0,0 ; mulps 0x2221(%eax),%xmm0
- DB 15,89,136,49,34,0,0 ; mulps 0x2231(%eax),%xmm1
+ DB 15,89,128,236,34,0,0 ; mulps 0x22ec(%eax),%xmm0
+ DB 15,89,136,252,34,0,0 ; mulps 0x22fc(%eax),%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,152,65,34,0,0 ; mulps 0x2241(%eax),%xmm3
+ DB 15,89,152,12,35,0,0 ; mulps 0x230c(%eax),%xmm3
DB 15,88,217 ; addps %xmm1,%xmm3
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -43821,7 +44580,7 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
DB 15,41,69,184 ; movaps %xmm0,-0x48(%ebp)
- DB 232,0,0,0,0 ; call 622c <_sk_evenly_spaced_gradient_sse2+0x12>
+ DB 232,0,0,0,0 ; call 6411 <_sk_evenly_spaced_gradient_sse2+0x12>
DB 90 ; pop %edx
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,65,4 ; lea 0x4(%ecx),%eax
@@ -43832,12 +44591,12 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 78 ; dec %esi
DB 102,15,110,206 ; movd %esi,%xmm1
DB 102,15,112,201,0 ; pshufd $0x0,%xmm1,%xmm1
- DB 102,15,111,146,180,29,0,0 ; movdqa 0x1db4(%edx),%xmm2
+ DB 102,15,111,146,127,30,0,0 ; movdqa 0x1e7f(%edx),%xmm2
DB 102,15,219,209 ; pand %xmm1,%xmm2
- DB 102,15,235,146,196,29,0,0 ; por 0x1dc4(%edx),%xmm2
+ DB 102,15,235,146,143,30,0,0 ; por 0x1e8f(%edx),%xmm2
DB 102,15,114,209,16 ; psrld $0x10,%xmm1
- DB 102,15,235,138,212,29,0,0 ; por 0x1dd4(%edx),%xmm1
- DB 15,88,138,228,29,0,0 ; addps 0x1de4(%edx),%xmm1
+ DB 102,15,235,138,159,30,0,0 ; por 0x1e9f(%edx),%xmm1
+ DB 15,88,138,175,30,0,0 ; addps 0x1eaf(%edx),%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 243,15,91,201 ; cvttps2dq %xmm1,%xmm1
@@ -43942,18 +44701,18 @@ _sk_gauss_a_to_rgba_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 63e2 <_sk_gauss_a_to_rgba_sse2+0xb>
+ DB 232,0,0,0,0 ; call 65c7 <_sk_gauss_a_to_rgba_sse2+0xb>
DB 88 ; pop %eax
DB 139,77,12 ; mov 0xc(%ebp),%ecx
- DB 15,40,128,62,28,0,0 ; movaps 0x1c3e(%eax),%xmm0
+ DB 15,40,128,9,29,0,0 ; movaps 0x1d09(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,78,28,0,0 ; addps 0x1c4e(%eax),%xmm0
+ DB 15,88,128,25,29,0,0 ; addps 0x1d19(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,94,28,0,0 ; addps 0x1c5e(%eax),%xmm0
+ DB 15,88,128,41,29,0,0 ; addps 0x1d29(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,110,28,0,0 ; addps 0x1c6e(%eax),%xmm0
+ DB 15,88,128,57,29,0,0 ; addps 0x1d39(%eax),%xmm0
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,128,126,28,0,0 ; addps 0x1c7e(%eax),%xmm0
+ DB 15,88,128,73,29,0,0 ; addps 0x1d49(%eax),%xmm0
DB 141,65,4 ; lea 0x4(%ecx),%eax
DB 131,236,8 ; sub $0x8,%esp
DB 15,40,200 ; movaps %xmm0,%xmm1
@@ -43974,7 +44733,7 @@ _sk_gradient_sse2 LABEL PROC
DB 87 ; push %edi
DB 86 ; push %esi
DB 131,236,60 ; sub $0x3c,%esp
- DB 232,0,0,0,0 ; call 643d <_sk_gradient_sse2+0xe>
+ DB 232,0,0,0,0 ; call 6622 <_sk_gradient_sse2+0xe>
DB 95 ; pop %edi
DB 139,77,12 ; mov 0xc(%ebp),%ecx
DB 141,81,4 ; lea 0x4(%ecx),%edx
@@ -43983,12 +44742,12 @@ _sk_gradient_sse2 LABEL PROC
DB 139,17 ; mov (%ecx),%edx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 131,250,2 ; cmp $0x2,%edx
- DB 114,43 ; jb 647f <_sk_gradient_sse2+0x50>
+ DB 114,43 ; jb 6664 <_sk_gradient_sse2+0x50>
DB 139,113,36 ; mov 0x24(%ecx),%esi
DB 74 ; dec %edx
DB 131,198,4 ; add $0x4,%esi
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,151,51,28,0,0 ; movaps 0x1c33(%edi),%xmm2
+ DB 15,40,151,254,28,0,0 ; movaps 0x1cfe(%edi),%xmm2
DB 243,15,16,30 ; movss (%esi),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -43996,7 +44755,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 131,198,4 ; add $0x4,%esi
DB 74 ; dec %edx
- DB 117,231 ; jne 6466 <_sk_gradient_sse2+0x37>
+ DB 117,231 ; jne 664b <_sk_gradient_sse2+0x37>
DB 102,15,126,202 ; movd %xmm1,%edx
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
DB 102,15,126,214 ; movd %xmm2,%esi
@@ -44144,7 +44903,7 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 15,40,200 ; movaps %xmm0,%xmm1
- DB 232,0,0,0,0 ; call 6679 <_sk_xy_to_unit_angle_sse2+0x18>
+ DB 232,0,0,0,0 ; call 685e <_sk_xy_to_unit_angle_sse2+0x18>
DB 88 ; pop %eax
DB 15,87,237 ; xorps %xmm5,%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
@@ -44159,30 +44918,30 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 15,94,247 ; divps %xmm7,%xmm6
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,255 ; mulps %xmm7,%xmm7
- DB 15,40,128,7,26,0,0 ; movaps 0x1a07(%eax),%xmm0
+ DB 15,40,128,210,26,0,0 ; movaps 0x1ad2(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,23,26,0,0 ; addps 0x1a17(%eax),%xmm0
+ DB 15,88,128,226,26,0,0 ; addps 0x1ae2(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,39,26,0,0 ; addps 0x1a27(%eax),%xmm0
+ DB 15,88,128,242,26,0,0 ; addps 0x1af2(%eax),%xmm0
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 15,88,128,55,26,0,0 ; addps 0x1a37(%eax),%xmm0
+ DB 15,88,128,2,27,0,0 ; addps 0x1b02(%eax),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,194,236,1 ; cmpltps %xmm4,%xmm5
- DB 15,40,176,71,26,0,0 ; movaps 0x1a47(%eax),%xmm6
+ DB 15,40,176,18,27,0,0 ; movaps 0x1b12(%eax),%xmm6
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,84,245 ; andps %xmm5,%xmm6
DB 15,85,232 ; andnps %xmm0,%xmm5
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,86,238 ; orps %xmm6,%xmm5
DB 15,194,204,1 ; cmpltps %xmm4,%xmm1
- DB 15,40,128,87,26,0,0 ; movaps 0x1a57(%eax),%xmm0
+ DB 15,40,128,34,27,0,0 ; movaps 0x1b22(%eax),%xmm0
DB 15,92,197 ; subps %xmm5,%xmm0
DB 15,84,193 ; andps %xmm1,%xmm0
DB 15,85,205 ; andnps %xmm5,%xmm1
DB 15,86,200 ; orps %xmm0,%xmm1
DB 15,40,194 ; movaps %xmm2,%xmm0
DB 15,194,196,1 ; cmpltps %xmm4,%xmm0
- DB 15,40,168,103,26,0,0 ; movaps 0x1a67(%eax),%xmm5
+ DB 15,40,168,50,27,0,0 ; movaps 0x1b32(%eax),%xmm5
DB 15,92,233 ; subps %xmm1,%xmm5
DB 15,84,232 ; andps %xmm0,%xmm5
DB 15,85,193 ; andnps %xmm1,%xmm0
@@ -44239,15 +44998,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 232,0,0,0,0 ; call 6796 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ DB 232,0,0,0,0 ; call 697b <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
DB 90 ; pop %edx
DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,90,25,0,0 ; mulps 0x195a(%edx),%xmm4
- DB 15,89,130,106,25,0,0 ; mulps 0x196a(%edx),%xmm0
+ DB 15,89,162,37,26,0,0 ; mulps 0x1a25(%edx),%xmm4
+ DB 15,89,130,53,26,0,0 ; mulps 0x1a35(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -44255,11 +45014,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,122,25,0,0 ; xorps 0x197a(%edx),%xmm4
+ DB 15,87,162,69,26,0,0 ; xorps 0x1a45(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,138,25,0,0 ; mulps 0x198a(%edx),%xmm5
+ DB 15,89,170,85,26,0,0 ; mulps 0x1a55(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,95,196 ; maxps %xmm4,%xmm0
@@ -44288,15 +45047,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
DB 15,88,240 ; addps %xmm0,%xmm6
- DB 232,0,0,0,0 ; call 6834 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ DB 232,0,0,0,0 ; call 6a19 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
DB 90 ; pop %edx
DB 243,15,89,237 ; mulss %xmm5,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,92,245 ; subps %xmm5,%xmm6
DB 243,15,16,65,32 ; movss 0x20(%ecx),%xmm0
DB 15,198,192,0 ; shufps $0x0,%xmm0,%xmm0
- DB 15,89,162,252,24,0,0 ; mulps 0x18fc(%edx),%xmm4
- DB 15,89,130,12,25,0,0 ; mulps 0x190c(%edx),%xmm0
+ DB 15,89,162,199,25,0,0 ; mulps 0x19c7(%edx),%xmm4
+ DB 15,89,130,215,25,0,0 ; mulps 0x19d7(%edx),%xmm0
DB 15,89,198 ; mulps %xmm6,%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
@@ -44304,11 +45063,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 15,81,237 ; sqrtps %xmm5,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,162,28,25,0,0 ; xorps 0x191c(%edx),%xmm4
+ DB 15,87,162,231,25,0,0 ; xorps 0x19e7(%edx),%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 243,15,16,105,36 ; movss 0x24(%ecx),%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
- DB 15,89,170,44,25,0,0 ; mulps 0x192c(%edx),%xmm5
+ DB 15,89,170,247,25,0,0 ; mulps 0x19f7(%edx),%xmm5
DB 15,89,197 ; mulps %xmm5,%xmm0
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,93,196 ; minps %xmm4,%xmm0
@@ -44326,7 +45085,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 85 ; push %ebp
DB 137,229 ; mov %esp,%ebp
DB 131,236,8 ; sub $0x8,%esp
- DB 232,0,0,0,0 ; call 68ac <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ DB 232,0,0,0,0 ; call 6a91 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
DB 89 ; pop %ecx
DB 139,69,12 ; mov 0xc(%ebp),%eax
DB 139,16 ; mov (%eax),%edx
@@ -44335,7 +45094,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 15,198,237,0 ; shufps $0x0,%xmm5,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 15,89,169,196,24,0,0 ; mulps 0x18c4(%ecx),%xmm5
+ DB 15,89,169,143,25,0,0 ; mulps 0x198f(%ecx),%xmm5
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 15,40,241 ; movaps %xmm1,%xmm6
DB 15,89,246 ; mulps %xmm6,%xmm6
@@ -44343,7 +45102,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,15,89,228 ; mulss %xmm4,%xmm4
DB 15,198,228,0 ; shufps $0x0,%xmm4,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 15,87,129,212,24,0,0 ; xorps 0x18d4(%ecx),%xmm0
+ DB 15,87,129,159,25,0,0 ; xorps 0x199f(%ecx),%xmm0
DB 15,94,197 ; divps %xmm5,%xmm0
DB 141,72,8 ; lea 0x8(%eax),%ecx
DB 131,236,8 ; sub $0x8,%esp
@@ -44411,16 +45170,16 @@ _sk_save_xy_sse2 LABEL PROC
DB 131,236,24 ; sub $0x18,%esp
DB 15,41,93,232 ; movaps %xmm3,-0x18(%ebp)
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 232,0,0,0,0 ; call 6989 <_sk_save_xy_sse2+0x12>
+ DB 232,0,0,0,0 ; call 6b6e <_sk_save_xy_sse2+0x12>
DB 88 ; pop %eax
- DB 15,40,160,7,24,0,0 ; movaps 0x1807(%eax),%xmm4
+ DB 15,40,160,210,24,0,0 ; movaps 0x18d2(%eax),%xmm4
DB 15,40,232 ; movaps %xmm0,%xmm5
DB 15,88,236 ; addps %xmm4,%xmm5
DB 243,15,91,245 ; cvttps2dq %xmm5,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 15,40,253 ; movaps %xmm5,%xmm7
DB 15,194,254,1 ; cmpltps %xmm6,%xmm7
- DB 15,40,144,23,24,0,0 ; movaps 0x1817(%eax),%xmm2
+ DB 15,40,144,226,24,0,0 ; movaps 0x18e2(%eax),%xmm2
DB 15,84,250 ; andps %xmm2,%xmm7
DB 15,92,247 ; subps %xmm7,%xmm6
DB 15,92,238 ; subps %xmm6,%xmm5
@@ -44491,15 +45250,15 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6a6b <_sk_bilinear_nx_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6c50 <_sk_bilinear_nx_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,69,23,0,0 ; addps 0x1745(%eax),%xmm0
- DB 15,40,168,85,23,0,0 ; movaps 0x1755(%eax),%xmm5
+ DB 15,88,128,16,24,0,0 ; addps 0x1810(%eax),%xmm0
+ DB 15,40,168,32,24,0,0 ; movaps 0x1820(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -44518,14 +45277,14 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6aae <_sk_bilinear_px_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6c93 <_sk_bilinear_px_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,34,23,0,0 ; addps 0x1722(%eax),%xmm0
+ DB 15,88,128,237,23,0,0 ; addps 0x17ed(%eax),%xmm0
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -44543,15 +45302,15 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6ae7 <_sk_bilinear_ny_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6ccc <_sk_bilinear_ny_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,249,22,0,0 ; addps 0x16f9(%eax),%xmm1
- DB 15,40,168,9,23,0,0 ; movaps 0x1709(%eax),%xmm5
+ DB 15,88,136,196,23,0,0 ; addps 0x17c4(%eax),%xmm1
+ DB 15,40,168,212,23,0,0 ; movaps 0x17d4(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -44570,14 +45329,14 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6b2b <_sk_bilinear_py_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6d10 <_sk_bilinear_py_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,213,22,0,0 ; addps 0x16d5(%eax),%xmm1
+ DB 15,88,136,160,23,0,0 ; addps 0x17a0(%eax),%xmm1
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -44595,20 +45354,20 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6b65 <_sk_bicubic_n3x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6d4a <_sk_bicubic_n3x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,171,22,0,0 ; addps 0x16ab(%eax),%xmm0
- DB 15,40,168,187,22,0,0 ; movaps 0x16bb(%eax),%xmm5
+ DB 15,88,128,118,23,0,0 ; addps 0x1776(%eax),%xmm0
+ DB 15,40,168,134,23,0,0 ; movaps 0x1786(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,203,22,0,0 ; mulps 0x16cb(%eax),%xmm5
- DB 15,88,168,219,22,0,0 ; addps 0x16db(%eax),%xmm5
+ DB 15,89,168,150,23,0,0 ; mulps 0x1796(%eax),%xmm5
+ DB 15,88,168,166,23,0,0 ; addps 0x17a6(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,128,0,0,0 ; movups %xmm5,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -44627,23 +45386,23 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6bbf <_sk_bicubic_n1x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6da4 <_sk_bicubic_n1x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,145,22,0,0 ; addps 0x1691(%eax),%xmm0
- DB 15,40,168,161,22,0,0 ; movaps 0x16a1(%eax),%xmm5
+ DB 15,88,128,92,23,0,0 ; addps 0x175c(%eax),%xmm0
+ DB 15,40,168,108,23,0,0 ; movaps 0x176c(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,177,22,0,0 ; movaps 0x16b1(%eax),%xmm4
+ DB 15,40,160,124,23,0,0 ; movaps 0x177c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,193,22,0,0 ; addps 0x16c1(%eax),%xmm4
+ DB 15,88,160,140,23,0,0 ; addps 0x178c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,209,22,0,0 ; addps 0x16d1(%eax),%xmm4
+ DB 15,88,160,156,23,0,0 ; addps 0x179c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,225,22,0,0 ; addps 0x16e1(%eax),%xmm4
+ DB 15,88,160,172,23,0,0 ; addps 0x17ac(%eax),%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -44661,22 +45420,22 @@ _sk_bicubic_p1x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6c27 <_sk_bicubic_p1x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6e0c <_sk_bicubic_p1x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,137,22,0,0 ; movaps 0x1689(%eax),%xmm4
+ DB 15,40,160,84,23,0,0 ; movaps 0x1754(%eax),%xmm4
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,110,64 ; movups 0x40(%esi),%xmm5
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 15,40,176,153,22,0,0 ; movaps 0x1699(%eax),%xmm6
+ DB 15,40,176,100,23,0,0 ; movaps 0x1764(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,169,22,0,0 ; addps 0x16a9(%eax),%xmm6
+ DB 15,88,176,116,23,0,0 ; addps 0x1774(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,185,22,0,0 ; addps 0x16b9(%eax),%xmm6
+ DB 15,88,176,132,23,0,0 ; addps 0x1784(%eax),%xmm6
DB 15,17,182,128,0,0,0 ; movups %xmm6,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -44694,18 +45453,18 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6c84 <_sk_bicubic_p3x_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6e69 <_sk_bicubic_p3x_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,6 ; movups (%esi),%xmm0
DB 15,16,102,64 ; movups 0x40(%esi),%xmm4
- DB 15,88,128,108,22,0,0 ; addps 0x166c(%eax),%xmm0
+ DB 15,88,128,55,23,0,0 ; addps 0x1737(%eax),%xmm0
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,124,22,0,0 ; mulps 0x167c(%eax),%xmm4
- DB 15,88,160,140,22,0,0 ; addps 0x168c(%eax),%xmm4
+ DB 15,89,160,71,23,0,0 ; mulps 0x1747(%eax),%xmm4
+ DB 15,88,160,87,23,0,0 ; addps 0x1757(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,128,0,0,0 ; movups %xmm4,0x80(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -44724,20 +45483,20 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6cd4 <_sk_bicubic_n3y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6eb9 <_sk_bicubic_n3y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,76,22,0,0 ; addps 0x164c(%eax),%xmm1
- DB 15,40,168,92,22,0,0 ; movaps 0x165c(%eax),%xmm5
+ DB 15,88,136,23,23,0,0 ; addps 0x1717(%eax),%xmm1
+ DB 15,40,168,39,23,0,0 ; movaps 0x1727(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,89,228 ; mulps %xmm4,%xmm4
- DB 15,89,168,108,22,0,0 ; mulps 0x166c(%eax),%xmm5
- DB 15,88,168,124,22,0,0 ; addps 0x167c(%eax),%xmm5
+ DB 15,89,168,55,23,0,0 ; mulps 0x1737(%eax),%xmm5
+ DB 15,88,168,71,23,0,0 ; addps 0x1747(%eax),%xmm5
DB 15,89,236 ; mulps %xmm4,%xmm5
DB 15,17,174,160,0,0,0 ; movups %xmm5,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -44756,23 +45515,23 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6d2f <_sk_bicubic_n1y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6f14 <_sk_bicubic_n1y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,49,22,0,0 ; addps 0x1631(%eax),%xmm1
- DB 15,40,168,65,22,0,0 ; movaps 0x1641(%eax),%xmm5
+ DB 15,88,136,252,22,0,0 ; addps 0x16fc(%eax),%xmm1
+ DB 15,40,168,12,23,0,0 ; movaps 0x170c(%eax),%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
- DB 15,40,160,81,22,0,0 ; movaps 0x1651(%eax),%xmm4
+ DB 15,40,160,28,23,0,0 ; movaps 0x171c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,97,22,0,0 ; addps 0x1661(%eax),%xmm4
+ DB 15,88,160,44,23,0,0 ; addps 0x172c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,113,22,0,0 ; addps 0x1671(%eax),%xmm4
+ DB 15,88,160,60,23,0,0 ; addps 0x173c(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
- DB 15,88,160,129,22,0,0 ; addps 0x1681(%eax),%xmm4
+ DB 15,88,160,76,23,0,0 ; addps 0x174c(%eax),%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -44790,22 +45549,22 @@ _sk_bicubic_p1y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6d98 <_sk_bicubic_p1y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6f7d <_sk_bicubic_p1y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
- DB 15,40,160,40,22,0,0 ; movaps 0x1628(%eax),%xmm4
+ DB 15,40,160,243,22,0,0 ; movaps 0x16f3(%eax),%xmm4
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,110,96 ; movups 0x60(%esi),%xmm5
DB 15,88,204 ; addps %xmm4,%xmm1
- DB 15,40,176,56,22,0,0 ; movaps 0x1638(%eax),%xmm6
+ DB 15,40,176,3,23,0,0 ; movaps 0x1703(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,72,22,0,0 ; addps 0x1648(%eax),%xmm6
+ DB 15,88,176,19,23,0,0 ; addps 0x1713(%eax),%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
DB 15,89,245 ; mulps %xmm5,%xmm6
- DB 15,88,176,88,22,0,0 ; addps 0x1658(%eax),%xmm6
+ DB 15,88,176,35,23,0,0 ; addps 0x1723(%eax),%xmm6
DB 15,17,182,160,0,0,0 ; movups %xmm6,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
DB 131,236,8 ; sub $0x8,%esp
@@ -44823,18 +45582,18 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 137,229 ; mov %esp,%ebp
DB 86 ; push %esi
DB 80 ; push %eax
- DB 232,0,0,0,0 ; call 6df6 <_sk_bicubic_p3y_sse2+0xa>
+ DB 232,0,0,0,0 ; call 6fdb <_sk_bicubic_p3y_sse2+0xa>
DB 88 ; pop %eax
DB 139,77,8 ; mov 0x8(%ebp),%ecx
DB 139,85,12 ; mov 0xc(%ebp),%edx
DB 139,50 ; mov (%edx),%esi
DB 15,16,78,32 ; movups 0x20(%esi),%xmm1
DB 15,16,102,96 ; movups 0x60(%esi),%xmm4
- DB 15,88,136,10,22,0,0 ; addps 0x160a(%eax),%xmm1
+ DB 15,88,136,213,22,0,0 ; addps 0x16d5(%eax),%xmm1
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,237 ; mulps %xmm5,%xmm5
- DB 15,89,160,26,22,0,0 ; mulps 0x161a(%eax),%xmm4
- DB 15,88,160,42,22,0,0 ; addps 0x162a(%eax),%xmm4
+ DB 15,89,160,229,22,0,0 ; mulps 0x16e5(%eax),%xmm4
+ DB 15,88,160,245,22,0,0 ; addps 0x16f5(%eax),%xmm4
DB 15,89,229 ; mulps %xmm5,%xmm4
DB 15,17,166,160,0,0,0 ; movups %xmm4,0xa0(%esi)
DB 141,66,8 ; lea 0x8(%edx),%eax
@@ -45069,9 +45828,9 @@ ALIGN 16
DB 0,224 ; add %ah,%al
DB 64 ; inc %eax
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 70ec <.literal16+0x1fc>
+ DB 224,64 ; loopne 72cc <.literal16+0x1fc>
DB 0,0 ; add %al,(%eax)
- DB 224,64 ; loopne 70f0 <.literal16+0x200>
+ DB 224,64 ; loopne 72d0 <.literal16+0x200>
DB 154,153,153,62,154,153,153 ; lcall $0x9999,$0x9a3e9999
DB 62,154,153,153,62,154,153,153 ; ds lcall $0x9999,$0x9a3e9999
DB 62,61,10,23,63,61 ; ds cmp $0x3d3f170a,%eax
@@ -45082,16 +45841,16 @@ ALIGN 16
DB 63 ; aas
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7111 <.literal16+0x221>
+ DB 225,61 ; loope 72f1 <.literal16+0x221>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7115 <.literal16+0x225>
+ DB 225,61 ; loope 72f5 <.literal16+0x225>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7119 <.literal16+0x229>
+ DB 225,61 ; loope 72f9 <.literal16+0x229>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 711d <.literal16+0x22d>
+ DB 225,61 ; loope 72fd <.literal16+0x22d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45108,16 +45867,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 7151 <.literal16+0x261>
+ DB 225,61 ; loope 7331 <.literal16+0x261>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7155 <.literal16+0x265>
+ DB 225,61 ; loope 7335 <.literal16+0x265>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7159 <.literal16+0x269>
+ DB 225,61 ; loope 7339 <.literal16+0x269>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 715d <.literal16+0x26d>
+ DB 225,61 ; loope 733d <.literal16+0x26d>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45134,16 +45893,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 7191 <.literal16+0x2a1>
+ DB 225,61 ; loope 7371 <.literal16+0x2a1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7195 <.literal16+0x2a5>
+ DB 225,61 ; loope 7375 <.literal16+0x2a5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 7199 <.literal16+0x2a9>
+ DB 225,61 ; loope 7379 <.literal16+0x2a9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 719d <.literal16+0x2ad>
+ DB 225,61 ; loope 737d <.literal16+0x2ad>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45160,16 +45919,16 @@ ALIGN 16
DB 63 ; aas
DB 61,10,23,63,174 ; cmp $0xae3f170a,%eax
DB 71 ; inc %edi
- DB 225,61 ; loope 71d1 <.literal16+0x2e1>
+ DB 225,61 ; loope 73b1 <.literal16+0x2e1>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 71d5 <.literal16+0x2e5>
+ DB 225,61 ; loope 73b5 <.literal16+0x2e5>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 71d9 <.literal16+0x2e9>
+ DB 225,61 ; loope 73b9 <.literal16+0x2e9>
DB 174 ; scas %es:(%edi),%al
DB 71 ; inc %edi
- DB 225,61 ; loope 71dd <.literal16+0x2ed>
+ DB 225,61 ; loope 73bd <.literal16+0x2ed>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45191,11 +45950,11 @@ ALIGN 16
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%eax)
DB 67 ; inc %ebx
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 721b <.literal16+0x32b>
+ DB 127,67 ; jg 73fb <.literal16+0x32b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 721f <.literal16+0x32f>
+ DB 127,67 ; jg 73ff <.literal16+0x32f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7223 <.literal16+0x333>
+ DB 127,67 ; jg 7403 <.literal16+0x333>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45469,13 +46228,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 7479 <.literal16+0x589>
+ DB 224,7 ; loopne 7659 <.literal16+0x589>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 747d <.literal16+0x58d>
+ DB 224,7 ; loopne 765d <.literal16+0x58d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7481 <.literal16+0x591>
+ DB 224,7 ; loopne 7661 <.literal16+0x591>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7485 <.literal16+0x595>
+ DB 224,7 ; loopne 7665 <.literal16+0x595>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -45524,11 +46283,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 753b <.literal16+0x64b>
+ DB 127,67 ; jg 771b <.literal16+0x64b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 753f <.literal16+0x64f>
+ DB 127,67 ; jg 771f <.literal16+0x64f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7543 <.literal16+0x653>
+ DB 127,67 ; jg 7723 <.literal16+0x653>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%eax)
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%eax)
@@ -45543,16 +46302,116 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7534 <.literal16+0x644>
+ DB 127,0 ; jg 7714 <.literal16+0x644>
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 7718 <.literal16+0x648>
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 771c <.literal16+0x64c>
+ DB 255 ; (bad)
+ DB 255 ; (bad)
+ DB 127,0 ; jg 7720 <.literal16+0x650>
+ DB 0,0 ; add %al,(%eax)
+ DB 0,63 ; add %bh,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 0,63 ; add %bh,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 0,63 ; add %bh,(%edi)
+ DB 0,0 ; add %al,(%eax)
+ DB 0,63 ; add %bh,(%edi)
+ DB 119,115 ; ja 77a5 <.literal16+0x6d5>
+ DB 248 ; clc
+ DB 194,119,115 ; ret $0x7377
+ DB 248 ; clc
+ DB 194,119,115 ; ret $0x7377
+ DB 248 ; clc
+ DB 194,119,115 ; ret $0x7377
+ DB 248 ; clc
+ DB 194,117,191 ; ret $0xbf75
+ DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
+ DB 63 ; aas
+ DB 117,191 ; jne 7709 <.literal16+0x639>
+ DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
+ DB 63 ; aas
+ DB 249 ; stc
+ DB 68 ; inc %esp
+ DB 180,62 ; mov $0x3e,%ah
+ DB 249 ; stc
+ DB 68 ; inc %esp
+ DB 180,62 ; mov $0x3e,%ah
+ DB 249 ; stc
+ DB 68 ; inc %esp
+ DB 180,62 ; mov $0x3e,%ah
+ DB 249 ; stc
+ DB 68 ; inc %esp
+ DB 180,62 ; mov $0x3e,%ah
+ DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
+ DB 233,220,63,163,233 ; jmp e9a3b746 <_sk_callback_sse2+0xe9a34724>
+ DB 220,63 ; fdivrl (%edi)
+ DB 163,233,220,63,0 ; mov %eax,0x3fdce9
+ DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
+ DB 63 ; aas
+ DB 0,0 ; add %al,(%eax)
+ DB 128,63,0 ; cmpb $0x0,(%edi)
+ DB 0,128,63,81,140,242 ; add %al,-0xd73aec1(%eax)
+ DB 66 ; inc %edx
+ DB 81 ; push %ecx
+ DB 140,242 ; mov %?,%edx
+ DB 66 ; inc %edx
+ DB 81 ; push %ecx
+ DB 140,242 ; mov %?,%edx
+ DB 66 ; inc %edx
+ DB 81 ; push %ecx
+ DB 140,242 ; mov %?,%edx
+ DB 66 ; inc %edx
+ DB 141,188,190,63,141,188,190 ; lea -0x414372c1(%esi,%edi,4),%edi
+ DB 63 ; aas
+ DB 141,188,190,63,141,188,190 ; lea -0x414372c1(%esi,%edi,4),%edi
+ DB 63 ; aas
+ DB 248 ; clc
+ DB 245 ; cmc
+ DB 154,64,248,245,154,64,248 ; lcall $0xf840,$0x9af5f840
+ DB 245 ; cmc
+ DB 154,64,248,245,154,64,254 ; lcall $0xfe40,$0x9af5f840
+ DB 210,221 ; rcr %cl,%ch
+ DB 65 ; inc %ecx
+ DB 254 ; (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65 ; inc %ecx
+ DB 254 ; (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65 ; inc %ecx
+ DB 254 ; (bad)
+ DB 210,221 ; rcr %cl,%ch
+ DB 65 ; inc %ecx
+ DB 0,0 ; add %al,(%eax)
+ DB 0,75,0 ; add %cl,0x0(%ebx)
+ DB 0,0 ; add %al,(%eax)
+ DB 75 ; dec %ebx
+ DB 0,0 ; add %al,(%eax)
+ DB 0,75,0 ; add %cl,0x0(%ebx)
+ DB 0,0 ; add %al,(%eax)
+ DB 75 ; dec %ebx
+ DB 0,0 ; add %al,(%eax)
+ DB 0,52,0 ; add %dh,(%eax,%eax,1)
+ DB 0,0 ; add %al,(%eax)
+ DB 52,0 ; xor $0x0,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 52,0 ; xor $0x0,%al
+ DB 0,0 ; add %al,(%eax)
+ DB 52,255 ; xor $0xff,%al
+ DB 255 ; (bad)
+ DB 127,0 ; jg 77e4 <.literal16+0x714>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7538 <.literal16+0x648>
+ DB 127,0 ; jg 77e8 <.literal16+0x718>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 753c <.literal16+0x64c>
+ DB 127,0 ; jg 77ec <.literal16+0x71c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7540 <.literal16+0x650>
+ DB 127,0 ; jg 77f0 <.literal16+0x720>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -45561,7 +46420,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 75c5 <.literal16+0x6d5>
+ DB 119,115 ; ja 7875 <.literal16+0x7a5>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -45572,7 +46431,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 7529 <.literal16+0x639>
+ DB 117,191 ; jne 77d9 <.literal16+0x709>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -45588,7 +46447,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3b566 <_sk_callback_sse2+0xe9a34729>
+ DB 233,220,63,163,233 ; jmp e9a3b816 <_sk_callback_sse2+0xe9a347f4>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45643,16 +46502,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 7604 <.literal16+0x714>
+ DB 127,0 ; jg 78b4 <.literal16+0x7e4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7608 <.literal16+0x718>
+ DB 127,0 ; jg 78b8 <.literal16+0x7e8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 760c <.literal16+0x71c>
+ DB 127,0 ; jg 78bc <.literal16+0x7ec>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 7610 <.literal16+0x720>
+ DB 127,0 ; jg 78c0 <.literal16+0x7f0>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -45661,7 +46520,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 7695 <.literal16+0x7a5>
+ DB 119,115 ; ja 7945 <.literal16+0x875>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -45672,7 +46531,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 75f9 <.literal16+0x709>
+ DB 117,191 ; jne 78a9 <.literal16+0x7d9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -45688,7 +46547,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3b636 <_sk_callback_sse2+0xe9a347f9>
+ DB 233,220,63,163,233 ; jmp e9a3b8e6 <_sk_callback_sse2+0xe9a348c4>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45743,16 +46602,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 76d4 <.literal16+0x7e4>
+ DB 127,0 ; jg 7984 <.literal16+0x8b4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 76d8 <.literal16+0x7e8>
+ DB 127,0 ; jg 7988 <.literal16+0x8b8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 76dc <.literal16+0x7ec>
+ DB 127,0 ; jg 798c <.literal16+0x8bc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 76e0 <.literal16+0x7f0>
+ DB 127,0 ; jg 7990 <.literal16+0x8c0>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -45761,7 +46620,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 7765 <.literal16+0x875>
+ DB 119,115 ; ja 7a15 <.literal16+0x945>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -45772,7 +46631,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 76c9 <.literal16+0x7d9>
+ DB 117,191 ; jne 7979 <.literal16+0x8a9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -45788,7 +46647,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3b706 <_sk_callback_sse2+0xe9a348c9>
+ DB 233,220,63,163,233 ; jmp e9a3b9b6 <_sk_callback_sse2+0xe9a34994>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45843,16 +46702,16 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 77a4 <.literal16+0x8b4>
+ DB 127,0 ; jg 7a54 <.literal16+0x984>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 77a8 <.literal16+0x8b8>
+ DB 127,0 ; jg 7a58 <.literal16+0x988>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 77ac <.literal16+0x8bc>
+ DB 127,0 ; jg 7a5c <.literal16+0x98c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 77b0 <.literal16+0x8c0>
+ DB 127,0 ; jg 7a60 <.literal16+0x990>
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
@@ -45861,7 +46720,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%edi)
DB 0,0 ; add %al,(%eax)
DB 0,63 ; add %bh,(%edi)
- DB 119,115 ; ja 7835 <.literal16+0x945>
+ DB 119,115 ; ja 7ae5 <.literal16+0xa15>
DB 248 ; clc
DB 194,119,115 ; ret $0x7377
DB 248 ; clc
@@ -45872,7 +46731,7 @@ ALIGN 16
DB 194,117,191 ; ret $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
- DB 117,191 ; jne 7799 <.literal16+0x8a9>
+ DB 117,191 ; jne 7a49 <.literal16+0x979>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; aas
DB 249 ; stc
@@ -45888,7 +46747,7 @@ ALIGN 16
DB 68 ; inc %esp
DB 180,62 ; mov $0x3e,%ah
DB 163,233,220,63,163 ; mov %eax,0xa33fdce9
- DB 233,220,63,163,233 ; jmp e9a3b7d6 <_sk_callback_sse2+0xe9a34999>
+ DB 233,220,63,163,233 ; jmp e9a3ba86 <_sk_callback_sse2+0xe9a34a64>
DB 220,63 ; fdivrl (%edi)
DB 163,233,220,63,0 ; mov %eax,0x3fdce9
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -45939,13 +46798,13 @@ ALIGN 16
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
DB 200,66,0,0 ; enter $0x42,$0x0
- DB 127,67 ; jg 78b7 <.literal16+0x9c7>
+ DB 127,67 ; jg 7b67 <.literal16+0xa97>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 78bb <.literal16+0x9cb>
+ DB 127,67 ; jg 7b6b <.literal16+0xa9b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 78bf <.literal16+0x9cf>
+ DB 127,67 ; jg 7b6f <.literal16+0xa9f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 78c3 <.literal16+0x9d3>
+ DB 127,67 ; jg 7b73 <.literal16+0xaa3>
DB 0,0 ; add %al,(%eax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%eax)
@@ -45996,16 +46855,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%ebx)
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 7943 <.literal16+0xa53>
+ DB 118,63 ; jbe 7bf3 <.literal16+0xb23>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 7947 <.literal16+0xa57>
+ DB 118,63 ; jbe 7bf7 <.literal16+0xb27>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 794b <.literal16+0xa5b>
+ DB 118,63 ; jbe 7bfb <.literal16+0xb2b>
DB 31 ; pop %ds
DB 215 ; xlat %ds:(%ebx)
- DB 118,63 ; jbe 794f <.literal16+0xa5f>
+ DB 118,63 ; jbe 7bff <.literal16+0xb2f>
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
DB 246,64,83,63 ; testb $0x3f,0x53(%eax)
@@ -46034,11 +46893,11 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%ebx)
DB 0,127,67 ; add %bh,0x43(%edi)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 79bb <.literal16+0xacb>
+ DB 127,67 ; jg 7c6b <.literal16+0xb9b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 79bf <.literal16+0xacf>
+ DB 127,67 ; jg 7c6f <.literal16+0xb9f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 79c3 <.literal16+0xad3>
+ DB 127,67 ; jg 7c73 <.literal16+0xba3>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 0,0 ; add %al,(%eax)
@@ -46100,13 +46959,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 7a39 <.literal16+0xb49>
+ DB 224,7 ; loopne 7ce9 <.literal16+0xc19>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7a3d <.literal16+0xb4d>
+ DB 224,7 ; loopne 7ced <.literal16+0xc1d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7a41 <.literal16+0xb51>
+ DB 224,7 ; loopne 7cf1 <.literal16+0xc21>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7a45 <.literal16+0xb55>
+ DB 224,7 ; loopne 7cf5 <.literal16+0xc25>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -46152,13 +47011,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 7aa9 <.literal16+0xbb9>
+ DB 224,7 ; loopne 7d59 <.literal16+0xc89>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7aad <.literal16+0xbbd>
+ DB 224,7 ; loopne 7d5d <.literal16+0xc8d>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7ab1 <.literal16+0xbc1>
+ DB 224,7 ; loopne 7d61 <.literal16+0xc91>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7ab5 <.literal16+0xbc5>
+ DB 224,7 ; loopne 7d65 <.literal16+0xc95>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -46204,13 +47063,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%edi)
DB 8,33 ; or %ah,(%ecx)
DB 132,55 ; test %dh,(%edi)
- DB 224,7 ; loopne 7b19 <.literal16+0xc29>
+ DB 224,7 ; loopne 7dc9 <.literal16+0xcf9>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7b1d <.literal16+0xc2d>
+ DB 224,7 ; loopne 7dcd <.literal16+0xcfd>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7b21 <.literal16+0xc31>
+ DB 224,7 ; loopne 7dd1 <.literal16+0xd01>
DB 0,0 ; add %al,(%eax)
- DB 224,7 ; loopne 7b25 <.literal16+0xc35>
+ DB 224,7 ; loopne 7dd5 <.literal16+0xd05>
DB 0,0 ; add %al,(%eax)
DB 33,8 ; and %ecx,(%eax)
DB 2,58 ; add (%edx),%bh
@@ -46252,13 +47111,13 @@ ALIGN 16
DB 248 ; clc
DB 65 ; inc %ecx
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 7bb6 <.literal16+0xcc6>
+ DB 124,66 ; jl 7e66 <.literal16+0xd96>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 7bba <.literal16+0xcca>
+ DB 124,66 ; jl 7e6a <.literal16+0xd9a>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 7bbe <.literal16+0xcce>
+ DB 124,66 ; jl 7e6e <.literal16+0xd9e>
DB 0,0 ; add %al,(%eax)
- DB 124,66 ; jl 7bc2 <.literal16+0xcd2>
+ DB 124,66 ; jl 7e72 <.literal16+0xda2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%eax)
DB 0,240 ; add %dh,%al
@@ -46392,13 +47251,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%eax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 7d45 <.literal16+0xe55>
+ DB 112,65 ; jo 7ff5 <.literal16+0xf25>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 7d49 <.literal16+0xe59>
+ DB 112,65 ; jo 7ff9 <.literal16+0xf29>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 7d4d <.literal16+0xe5d>
+ DB 112,65 ; jo 7ffd <.literal16+0xf2d>
DB 0,0 ; add %al,(%eax)
- DB 112,65 ; jo 7d51 <.literal16+0xe61>
+ DB 112,65 ; jo 8001 <.literal16+0xf31>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -46429,11 +47288,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7dbb <.literal16+0xecb>
+ DB 127,67 ; jg 806b <.literal16+0xf9b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7dbf <.literal16+0xecf>
+ DB 127,67 ; jg 806f <.literal16+0xf9f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7dc3 <.literal16+0xed3>
+ DB 127,67 ; jg 8073 <.literal16+0xfa3>
DB 255,0 ; incl (%eax)
DB 0,0 ; add %al,(%eax)
DB 255,0 ; incl (%eax)
@@ -46464,11 +47323,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%ebx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%eax)
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7e2b <.literal16+0xf3b>
+ DB 127,67 ; jg 80db <.literal16+0x100b>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7e2f <.literal16+0xf3f>
+ DB 127,67 ; jg 80df <.literal16+0x100f>
DB 0,0 ; add %al,(%eax)
- DB 127,67 ; jg 7e33 <.literal16+0xf43>
+ DB 127,67 ; jg 80e3 <.literal16+0x1013>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
DB 0,0 ; add %al,(%eax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%eax)
@@ -46567,13 +47426,13 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 255 ; (bad)
- DB 127,71 ; jg 7f5b <.literal16+0x106b>
+ DB 127,71 ; jg 820b <.literal16+0x113b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 7f5f <.literal16+0x106f>
+ DB 127,71 ; jg 820f <.literal16+0x113f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 7f63 <.literal16+0x1073>
+ DB 127,71 ; jg 8213 <.literal16+0x1143>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 7f67 <.literal16+0x1077>
+ DB 127,71 ; jg 8217 <.literal16+0x1147>
DB 0,0 ; add %al,(%eax)
DB 128,63,0 ; cmpb $0x0,(%edi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%eax)
@@ -46681,7 +47540,7 @@ ALIGN 16
DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 806c <.literal16+0x117c>
+ DB 120,57 ; js 831c <.literal16+0x124c>
DB 64 ; inc %eax
DB 18,120,57 ; adc 0x39(%eax),%bh
DB 64 ; inc %eax
@@ -46874,11 +47733,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 8252 <.literal16+0x1362>
+ DB 62,114,28 ; jb,pt 8502 <.literal16+0x1432>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 8256 <.literal16+0x1366>
+ DB 62,114,28 ; jb,pt 8506 <.literal16+0x1436>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 825a <.literal16+0x136a>
+ DB 62,114,28 ; jb,pt 850a <.literal16+0x143a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -46957,13 +47816,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb 831e <.literal16+0x142e>
+ DB 114,28 ; jb 85ce <.literal16+0x14fe>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 8322 <.literal16+0x1432>
+ DB 62,114,28 ; jb,pt 85d2 <.literal16+0x1502>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 8326 <.literal16+0x1436>
+ DB 62,114,28 ; jb,pt 85d6 <.literal16+0x1506>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 832a <.literal16+0x143a>
+ DB 62,114,28 ; jb,pt 85da <.literal16+0x150a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -46984,11 +47843,11 @@ ALIGN 16
DB 0,0 ; add %al,(%eax)
DB 128,63,114 ; cmpb $0x72,(%edi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 8362 <.literal16+0x1472>
+ DB 62,114,28 ; jb,pt 8612 <.literal16+0x1542>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 8366 <.literal16+0x1476>
+ DB 62,114,28 ; jb,pt 8616 <.literal16+0x1546>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 836a <.literal16+0x147a>
+ DB 62,114,28 ; jb,pt 861a <.literal16+0x154a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
@@ -47067,13 +47926,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%edi)
DB 0,192 ; add %al,%al
DB 63 ; aas
- DB 114,28 ; jb 842e <.literal16+0x153e>
+ DB 114,28 ; jb 86de <.literal16+0x160e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 8432 <_sk_callback_sse2+0x15f5>
+ DB 62,114,28 ; jb,pt 86e2 <_sk_callback_sse2+0x16c0>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 8436 <_sk_callback_sse2+0x15f9>
+ DB 62,114,28 ; jb,pt 86e6 <_sk_callback_sse2+0x16c4>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 843a <_sk_callback_sse2+0x15fd>
+ DB 62,114,28 ; jb,pt 86ea <_sk_callback_sse2+0x16c8>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%edi)
DB 170 ; stos %al,%es:(%edi)
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index 60f9c87116..4eaa77c5a9 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -836,6 +836,13 @@ STAGE(parametric_g) { g = parametric(g, ctx); }
STAGE(parametric_b) { b = parametric(b, ctx); }
STAGE(parametric_a) { a = parametric(a, ctx); }
+STAGE(gamma) {
+ float G = *(const float*)ctx;
+ r = approx_powf(r,G);
+ g = approx_powf(g,G);
+ b = approx_powf(b,G);
+}
+
STAGE(lab_to_xyz) {
F L = r * 100.0f,
A = g * 255.0f - 128.0f,