aboutsummaryrefslogtreecommitdiffhomepage
path: root/src/jumper/SkJumper_generated.S
diff options
context:
space:
mode:
authorGravatar Mike Klein <mtklein@chromium.org>2017-08-09 13:51:35 -0400
committerGravatar Skia Commit-Bot <skia-commit-bot@chromium.org>2017-08-09 18:51:44 +0000
commita07e4302cfefc282d8d235edfbc20a54c75afa88 (patch)
tree213da9d00c56d3cf3f8056410a81da60388dc933 /src/jumper/SkJumper_generated.S
parentb681a0f1b0acebe36130fd463d14016d48295b97 (diff)
add gamma stage
Until now we've been using 3 separate parametric stages to apply gamma to r,g,b. That works fine, but is kind of unnecessarily slow, and again less clear in a stack trace than seeing "gamma". The new bench runs in about 60% of the time the old one does on my Trashcan. BUG=skia:6939 Change-Id: I079698d3009b081f1c23a2e27fc26e373b439610 Reviewed-on: https://skia-review.googlesource.com/32721 Reviewed-by: Mike Reed <reed@google.com> Commit-Queue: Mike Klein <mtklein@chromium.org>
Diffstat (limited to 'src/jumper/SkJumper_generated.S')
-rw-r--r--src/jumper/SkJumper_generated.S7653
1 files changed, 4394 insertions, 3259 deletions
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index e0f31bdfaa..05483651db 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -2813,6 +2813,97 @@ _sk_parametric_a_aarch64:
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
+HIDDEN _sk_gamma_aarch64
+.globl _sk_gamma_aarch64
+FUNCTION(_sk_gamma_aarch64)
+_sk_gamma_aarch64:
+ .long 0x52b85f08 // mov w8, #0xc2f80000
+ .long 0x728e6ee8 // movk w8, #0x7377
+ .long 0x4e040d10 // dup v16.4s, w8
+ .long 0x52a7d688 // mov w8, #0x3eb40000
+ .long 0x72889f28 // movk w8, #0x44f9
+ .long 0x4e040d12 // dup v18.4s, w8
+ .long 0x52a85e48 // mov w8, #0x42f20000
+ .long 0x72918a28 // movk w8, #0x8c51
+ .long 0x4e040d13 // dup v19.4s, w8
+ .long 0x52a81348 // mov w8, #0x409a0000
+ .long 0x729ebf08 // movk w8, #0xf5f8
+ .long 0x4e040d15 // dup v21.4s, w8
+ .long 0xa8c11428 // ldp x8, x5, [x1], #16
+ .long 0x52a7f7e9 // mov w9, #0x3fbf0000
+ .long 0x4f01669a // movi v26.4s, #0x34, lsl #24
+ .long 0x4e21d85b // scvtf v27.4s, v2.4s
+ .long 0x7297eea9 // movk w9, #0xbf75
+ .long 0x4eb01e1c // mov v28.16b, v16.16b
+ .long 0x4eb01e1d // mov v29.16b, v16.16b
+ .long 0x4e3bcf50 // fmla v16.4s, v26.4s, v27.4s
+ .long 0x4f03d7fb // movi v27.4s, #0x7f, msl #16
+ .long 0x4e040d31 // dup v17.4s, w9
+ .long 0x52a7fb89 // mov w9, #0x3fdc0000
+ .long 0x4e21d819 // scvtf v25.4s, v0.4s
+ .long 0x4e3b1c00 // and v0.16b, v0.16b, v27.16b
+ .long 0x4e3b1c42 // and v2.16b, v2.16b, v27.16b
+ .long 0x4e3b1c3b // and v27.16b, v1.16b, v27.16b
+ .long 0x729d3469 // movk w9, #0xe9a3
+ .long 0xbd400118 // ldr s24, [x8]
+ .long 0x4e21d821 // scvtf v1.4s, v1.4s
+ .long 0x4f0177e0 // orr v0.4s, #0x3f, lsl #24
+ .long 0x4f0177fb // orr v27.4s, #0x3f, lsl #24
+ .long 0x4f0177e2 // orr v2.4s, #0x3f, lsl #24
+ .long 0x4e040d37 // dup v23.4s, w9
+ .long 0x4e39cf5c // fmla v28.4s, v26.4s, v25.4s
+ .long 0x4e21cf5d // fmla v29.4s, v26.4s, v1.4s
+ .long 0x4e32d401 // fadd v1.4s, v0.4s, v18.4s
+ .long 0x4e32d77a // fadd v26.4s, v27.4s, v18.4s
+ .long 0x4eb1cc50 // fmls v16.4s, v2.4s, v17.4s
+ .long 0x4e32d442 // fadd v2.4s, v2.4s, v18.4s
+ .long 0x4eb1cc1c // fmls v28.4s, v0.4s, v17.4s
+ .long 0x6e21fee0 // fdiv v0.4s, v23.4s, v1.4s
+ .long 0x4eb1cf7d // fmls v29.4s, v27.4s, v17.4s
+ .long 0x6e3afee1 // fdiv v1.4s, v23.4s, v26.4s
+ .long 0x6e22fee2 // fdiv v2.4s, v23.4s, v2.4s
+ .long 0x52a7f7c9 // mov w9, #0x3fbe0000
+ .long 0x4ea0d780 // fsub v0.4s, v28.4s, v0.4s
+ .long 0x4ea1d7a1 // fsub v1.4s, v29.4s, v1.4s
+ .long 0x4ea2d602 // fsub v2.4s, v16.4s, v2.4s
+ .long 0x729791a9 // movk w9, #0xbc8d
+ .long 0x4f989000 // fmul v0.4s, v0.4s, v24.s[0]
+ .long 0x4f989021 // fmul v1.4s, v1.4s, v24.s[0]
+ .long 0x4f989042 // fmul v2.4s, v2.4s, v24.s[0]
+ .long 0x4e040d34 // dup v20.4s, w9
+ .long 0x52a83ba9 // mov w9, #0x41dd0000
+ .long 0x4e219810 // frintm v16.4s, v0.4s
+ .long 0x4e219832 // frintm v18.4s, v1.4s
+ .long 0x4e219858 // frintm v24.4s, v2.4s
+ .long 0x729a5fc9 // movk w9, #0xd2fe
+ .long 0x4e33d411 // fadd v17.4s, v0.4s, v19.4s
+ .long 0x4e33d437 // fadd v23.4s, v1.4s, v19.4s
+ .long 0x4e33d453 // fadd v19.4s, v2.4s, v19.4s
+ .long 0x4eb0d400 // fsub v0.4s, v0.4s, v16.4s
+ .long 0x4eb2d421 // fsub v1.4s, v1.4s, v18.4s
+ .long 0x4eb8d442 // fsub v2.4s, v2.4s, v24.4s
+ .long 0x4e040d36 // dup v22.4s, w9
+ .long 0x4eb4cc11 // fmls v17.4s, v0.4s, v20.4s
+ .long 0x4ea0d6a0 // fsub v0.4s, v21.4s, v0.4s
+ .long 0x4eb4cc37 // fmls v23.4s, v1.4s, v20.4s
+ .long 0x4ea1d6a1 // fsub v1.4s, v21.4s, v1.4s
+ .long 0x4eb4cc53 // fmls v19.4s, v2.4s, v20.4s
+ .long 0x4ea2d6a2 // fsub v2.4s, v21.4s, v2.4s
+ .long 0x6e20fec0 // fdiv v0.4s, v22.4s, v0.4s
+ .long 0x6e21fec1 // fdiv v1.4s, v22.4s, v1.4s
+ .long 0x6e22fec2 // fdiv v2.4s, v22.4s, v2.4s
+ .long 0x4f026579 // movi v25.4s, #0x4b, lsl #24
+ .long 0x4e20d620 // fadd v0.4s, v17.4s, v0.4s
+ .long 0x4e21d6e1 // fadd v1.4s, v23.4s, v1.4s
+ .long 0x4e22d662 // fadd v2.4s, v19.4s, v2.4s
+ .long 0x6e39dc00 // fmul v0.4s, v0.4s, v25.4s
+ .long 0x6e39dc21 // fmul v1.4s, v1.4s, v25.4s
+ .long 0x6e39dc42 // fmul v2.4s, v2.4s, v25.4s
+ .long 0x6e21a800 // fcvtnu v0.4s, v0.4s
+ .long 0x6e21a821 // fcvtnu v1.4s, v1.4s
+ .long 0x6e21a842 // fcvtnu v2.4s, v2.4s
+ .long 0xd61f00a0 // br x5
+
HIDDEN _sk_lab_to_xyz_aarch64
.globl _sk_lab_to_xyz_aarch64
FUNCTION(_sk_lab_to_xyz_aarch64)
@@ -2889,7 +2980,7 @@ _sk_load_a8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2754 <_sk_load_a8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 28ac <_sk_load_a8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -2914,12 +3005,12 @@ _sk_load_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 27a0 <_sk_load_a8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 28f8 <_sk_load_a8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e402 // movi d2, #0x0
- .long 0x540000c0 // b.eq 2780 <_sk_load_a8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 28d8 <_sk_load_a8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 271c <_sk_load_a8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2874 <_sk_load_a8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e0a1d22 // mov v2.h[2], w9
@@ -2930,11 +3021,11 @@ _sk_load_a8_aarch64:
.long 0x0e401800 // uzp1 v0.4h, v0.4h, v0.4h
.long 0x2e002040 // ext v0.8b, v2.8b, v0.8b, #4
.long 0x2e002002 // ext v2.8b, v0.8b, v0.8b, #4
- .long 0x17ffffe0 // b 271c <_sk_load_a8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2874 <_sk_load_a8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e021d02 // mov v2.h[0], w8
- .long 0x17ffffdc // b 271c <_sk_load_a8_aarch64+0x3c>
+ .long 0x17ffffdc // b 2874 <_sk_load_a8_aarch64+0x3c>
HIDDEN _sk_load_a8_dst_aarch64
.globl _sk_load_a8_dst_aarch64
@@ -2946,7 +3037,7 @@ _sk_load_a8_dst_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2824 <_sk_load_a8_dst_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 297c <_sk_load_a8_dst_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -2971,12 +3062,12 @@ _sk_load_a8_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2870 <_sk_load_a8_dst_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 29c8 <_sk_load_a8_dst_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e406 // movi d6, #0x0
- .long 0x540000c0 // b.eq 2850 <_sk_load_a8_dst_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 29a8 <_sk_load_a8_dst_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 27ec <_sk_load_a8_dst_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2944 <_sk_load_a8_dst_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe6 // dup v6.4h, wzr
.long 0x4e0a1d26 // mov v6.h[2], w9
@@ -2987,11 +3078,11 @@ _sk_load_a8_dst_aarch64:
.long 0x0e401884 // uzp1 v4.4h, v4.4h, v0.4h
.long 0x2e0420c4 // ext v4.8b, v6.8b, v4.8b, #4
.long 0x2e042086 // ext v6.8b, v4.8b, v4.8b, #4
- .long 0x17ffffe0 // b 27ec <_sk_load_a8_dst_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2944 <_sk_load_a8_dst_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe6 // dup v6.4h, wzr
.long 0x4e021d06 // mov v6.h[0], w8
- .long 0x17ffffdc // b 27ec <_sk_load_a8_dst_aarch64+0x3c>
+ .long 0x17ffffdc // b 2944 <_sk_load_a8_dst_aarch64+0x3c>
HIDDEN _sk_gather_a8_aarch64
.globl _sk_gather_a8_aarch64
@@ -3043,7 +3134,7 @@ _sk_store_a8_aarch64:
.long 0x0e612a10 // xtn v16.4h, v16.4s
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb5000184 // cbnz x4, 2954 <_sk_store_a8_aarch64+0x5c>
+ .long 0xb5000184 // cbnz x4, 2aac <_sk_store_a8_aarch64+0x5c>
.long 0x0e0e3e09 // umov w9, v16.h[3]
.long 0x0e0a3e0a // umov w10, v16.h[2]
.long 0x0e063e0b // umov w11, v16.h[1]
@@ -3057,21 +3148,21 @@ _sk_store_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000180 // b.eq 298c <_sk_store_a8_aarch64+0x94> // b.none
+ .long 0x54000180 // b.eq 2ae4 <_sk_store_a8_aarch64+0x94> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2978 <_sk_store_a8_aarch64+0x80> // b.none
+ .long 0x540000a0 // b.eq 2ad0 <_sk_store_a8_aarch64+0x80> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 2948 <_sk_store_a8_aarch64+0x50> // b.any
+ .long 0x54fffee1 // b.ne 2aa0 <_sk_store_a8_aarch64+0x50> // b.any
.long 0x0e0a3e09 // umov w9, v16.h[2]
.long 0x39000909 // strb w9, [x8, #2]
.long 0x0e023e09 // umov w9, v16.h[0]
.long 0x0e063e0a // umov w10, v16.h[1]
.long 0x3900050a // strb w10, [x8, #1]
.long 0x39000109 // strb w9, [x8]
- .long 0x17fffff0 // b 2948 <_sk_store_a8_aarch64+0x50>
+ .long 0x17fffff0 // b 2aa0 <_sk_store_a8_aarch64+0x50>
.long 0x0e023e09 // umov w9, v16.h[0]
.long 0x39000109 // strb w9, [x8]
- .long 0x17ffffed // b 2948 <_sk_store_a8_aarch64+0x50>
+ .long 0x17ffffed // b 2aa0 <_sk_store_a8_aarch64+0x50>
HIDDEN _sk_load_g8_aarch64
.globl _sk_load_g8_aarch64
@@ -3083,7 +3174,7 @@ _sk_load_g8_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2a0c <_sk_load_g8_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2b64 <_sk_load_g8_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3108,12 +3199,12 @@ _sk_load_g8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2a58 <_sk_load_g8_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2bb0 <_sk_load_g8_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2a38 <_sk_load_g8_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2b90 <_sk_load_g8_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 29d4 <_sk_load_g8_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2b2c <_sk_load_g8_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e0a1d20 // mov v0.h[2], w9
@@ -3124,11 +3215,11 @@ _sk_load_g8_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffe0 // b 29d4 <_sk_load_g8_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2b2c <_sk_load_g8_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e021d00 // mov v0.h[0], w8
- .long 0x17ffffdc // b 29d4 <_sk_load_g8_aarch64+0x3c>
+ .long 0x17ffffdc // b 2b2c <_sk_load_g8_aarch64+0x3c>
HIDDEN _sk_load_g8_dst_aarch64
.globl _sk_load_g8_dst_aarch64
@@ -3140,7 +3231,7 @@ _sk_load_g8_dst_aarch64:
.long 0xb9800908 // ldrsw x8, [x8, #8]
.long 0x9b0a2508 // madd x8, x8, x10, x9
.long 0x8b22c108 // add x8, x8, w2, sxtw
- .long 0xb50002e4 // cbnz x4, 2adc <_sk_load_g8_dst_aarch64+0x74>
+ .long 0xb50002e4 // cbnz x4, 2c34 <_sk_load_g8_dst_aarch64+0x74>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -3165,12 +3256,12 @@ _sk_load_g8_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2b28 <_sk_load_g8_dst_aarch64+0xc0> // b.none
+ .long 0x54000220 // b.eq 2c80 <_sk_load_g8_dst_aarch64+0xc0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 2b08 <_sk_load_g8_dst_aarch64+0xa0> // b.none
+ .long 0x540000c0 // b.eq 2c60 <_sk_load_g8_dst_aarch64+0xa0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 2aa4 <_sk_load_g8_dst_aarch64+0x3c> // b.any
+ .long 0x54fffd61 // b.ne 2bfc <_sk_load_g8_dst_aarch64+0x3c> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x4e0a1d24 // mov v4.h[2], w9
@@ -3181,11 +3272,11 @@ _sk_load_g8_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffe0 // b 2aa4 <_sk_load_g8_dst_aarch64+0x3c>
+ .long 0x17ffffe0 // b 2bfc <_sk_load_g8_dst_aarch64+0x3c>
.long 0x39400108 // ldrb w8, [x8]
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x4e021d04 // mov v4.h[0], w8
- .long 0x17ffffdc // b 2aa4 <_sk_load_g8_dst_aarch64+0x3c>
+ .long 0x17ffffdc // b 2bfc <_sk_load_g8_dst_aarch64+0x3c>
HIDDEN _sk_gather_g8_aarch64
.globl _sk_gather_g8_aarch64
@@ -3233,7 +3324,7 @@ _sk_load_565_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50003c4 // cbnz x4, 2c44 <_sk_load_565_aarch64+0x94>
+ .long 0xb50003c4 // cbnz x4, 2d9c <_sk_load_565_aarch64+0x94>
.long 0xfd400100 // ldr d0, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d02 // dup v2.4s, w8
@@ -3265,12 +3356,12 @@ _sk_load_565_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2c90 <_sk_load_565_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 2de8 <_sk_load_565_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2c70 <_sk_load_565_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 2dc8 <_sk_load_565_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffba1 // b.ne 2bd4 <_sk_load_565_aarch64+0x24> // b.any
+ .long 0x54fffba1 // b.ne 2d2c <_sk_load_565_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
@@ -3281,10 +3372,10 @@ _sk_load_565_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffd2 // b 2bd4 <_sk_load_565_aarch64+0x24>
+ .long 0x17ffffd2 // b 2d2c <_sk_load_565_aarch64+0x24>
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffcf // b 2bd4 <_sk_load_565_aarch64+0x24>
+ .long 0x17ffffcf // b 2d2c <_sk_load_565_aarch64+0x24>
HIDDEN _sk_load_565_dst_aarch64
.globl _sk_load_565_dst_aarch64
@@ -3297,7 +3388,7 @@ _sk_load_565_dst_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb50003c4 // cbnz x4, 2d30 <_sk_load_565_dst_aarch64+0x94>
+ .long 0xb50003c4 // cbnz x4, 2e88 <_sk_load_565_dst_aarch64+0x94>
.long 0xfd400104 // ldr d4, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d06 // dup v6.4s, w8
@@ -3329,12 +3420,12 @@ _sk_load_565_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2d7c <_sk_load_565_dst_aarch64+0xe0> // b.none
+ .long 0x54000220 // b.eq 2ed4 <_sk_load_565_dst_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 2d5c <_sk_load_565_dst_aarch64+0xc0> // b.none
+ .long 0x540000c0 // b.eq 2eb4 <_sk_load_565_dst_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffba1 // b.ne 2cc0 <_sk_load_565_dst_aarch64+0x24> // b.any
+ .long 0x54fffba1 // b.ne 2e18 <_sk_load_565_dst_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d405124 // ld1 {v4.h}[2], [x9]
@@ -3345,10 +3436,10 @@ _sk_load_565_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffd2 // b 2cc0 <_sk_load_565_dst_aarch64+0x24>
+ .long 0x17ffffd2 // b 2e18 <_sk_load_565_dst_aarch64+0x24>
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d404104 // ld1 {v4.h}[0], [x8]
- .long 0x17ffffcf // b 2cc0 <_sk_load_565_dst_aarch64+0x24>
+ .long 0x17ffffcf // b 2e18 <_sk_load_565_dst_aarch64+0x24>
HIDDEN _sk_gather_565_aarch64
.globl _sk_gather_565_aarch64
@@ -3424,24 +3515,24 @@ _sk_store_565_aarch64:
.long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b
.long 0x8b897d08 // add x8, x8, x9, asr #31
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 2ea0 <_sk_store_565_aarch64+0x68>
+ .long 0xb50000a4 // cbnz x4, 2ff8 <_sk_store_565_aarch64+0x68>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 2ecc <_sk_store_565_aarch64+0x94> // b.none
+ .long 0x54000120 // b.eq 3024 <_sk_store_565_aarch64+0x94> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2ec4 <_sk_store_565_aarch64+0x8c> // b.none
+ .long 0x540000a0 // b.eq 301c <_sk_store_565_aarch64+0x8c> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 2e94 <_sk_store_565_aarch64+0x5c> // b.any
+ .long 0x54fffee1 // b.ne 2fec <_sk_store_565_aarch64+0x5c> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 2e94 <_sk_store_565_aarch64+0x5c>
+ .long 0x17fffff1 // b 2fec <_sk_store_565_aarch64+0x5c>
HIDDEN _sk_load_4444_aarch64
.globl _sk_load_4444_aarch64
@@ -3454,7 +3545,7 @@ _sk_load_4444_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000444 // cbnz x4, 2f78 <_sk_load_4444_aarch64+0xa4>
+ .long 0xb5000444 // cbnz x4, 30d0 <_sk_load_4444_aarch64+0xa4>
.long 0xfd400100 // ldr d0, [x8]
.long 0x52a6f108 // mov w8, #0x37880000
.long 0x2f10a400 // uxtl v0.4s, v0.4h
@@ -3490,12 +3581,12 @@ _sk_load_4444_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 2fc4 <_sk_load_4444_aarch64+0xf0> // b.none
+ .long 0x54000220 // b.eq 311c <_sk_load_4444_aarch64+0xf0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e400 // movi d0, #0x0
- .long 0x540000c0 // b.eq 2fa4 <_sk_load_4444_aarch64+0xd0> // b.none
+ .long 0x540000c0 // b.eq 30fc <_sk_load_4444_aarch64+0xd0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffb21 // b.ne 2ef8 <_sk_load_4444_aarch64+0x24> // b.any
+ .long 0x54fffb21 // b.ne 3050 <_sk_load_4444_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
@@ -3506,10 +3597,10 @@ _sk_load_4444_aarch64:
.long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
.long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
.long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
- .long 0x17ffffce // b 2ef8 <_sk_load_4444_aarch64+0x24>
+ .long 0x17ffffce // b 3050 <_sk_load_4444_aarch64+0x24>
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffcb // b 2ef8 <_sk_load_4444_aarch64+0x24>
+ .long 0x17ffffcb // b 3050 <_sk_load_4444_aarch64+0x24>
HIDDEN _sk_load_4444_dst_aarch64
.globl _sk_load_4444_dst_aarch64
@@ -3522,7 +3613,7 @@ _sk_load_4444_dst_aarch64:
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000444 // cbnz x4, 3074 <_sk_load_4444_dst_aarch64+0xa4>
+ .long 0xb5000444 // cbnz x4, 31cc <_sk_load_4444_dst_aarch64+0xa4>
.long 0xfd400104 // ldr d4, [x8]
.long 0x52a6f108 // mov w8, #0x37880000
.long 0x2f10a484 // uxtl v4.4s, v4.4h
@@ -3558,12 +3649,12 @@ _sk_load_4444_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000220 // b.eq 30c0 <_sk_load_4444_dst_aarch64+0xf0> // b.none
+ .long 0x54000220 // b.eq 3218 <_sk_load_4444_dst_aarch64+0xf0> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x2f00e404 // movi d4, #0x0
- .long 0x540000c0 // b.eq 30a0 <_sk_load_4444_dst_aarch64+0xd0> // b.none
+ .long 0x540000c0 // b.eq 31f8 <_sk_load_4444_dst_aarch64+0xd0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffb21 // b.ne 2ff4 <_sk_load_4444_dst_aarch64+0x24> // b.any
+ .long 0x54fffb21 // b.ne 314c <_sk_load_4444_dst_aarch64+0x24> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d405124 // ld1 {v4.h}[2], [x9]
@@ -3574,10 +3665,10 @@ _sk_load_4444_dst_aarch64:
.long 0x0e4018a5 // uzp1 v5.4h, v5.4h, v0.4h
.long 0x2e052084 // ext v4.8b, v4.8b, v5.8b, #4
.long 0x2e042084 // ext v4.8b, v4.8b, v4.8b, #4
- .long 0x17ffffce // b 2ff4 <_sk_load_4444_dst_aarch64+0x24>
+ .long 0x17ffffce // b 314c <_sk_load_4444_dst_aarch64+0x24>
.long 0x0e020fe4 // dup v4.4h, wzr
.long 0x0d404104 // ld1 {v4.h}[0], [x8]
- .long 0x17ffffcb // b 2ff4 <_sk_load_4444_dst_aarch64+0x24>
+ .long 0x17ffffcb // b 314c <_sk_load_4444_dst_aarch64+0x24>
HIDDEN _sk_gather_4444_aarch64
.globl _sk_gather_4444_aarch64
@@ -3660,24 +3751,24 @@ _sk_store_4444_aarch64:
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
.long 0x8b897d08 // add x8, x8, x9, asr #31
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 3200 <_sk_store_4444_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 3358 <_sk_store_4444_aarch64+0x70>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 322c <_sk_store_4444_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 3384 <_sk_store_4444_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 3224 <_sk_store_4444_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 337c <_sk_store_4444_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 31f4 <_sk_store_4444_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 334c <_sk_store_4444_aarch64+0x64> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 31f4 <_sk_store_4444_aarch64+0x64>
+ .long 0x17fffff1 // b 334c <_sk_store_4444_aarch64+0x64>
HIDDEN _sk_load_8888_aarch64
.globl _sk_load_8888_aarch64
@@ -3690,7 +3781,7 @@ _sk_load_8888_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 32ac <_sk_load_8888_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 3404 <_sk_load_8888_aarch64+0x78>
.long 0x3dc00100 // ldr q0, [x8]
.long 0x6f00e621 // movi v1.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3715,22 +3806,22 @@ _sk_load_8888_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 32e8 <_sk_load_8888_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 3440 <_sk_load_8888_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e400 // movi v0.2d, #0x0
- .long 0x540000c0 // b.eq 32d8 <_sk_load_8888_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 3430 <_sk_load_8888_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 3258 <_sk_load_8888_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 33b0 <_sk_load_8888_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x4d408120 // ld1 {v0.s}[2], [x9]
.long 0xfd400101 // ldr d1, [x8]
.long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8
.long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8
- .long 0x17ffffdd // b 3258 <_sk_load_8888_aarch64+0x24>
+ .long 0x17ffffdd // b 33b0 <_sk_load_8888_aarch64+0x24>
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x0d408100 // ld1 {v0.s}[0], [x8]
- .long 0x17ffffda // b 3258 <_sk_load_8888_aarch64+0x24>
+ .long 0x17ffffda // b 33b0 <_sk_load_8888_aarch64+0x24>
HIDDEN _sk_load_8888_dst_aarch64
.globl _sk_load_8888_dst_aarch64
@@ -3743,7 +3834,7 @@ _sk_load_8888_dst_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 336c <_sk_load_8888_dst_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 34c4 <_sk_load_8888_dst_aarch64+0x78>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3768,22 +3859,22 @@ _sk_load_8888_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 33a8 <_sk_load_8888_dst_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 3500 <_sk_load_8888_dst_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 3398 <_sk_load_8888_dst_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 34f0 <_sk_load_8888_dst_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 3318 <_sk_load_8888_dst_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 3470 <_sk_load_8888_dst_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffdd // b 3318 <_sk_load_8888_dst_aarch64+0x24>
+ .long 0x17ffffdd // b 3470 <_sk_load_8888_dst_aarch64+0x24>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffda // b 3318 <_sk_load_8888_dst_aarch64+0x24>
+ .long 0x17ffffda // b 3470 <_sk_load_8888_dst_aarch64+0x24>
HIDDEN _sk_gather_8888_aarch64
.globl _sk_gather_8888_aarch64
@@ -3855,24 +3946,24 @@ _sk_store_8888_aarch64:
.long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b
.long 0x8b897908 // add x8, x8, x9, asr #30
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
- .long 0xb50000a4 // cbnz x4, 34bc <_sk_store_8888_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 3614 <_sk_store_8888_aarch64+0x70>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 34e8 <_sk_store_8888_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 3640 <_sk_store_8888_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 34e0 <_sk_store_8888_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 3638 <_sk_store_8888_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 34b0 <_sk_store_8888_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 3608 <_sk_store_8888_aarch64+0x64> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17fffff3 // b 34b0 <_sk_store_8888_aarch64+0x64>
+ .long 0x17fffff3 // b 3608 <_sk_store_8888_aarch64+0x64>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17fffff1 // b 34b0 <_sk_store_8888_aarch64+0x64>
+ .long 0x17fffff1 // b 3608 <_sk_store_8888_aarch64+0x64>
HIDDEN _sk_load_bgra_aarch64
.globl _sk_load_bgra_aarch64
@@ -3885,7 +3976,7 @@ _sk_load_bgra_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 3568 <_sk_load_bgra_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 36c0 <_sk_load_bgra_aarch64+0x78>
.long 0x3dc00100 // ldr q0, [x8]
.long 0x6f00e621 // movi v1.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3910,22 +4001,22 @@ _sk_load_bgra_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 35a4 <_sk_load_bgra_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 36fc <_sk_load_bgra_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e400 // movi v0.2d, #0x0
- .long 0x540000c0 // b.eq 3594 <_sk_load_bgra_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 36ec <_sk_load_bgra_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 3514 <_sk_load_bgra_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 366c <_sk_load_bgra_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x4d408120 // ld1 {v0.s}[2], [x9]
.long 0xfd400101 // ldr d1, [x8]
.long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8
.long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8
- .long 0x17ffffdd // b 3514 <_sk_load_bgra_aarch64+0x24>
+ .long 0x17ffffdd // b 366c <_sk_load_bgra_aarch64+0x24>
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x0d408100 // ld1 {v0.s}[0], [x8]
- .long 0x17ffffda // b 3514 <_sk_load_bgra_aarch64+0x24>
+ .long 0x17ffffda // b 366c <_sk_load_bgra_aarch64+0x24>
HIDDEN _sk_load_bgra_dst_aarch64
.globl _sk_load_bgra_dst_aarch64
@@ -3938,7 +4029,7 @@ _sk_load_bgra_dst_aarch64:
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897908 // add x8, x8, x9, asr #30
- .long 0xb50002e4 // cbnz x4, 3628 <_sk_load_bgra_dst_aarch64+0x78>
+ .long 0xb50002e4 // cbnz x4, 3780 <_sk_load_bgra_dst_aarch64+0x78>
.long 0x3dc00104 // ldr q4, [x8]
.long 0x6f00e625 // movi v5.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3963,22 +4054,22 @@ _sk_load_bgra_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x540001a0 // b.eq 3664 <_sk_load_bgra_dst_aarch64+0xb4> // b.none
+ .long 0x540001a0 // b.eq 37bc <_sk_load_bgra_dst_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x540000c0 // b.eq 3654 <_sk_load_bgra_dst_aarch64+0xa4> // b.none
+ .long 0x540000c0 // b.eq 37ac <_sk_load_bgra_dst_aarch64+0xa4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 35d4 <_sk_load_bgra_dst_aarch64+0x24> // b.any
+ .long 0x54fffc81 // b.ne 372c <_sk_load_bgra_dst_aarch64+0x24> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
.long 0xfd400105 // ldr d5, [x8]
.long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
.long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
- .long 0x17ffffdd // b 35d4 <_sk_load_bgra_dst_aarch64+0x24>
+ .long 0x17ffffdd // b 372c <_sk_load_bgra_dst_aarch64+0x24>
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x0d408104 // ld1 {v4.s}[0], [x8]
- .long 0x17ffffda // b 35d4 <_sk_load_bgra_dst_aarch64+0x24>
+ .long 0x17ffffda // b 372c <_sk_load_bgra_dst_aarch64+0x24>
HIDDEN _sk_gather_bgra_aarch64
.globl _sk_gather_bgra_aarch64
@@ -4050,24 +4141,24 @@ _sk_store_bgra_aarch64:
.long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b
.long 0x8b897908 // add x8, x8, x9, asr #30
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
- .long 0xb50000a4 // cbnz x4, 3778 <_sk_store_bgra_aarch64+0x70>
+ .long 0xb50000a4 // cbnz x4, 38d0 <_sk_store_bgra_aarch64+0x70>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 37a4 <_sk_store_bgra_aarch64+0x9c> // b.none
+ .long 0x54000120 // b.eq 38fc <_sk_store_bgra_aarch64+0x9c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 379c <_sk_store_bgra_aarch64+0x94> // b.none
+ .long 0x540000a0 // b.eq 38f4 <_sk_store_bgra_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 376c <_sk_store_bgra_aarch64+0x64> // b.any
+ .long 0x54fffee1 // b.ne 38c4 <_sk_store_bgra_aarch64+0x64> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
.long 0xfd000110 // str d16, [x8]
- .long 0x17fffff3 // b 376c <_sk_store_bgra_aarch64+0x64>
+ .long 0x17fffff3 // b 38c4 <_sk_store_bgra_aarch64+0x64>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17fffff1 // b 376c <_sk_store_bgra_aarch64+0x64>
+ .long 0x17fffff1 // b 38c4 <_sk_store_bgra_aarch64+0x64>
HIDDEN _sk_load_f16_aarch64
.globl _sk_load_f16_aarch64
@@ -4080,7 +4171,7 @@ _sk_load_f16_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb5000124 // cbnz x4, 37ec <_sk_load_f16_aarch64+0x40>
+ .long 0xb5000124 // cbnz x4, 3944 <_sk_load_f16_aarch64+0x40>
.long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x0e217a00 // fcvtl v0.4s, v16.4h
@@ -4091,14 +4182,14 @@ _sk_load_f16_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffee0 // b.eq 37d0 <_sk_load_f16_aarch64+0x24> // b.none
+ .long 0x54fffee0 // b.eq 3928 <_sk_load_f16_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffe63 // b.cc 37d0 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffe63 // b.cc 3928 <_sk_load_f16_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff0 // b 37d0 <_sk_load_f16_aarch64+0x24>
+ .long 0x17fffff0 // b 3928 <_sk_load_f16_aarch64+0x24>
HIDDEN _sk_load_f16_dst_aarch64
.globl _sk_load_f16_dst_aarch64
@@ -4111,7 +4202,7 @@ _sk_load_f16_dst_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb5000124 // cbnz x4, 3854 <_sk_load_f16_dst_aarch64+0x40>
+ .long 0xb5000124 // cbnz x4, 39ac <_sk_load_f16_dst_aarch64+0x40>
.long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x0e217a04 // fcvtl v4.4s, v16.4h
@@ -4122,14 +4213,14 @@ _sk_load_f16_dst_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffee0 // b.eq 3838 <_sk_load_f16_dst_aarch64+0x24> // b.none
+ .long 0x54fffee0 // b.eq 3990 <_sk_load_f16_dst_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffe63 // b.cc 3838 <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffe63 // b.cc 3990 <_sk_load_f16_dst_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff0 // b 3838 <_sk_load_f16_dst_aarch64+0x24>
+ .long 0x17fffff0 // b 3990 <_sk_load_f16_dst_aarch64+0x24>
HIDDEN _sk_gather_f16_aarch64
.globl _sk_gather_f16_aarch64
@@ -4187,21 +4278,21 @@ _sk_store_f16_aarch64:
.long 0x8b29cd08 // add x8, x8, w9, sxtw #3
.long 0xd3607c49 // lsl x9, x2, #32
.long 0x8b897508 // add x8, x8, x9, asr #29
- .long 0xb50000a4 // cbnz x4, 394c <_sk_store_f16_aarch64+0x40>
+ .long 0xb50000a4 // cbnz x4, 3aa4 <_sk_store_f16_aarch64+0x40>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3940 <_sk_store_f16_aarch64+0x34> // b.none
+ .long 0x54ffff60 // b.eq 3a98 <_sk_store_f16_aarch64+0x34> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3940 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3a98 <_sk_store_f16_aarch64+0x34> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3940 <_sk_store_f16_aarch64+0x34>
+ .long 0x17fffff4 // b 3a98 <_sk_store_f16_aarch64+0x34>
HIDDEN _sk_load_u16_be_aarch64
.globl _sk_load_u16_be_aarch64
@@ -4214,7 +4305,7 @@ _sk_load_u16_be_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0x8b2ac508 // add x8, x8, w10, sxtw #1
- .long 0xb5000404 // cbnz x4, 3a10 <_sk_load_u16_be_aarch64+0x9c>
+ .long 0xb5000404 // cbnz x4, 3b68 <_sk_load_u16_be_aarch64+0x9c>
.long 0x0c400500 // ld4 {v0.4h-v3.4h}, [x8]
.long 0x0f185410 // shl v16.4h, v0.4h, #8
.long 0x2f180411 // ushr v17.4h, v0.4h, #8
@@ -4248,14 +4339,14 @@ _sk_load_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606100 // ld4 {v0.h-v3.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc00 // b.eq 3998 <_sk_load_u16_be_aarch64+0x24> // b.none
+ .long 0x54fffc00 // b.eq 3af0 <_sk_load_u16_be_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606920 // ld4 {v0.h-v3.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffb83 // b.cc 3998 <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffb83 // b.cc 3af0 <_sk_load_u16_be_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607100 // ld4 {v0.h-v3.h}[2], [x8]
- .long 0x17ffffd9 // b 3998 <_sk_load_u16_be_aarch64+0x24>
+ .long 0x17ffffd9 // b 3af0 <_sk_load_u16_be_aarch64+0x24>
HIDDEN _sk_load_rgb_u16_be_aarch64
.globl _sk_load_rgb_u16_be_aarch64
@@ -4269,7 +4360,7 @@ _sk_load_rgb_u16_be_aarch64:
.long 0x0b020449 // add w9, w2, w2, lsl #1
.long 0xd3607d29 // lsl x9, x9, #32
.long 0x8b897d08 // add x8, x8, x9, asr #31
- .long 0xb5000384 // cbnz x4, 3ac8 <_sk_load_rgb_u16_be_aarch64+0x90>
+ .long 0xb5000384 // cbnz x4, 3c20 <_sk_load_rgb_u16_be_aarch64+0x90>
.long 0x0c404500 // ld3 {v0.4h-v2.4h}, [x8]
.long 0x0f185403 // shl v3.4h, v0.4h, #8
.long 0x2f180410 // ushr v16.4h, v0.4h, #8
@@ -4299,14 +4390,14 @@ _sk_load_rgb_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d406100 // ld3 {v0.h-v2.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc80 // b.eq 3a60 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none
+ .long 0x54fffc80 // b.eq 3bb8 <_sk_load_rgb_u16_be_aarch64+0x28> // b.none
.long 0x91001909 // add x9, x8, #0x6
.long 0x0d406920 // ld3 {v0.h-v2.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffc03 // b.cc 3a60 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last
+ .long 0x54fffc03 // b.cc 3bb8 <_sk_load_rgb_u16_be_aarch64+0x28> // b.lo, b.ul, b.last
.long 0x91003108 // add x8, x8, #0xc
.long 0x0d407100 // ld3 {v0.h-v2.h}[2], [x8]
- .long 0x17ffffdd // b 3a60 <_sk_load_rgb_u16_be_aarch64+0x28>
+ .long 0x17ffffdd // b 3bb8 <_sk_load_rgb_u16_be_aarch64+0x28>
HIDDEN _sk_store_u16_be_aarch64
.globl _sk_store_u16_be_aarch64
@@ -4346,21 +4437,21 @@ _sk_store_u16_be_aarch64:
.long 0x8b28c548 // add x8, x10, w8, sxtw #1
.long 0x8b29c508 // add x8, x8, w9, sxtw #1
.long 0x0eb41eb3 // orr v19.8b, v21.8b, v20.8b
- .long 0xb50000a4 // cbnz x4, 3b8c <_sk_store_u16_be_aarch64+0x9c>
+ .long 0xb50000a4 // cbnz x4, 3ce4 <_sk_store_u16_be_aarch64+0x9c>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3b80 <_sk_store_u16_be_aarch64+0x90> // b.none
+ .long 0x54ffff60 // b.eq 3cd8 <_sk_store_u16_be_aarch64+0x90> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3b80 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3cd8 <_sk_store_u16_be_aarch64+0x90> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3b80 <_sk_store_u16_be_aarch64+0x90>
+ .long 0x17fffff4 // b 3cd8 <_sk_store_u16_be_aarch64+0x90>
HIDDEN _sk_load_f32_aarch64
.globl _sk_load_f32_aarch64
@@ -4373,21 +4464,21 @@ _sk_load_f32_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3be4 <_sk_load_f32_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3d3c <_sk_load_f32_aarch64+0x30>
.long 0x4c400900 // ld4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x0d60a100 // ld4 {v0.s-v3.s}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54ffff60 // b.eq 3bd8 <_sk_load_f32_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3d30 <_sk_load_f32_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0x0d60b120 // ld4 {v0.s-v3.s}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffee3 // b.cc 3bd8 <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3d30 <_sk_load_f32_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d60a100 // ld4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 3bd8 <_sk_load_f32_aarch64+0x24>
+ .long 0x17fffff4 // b 3d30 <_sk_load_f32_aarch64+0x24>
HIDDEN _sk_load_f32_dst_aarch64
.globl _sk_load_f32_dst_aarch64
@@ -4400,21 +4491,21 @@ _sk_load_f32_dst_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3c3c <_sk_load_f32_dst_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3d94 <_sk_load_f32_dst_aarch64+0x30>
.long 0x4c400904 // ld4 {v4.4s-v7.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x0d60a104 // ld4 {v4.s-v7.s}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54ffff60 // b.eq 3c30 <_sk_load_f32_dst_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3d88 <_sk_load_f32_dst_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0x0d60b124 // ld4 {v4.s-v7.s}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffee3 // b.cc 3c30 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3d88 <_sk_load_f32_dst_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d60a104 // ld4 {v4.s-v7.s}[2], [x8]
- .long 0x17fffff4 // b 3c30 <_sk_load_f32_dst_aarch64+0x24>
+ .long 0x17fffff4 // b 3d88 <_sk_load_f32_dst_aarch64+0x24>
HIDDEN _sk_store_f32_aarch64
.globl _sk_store_f32_aarch64
@@ -4427,21 +4518,21 @@ _sk_store_f32_aarch64:
.long 0x1b037d29 // mul w9, w9, w3
.long 0x8b29c908 // add x8, x8, w9, sxtw #2
.long 0x8b2ac908 // add x8, x8, w10, sxtw #2
- .long 0xb50000a4 // cbnz x4, 3c94 <_sk_store_f32_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3dec <_sk_store_f32_aarch64+0x30>
.long 0x4c000900 // st4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d20a100 // st4 {v0.s-v3.s}[0], [x8]
- .long 0x54ffff60 // b.eq 3c88 <_sk_store_f32_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3de0 <_sk_store_f32_aarch64+0x24> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d20b120 // st4 {v0.s-v3.s}[1], [x9]
- .long 0x54fffee3 // b.cc 3c88 <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3de0 <_sk_store_f32_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d20a100 // st4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 3c88 <_sk_store_f32_aarch64+0x24>
+ .long 0x17fffff4 // b 3de0 <_sk_store_f32_aarch64+0x24>
HIDDEN _sk_clamp_x_aarch64
.globl _sk_clamp_x_aarch64
@@ -4934,7 +5025,7 @@ _sk_gradient_aarch64:
.long 0x6f00e411 // movi v17.2d, #0x0
.long 0xf9400109 // ldr x9, [x8]
.long 0xf100093f // cmp x9, #0x2
- .long 0x540001c3 // b.cc 4314 <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
+ .long 0x540001c3 // b.cc 446c <_sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
.long 0xf940250a // ldr x10, [x8, #72]
.long 0xd1000529 // sub x9, x9, #0x1
.long 0x6f00e401 // movi v1.2d, #0x0
@@ -4945,7 +5036,7 @@ _sk_gradient_aarch64:
.long 0x6e23e403 // fcmge v3.4s, v0.4s, v3.4s
.long 0x4e221c63 // and v3.16b, v3.16b, v2.16b
.long 0x4ea18461 // add v1.4s, v3.4s, v1.4s
- .long 0xb5ffff69 // cbnz x9, 42f4 <_sk_gradient_aarch64+0x38>
+ .long 0xb5ffff69 // cbnz x9, 444c <_sk_gradient_aarch64+0x38>
.long 0x6f20a431 // uxtl2 v17.2d, v1.4s
.long 0x2f20a421 // uxtl v1.2d, v1.2s
.long 0xa940b10a // ldp x10, x12, [x8, #8]
@@ -9472,6 +9563,187 @@ _sk_parametric_a_vfp4:
.long 0x3fdce9a3 // .word 0x3fdce9a3
.long 0x41ddd2fe // .word 0x41ddd2fe
+HIDDEN _sk_gamma_vfp4
+.globl _sk_gamma_vfp4
+FUNCTION(_sk_gamma_vfp4)
+_sk_gamma_vfp4:
+ .long 0xe92d0030 // push {r4, r5}
+ .long 0xed2d8b10 // vpush {d8-d15}
+ .long 0xe24dd038 // sub sp, sp, #56
+ .long 0xf2c70d5f // vmov.i32 q8, #8388607
+ .long 0xe28d4020 // add r4, sp, #32
+ .long 0xed9fcaa7 // vldr s24, [pc, #668]
+ .long 0xf3fb2644 // vcvt.f32.s32 q9, q2
+ .long 0xec846b04 // vstmia r4, {d6-d7}
+ .long 0xe28f2e22 // add r2, pc, #544
+ .long 0xf2440170 // vand q8, q2, q8
+ .long 0xe28d4010 // add r4, sp, #16
+ .long 0xf2c3075f // vorr.i32 q8, #1056964608
+ .long 0xf422aacf // vld1.64 {d10-d11}, [r2]
+ .long 0xf2c34654 // vmov.i32 q10, #872415232
+ .long 0xe28f2f86 // add r2, pc, #536
+ .long 0xf2006dca // vadd.f32 q3, q8, q5
+ .long 0xf462cacf // vld1.64 {d28-d29}, [r2]
+ .long 0xe28f2f87 // add r2, pc, #540
+ .long 0xf3422df4 // vmul.f32 q9, q9, q10
+ .long 0xf462aacf // vld1.64 {d26-d27}, [r2]
+ .long 0xf3400dfc // vmul.f32 q8, q8, q14
+ .long 0xe5913000 // ldr r3, [r1]
+ .long 0xf2c76d5f // vmov.i32 q11, #8388607
+ .long 0xe5912004 // ldr r2, [r1, #4]
+ .long 0xf280e050 // vmov.i32 q7, #0
+ .long 0xeecc5a27 // vdiv.f32 s11, s24, s15
+ .long 0xe2811008 // add r1, r1, #8
+ .long 0xf4e3ecbf // vld1.32 {d30[]-d31[]}, [r3 :32]
+ .long 0xe28f3c02 // add r3, pc, #512
+ .long 0xf2422dea // vadd.f32 q9, q9, q13
+ .long 0xee8c5a07 // vdiv.f32 s10, s24, s14
+ .long 0xeecc4a26 // vdiv.f32 s9, s24, s13
+ .long 0xee8c4a06 // vdiv.f32 s8, s24, s12
+ .long 0xf2620de0 // vsub.f32 q8, q9, q8
+ .long 0xf4638acf // vld1.64 {d24-d25}, [r3]
+ .long 0xed9f6a8a // vldr s12, [pc, #552]
+ .long 0xeeb07a4c // vmov.f32 s14, s24
+ .long 0xf2600dc4 // vsub.f32 q8, q8, q2
+ .long 0xf2804050 // vmov.i32 q2, #0
+ .long 0xf3402dfe // vmul.f32 q9, q8, q15
+ .long 0xf3fb0762 // vcvt.s32.f32 q8, q9
+ .long 0xf3fb0660 // vcvt.f32.s32 q8, q8
+ .long 0xf3604ee2 // vcgt.f32 q10, q8, q9
+ .long 0xf35841d4 // vbsl q10, q12, q2
+ .long 0xf2600de4 // vsub.f32 q8, q8, q10
+ .long 0xf2620de0 // vsub.f32 q8, q9, q8
+ .long 0xecc40b04 // vstmia r4, {d16-d17}
+ .long 0xe28f3f71 // add r3, pc, #452
+ .long 0xf4634acf // vld1.64 {d20-d21}, [r3]
+ .long 0xf2248de0 // vsub.f32 q4, q10, q8
+ .long 0xf2420176 // vand q8, q1, q11
+ .long 0xf2c3075f // vorr.i32 q8, #1056964608
+ .long 0xf3fb6642 // vcvt.f32.s32 q11, q1
+ .long 0xeec65a29 // vdiv.f32 s11, s12, s19
+ .long 0xee865a09 // vdiv.f32 s10, s12, s18
+ .long 0xec8d8b04 // vstmia sp, {d8-d9}
+ .long 0xf2832654 // vmov.i32 q1, #872415232
+ .long 0xe28f3f6b // add r3, pc, #428
+ .long 0xeec64a28 // vdiv.f32 s9, s12, s17
+ .long 0xf2008dca // vadd.f32 q4, q8, q5
+ .long 0xf3466dd2 // vmul.f32 q11, q11, q1
+ .long 0xf3400dfc // vmul.f32 q8, q8, q14
+ .long 0xeec7da29 // vdiv.f32 s27, s14, s19
+ .long 0xee87da09 // vdiv.f32 s26, s14, s18
+ .long 0xeec7ca28 // vdiv.f32 s25, s14, s17
+ .long 0xee87ca08 // vdiv.f32 s24, s14, s16
+ .long 0xf2466dea // vadd.f32 q11, q11, q13
+ .long 0xf2660de0 // vsub.f32 q8, q11, q8
+ .long 0xf2600dcc // vsub.f32 q8, q8, q6
+ .long 0xf3406dfe // vmul.f32 q11, q8, q15
+ .long 0xf3fb0766 // vcvt.s32.f32 q8, q11
+ .long 0xf3fb0660 // vcvt.f32.s32 q8, q8
+ .long 0xf3202ee6 // vcgt.f32 q1, q8, q11
+ .long 0xf31821de // vbsl q1, q12, q7
+ .long 0xf220e150 // vorr q7, q0, q0
+ .long 0xf2600dc2 // vsub.f32 q8, q8, q1
+ .long 0xf2870d5f // vmov.i32 q0, #8388607
+ .long 0xf20e0150 // vand q0, q7, q0
+ .long 0xf226cde0 // vsub.f32 q6, q11, q8
+ .long 0xf4630acf // vld1.64 {d16-d17}, [r3]
+ .long 0xe28f3e16 // add r3, pc, #352
+ .long 0xf283075f // vorr.i32 q0, #1056964608
+ .long 0xf200ad4a // vadd.f32 q5, q0, q5
+ .long 0xf2248dcc // vsub.f32 q4, q10, q6
+ .long 0xf30ccd70 // vmul.f32 q6, q6, q8
+ .long 0xf340cd7c // vmul.f32 q14, q0, q14
+ .long 0xf3bb064e // vcvt.f32.s32 q0, q7
+ .long 0xeec63a29 // vdiv.f32 s7, s12, s19
+ .long 0xee863a09 // vdiv.f32 s6, s12, s18
+ .long 0xeec62a28 // vdiv.f32 s5, s12, s17
+ .long 0xee862a08 // vdiv.f32 s4, s12, s16
+ .long 0xf4238acf // vld1.64 {d8-d9}, [r3]
+ .long 0xe28d3010 // add r3, sp, #16
+ .long 0xf2466dc8 // vadd.f32 q11, q11, q4
+ .long 0xf2422dc8 // vadd.f32 q9, q9, q4
+ .long 0xf2666dcc // vsub.f32 q11, q11, q6
+ .long 0xeec7da2b // vdiv.f32 s27, s14, s23
+ .long 0xee87da0b // vdiv.f32 s26, s14, s22
+ .long 0xeec7ca2a // vdiv.f32 s25, s14, s21
+ .long 0xee87ca0a // vdiv.f32 s24, s14, s20
+ .long 0xf283a654 // vmov.i32 q5, #872415232
+ .long 0xf3000d5a // vmul.f32 q0, q0, q5
+ .long 0xf240ad6a // vadd.f32 q13, q0, q13
+ .long 0xf2800050 // vmov.i32 q0, #0
+ .long 0xf26aadec // vsub.f32 q13, q13, q14
+ .long 0xf26aadcc // vsub.f32 q13, q13, q6
+ .long 0xf34aadfe // vmul.f32 q13, q13, q15
+ .long 0xf3fbc76a // vcvt.s32.f32 q14, q13
+ .long 0xf3fbc66c // vcvt.f32.s32 q14, q14
+ .long 0xf36ceeea // vcgt.f32 q15, q14, q13
+ .long 0xf358e1d0 // vbsl q15, q12, q0
+ .long 0xf26c8dee // vsub.f32 q12, q14, q15
+ .long 0xf26a8de8 // vsub.f32 q12, q13, q12
+ .long 0xf2240de8 // vsub.f32 q0, q10, q12
+ .long 0xf3484df0 // vmul.f32 q10, q12, q8
+ .long 0xf24a8dc8 // vadd.f32 q12, q13, q4
+ .long 0xf2c3a65f // vmov.i32 q13, #1056964608
+ .long 0xeec6da21 // vdiv.f32 s27, s12, s3
+ .long 0xee86da01 // vdiv.f32 s26, s12, s2
+ .long 0xeec6ca20 // vdiv.f32 s25, s12, s1
+ .long 0xee86ca00 // vdiv.f32 s24, s12, s0
+ .long 0xec9d0b04 // vldmia sp, {d0-d1}
+ .long 0xf2684de4 // vsub.f32 q10, q12, q10
+ .long 0xee864a00 // vdiv.f32 s8, s12, s0
+ .long 0xecd38b04 // vldmia r3, {d24-d25}
+ .long 0xe28d3020 // add r3, sp, #32
+ .long 0xf3480df0 // vmul.f32 q8, q12, q8
+ .long 0xec936b04 // vldmia r3, {d6-d7}
+ .long 0xf2c3865f // vmov.i32 q12, #1056964608
+ .long 0xf2620de0 // vsub.f32 q8, q9, q8
+ .long 0xf2442dcc // vadd.f32 q9, q10, q6
+ .long 0xf2464dc2 // vadd.f32 q10, q11, q1
+ .long 0xf2400dc4 // vadd.f32 q8, q8, q2
+ .long 0xf2c4665b // vmov.i32 q11, #1258291200
+ .long 0xf242acf6 // vfma.f32 q13, q9, q11
+ .long 0xf2c3265f // vmov.i32 q9, #1056964608
+ .long 0xf2442cf6 // vfma.f32 q9, q10, q11
+ .long 0xf2408cf6 // vfma.f32 q12, q8, q11
+ .long 0xf3bb07ea // vcvt.u32.f32 q0, q13
+ .long 0xf3bb27e2 // vcvt.u32.f32 q1, q9
+ .long 0xf3bb47e8 // vcvt.u32.f32 q2, q12
+ .long 0xe28dd038 // add sp, sp, #56
+ .long 0xecbd8b10 // vpop {d8-d15}
+ .long 0xe8bd0030 // pop {r4, r5}
+ .long 0xe12fff12 // bx r2
+ .long 0xe320f000 // nop {0}
+ .long 0x3eb444f9 // .word 0x3eb444f9
+ .long 0x3eb444f9 // .word 0x3eb444f9
+ .long 0x3eb444f9 // .word 0x3eb444f9
+ .long 0x3eb444f9 // .word 0x3eb444f9
+ .long 0x3fbfbf75 // .word 0x3fbfbf75
+ .long 0x3fbfbf75 // .word 0x3fbfbf75
+ .long 0x3fbfbf75 // .word 0x3fbfbf75
+ .long 0x3fbfbf75 // .word 0x3fbfbf75
+ .long 0xc2f87377 // .word 0xc2f87377
+ .long 0xc2f87377 // .word 0xc2f87377
+ .long 0xc2f87377 // .word 0xc2f87377
+ .long 0xc2f87377 // .word 0xc2f87377
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x3f800000 // .word 0x3f800000
+ .long 0x409af5f8 // .word 0x409af5f8
+ .long 0x409af5f8 // .word 0x409af5f8
+ .long 0x409af5f8 // .word 0x409af5f8
+ .long 0x409af5f8 // .word 0x409af5f8
+ .long 0x3fbebc8d // .word 0x3fbebc8d
+ .long 0x3fbebc8d // .word 0x3fbebc8d
+ .long 0x3fbebc8d // .word 0x3fbebc8d
+ .long 0x3fbebc8d // .word 0x3fbebc8d
+ .long 0x42f28c51 // .word 0x42f28c51
+ .long 0x42f28c51 // .word 0x42f28c51
+ .long 0x42f28c51 // .word 0x42f28c51
+ .long 0x42f28c51 // .word 0x42f28c51
+ .long 0x3fdce9a3 // .word 0x3fdce9a3
+ .long 0x41ddd2fe // .word 0x41ddd2fe
+
HIDDEN _sk_lab_to_xyz_vfp4
.globl _sk_lab_to_xyz_vfp4
FUNCTION(_sk_lab_to_xyz_vfp4)
@@ -9589,7 +9861,7 @@ _sk_load_a8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000012 // bne 3968 <sk_load_a8_vfp4+0x78>
+ .long 0x1a000012 // bne 3c28 <sk_load_a8_vfp4+0x78>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -9611,12 +9883,12 @@ _sk_load_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 39c0 <sk_load_a8_vfp4+0xd0>
+ .long 0x0a000012 // beq 3c80 <sk_load_a8_vfp4+0xd0>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3998 <sk_load_a8_vfp4+0xa8>
+ .long 0x0a000005 // beq 3c58 <sk_load_a8_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe9 // bne 3930 <sk_load_a8_vfp4+0x40>
+ .long 0x1affffe9 // bne 3bf0 <sk_load_a8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -9630,12 +9902,12 @@ _sk_load_a8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdb // b 3930 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffdb // b 3bf0 <sk_load_a8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd6 // b 3930 <sk_load_a8_vfp4+0x40>
+ .long 0xeaffffd6 // b 3bf0 <sk_load_a8_vfp4+0x40>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -9664,7 +9936,7 @@ _sk_load_a8_dst_vfp4:
.long 0xf4430aef // vst1.64 {d16-d17}, [r3 :128]
.long 0xe082300c // add r3, r2, ip
.long 0xe280c040 // add ip, r0, #64
- .long 0x1a000011 // bne 3a7c <sk_load_a8_dst_vfp4+0x94>
+ .long 0x1a000011 // bne 3d3c <sk_load_a8_dst_vfp4+0x94>
.long 0xe5932000 // ldr r2, [r3]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -9685,12 +9957,12 @@ _sk_load_a8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe20e2003 // and r2, lr, #3
.long 0xe3520001 // cmp r2, #1
- .long 0x0a000012 // beq 3ad4 <sk_load_a8_dst_vfp4+0xec>
+ .long 0x0a000012 // beq 3d94 <sk_load_a8_dst_vfp4+0xec>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3520002 // cmp r2, #2
- .long 0x0a000005 // beq 3aac <sk_load_a8_dst_vfp4+0xc4>
+ .long 0x0a000005 // beq 3d6c <sk_load_a8_dst_vfp4+0xc4>
.long 0xe3520003 // cmp r2, #3
- .long 0x1affffea // bne 3a48 <sk_load_a8_dst_vfp4+0x60>
+ .long 0x1affffea // bne 3d08 <sk_load_a8_dst_vfp4+0x60>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d32002 // ldrb r2, [r3, #2]
.long 0xee805bb0 // vdup.16 d16, r5
@@ -9704,12 +9976,12 @@ _sk_load_a8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffdc // b 3a48 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffdc // b 3d08 <sk_load_a8_dst_vfp4+0x60>
.long 0xe5d32000 // ldrb r2, [r3]
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd7 // b 3a48 <sk_load_a8_dst_vfp4+0x60>
+ .long 0xeaffffd7 // b 3d08 <sk_load_a8_dst_vfp4+0x60>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -9775,7 +10047,7 @@ _sk_store_a8_vfp4:
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000005 // bne 3be0 <sk_store_a8_vfp4+0x58>
+ .long 0x1a000005 // bne 3ea0 <sk_store_a8_vfp4+0x58>
.long 0xf3f20121 // vuzp.8 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -9784,21 +10056,21 @@ _sk_store_a8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000a // beq 3c18 <sk_store_a8_vfp4+0x90>
+ .long 0x0a00000a // beq 3ed8 <sk_store_a8_vfp4+0x90>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 3c04 <sk_store_a8_vfp4+0x7c>
+ .long 0x0a000003 // beq 3ec4 <sk_store_a8_vfp4+0x7c>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 3bd0 <sk_store_a8_vfp4+0x48>
+ .long 0x1afffff4 // bne 3e90 <sk_store_a8_vfp4+0x48>
.long 0xeeb03bb0 // vmov.u16 r3, d16[2]
.long 0xe5c23002 // strb r3, [r2, #2]
.long 0xee903bf0 // vmov.u16 r3, d16[1]
.long 0xee904bb0 // vmov.u16 r4, d16[0]
.long 0xe5c23001 // strb r3, [r2, #1]
.long 0xe5c24000 // strb r4, [r2]
- .long 0xeaffffed // b 3bd0 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffed // b 3e90 <sk_store_a8_vfp4+0x48>
.long 0xee903bb0 // vmov.u16 r3, d16[0]
.long 0xe5c23000 // strb r3, [r2]
- .long 0xeaffffea // b 3bd0 <sk_store_a8_vfp4+0x48>
+ .long 0xeaffffea // b 3e90 <sk_store_a8_vfp4+0x48>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -9819,7 +10091,7 @@ _sk_load_g8_vfp4:
.long 0xe5922004 // ldr r2, [r2, #4]
.long 0xe0224392 // mla r2, r2, r3, r4
.long 0xe082200e // add r2, r2, lr
- .long 0x1a000013 // bne 3cb4 <sk_load_g8_vfp4+0x7c>
+ .long 0x1a000013 // bne 3f74 <sk_load_g8_vfp4+0x7c>
.long 0xe5922000 // ldr r2, [r2]
.long 0xe58d2000 // str r2, [sp]
.long 0xe1a0200d // mov r2, sp
@@ -9842,12 +10114,12 @@ _sk_load_g8_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000012 // beq 3d0c <sk_load_g8_vfp4+0xd4>
+ .long 0x0a000012 // beq 3fcc <sk_load_g8_vfp4+0xd4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3ce4 <sk_load_g8_vfp4+0xac>
+ .long 0x0a000005 // beq 3fa4 <sk_load_g8_vfp4+0xac>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe8 // bne 3c78 <sk_load_g8_vfp4+0x40>
+ .long 0x1affffe8 // bne 3f38 <sk_load_g8_vfp4+0x40>
.long 0xe3a04000 // mov r4, #0
.long 0xe5d23002 // ldrb r3, [r2, #2]
.long 0xee804bb0 // vdup.16 d16, r4
@@ -9861,12 +10133,12 @@ _sk_load_g8_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffda // b 3c78 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffda // b 3f38 <sk_load_g8_vfp4+0x40>
.long 0xe3a03000 // mov r3, #0
.long 0xe5d22000 // ldrb r2, [r2]
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xee002bb0 // vmov.16 d16[0], r2
- .long 0xeaffffd5 // b 3c78 <sk_load_g8_vfp4+0x40>
+ .long 0xeaffffd5 // b 3f38 <sk_load_g8_vfp4+0x40>
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -9893,7 +10165,7 @@ _sk_load_g8_dst_vfp4:
.long 0xe0824003 // add r4, r2, r3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000015 // bne 3dd0 <sk_load_g8_dst_vfp4+0x90>
+ .long 0x1a000015 // bne 4090 <sk_load_g8_dst_vfp4+0x90>
.long 0xe5944000 // ldr r4, [r4]
.long 0xe58d4000 // str r4, [sp]
.long 0xe1a0400d // mov r4, sp
@@ -9918,12 +10190,12 @@ _sk_load_g8_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000012 // beq 3e28 <sk_load_g8_dst_vfp4+0xe8>
+ .long 0x0a000012 // beq 40e8 <sk_load_g8_dst_vfp4+0xe8>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 3e00 <sk_load_g8_dst_vfp4+0xc0>
+ .long 0x0a000005 // beq 40c0 <sk_load_g8_dst_vfp4+0xc0>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffe6 // bne 3d8c <sk_load_g8_dst_vfp4+0x4c>
+ .long 0x1affffe6 // bne 404c <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a06000 // mov r6, #0
.long 0xe5d45002 // ldrb r5, [r4, #2]
.long 0xee806bb0 // vdup.16 d16, r6
@@ -9937,12 +10209,12 @@ _sk_load_g8_dst_vfp4:
.long 0xf3f62124 // vuzp.16 d18, d20
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffd8 // b 3d8c <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd8 // b 404c <sk_load_g8_dst_vfp4+0x4c>
.long 0xe3a05000 // mov r5, #0
.long 0xe5d44000 // ldrb r4, [r4]
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xee004bb0 // vmov.16 d16[0], r4
- .long 0xeaffffd3 // b 3d8c <sk_load_g8_dst_vfp4+0x4c>
+ .long 0xeaffffd3 // b 404c <sk_load_g8_dst_vfp4+0x4c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10009,7 +10281,7 @@ _sk_load_565_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001b // bne 3f90 <sk_load_565_vfp4+0xa0>
+ .long 0x1a00001b // bne 4250 <sk_load_565_vfp4+0xa0>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a02e7e // mov r2, #2016
@@ -10040,12 +10312,12 @@ _sk_load_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 3fe4 <sk_load_565_vfp4+0xf4>
+ .long 0x0a000011 // beq 42a4 <sk_load_565_vfp4+0xf4>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 3fc0 <sk_load_565_vfp4+0xd0>
+ .long 0x0a000005 // beq 4280 <sk_load_565_vfp4+0xd0>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffdc // bne 3f24 <sk_load_565_vfp4+0x34>
+ .long 0x1affffdc // bne 41e4 <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -10058,11 +10330,11 @@ _sk_load_565_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcf // b 3f24 <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcf // b 41e4 <sk_load_565_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffcb // b 3f24 <sk_load_565_vfp4+0x34>
+ .long 0xeaffffcb // b 41e4 <sk_load_565_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -10099,7 +10371,7 @@ _sk_load_565_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001f // bne 40f4 <sk_load_565_dst_vfp4+0xbc>
+ .long 0x1a00001f // bne 43b4 <sk_load_565_dst_vfp4+0xbc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe3a04e7e // mov r4, #2016
@@ -10134,12 +10406,12 @@ _sk_load_565_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 4148 <sk_load_565_dst_vfp4+0x110>
+ .long 0x0a000011 // beq 4408 <sk_load_565_dst_vfp4+0x110>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4124 <sk_load_565_dst_vfp4+0xec>
+ .long 0x0a000005 // beq 43e4 <sk_load_565_dst_vfp4+0xec>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd8 // bne 4078 <sk_load_565_dst_vfp4+0x40>
+ .long 0x1affffd8 // bne 4338 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -10152,11 +10424,11 @@ _sk_load_565_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcb // b 4078 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffcb // b 4338 <sk_load_565_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc7 // b 4078 <sk_load_565_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 4338 <sk_load_565_dst_vfp4+0x40>
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
.long 0x37842108 // .word 0x37842108
@@ -10268,7 +10540,7 @@ _sk_store_565_vfp4:
.long 0xf26401f0 // vorr q8, q10, q8
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 4304 <sk_store_565_vfp4+0x84>
+ .long 0x1a000004 // bne 45c4 <sk_store_565_vfp4+0x84>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -10276,11 +10548,11 @@ _sk_store_565_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4344 <sk_store_565_vfp4+0xc4>
+ .long 0x0a00000c // beq 4604 <sk_store_565_vfp4+0xc4>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4328 <sk_store_565_vfp4+0xa8>
+ .long 0x0a000003 // beq 45e8 <sk_store_565_vfp4+0xa8>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 42f4 <sk_store_565_vfp4+0x74>
+ .long 0x1afffff4 // bne 45b4 <sk_store_565_vfp4+0x74>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -10289,9 +10561,9 @@ _sk_store_565_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 42f4 <sk_store_565_vfp4+0x74>
+ .long 0xeaffffeb // b 45b4 <sk_store_565_vfp4+0x74>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 42f4 <sk_store_565_vfp4+0x74>
+ .long 0xeaffffe9 // b 45b4 <sk_store_565_vfp4+0x74>
.long 0xe320f000 // nop {0}
.long 0x427c0000 // .word 0x427c0000
.long 0x427c0000 // .word 0x427c0000
@@ -10313,7 +10585,7 @@ _sk_load_4444_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082208e // add r2, r2, lr, lsl #1
- .long 0x1a00001e // bne 440c <sk_load_4444_vfp4+0xac>
+ .long 0x1a00001e // bne 46cc <sk_load_4444_vfp4+0xac>
.long 0xf462074f // vld1.16 {d16}, [r2]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f20d0 // add r2, pc, #208
@@ -10347,12 +10619,12 @@ _sk_load_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000011 // beq 4460 <sk_load_4444_vfp4+0x100>
+ .long 0x0a000011 // beq 4720 <sk_load_4444_vfp4+0x100>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 443c <sk_load_4444_vfp4+0xdc>
+ .long 0x0a000005 // beq 46fc <sk_load_4444_vfp4+0xdc>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffd9 // bne 4394 <sk_load_4444_vfp4+0x34>
+ .long 0x1affffd9 // bne 4654 <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xe2823004 // add r3, r2, #4
@@ -10365,11 +10637,11 @@ _sk_load_4444_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffcc // b 4394 <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffcc // b 4654 <sk_load_4444_vfp4+0x34>
.long 0xe3a03000 // mov r3, #0
.long 0xee803bb0 // vdup.16 d16, r3
.long 0xf4e2041f // vld1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffc8 // b 4394 <sk_load_4444_vfp4+0x34>
+ .long 0xeaffffc8 // b 4654 <sk_load_4444_vfp4+0x34>
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
.long 0x3b888889 // .word 0x3b888889
@@ -10405,7 +10677,7 @@ _sk_load_4444_dst_vfp4:
.long 0xe0824083 // add r4, r2, r3, lsl #1
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a000023 // bne 457c <sk_load_4444_dst_vfp4+0xcc>
+ .long 0x1a000023 // bne 483c <sk_load_4444_dst_vfp4+0xcc>
.long 0xf464074f // vld1.16 {d16}, [r4]
.long 0xf3d00a30 // vmovl.u16 q8, d16
.long 0xe28f40e4 // add r4, pc, #228
@@ -10444,12 +10716,12 @@ _sk_load_4444_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a000011 // beq 45d0 <sk_load_4444_dst_vfp4+0x120>
+ .long 0x0a000011 // beq 4890 <sk_load_4444_dst_vfp4+0x120>
.long 0xf2c00010 // vmov.i32 d16, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 45ac <sk_load_4444_dst_vfp4+0xfc>
+ .long 0x0a000005 // beq 486c <sk_load_4444_dst_vfp4+0xfc>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffd4 // bne 44f0 <sk_load_4444_dst_vfp4+0x40>
+ .long 0x1affffd4 // bne 47b0 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xe2845004 // add r5, r4, #4
@@ -10462,11 +10734,11 @@ _sk_load_4444_dst_vfp4:
.long 0xf3f62121 // vuzp.16 d18, d17
.long 0xf2f004a2 // vext.8 d16, d16, d18, #4
.long 0xf2f004a0 // vext.8 d16, d16, d16, #4
- .long 0xeaffffc7 // b 44f0 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc7 // b 47b0 <sk_load_4444_dst_vfp4+0x40>
.long 0xe3a05000 // mov r5, #0
.long 0xee805bb0 // vdup.16 d16, r5
.long 0xf4e4041f // vld1.16 {d16[0]}, [r4 :16]
- .long 0xeaffffc3 // b 44f0 <sk_load_4444_dst_vfp4+0x40>
+ .long 0xeaffffc3 // b 47b0 <sk_load_4444_dst_vfp4+0x40>
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
.long 0x37888889 // .word 0x37888889
@@ -10589,7 +10861,7 @@ _sk_store_4444_vfp4:
.long 0xf26001f6 // vorr q8, q8, q11
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf3f60220 // vmovn.i32 d16, q8
- .long 0x1a000004 // bne 47b8 <sk_store_4444_vfp4+0x90>
+ .long 0x1a000004 // bne 4a78 <sk_store_4444_vfp4+0x90>
.long 0xf442074f // vst1.16 {d16}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -10597,11 +10869,11 @@ _sk_store_4444_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 47f8 <sk_store_4444_vfp4+0xd0>
+ .long 0x0a00000c // beq 4ab8 <sk_store_4444_vfp4+0xd0>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 47dc <sk_store_4444_vfp4+0xb4>
+ .long 0x0a000003 // beq 4a9c <sk_store_4444_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 47a8 <sk_store_4444_vfp4+0x80>
+ .long 0x1afffff4 // bne 4a68 <sk_store_4444_vfp4+0x80>
.long 0xe2823004 // add r3, r2, #4
.long 0xf4c3049f // vst1.16 {d16[2]}, [r3 :16]
.long 0xee903bb0 // vmov.u16 r3, d16[0]
@@ -10610,9 +10882,9 @@ _sk_store_4444_vfp4:
.long 0xee204b90 // vmov.32 d16[1], r4
.long 0xf3f60121 // vuzp.16 d16, d17
.long 0xf4c2080f // vst1.32 {d16[0]}, [r2]
- .long 0xeaffffeb // b 47a8 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffeb // b 4a68 <sk_store_4444_vfp4+0x80>
.long 0xf4c2041f // vst1.16 {d16[0]}, [r2 :16]
- .long 0xeaffffe9 // b 47a8 <sk_store_4444_vfp4+0x80>
+ .long 0xeaffffe9 // b 4a68 <sk_store_4444_vfp4+0x80>
HIDDEN _sk_load_8888_vfp4
.globl _sk_load_8888_vfp4
@@ -10628,7 +10900,7 @@ _sk_load_8888_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 4884 <sk_load_8888_vfp4+0x84>
+ .long 0x1a000015 // bne 4b44 <sk_load_8888_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -10653,12 +10925,12 @@ _sk_load_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 48c4 <sk_load_8888_vfp4+0xc4>
+ .long 0x0a00000c // beq 4b84 <sk_load_8888_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 48b4 <sk_load_8888_vfp4+0xb4>
+ .long 0x0a000005 // beq 4b74 <sk_load_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4830 <sk_load_8888_vfp4+0x30>
+ .long 0x1affffe2 // bne 4af0 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -10666,11 +10938,11 @@ _sk_load_8888_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4830 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffda // b 4af0 <sk_load_8888_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4830 <sk_load_8888_vfp4+0x30>
+ .long 0xeaffffd6 // b 4af0 <sk_load_8888_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10694,7 +10966,7 @@ _sk_load_8888_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 498c <sk_load_8888_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 4c4c <sk_load_8888_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -10724,12 +10996,12 @@ _sk_load_8888_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 49cc <sk_load_8888_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 4c8c <sk_load_8888_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 49bc <sk_load_8888_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 4c7c <sk_load_8888_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 4924 <sk_load_8888_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 4be4 <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -10737,11 +11009,11 @@ _sk_load_8888_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 4924 <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 4be4 <sk_load_8888_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 4924 <sk_load_8888_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 4be4 <sk_load_8888_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10831,7 +11103,7 @@ _sk_store_8888_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 4b30 <sk_store_8888_vfp4+0x90>
+ .long 0x1a000004 // bne 4df0 <sk_store_8888_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -10839,17 +11111,17 @@ _sk_store_8888_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 4b5c <sk_store_8888_vfp4+0xbc>
+ .long 0x0a000007 // beq 4e1c <sk_store_8888_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4b54 <sk_store_8888_vfp4+0xb4>
+ .long 0x0a000003 // beq 4e14 <sk_store_8888_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4b20 <sk_store_8888_vfp4+0x80>
+ .long 0x1afffff4 // bne 4de0 <sk_store_8888_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 4b20 <sk_store_8888_vfp4+0x80>
+ .long 0xeafffff0 // b 4de0 <sk_store_8888_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 4b20 <sk_store_8888_vfp4+0x80>
+ .long 0xeaffffee // b 4de0 <sk_store_8888_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -10870,7 +11142,7 @@ _sk_load_bgra_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082210e // add r2, r2, lr, lsl #2
- .long 0x1a000015 // bne 4bfc <sk_load_bgra_vfp4+0x84>
+ .long 0x1a000015 // bne 4ebc <sk_load_bgra_vfp4+0x84>
.long 0xf4620a8f // vld1.32 {d16-d17}, [r2]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f209c // add r2, pc, #156
@@ -10895,12 +11167,12 @@ _sk_load_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a00000c // beq 4c3c <sk_load_bgra_vfp4+0xc4>
+ .long 0x0a00000c // beq 4efc <sk_load_bgra_vfp4+0xc4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000005 // beq 4c2c <sk_load_bgra_vfp4+0xb4>
+ .long 0x0a000005 // beq 4eec <sk_load_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1affffe2 // bne 4ba8 <sk_load_bgra_vfp4+0x30>
+ .long 0x1affffe2 // bne 4e68 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xe2823008 // add r3, r2, #8
@@ -10908,11 +11180,11 @@ _sk_load_bgra_vfp4:
.long 0xedd22b00 // vldr d18, [r2]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffda // b 4ba8 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffda // b 4e68 <sk_load_bgra_vfp4+0x30>
.long 0xe3a03000 // mov r3, #0
.long 0xeea03b90 // vdup.32 q8, r3
.long 0xf4e2083f // vld1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffd6 // b 4ba8 <sk_load_bgra_vfp4+0x30>
+ .long 0xeaffffd6 // b 4e68 <sk_load_bgra_vfp4+0x30>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -10936,7 +11208,7 @@ _sk_load_bgra_dst_vfp4:
.long 0xe0824103 // add r4, r2, r3, lsl #2
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00001a // bne 4d04 <sk_load_bgra_dst_vfp4+0xa4>
+ .long 0x1a00001a // bne 4fc4 <sk_load_bgra_dst_vfp4+0xa4>
.long 0xf4640a8f // vld1.32 {d16-d17}, [r4]
.long 0xf3c7205f // vmov.i32 q9, #255
.long 0xe28f40b0 // add r4, pc, #176
@@ -10966,12 +11238,12 @@ _sk_load_bgra_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xe2065003 // and r5, r6, #3
.long 0xe3550001 // cmp r5, #1
- .long 0x0a00000c // beq 4d44 <sk_load_bgra_dst_vfp4+0xe4>
+ .long 0x0a00000c // beq 5004 <sk_load_bgra_dst_vfp4+0xe4>
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe3550002 // cmp r5, #2
- .long 0x0a000005 // beq 4d34 <sk_load_bgra_dst_vfp4+0xd4>
+ .long 0x0a000005 // beq 4ff4 <sk_load_bgra_dst_vfp4+0xd4>
.long 0xe3550003 // cmp r5, #3
- .long 0x1affffdd // bne 4c9c <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0x1affffdd // bne 4f5c <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xe2845008 // add r5, r4, #8
@@ -10979,11 +11251,11 @@ _sk_load_bgra_dst_vfp4:
.long 0xedd42b00 // vldr d18, [r4]
.long 0xf2f008e2 // vext.8 q8, q8, q9, #8
.long 0xf2f008e0 // vext.8 q8, q8, q8, #8
- .long 0xeaffffd5 // b 4c9c <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd5 // b 4f5c <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe3a05000 // mov r5, #0
.long 0xeea05b90 // vdup.32 q8, r5
.long 0xf4e4083f // vld1.32 {d16[0]}, [r4 :32]
- .long 0xeaffffd1 // b 4c9c <sk_load_bgra_dst_vfp4+0x3c>
+ .long 0xeaffffd1 // b 4f5c <sk_load_bgra_dst_vfp4+0x3c>
.long 0xe320f000 // nop {0}
.long 0x3b808081 // .word 0x3b808081
.long 0x3b808081 // .word 0x3b808081
@@ -11073,7 +11345,7 @@ _sk_store_bgra_vfp4:
.long 0xf2f84576 // vshl.s32 q10, q11, #24
.long 0xf26001f2 // vorr q8, q8, q9
.long 0xf26001f4 // vorr q8, q8, q10
- .long 0x1a000004 // bne 4ea8 <sk_store_bgra_vfp4+0x90>
+ .long 0x1a000004 // bne 5168 <sk_store_bgra_vfp4+0x90>
.long 0xf4420a8f // vst1.32 {d16-d17}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -11081,17 +11353,17 @@ _sk_store_bgra_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe20c3003 // and r3, ip, #3
.long 0xe3530001 // cmp r3, #1
- .long 0x0a000007 // beq 4ed4 <sk_store_bgra_vfp4+0xbc>
+ .long 0x0a000007 // beq 5194 <sk_store_bgra_vfp4+0xbc>
.long 0xe3530002 // cmp r3, #2
- .long 0x0a000003 // beq 4ecc <sk_store_bgra_vfp4+0xb4>
+ .long 0x0a000003 // beq 518c <sk_store_bgra_vfp4+0xb4>
.long 0xe3530003 // cmp r3, #3
- .long 0x1afffff4 // bne 4e98 <sk_store_bgra_vfp4+0x80>
+ .long 0x1afffff4 // bne 5158 <sk_store_bgra_vfp4+0x80>
.long 0xe2823008 // add r3, r2, #8
.long 0xf4c3183f // vst1.32 {d17[0]}, [r3 :32]
.long 0xedc20b00 // vstr d16, [r2]
- .long 0xeafffff0 // b 4e98 <sk_store_bgra_vfp4+0x80>
+ .long 0xeafffff0 // b 5158 <sk_store_bgra_vfp4+0x80>
.long 0xf4c2083f // vst1.32 {d16[0]}, [r2 :32]
- .long 0xeaffffee // b 4e98 <sk_store_bgra_vfp4+0x80>
+ .long 0xeaffffee // b 5158 <sk_store_bgra_vfp4+0x80>
.long 0xe320f000 // nop {0}
.long 0x437f0000 // .word 0x437f0000
.long 0x437f0000 // .word 0x437f0000
@@ -11112,7 +11384,7 @@ _sk_load_f16_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a000008 // bne 4f40 <sk_load_f16_vfp4+0x50>
+ .long 0x1a000008 // bne 5200 <sk_load_f16_vfp4+0x50>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xf3b60720 // vcvt.f32.f16 q0, d16
@@ -11124,14 +11396,14 @@ _sk_load_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff4 // beq 4f20 <sk_load_f16_vfp4+0x30>
+ .long 0x0afffff4 // beq 51e0 <sk_load_f16_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff0 // bcc 4f20 <sk_load_f16_vfp4+0x30>
+ .long 0x3afffff0 // bcc 51e0 <sk_load_f16_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffed // b 4f20 <sk_load_f16_vfp4+0x30>
+ .long 0xeaffffed // b 51e0 <sk_load_f16_vfp4+0x30>
HIDDEN _sk_load_f16_dst_vfp4
.globl _sk_load_f16_dst_vfp4
@@ -11150,7 +11422,7 @@ _sk_load_f16_dst_vfp4:
.long 0xe0825183 // add r5, r2, r3, lsl #3
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000d // bne 4fd8 <sk_load_f16_dst_vfp4+0x70>
+ .long 0x1a00000d // bne 5298 <sk_load_f16_dst_vfp4+0x70>
.long 0xf465004f // vld4.16 {d16-d19}, [r5]
.long 0xf3f64720 // vcvt.f32.f16 q10, d16
.long 0xf3f66721 // vcvt.f32.f16 q11, d17
@@ -11167,14 +11439,14 @@ _sk_load_f16_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e5070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r5]
.long 0xe3560001 // cmp r6, #1
- .long 0x0affffef // beq 4fa4 <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x0affffef // beq 5264 <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854008 // add r4, r5, #8
.long 0xe3560003 // cmp r6, #3
.long 0xf4e4074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r4]
- .long 0x3affffeb // bcc 4fa4 <sk_load_f16_dst_vfp4+0x3c>
+ .long 0x3affffeb // bcc 5264 <sk_load_f16_dst_vfp4+0x3c>
.long 0xe2854010 // add r4, r5, #16
.long 0xf4e4078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r4]
- .long 0xeaffffe8 // b 4fa4 <sk_load_f16_dst_vfp4+0x3c>
+ .long 0xeaffffe8 // b 5264 <sk_load_f16_dst_vfp4+0x3c>
HIDDEN _sk_gather_f16_vfp4
.globl _sk_gather_f16_vfp4
@@ -11235,7 +11507,7 @@ _sk_store_f16_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842182 // add r2, r4, r2, lsl #3
.long 0xe082218e // add r2, r2, lr, lsl #3
- .long 0x1a000004 // bne 50e0 <sk_store_f16_vfp4+0x50>
+ .long 0x1a000004 // bne 53a0 <sk_store_f16_vfp4+0x50>
.long 0xf442004f // vst4.16 {d16-d19}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -11243,14 +11515,14 @@ _sk_store_f16_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c2070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r2]
- .long 0x0afffff8 // beq 50d0 <sk_store_f16_vfp4+0x40>
+ .long 0x0afffff8 // beq 5390 <sk_store_f16_vfp4+0x40>
.long 0xe2823008 // add r3, r2, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c3074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r3]
- .long 0x3afffff4 // bcc 50d0 <sk_store_f16_vfp4+0x40>
+ .long 0x3afffff4 // bcc 5390 <sk_store_f16_vfp4+0x40>
.long 0xe2822010 // add r2, r2, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 50d0 <sk_store_f16_vfp4+0x40>
+ .long 0xeafffff1 // b 5390 <sk_store_f16_vfp4+0x40>
HIDDEN _sk_load_u16_be_vfp4
.globl _sk_load_u16_be_vfp4
@@ -11266,7 +11538,7 @@ _sk_load_u16_be_vfp4:
.long 0xe0020293 // mul r2, r3, r2
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe082318e // add r3, r2, lr, lsl #3
- .long 0x1a00001e // bne 51b0 <sk_load_u16_be_vfp4+0xa8>
+ .long 0x1a00001e // bne 5470 <sk_load_u16_be_vfp4+0xa8>
.long 0xf463004f // vld4.16 {d16-d19}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2094 // add r2, pc, #148
@@ -11300,14 +11572,14 @@ _sk_load_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffde // beq 5138 <sk_load_u16_be_vfp4+0x30>
+ .long 0x0affffde // beq 53f8 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3affffda // bcc 5138 <sk_load_u16_be_vfp4+0x30>
+ .long 0x3affffda // bcc 53f8 <sk_load_u16_be_vfp4+0x30>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4e2078f // vld4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeaffffd7 // b 5138 <sk_load_u16_be_vfp4+0x30>
+ .long 0xeaffffd7 // b 53f8 <sk_load_u16_be_vfp4+0x30>
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -11328,7 +11600,7 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe08e308e // add r3, lr, lr, lsl #1
.long 0xe0842082 // add r2, r4, r2, lsl #1
.long 0xe0823083 // add r3, r2, r3, lsl #1
- .long 0x1a00001a // bne 5284 <sk_load_rgb_u16_be_vfp4+0x9c>
+ .long 0x1a00001a // bne 5544 <sk_load_rgb_u16_be_vfp4+0x9c>
.long 0xf463044f // vld3.16 {d16-d18}, [r3]
.long 0xf3d84030 // vshr.u16 d20, d16, #8
.long 0xe28f2088 // add r2, pc, #136
@@ -11358,14 +11630,14 @@ _sk_load_rgb_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4e3060f // vld3.16 {d16[0],d17[0],d18[0]}, [r3]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0affffe2 // beq 521c <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x0affffe2 // beq 54dc <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe2832006 // add r2, r3, #6
.long 0xe35c0003 // cmp ip, #3
.long 0xf4e2064f // vld3.16 {d16[1],d17[1],d18[1]}, [r2]
- .long 0x3affffde // bcc 521c <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0x3affffde // bcc 54dc <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe283200c // add r2, r3, #12
.long 0xf4e2068f // vld3.16 {d16[2],d17[2],d18[2]}, [r2]
- .long 0xeaffffdb // b 521c <sk_load_rgb_u16_be_vfp4+0x34>
+ .long 0xeaffffdb // b 54dc <sk_load_rgb_u16_be_vfp4+0x34>
.long 0xe320f000 // nop {0}
.long 0x37800080 // .word 0x37800080
.long 0x37800080 // .word 0x37800080
@@ -11420,7 +11692,7 @@ _sk_store_u16_be_vfp4:
.long 0xf2d84534 // vshl.s16 d20, d20, #8
.long 0xf26811b7 // vorr d17, d24, d23
.long 0xf26401b9 // vorr d16, d20, d25
- .long 0x1a000004 // bne 5388 <sk_store_u16_be_vfp4+0xb8>
+ .long 0x1a000004 // bne 5648 <sk_store_u16_be_vfp4+0xb8>
.long 0xf443004f // vst4.16 {d16-d19}, [r3]
.long 0xe5912004 // ldr r2, [r1, #4]
.long 0xe2811008 // add r1, r1, #8
@@ -11428,14 +11700,14 @@ _sk_store_u16_be_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4c3070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [r3]
- .long 0x0afffff8 // beq 5378 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x0afffff8 // beq 5638 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832008 // add r2, r3, #8
.long 0xe35c0003 // cmp ip, #3
.long 0xf4c2074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [r2]
- .long 0x3afffff4 // bcc 5378 <sk_store_u16_be_vfp4+0xa8>
+ .long 0x3afffff4 // bcc 5638 <sk_store_u16_be_vfp4+0xa8>
.long 0xe2832010 // add r2, r3, #16
.long 0xf4c2078f // vst4.16 {d16[2],d17[2],d18[2],d19[2]}, [r2]
- .long 0xeafffff1 // b 5378 <sk_store_u16_be_vfp4+0xa8>
+ .long 0xeafffff1 // b 5638 <sk_store_u16_be_vfp4+0xa8>
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
.long 0x477fff00 // .word 0x477fff00
@@ -11455,7 +11727,7 @@ _sk_load_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000009 // bne 5414 <sk_load_f32_vfp4+0x54>
+ .long 0x1a000009 // bne 56d4 <sk_load_f32_vfp4+0x54>
.long 0xf462018d // vld4.32 {d16,d18,d20,d22}, [r2]!
.long 0xf462118f // vld4.32 {d17,d19,d21,d23}, [r2]
.long 0xf22001f0 // vorr q0, q8, q8
@@ -11468,14 +11740,14 @@ _sk_load_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xf4a20b4f // vld4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
.long 0xe35c0001 // cmp ip, #1
- .long 0x0afffff8 // beq 5404 <sk_load_f32_vfp4+0x44>
+ .long 0x0afffff8 // beq 56c4 <sk_load_f32_vfp4+0x44>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4a30bcf // vld4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 5404 <sk_load_f32_vfp4+0x44>
+ .long 0x3afffff4 // bcc 56c4 <sk_load_f32_vfp4+0x44>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4a21b4f // vld4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 5404 <sk_load_f32_vfp4+0x44>
+ .long 0xeafffff1 // b 56c4 <sk_load_f32_vfp4+0x44>
HIDDEN _sk_load_f32_dst_vfp4
.globl _sk_load_f32_dst_vfp4
@@ -11494,7 +11766,7 @@ _sk_load_f32_dst_vfp4:
.long 0xe0824203 // add r4, r2, r3, lsl #4
.long 0xe2802020 // add r2, r0, #32
.long 0xe2803010 // add r3, r0, #16
- .long 0x1a00000e // bne 54b0 <sk_load_f32_dst_vfp4+0x74>
+ .long 0x1a00000e // bne 5770 <sk_load_f32_dst_vfp4+0x74>
.long 0xf464818d // vld4.32 {d24,d26,d28,d30}, [r4]!
.long 0xf464918f // vld4.32 {d25,d27,d29,d31}, [r4]
.long 0xf26801f8 // vorr q8, q12, q12
@@ -11512,14 +11784,14 @@ _sk_load_f32_dst_vfp4:
.long 0xe12fff13 // bx r3
.long 0xf4e40b4f // vld4.32 {d16[0],d18[0],d20[0],d22[0]}, [r4]
.long 0xe3560001 // cmp r6, #1
- .long 0x0afffff3 // beq 548c <sk_load_f32_dst_vfp4+0x50>
+ .long 0x0afffff3 // beq 574c <sk_load_f32_dst_vfp4+0x50>
.long 0xe2845010 // add r5, r4, #16
.long 0xe3560003 // cmp r6, #3
.long 0xf4e50bcf // vld4.32 {d16[1],d18[1],d20[1],d22[1]}, [r5]
- .long 0x3affffef // bcc 548c <sk_load_f32_dst_vfp4+0x50>
+ .long 0x3affffef // bcc 574c <sk_load_f32_dst_vfp4+0x50>
.long 0xe2844020 // add r4, r4, #32
.long 0xf4e41b4f // vld4.32 {d17[0],d19[0],d21[0],d23[0]}, [r4]
- .long 0xeaffffec // b 548c <sk_load_f32_dst_vfp4+0x50>
+ .long 0xeaffffec // b 574c <sk_load_f32_dst_vfp4+0x50>
HIDDEN _sk_store_f32_vfp4
.globl _sk_store_f32_vfp4
@@ -11535,7 +11807,7 @@ _sk_store_f32_vfp4:
.long 0xe0020392 // mul r2, r2, r3
.long 0xe0842102 // add r2, r4, r2, lsl #2
.long 0xe082220e // add r2, r2, lr, lsl #4
- .long 0x1a000005 // bne 551c <sk_store_f32_vfp4+0x44>
+ .long 0x1a000005 // bne 57dc <sk_store_f32_vfp4+0x44>
.long 0xf402018d // vst4.32 {d0,d2,d4,d6}, [r2]!
.long 0xf402118f // vst4.32 {d1,d3,d5,d7}, [r2]
.long 0xe5912004 // ldr r2, [r1, #4]
@@ -11544,14 +11816,14 @@ _sk_store_f32_vfp4:
.long 0xe12fff12 // bx r2
.long 0xe35c0001 // cmp ip, #1
.long 0xf4820b4f // vst4.32 {d0[0],d2[0],d4[0],d6[0]}, [r2]
- .long 0x0afffff8 // beq 550c <sk_store_f32_vfp4+0x34>
+ .long 0x0afffff8 // beq 57cc <sk_store_f32_vfp4+0x34>
.long 0xe2823010 // add r3, r2, #16
.long 0xe35c0003 // cmp ip, #3
.long 0xf4830bcf // vst4.32 {d0[1],d2[1],d4[1],d6[1]}, [r3]
- .long 0x3afffff4 // bcc 550c <sk_store_f32_vfp4+0x34>
+ .long 0x3afffff4 // bcc 57cc <sk_store_f32_vfp4+0x34>
.long 0xe2822020 // add r2, r2, #32
.long 0xf4821b4f // vst4.32 {d1[0],d3[0],d5[0],d7[0]}, [r2]
- .long 0xeafffff1 // b 550c <sk_store_f32_vfp4+0x34>
+ .long 0xeafffff1 // b 57cc <sk_store_f32_vfp4+0x34>
HIDDEN _sk_clamp_x_vfp4
.globl _sk_clamp_x_vfp4
@@ -12232,7 +12504,7 @@ _sk_gradient_vfp4:
.long 0xf2c00050 // vmov.i32 q8, #0
.long 0xe5931000 // ldr r1, [r3]
.long 0xe3510002 // cmp r1, #2
- .long 0x3a00000a // bcc 5e84 <sk_gradient_vfp4+0x5c>
+ .long 0x3a00000a // bcc 6144 <sk_gradient_vfp4+0x5c>
.long 0xe5932024 // ldr r2, [r3, #36]
.long 0xf2c04051 // vmov.i32 q10, #1
.long 0xf2c00050 // vmov.i32 q8, #0
@@ -12243,7 +12515,7 @@ _sk_gradient_vfp4:
.long 0xf3468ee8 // vcge.f32 q12, q11, q12
.long 0xf35481f2 // vbsl q12, q10, q9
.long 0xf26808e0 // vadd.i32 q8, q12, q8
- .long 0x1afffff9 // bne 5e6c <sk_gradient_vfp4+0x44>
+ .long 0x1afffff9 // bne 612c <sk_gradient_vfp4+0x44>
.long 0xee315b90 // vmov.32 r5, d17[1]
.long 0xe5937010 // ldr r7, [r3, #16]
.long 0xee112b90 // vmov.32 r2, d17[0]
@@ -13147,7 +13419,7 @@ _sk_seed_shader_hsw:
.byte 197,249,110,194 // vmovd %edx,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,154,88,0,0 // vbroadcastss 0x589a(%rip),%ymm1 # 5964 <_sk_callback_hsw+0x142>
+ .byte 196,226,125,24,13,82,90,0,0 // vbroadcastss 0x5a52(%rip),%ymm1 # 5b1c <_sk_callback_hsw+0x142>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -13155,7 +13427,7 @@ _sk_seed_shader_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,122,88,0,0 // vbroadcastss 0x587a(%rip),%ymm2 # 5968 <_sk_callback_hsw+0x146>
+ .byte 196,226,125,24,21,50,90,0,0 // vbroadcastss 0x5a32(%rip),%ymm2 # 5b20 <_sk_callback_hsw+0x146>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -13174,13 +13446,13 @@ _sk_dither_hsw:
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9
.byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9
- .byte 196,98,125,88,21,65,88,0,0 // vpbroadcastd 0x5841(%rip),%ymm10 # 596c <_sk_callback_hsw+0x14a>
+ .byte 196,98,125,88,21,249,89,0,0 // vpbroadcastd 0x59f9(%rip),%ymm10 # 5b24 <_sk_callback_hsw+0x14a>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,38,88,0,0 // vpbroadcastd 0x5826(%rip),%ymm12 # 5970 <_sk_callback_hsw+0x14e>
- .byte 196,98,125,88,45,33,88,0,0 // vpbroadcastd 0x5821(%rip),%ymm13 # 5974 <_sk_callback_hsw+0x152>
+ .byte 196,98,125,88,37,222,89,0,0 // vpbroadcastd 0x59de(%rip),%ymm12 # 5b28 <_sk_callback_hsw+0x14e>
+ .byte 196,98,125,88,45,217,89,0,0 // vpbroadcastd 0x59d9(%rip),%ymm13 # 5b2c <_sk_callback_hsw+0x152>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -13195,8 +13467,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,211,87,0,0 // vbroadcastss 0x57d3(%rip),%ymm9 # 5978 <_sk_callback_hsw+0x156>
- .byte 196,98,125,24,21,206,87,0,0 // vbroadcastss 0x57ce(%rip),%ymm10 # 597c <_sk_callback_hsw+0x15a>
+ .byte 196,98,125,24,13,139,89,0,0 // vbroadcastss 0x598b(%rip),%ymm9 # 5b30 <_sk_callback_hsw+0x156>
+ .byte 196,98,125,24,21,134,89,0,0 // vbroadcastss 0x5986(%rip),%ymm10 # 5b34 <_sk_callback_hsw+0x15a>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
@@ -13230,7 +13502,7 @@ HIDDEN _sk_black_color_hsw
FUNCTION(_sk_black_color_hsw)
_sk_black_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,110,87,0,0 // vbroadcastss 0x576e(%rip),%ymm3 # 5980 <_sk_callback_hsw+0x15e>
+ .byte 196,226,125,24,29,38,89,0,0 // vbroadcastss 0x5926(%rip),%ymm3 # 5b38 <_sk_callback_hsw+0x15e>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -13241,7 +13513,7 @@ HIDDEN _sk_white_color_hsw
FUNCTION(_sk_white_color_hsw)
_sk_white_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,89,87,0,0 // vbroadcastss 0x5759(%rip),%ymm0 # 5984 <_sk_callback_hsw+0x162>
+ .byte 196,226,125,24,5,17,89,0,0 // vbroadcastss 0x5911(%rip),%ymm0 # 5b3c <_sk_callback_hsw+0x162>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -13287,7 +13559,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,252,86,0,0 // vbroadcastss 0x56fc(%rip),%ymm8 # 5988 <_sk_callback_hsw+0x166>
+ .byte 196,98,125,24,5,180,88,0,0 // vbroadcastss 0x58b4(%rip),%ymm8 # 5b40 <_sk_callback_hsw+0x166>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -13303,7 +13575,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,207,86,0,0 // vbroadcastss 0x56cf(%rip),%ymm8 # 598c <_sk_callback_hsw+0x16a>
+ .byte 196,98,125,24,5,135,88,0,0 // vbroadcastss 0x5887(%rip),%ymm8 # 5b44 <_sk_callback_hsw+0x16a>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -13342,7 +13614,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,118,86,0,0 // vbroadcastss 0x5676(%rip),%ymm8 # 5990 <_sk_callback_hsw+0x16e>
+ .byte 196,98,125,24,5,46,88,0,0 // vbroadcastss 0x582e(%rip),%ymm8 # 5b48 <_sk_callback_hsw+0x16e>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -13355,7 +13627,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,89,86,0,0 // vbroadcastss 0x5659(%rip),%ymm0 # 5994 <_sk_callback_hsw+0x172>
+ .byte 196,226,125,24,5,17,88,0,0 // vbroadcastss 0x5811(%rip),%ymm0 # 5b4c <_sk_callback_hsw+0x172>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -13368,7 +13640,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,60,86,0,0 // vbroadcastss 0x563c(%rip),%ymm8 # 5998 <_sk_callback_hsw+0x176>
+ .byte 196,98,125,24,5,244,87,0,0 // vbroadcastss 0x57f4(%rip),%ymm8 # 5b50 <_sk_callback_hsw+0x176>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -13381,7 +13653,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,27,86,0,0 // vbroadcastss 0x561b(%rip),%ymm8 # 599c <_sk_callback_hsw+0x17a>
+ .byte 196,98,125,24,5,211,87,0,0 // vbroadcastss 0x57d3(%rip),%ymm8 # 5b54 <_sk_callback_hsw+0x17a>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -13405,7 +13677,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,230,85,0,0 // vbroadcastss 0x55e6(%rip),%ymm8 # 59a0 <_sk_callback_hsw+0x17e>
+ .byte 196,98,125,24,5,158,87,0,0 // vbroadcastss 0x579e(%rip),%ymm8 # 5b58 <_sk_callback_hsw+0x17e>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13453,7 +13725,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,97,85,0,0 // vbroadcastss 0x5561(%rip),%ymm8 # 59a4 <_sk_callback_hsw+0x182>
+ .byte 196,98,125,24,5,25,87,0,0 // vbroadcastss 0x5719(%rip),%ymm8 # 5b5c <_sk_callback_hsw+0x182>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13487,7 +13759,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,233,84,0,0 // vbroadcastss 0x54e9(%rip),%ymm8 # 59a8 <_sk_callback_hsw+0x186>
+ .byte 196,98,125,24,5,161,86,0,0 // vbroadcastss 0x56a1(%rip),%ymm8 # 5b60 <_sk_callback_hsw+0x186>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13512,7 +13784,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,152,84,0,0 // vbroadcastss 0x5498(%rip),%ymm8 # 59ac <_sk_callback_hsw+0x18a>
+ .byte 196,98,125,24,5,80,86,0,0 // vbroadcastss 0x5650(%rip),%ymm8 # 5b64 <_sk_callback_hsw+0x18a>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13540,7 +13812,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,59,84,0,0 // vbroadcastss 0x543b(%rip),%ymm8 # 59b0 <_sk_callback_hsw+0x18e>
+ .byte 196,98,125,24,5,243,85,0,0 // vbroadcastss 0x55f3(%rip),%ymm8 # 5b68 <_sk_callback_hsw+0x18e>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13562,7 +13834,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,249,83,0,0 // vbroadcastss 0x53f9(%rip),%ymm8 # 59b4 <_sk_callback_hsw+0x192>
+ .byte 196,98,125,24,5,177,85,0,0 // vbroadcastss 0x55b1(%rip),%ymm8 # 5b6c <_sk_callback_hsw+0x192>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -13572,7 +13844,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,231,83,0,0 // vbroadcastss 0x53e7(%rip),%ymm8 # 59b8 <_sk_callback_hsw+0x196>
+ .byte 196,98,125,24,5,159,85,0,0 // vbroadcastss 0x559f(%rip),%ymm8 # 5b70 <_sk_callback_hsw+0x196>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -13630,7 +13902,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,242,82,0,0 // vbroadcastss 0x52f2(%rip),%ymm9 # 59bc <_sk_callback_hsw+0x19a>
+ .byte 196,98,125,24,13,170,84,0,0 // vbroadcastss 0x54aa(%rip),%ymm9 # 5b74 <_sk_callback_hsw+0x19a>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -13683,7 +13955,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,19,82,0,0 // vbroadcastss 0x5213(%rip),%ymm8 # 59c0 <_sk_callback_hsw+0x19e>
+ .byte 196,98,125,24,5,203,83,0,0 // vbroadcastss 0x53cb(%rip),%ymm8 # 5b78 <_sk_callback_hsw+0x19e>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13734,7 +14006,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,75,81,0,0 // vbroadcastss 0x514b(%rip),%ymm8 # 59c4 <_sk_callback_hsw+0x1a2>
+ .byte 196,98,125,24,5,3,83,0,0 // vbroadcastss 0x5303(%rip),%ymm8 # 5b7c <_sk_callback_hsw+0x1a2>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -13795,10 +14067,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,86,80,0,0 // vbroadcastss 0x5056(%rip),%ymm11 # 59cc <_sk_callback_hsw+0x1aa>
+ .byte 196,98,125,24,29,14,82,0,0 // vbroadcastss 0x520e(%rip),%ymm11 # 5b84 <_sk_callback_hsw+0x1aa>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,71,80,0,0 // vbroadcastss 0x5047(%rip),%ymm12 # 59d0 <_sk_callback_hsw+0x1ae>
+ .byte 196,98,125,24,37,255,81,0,0 // vbroadcastss 0x51ff(%rip),%ymm12 # 5b88 <_sk_callback_hsw+0x1ae>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -13808,7 +14080,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,10,80,0,0 // vbroadcastss 0x500a(%rip),%ymm8 # 59c8 <_sk_callback_hsw+0x1a6>
+ .byte 196,98,125,24,5,194,81,0,0 // vbroadcastss 0x51c2(%rip),%ymm8 # 5b80 <_sk_callback_hsw+0x1a6>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -13921,11 +14193,11 @@ _sk_hue_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,14,78,0,0 // vbroadcastss 0x4e0e(%rip),%ymm14 # 59d4 <_sk_callback_hsw+0x1b2>
- .byte 196,98,125,24,61,9,78,0,0 // vbroadcastss 0x4e09(%rip),%ymm15 # 59d8 <_sk_callback_hsw+0x1b6>
+ .byte 196,98,125,24,53,198,79,0,0 // vbroadcastss 0x4fc6(%rip),%ymm14 # 5b8c <_sk_callback_hsw+0x1b2>
+ .byte 196,98,125,24,61,193,79,0,0 // vbroadcastss 0x4fc1(%rip),%ymm15 # 5b90 <_sk_callback_hsw+0x1b6>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,250,77,0,0 // vbroadcastss 0x4dfa(%rip),%ymm0 # 59dc <_sk_callback_hsw+0x1ba>
+ .byte 196,226,125,24,5,178,79,0,0 // vbroadcastss 0x4fb2(%rip),%ymm0 # 5b94 <_sk_callback_hsw+0x1ba>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -13980,7 +14252,7 @@ _sk_hue_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,231,76,0,0 // vbroadcastss 0x4ce7(%rip),%ymm1 # 59e0 <_sk_callback_hsw+0x1be>
+ .byte 196,226,125,24,13,159,78,0,0 // vbroadcastss 0x4e9f(%rip),%ymm1 # 5b98 <_sk_callback_hsw+0x1be>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -14034,11 +14306,11 @@ _sk_saturation_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,254,75,0,0 // vbroadcastss 0x4bfe(%rip),%ymm14 # 59e4 <_sk_callback_hsw+0x1c2>
- .byte 196,98,125,24,61,249,75,0,0 // vbroadcastss 0x4bf9(%rip),%ymm15 # 59e8 <_sk_callback_hsw+0x1c6>
+ .byte 196,98,125,24,53,182,77,0,0 // vbroadcastss 0x4db6(%rip),%ymm14 # 5b9c <_sk_callback_hsw+0x1c2>
+ .byte 196,98,125,24,61,177,77,0,0 // vbroadcastss 0x4db1(%rip),%ymm15 # 5ba0 <_sk_callback_hsw+0x1c6>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,234,75,0,0 // vbroadcastss 0x4bea(%rip),%ymm0 # 59ec <_sk_callback_hsw+0x1ca>
+ .byte 196,226,125,24,5,162,77,0,0 // vbroadcastss 0x4da2(%rip),%ymm0 # 5ba4 <_sk_callback_hsw+0x1ca>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -14093,7 +14365,7 @@ _sk_saturation_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,215,74,0,0 // vbroadcastss 0x4ad7(%rip),%ymm1 # 59f0 <_sk_callback_hsw+0x1ce>
+ .byte 196,226,125,24,13,143,76,0,0 // vbroadcastss 0x4c8f(%rip),%ymm1 # 5ba8 <_sk_callback_hsw+0x1ce>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -14121,11 +14393,11 @@ _sk_color_hsw:
.byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
.byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
.byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
- .byte 196,98,125,24,45,112,74,0,0 // vbroadcastss 0x4a70(%rip),%ymm13 # 59f4 <_sk_callback_hsw+0x1d2>
- .byte 196,98,125,24,53,107,74,0,0 // vbroadcastss 0x4a6b(%rip),%ymm14 # 59f8 <_sk_callback_hsw+0x1d6>
+ .byte 196,98,125,24,45,40,76,0,0 // vbroadcastss 0x4c28(%rip),%ymm13 # 5bac <_sk_callback_hsw+0x1d2>
+ .byte 196,98,125,24,53,35,76,0,0 // vbroadcastss 0x4c23(%rip),%ymm14 # 5bb0 <_sk_callback_hsw+0x1d6>
.byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
.byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
- .byte 196,98,125,24,61,92,74,0,0 // vbroadcastss 0x4a5c(%rip),%ymm15 # 59fc <_sk_callback_hsw+0x1da>
+ .byte 196,98,125,24,61,20,76,0,0 // vbroadcastss 0x4c14(%rip),%ymm15 # 5bb4 <_sk_callback_hsw+0x1da>
.byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -14181,7 +14453,7 @@ _sk_color_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,62,73,0,0 // vbroadcastss 0x493e(%rip),%ymm0 # 5a00 <_sk_callback_hsw+0x1de>
+ .byte 196,226,125,24,5,246,74,0,0 // vbroadcastss 0x4af6(%rip),%ymm0 # 5bb8 <_sk_callback_hsw+0x1de>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -14209,11 +14481,11 @@ _sk_luminosity_hsw:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
.byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
- .byte 196,98,125,24,45,215,72,0,0 // vbroadcastss 0x48d7(%rip),%ymm13 # 5a04 <_sk_callback_hsw+0x1e2>
- .byte 196,98,125,24,53,210,72,0,0 // vbroadcastss 0x48d2(%rip),%ymm14 # 5a08 <_sk_callback_hsw+0x1e6>
+ .byte 196,98,125,24,45,143,74,0,0 // vbroadcastss 0x4a8f(%rip),%ymm13 # 5bbc <_sk_callback_hsw+0x1e2>
+ .byte 196,98,125,24,53,138,74,0,0 // vbroadcastss 0x4a8a(%rip),%ymm14 # 5bc0 <_sk_callback_hsw+0x1e6>
.byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
.byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
- .byte 196,98,125,24,61,195,72,0,0 // vbroadcastss 0x48c3(%rip),%ymm15 # 5a0c <_sk_callback_hsw+0x1ea>
+ .byte 196,98,125,24,61,123,74,0,0 // vbroadcastss 0x4a7b(%rip),%ymm15 # 5bc4 <_sk_callback_hsw+0x1ea>
.byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -14269,7 +14541,7 @@ _sk_luminosity_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,165,71,0,0 // vbroadcastss 0x47a5(%rip),%ymm0 # 5a10 <_sk_callback_hsw+0x1ee>
+ .byte 196,226,125,24,5,93,73,0,0 // vbroadcastss 0x495d(%rip),%ymm0 # 5bc8 <_sk_callback_hsw+0x1ee>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -14302,17 +14574,17 @@ _sk_srcover_rgba_8888_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,178,0,0,0 // jne 1386 <_sk_srcover_rgba_8888_hsw+0xd9>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,196,84,37,64,75,0,0 // vandps 0x4b40(%rip),%ymm7,%ymm4 # 5e20 <_sk_callback_hsw+0x5fe>
+ .byte 197,196,84,37,32,77,0,0 // vandps 0x4d20(%rip),%ymm7,%ymm4 # 6000 <_sk_callback_hsw+0x626>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,69,0,45,83,75,0,0 // vpshufb 0x4b53(%rip),%ymm7,%ymm5 # 5e40 <_sk_callback_hsw+0x61e>
+ .byte 196,226,69,0,45,51,77,0,0 // vpshufb 0x4d33(%rip),%ymm7,%ymm5 # 6020 <_sk_callback_hsw+0x646>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,69,0,53,102,75,0,0 // vpshufb 0x4b66(%rip),%ymm7,%ymm6 # 5e60 <_sk_callback_hsw+0x63e>
+ .byte 196,226,69,0,53,70,77,0,0 // vpshufb 0x4d46(%rip),%ymm7,%ymm6 # 6040 <_sk_callback_hsw+0x666>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,4,71,0,0 // vbroadcastss 0x4704(%rip),%ymm8 # 5a14 <_sk_callback_hsw+0x1f2>
+ .byte 196,98,125,24,5,188,72,0,0 // vbroadcastss 0x48bc(%rip),%ymm8 # 5bcc <_sk_callback_hsw+0x1f2>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,251,70,0,0 // vbroadcastss 0x46fb(%rip),%ymm9 # 5a18 <_sk_callback_hsw+0x1f6>
+ .byte 196,98,125,24,13,179,72,0,0 // vbroadcastss 0x48b3(%rip),%ymm9 # 5bd0 <_sk_callback_hsw+0x1f6>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -14372,7 +14644,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,33,70,0,0 // vbroadcastss 0x4621(%rip),%ymm8 # 5a1c <_sk_callback_hsw+0x1fa>
+ .byte 196,98,125,24,5,217,71,0,0 // vbroadcastss 0x47d9(%rip),%ymm8 # 5bd4 <_sk_callback_hsw+0x1fa>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -14384,7 +14656,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,4,70,0,0 // vbroadcastss 0x4604(%rip),%ymm8 # 5a20 <_sk_callback_hsw+0x1fe>
+ .byte 196,98,125,24,5,188,71,0,0 // vbroadcastss 0x47bc(%rip),%ymm8 # 5bd8 <_sk_callback_hsw+0x1fe>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -14396,7 +14668,7 @@ HIDDEN _sk_clamp_a_dst_hsw
.globl _sk_clamp_a_dst_hsw
FUNCTION(_sk_clamp_a_dst_hsw)
_sk_clamp_a_dst_hsw:
- .byte 196,98,125,24,5,234,69,0,0 // vbroadcastss 0x45ea(%rip),%ymm8 # 5a24 <_sk_callback_hsw+0x202>
+ .byte 196,98,125,24,5,162,71,0,0 // vbroadcastss 0x47a2(%rip),%ymm8 # 5bdc <_sk_callback_hsw+0x202>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -14429,7 +14701,7 @@ HIDDEN _sk_invert_hsw
.globl _sk_invert_hsw
FUNCTION(_sk_invert_hsw)
_sk_invert_hsw:
- .byte 196,98,125,24,5,169,69,0,0 // vbroadcastss 0x45a9(%rip),%ymm8 # 5a28 <_sk_callback_hsw+0x206>
+ .byte 196,98,125,24,5,97,71,0,0 // vbroadcastss 0x4761(%rip),%ymm8 # 5be0 <_sk_callback_hsw+0x206>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -14485,7 +14757,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,61,69,0,0 // vbroadcastss 0x453d(%rip),%ymm10 # 5a2c <_sk_callback_hsw+0x20a>
+ .byte 196,98,125,24,21,245,70,0,0 // vbroadcastss 0x46f5(%rip),%ymm10 # 5be4 <_sk_callback_hsw+0x20a>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -14498,16 +14770,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,30,69,0,0 // vbroadcastss 0x451e(%rip),%ymm8 # 5a30 <_sk_callback_hsw+0x20e>
+ .byte 196,98,125,24,5,214,70,0,0 // vbroadcastss 0x46d6(%rip),%ymm8 # 5be8 <_sk_callback_hsw+0x20e>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,16,69,0,0 // vbroadcastss 0x4510(%rip),%ymm11 # 5a34 <_sk_callback_hsw+0x212>
- .byte 196,98,125,24,37,11,69,0,0 // vbroadcastss 0x450b(%rip),%ymm12 # 5a38 <_sk_callback_hsw+0x216>
+ .byte 196,98,125,24,29,200,70,0,0 // vbroadcastss 0x46c8(%rip),%ymm11 # 5bec <_sk_callback_hsw+0x212>
+ .byte 196,98,125,24,37,195,70,0,0 // vbroadcastss 0x46c3(%rip),%ymm12 # 5bf0 <_sk_callback_hsw+0x216>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,252,68,0,0 // vbroadcastss 0x44fc(%rip),%ymm14 # 5a3c <_sk_callback_hsw+0x21a>
+ .byte 196,98,125,24,53,180,70,0,0 // vbroadcastss 0x46b4(%rip),%ymm14 # 5bf4 <_sk_callback_hsw+0x21a>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,242,68,0,0 // vbroadcastss 0x44f2(%rip),%ymm10 # 5a40 <_sk_callback_hsw+0x21e>
+ .byte 196,98,125,24,21,170,70,0,0 // vbroadcastss 0x46aa(%rip),%ymm10 # 5bf8 <_sk_callback_hsw+0x21e>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -14530,16 +14802,16 @@ HIDDEN _sk_from_srgb_dst_hsw
.globl _sk_from_srgb_dst_hsw
FUNCTION(_sk_from_srgb_dst_hsw)
_sk_from_srgb_dst_hsw:
- .byte 196,98,125,24,5,154,68,0,0 // vbroadcastss 0x449a(%rip),%ymm8 # 5a44 <_sk_callback_hsw+0x222>
+ .byte 196,98,125,24,5,82,70,0,0 // vbroadcastss 0x4652(%rip),%ymm8 # 5bfc <_sk_callback_hsw+0x222>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,140,68,0,0 // vbroadcastss 0x448c(%rip),%ymm11 # 5a48 <_sk_callback_hsw+0x226>
- .byte 196,98,125,24,37,135,68,0,0 // vbroadcastss 0x4487(%rip),%ymm12 # 5a4c <_sk_callback_hsw+0x22a>
+ .byte 196,98,125,24,29,68,70,0,0 // vbroadcastss 0x4644(%rip),%ymm11 # 5c00 <_sk_callback_hsw+0x226>
+ .byte 196,98,125,24,37,63,70,0,0 // vbroadcastss 0x463f(%rip),%ymm12 # 5c04 <_sk_callback_hsw+0x22a>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13
- .byte 196,98,125,24,53,120,68,0,0 // vbroadcastss 0x4478(%rip),%ymm14 # 5a50 <_sk_callback_hsw+0x22e>
+ .byte 196,98,125,24,53,48,70,0,0 // vbroadcastss 0x4630(%rip),%ymm14 # 5c08 <_sk_callback_hsw+0x22e>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,110,68,0,0 // vbroadcastss 0x446e(%rip),%ymm10 # 5a54 <_sk_callback_hsw+0x232>
+ .byte 196,98,125,24,21,38,70,0,0 // vbroadcastss 0x4626(%rip),%ymm10 # 5c0c <_sk_callback_hsw+0x232>
.byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4
.byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -14563,19 +14835,19 @@ HIDDEN _sk_to_srgb_hsw
FUNCTION(_sk_to_srgb_hsw)
_sk_to_srgb_hsw:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,18,68,0,0 // vbroadcastss 0x4412(%rip),%ymm8 # 5a58 <_sk_callback_hsw+0x236>
+ .byte 196,98,125,24,5,202,69,0,0 // vbroadcastss 0x45ca(%rip),%ymm8 # 5c10 <_sk_callback_hsw+0x236>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,8,68,0,0 // vbroadcastss 0x4408(%rip),%ymm11 # 5a5c <_sk_callback_hsw+0x23a>
- .byte 196,98,125,24,37,3,68,0,0 // vbroadcastss 0x4403(%rip),%ymm12 # 5a60 <_sk_callback_hsw+0x23e>
+ .byte 196,98,125,24,29,192,69,0,0 // vbroadcastss 0x45c0(%rip),%ymm11 # 5c14 <_sk_callback_hsw+0x23a>
+ .byte 196,98,125,24,37,187,69,0,0 // vbroadcastss 0x45bb(%rip),%ymm12 # 5c18 <_sk_callback_hsw+0x23e>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13
- .byte 196,98,125,24,53,244,67,0,0 // vbroadcastss 0x43f4(%rip),%ymm14 # 5a64 <_sk_callback_hsw+0x242>
+ .byte 196,98,125,24,53,172,69,0,0 // vbroadcastss 0x45ac(%rip),%ymm14 # 5c1c <_sk_callback_hsw+0x242>
.byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13
- .byte 196,98,125,24,61,234,67,0,0 // vbroadcastss 0x43ea(%rip),%ymm15 # 5a68 <_sk_callback_hsw+0x246>
+ .byte 196,98,125,24,61,162,69,0,0 // vbroadcastss 0x45a2(%rip),%ymm15 # 5c20 <_sk_callback_hsw+0x246>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9
- .byte 196,98,125,24,45,214,67,0,0 // vbroadcastss 0x43d6(%rip),%ymm13 # 5a6c <_sk_callback_hsw+0x24a>
+ .byte 196,98,125,24,45,142,69,0,0 // vbroadcastss 0x458e(%rip),%ymm13 # 5c24 <_sk_callback_hsw+0x24a>
.byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -14609,26 +14881,26 @@ _sk_rgb_to_hsl_hsw:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,75,67,0,0 // vbroadcastss 0x434b(%rip),%ymm11 # 5a70 <_sk_callback_hsw+0x24e>
+ .byte 196,98,125,24,29,3,69,0,0 // vbroadcastss 0x4503(%rip),%ymm11 # 5c28 <_sk_callback_hsw+0x24e>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,56,67,0,0 // vbroadcastss 0x4338(%rip),%ymm14 # 5a74 <_sk_callback_hsw+0x252>
+ .byte 196,98,125,24,53,240,68,0,0 // vbroadcastss 0x44f0(%rip),%ymm14 # 5c2c <_sk_callback_hsw+0x252>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,31,67,0,0 // vbroadcastss 0x431f(%rip),%ymm14 # 5a7c <_sk_callback_hsw+0x25a>
+ .byte 196,98,125,24,53,215,68,0,0 // vbroadcastss 0x44d7(%rip),%ymm14 # 5c34 <_sk_callback_hsw+0x25a>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,13,67,0,0 // vbroadcastss 0x430d(%rip),%ymm14 # 5a78 <_sk_callback_hsw+0x256>
+ .byte 196,98,125,24,53,197,68,0,0 // vbroadcastss 0x44c5(%rip),%ymm14 # 5c30 <_sk_callback_hsw+0x256>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,240,66,0,0 // vbroadcastss 0x42f0(%rip),%ymm11 # 5a84 <_sk_callback_hsw+0x262>
+ .byte 196,98,125,24,29,168,68,0,0 // vbroadcastss 0x44a8(%rip),%ymm11 # 5c3c <_sk_callback_hsw+0x262>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -14638,7 +14910,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,179,66,0,0 // vbroadcastss 0x42b3(%rip),%ymm8 # 5a80 <_sk_callback_hsw+0x25e>
+ .byte 196,98,125,24,5,107,68,0,0 // vbroadcastss 0x446b(%rip),%ymm8 # 5c38 <_sk_callback_hsw+0x25e>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14655,30 +14927,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,128,66,0,0 // vbroadcastss 0x4280(%rip),%ymm8 # 5a88 <_sk_callback_hsw+0x266>
+ .byte 196,98,125,24,5,56,68,0,0 // vbroadcastss 0x4438(%rip),%ymm8 # 5c40 <_sk_callback_hsw+0x266>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,99,66,0,0 // vbroadcastss 0x4263(%rip),%ymm9 # 5a8c <_sk_callback_hsw+0x26a>
+ .byte 196,98,125,24,13,27,68,0,0 // vbroadcastss 0x441b(%rip),%ymm9 # 5c44 <_sk_callback_hsw+0x26a>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,89,66,0,0 // vbroadcastss 0x4259(%rip),%ymm11 # 5a90 <_sk_callback_hsw+0x26e>
+ .byte 196,98,125,24,29,17,68,0,0 // vbroadcastss 0x4411(%rip),%ymm11 # 5c48 <_sk_callback_hsw+0x26e>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,67,66,0,0 // vbroadcastss 0x4243(%rip),%ymm13 # 5a98 <_sk_callback_hsw+0x276>
+ .byte 196,98,125,24,45,251,67,0,0 // vbroadcastss 0x43fb(%rip),%ymm13 # 5c50 <_sk_callback_hsw+0x276>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,57,66,0,0 // vbroadcastss 0x4239(%rip),%ymm14 # 5a9c <_sk_callback_hsw+0x27a>
+ .byte 196,98,125,24,53,241,67,0,0 // vbroadcastss 0x43f1(%rip),%ymm14 # 5c54 <_sk_callback_hsw+0x27a>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,31,66,0,0 // vbroadcastss 0x421f(%rip),%ymm3 # 5a94 <_sk_callback_hsw+0x272>
+ .byte 196,226,125,24,29,215,67,0,0 // vbroadcastss 0x43d7(%rip),%ymm3 # 5c4c <_sk_callback_hsw+0x272>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,10,66,0,0 // vbroadcastss 0x420a(%rip),%ymm12 # 5aa0 <_sk_callback_hsw+0x27e>
+ .byte 196,98,125,24,37,194,67,0,0 // vbroadcastss 0x43c2(%rip),%ymm12 # 5c58 <_sk_callback_hsw+0x27e>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -14694,7 +14966,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,182,65,0,0 // vbroadcastss 0x41b6(%rip),%ymm0 # 5aa4 <_sk_callback_hsw+0x282>
+ .byte 196,226,125,24,5,110,67,0,0 // vbroadcastss 0x436e(%rip),%ymm0 # 5c5c <_sk_callback_hsw+0x282>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -14749,10 +15021,10 @@ _sk_scale_u8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,59 // jne 19df <_sk_scale_u8_hsw+0x54>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,110,71,0,0 // vpand 0x476e(%rip),%xmm8,%xmm8 # 6120 <_sk_callback_hsw+0x8fe>
+ .byte 197,57,219,5,78,73,0,0 // vpand 0x494e(%rip),%xmm8,%xmm8 # 6300 <_sk_callback_hsw+0x926>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,227,64,0,0 // vbroadcastss 0x40e3(%rip),%ymm9 # 5aa8 <_sk_callback_hsw+0x286>
+ .byte 196,98,125,24,13,155,66,0,0 // vbroadcastss 0x429b(%rip),%ymm9 # 5c60 <_sk_callback_hsw+0x286>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -14846,10 +15118,10 @@ _sk_lerp_u8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,79 // jne 1b2b <_sk_lerp_u8_hsw+0x68>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,70,70,0,0 // vpand 0x4646(%rip),%xmm8,%xmm8 # 6130 <_sk_callback_hsw+0x90e>
+ .byte 197,57,219,5,38,72,0,0 // vpand 0x4826(%rip),%xmm8,%xmm8 # 6310 <_sk_callback_hsw+0x936>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,175,63,0,0 // vbroadcastss 0x3faf(%rip),%ymm9 # 5aac <_sk_callback_hsw+0x28a>
+ .byte 196,98,125,24,13,103,65,0,0 // vbroadcastss 0x4167(%rip),%ymm9 # 5c64 <_sk_callback_hsw+0x28a>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -14932,20 +15204,20 @@ _sk_lerp_565_hsw:
.byte 15,133,170,0,0,0 // jne 1caa <_sk_lerp_565_hsw+0xca>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,156,62,0,0 // vpbroadcastd 0x3e9c(%rip),%ymm9 # 5ab0 <_sk_callback_hsw+0x28e>
+ .byte 196,98,125,88,13,84,64,0,0 // vpbroadcastd 0x4054(%rip),%ymm9 # 5c68 <_sk_callback_hsw+0x28e>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,141,62,0,0 // vbroadcastss 0x3e8d(%rip),%ymm10 # 5ab4 <_sk_callback_hsw+0x292>
+ .byte 196,98,125,24,21,69,64,0,0 // vbroadcastss 0x4045(%rip),%ymm10 # 5c6c <_sk_callback_hsw+0x292>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,131,62,0,0 // vpbroadcastd 0x3e83(%rip),%ymm10 # 5ab8 <_sk_callback_hsw+0x296>
+ .byte 196,98,125,88,21,59,64,0,0 // vpbroadcastd 0x403b(%rip),%ymm10 # 5c70 <_sk_callback_hsw+0x296>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,116,62,0,0 // vbroadcastss 0x3e74(%rip),%ymm11 # 5abc <_sk_callback_hsw+0x29a>
+ .byte 196,98,125,24,29,44,64,0,0 // vbroadcastss 0x402c(%rip),%ymm11 # 5c74 <_sk_callback_hsw+0x29a>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,106,62,0,0 // vpbroadcastd 0x3e6a(%rip),%ymm11 # 5ac0 <_sk_callback_hsw+0x29e>
+ .byte 196,98,125,88,29,34,64,0,0 // vpbroadcastd 0x4022(%rip),%ymm11 # 5c78 <_sk_callback_hsw+0x29e>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,91,62,0,0 // vbroadcastss 0x3e5b(%rip),%ymm11 # 5ac4 <_sk_callback_hsw+0x2a2>
+ .byte 196,98,125,24,29,19,64,0,0 // vbroadcastss 0x4013(%rip),%ymm11 # 5c7c <_sk_callback_hsw+0x2a2>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0
@@ -15018,21 +15290,21 @@ _sk_load_tables_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,105 // jne 1dce <_sk_load_tables_hsw+0x7e>
.byte 196,193,124,16,26 // vmovups (%r10),%ymm3
- .byte 197,228,84,13,14,65,0,0 // vandps 0x410e(%rip),%ymm3,%ymm1 # 5e80 <_sk_callback_hsw+0x65e>
+ .byte 197,228,84,13,238,66,0,0 // vandps 0x42ee(%rip),%ymm3,%ymm1 # 6060 <_sk_callback_hsw+0x686>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 72,139,72,8 // mov 0x8(%rax),%rcx
.byte 76,139,80,16 // mov 0x10(%rax),%r10
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,226,109,146,4,137 // vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,14,65,0,0 // vpshufb 0x410e(%rip),%ymm3,%ymm2 # 5ea0 <_sk_callback_hsw+0x67e>
+ .byte 196,226,101,0,21,238,66,0,0 // vpshufb 0x42ee(%rip),%ymm3,%ymm2 # 6080 <_sk_callback_hsw+0x6a6>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,22,65,0,0 // vpshufb 0x4116(%rip),%ymm3,%ymm9 # 5ec0 <_sk_callback_hsw+0x69e>
+ .byte 196,98,101,0,13,246,66,0,0 // vpshufb 0x42f6(%rip),%ymm3,%ymm9 # 60a0 <_sk_callback_hsw+0x6c6>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,6,61,0,0 // vbroadcastss 0x3d06(%rip),%ymm8 # 5ac8 <_sk_callback_hsw+0x2a6>
+ .byte 196,98,125,24,5,190,62,0,0 // vbroadcastss 0x3ebe(%rip),%ymm8 # 5c80 <_sk_callback_hsw+0x2a6>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -15071,7 +15343,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,226,66,0,0 // vmovdqa 0x42e2(%rip),%xmm10 # 6140 <_sk_callback_hsw+0x91e>
+ .byte 197,121,111,21,194,68,0,0 // vmovdqa 0x44c2(%rip),%xmm10 # 6320 <_sk_callback_hsw+0x946>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -15093,7 +15365,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,255,59,0,0 // vbroadcastss 0x3bff(%rip),%ymm8 # 5acc <_sk_callback_hsw+0x2aa>
+ .byte 196,98,125,24,5,183,61,0,0 // vbroadcastss 0x3db7(%rip),%ymm8 # 5c84 <_sk_callback_hsw+0x2aa>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15153,7 +15425,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,130,65,0,0 // vmovdqa 0x4182(%rip),%xmm9 # 6150 <_sk_callback_hsw+0x92e>
+ .byte 197,121,111,13,98,67,0,0 // vmovdqa 0x4362(%rip),%xmm9 # 6330 <_sk_callback_hsw+0x956>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -15170,7 +15442,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8
.byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,173,58,0,0 // vbroadcastss 0x3aad(%rip),%ymm3 # 5ad0 <_sk_callback_hsw+0x2ae>
+ .byte 196,226,125,24,29,101,60,0,0 // vbroadcastss 0x3c65(%rip),%ymm3 # 5c88 <_sk_callback_hsw+0x2ae>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
.byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
@@ -15211,7 +15483,7 @@ HIDDEN _sk_byte_tables_hsw
FUNCTION(_sk_byte_tables_hsw)
_sk_byte_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,245,57,0,0 // vbroadcastss 0x39f5(%rip),%ymm8 # 5ad4 <_sk_callback_hsw+0x2b2>
+ .byte 196,98,125,24,5,173,59,0,0 // vbroadcastss 0x3bad(%rip),%ymm8 # 5c8c <_sk_callback_hsw+0x2b2>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -15333,7 +15605,7 @@ _sk_byte_tables_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,154,55,0,0 // vbroadcastss 0x379a(%rip),%ymm8 # 5ad8 <_sk_callback_hsw+0x2b6>
+ .byte 196,98,125,24,5,82,57,0,0 // vbroadcastss 0x3952(%rip),%ymm8 # 5c90 <_sk_callback_hsw+0x2b6>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -15449,7 +15721,7 @@ _sk_byte_tables_rgb_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,134,53,0,0 // vbroadcastss 0x3586(%rip),%ymm8 # 5adc <_sk_callback_hsw+0x2ba>
+ .byte 196,98,125,24,5,62,55,0,0 // vbroadcastss 0x373e(%rip),%ymm8 # 5c94 <_sk_callback_hsw+0x2ba>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -15548,33 +15820,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,96,52,0,0 // vbroadcastss 0x3460(%rip),%ymm12 # 5ae0 <_sk_callback_hsw+0x2be>
- .byte 196,98,125,24,45,91,52,0,0 // vbroadcastss 0x345b(%rip),%ymm13 # 5ae4 <_sk_callback_hsw+0x2c2>
+ .byte 196,98,125,24,37,24,54,0,0 // vbroadcastss 0x3618(%rip),%ymm12 # 5c98 <_sk_callback_hsw+0x2be>
+ .byte 196,98,125,24,45,19,54,0,0 // vbroadcastss 0x3613(%rip),%ymm13 # 5c9c <_sk_callback_hsw+0x2c2>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,81,52,0,0 // vbroadcastss 0x3451(%rip),%ymm13 # 5ae8 <_sk_callback_hsw+0x2c6>
+ .byte 196,98,125,24,45,9,54,0,0 // vbroadcastss 0x3609(%rip),%ymm13 # 5ca0 <_sk_callback_hsw+0x2c6>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,71,52,0,0 // vbroadcastss 0x3447(%rip),%ymm13 # 5aec <_sk_callback_hsw+0x2ca>
+ .byte 196,98,125,24,45,255,53,0,0 // vbroadcastss 0x35ff(%rip),%ymm13 # 5ca4 <_sk_callback_hsw+0x2ca>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,61,52,0,0 // vbroadcastss 0x343d(%rip),%ymm11 # 5af0 <_sk_callback_hsw+0x2ce>
+ .byte 196,98,125,24,29,245,53,0,0 // vbroadcastss 0x35f5(%rip),%ymm11 # 5ca8 <_sk_callback_hsw+0x2ce>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,51,52,0,0 // vbroadcastss 0x3433(%rip),%ymm12 # 5af4 <_sk_callback_hsw+0x2d2>
+ .byte 196,98,125,24,37,235,53,0,0 // vbroadcastss 0x35eb(%rip),%ymm12 # 5cac <_sk_callback_hsw+0x2d2>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,41,52,0,0 // vbroadcastss 0x3429(%rip),%ymm12 # 5af8 <_sk_callback_hsw+0x2d6>
+ .byte 196,98,125,24,37,225,53,0,0 // vbroadcastss 0x35e1(%rip),%ymm12 # 5cb0 <_sk_callback_hsw+0x2d6>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,10,52,0,0 // vbroadcastss 0x340a(%rip),%ymm11 # 5afc <_sk_callback_hsw+0x2da>
+ .byte 196,98,125,24,29,194,53,0,0 // vbroadcastss 0x35c2(%rip),%ymm11 # 5cb4 <_sk_callback_hsw+0x2da>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,0,52,0,0 // vbroadcastss 0x3400(%rip),%ymm11 # 5b00 <_sk_callback_hsw+0x2de>
+ .byte 196,98,125,24,29,184,53,0,0 // vbroadcastss 0x35b8(%rip),%ymm11 # 5cb8 <_sk_callback_hsw+0x2de>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,246,51,0,0 // vbroadcastss 0x33f6(%rip),%ymm0 # 5b04 <_sk_callback_hsw+0x2e2>
+ .byte 196,226,125,24,5,174,53,0,0 // vbroadcastss 0x35ae(%rip),%ymm0 # 5cbc <_sk_callback_hsw+0x2e2>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,236,51,0,0 // vbroadcastss 0x33ec(%rip),%ymm10 # 5b08 <_sk_callback_hsw+0x2e6>
+ .byte 196,98,125,24,21,164,53,0,0 // vbroadcastss 0x35a4(%rip),%ymm10 # 5cc0 <_sk_callback_hsw+0x2e6>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,223,51,0,0 // vbroadcastss 0x33df(%rip),%ymm10 # 5b0c <_sk_callback_hsw+0x2ea>
+ .byte 196,98,125,24,21,151,53,0,0 // vbroadcastss 0x3597(%rip),%ymm10 # 5cc4 <_sk_callback_hsw+0x2ea>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15582,7 +15854,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,182,51,0,0 // vbroadcastss 0x33b6(%rip),%ymm8 # 5b10 <_sk_callback_hsw+0x2ee>
+ .byte 196,98,125,24,5,110,53,0,0 // vbroadcastss 0x356e(%rip),%ymm8 # 5cc8 <_sk_callback_hsw+0x2ee>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15602,33 +15874,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,110,51,0,0 // vbroadcastss 0x336e(%rip),%ymm12 # 5b14 <_sk_callback_hsw+0x2f2>
- .byte 196,98,125,24,45,105,51,0,0 // vbroadcastss 0x3369(%rip),%ymm13 # 5b18 <_sk_callback_hsw+0x2f6>
+ .byte 196,98,125,24,37,38,53,0,0 // vbroadcastss 0x3526(%rip),%ymm12 # 5ccc <_sk_callback_hsw+0x2f2>
+ .byte 196,98,125,24,45,33,53,0,0 // vbroadcastss 0x3521(%rip),%ymm13 # 5cd0 <_sk_callback_hsw+0x2f6>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,95,51,0,0 // vbroadcastss 0x335f(%rip),%ymm13 # 5b1c <_sk_callback_hsw+0x2fa>
+ .byte 196,98,125,24,45,23,53,0,0 // vbroadcastss 0x3517(%rip),%ymm13 # 5cd4 <_sk_callback_hsw+0x2fa>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,85,51,0,0 // vbroadcastss 0x3355(%rip),%ymm13 # 5b20 <_sk_callback_hsw+0x2fe>
+ .byte 196,98,125,24,45,13,53,0,0 // vbroadcastss 0x350d(%rip),%ymm13 # 5cd8 <_sk_callback_hsw+0x2fe>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,75,51,0,0 // vbroadcastss 0x334b(%rip),%ymm11 # 5b24 <_sk_callback_hsw+0x302>
+ .byte 196,98,125,24,29,3,53,0,0 // vbroadcastss 0x3503(%rip),%ymm11 # 5cdc <_sk_callback_hsw+0x302>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,65,51,0,0 // vbroadcastss 0x3341(%rip),%ymm12 # 5b28 <_sk_callback_hsw+0x306>
+ .byte 196,98,125,24,37,249,52,0,0 // vbroadcastss 0x34f9(%rip),%ymm12 # 5ce0 <_sk_callback_hsw+0x306>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,55,51,0,0 // vbroadcastss 0x3337(%rip),%ymm12 # 5b2c <_sk_callback_hsw+0x30a>
+ .byte 196,98,125,24,37,239,52,0,0 // vbroadcastss 0x34ef(%rip),%ymm12 # 5ce4 <_sk_callback_hsw+0x30a>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,24,51,0,0 // vbroadcastss 0x3318(%rip),%ymm11 # 5b30 <_sk_callback_hsw+0x30e>
+ .byte 196,98,125,24,29,208,52,0,0 // vbroadcastss 0x34d0(%rip),%ymm11 # 5ce8 <_sk_callback_hsw+0x30e>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,14,51,0,0 // vbroadcastss 0x330e(%rip),%ymm11 # 5b34 <_sk_callback_hsw+0x312>
+ .byte 196,98,125,24,29,198,52,0,0 // vbroadcastss 0x34c6(%rip),%ymm11 # 5cec <_sk_callback_hsw+0x312>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,4,51,0,0 // vbroadcastss 0x3304(%rip),%ymm1 # 5b38 <_sk_callback_hsw+0x316>
+ .byte 196,226,125,24,13,188,52,0,0 // vbroadcastss 0x34bc(%rip),%ymm1 # 5cf0 <_sk_callback_hsw+0x316>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,250,50,0,0 // vbroadcastss 0x32fa(%rip),%ymm10 # 5b3c <_sk_callback_hsw+0x31a>
+ .byte 196,98,125,24,21,178,52,0,0 // vbroadcastss 0x34b2(%rip),%ymm10 # 5cf4 <_sk_callback_hsw+0x31a>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,237,50,0,0 // vbroadcastss 0x32ed(%rip),%ymm10 # 5b40 <_sk_callback_hsw+0x31e>
+ .byte 196,98,125,24,21,165,52,0,0 // vbroadcastss 0x34a5(%rip),%ymm10 # 5cf8 <_sk_callback_hsw+0x31e>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15636,7 +15908,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,196,50,0,0 // vbroadcastss 0x32c4(%rip),%ymm8 # 5b44 <_sk_callback_hsw+0x322>
+ .byte 196,98,125,24,5,124,52,0,0 // vbroadcastss 0x347c(%rip),%ymm8 # 5cfc <_sk_callback_hsw+0x322>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15656,33 +15928,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,124,50,0,0 // vbroadcastss 0x327c(%rip),%ymm12 # 5b48 <_sk_callback_hsw+0x326>
- .byte 196,98,125,24,45,119,50,0,0 // vbroadcastss 0x3277(%rip),%ymm13 # 5b4c <_sk_callback_hsw+0x32a>
+ .byte 196,98,125,24,37,52,52,0,0 // vbroadcastss 0x3434(%rip),%ymm12 # 5d00 <_sk_callback_hsw+0x326>
+ .byte 196,98,125,24,45,47,52,0,0 // vbroadcastss 0x342f(%rip),%ymm13 # 5d04 <_sk_callback_hsw+0x32a>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,109,50,0,0 // vbroadcastss 0x326d(%rip),%ymm13 # 5b50 <_sk_callback_hsw+0x32e>
+ .byte 196,98,125,24,45,37,52,0,0 // vbroadcastss 0x3425(%rip),%ymm13 # 5d08 <_sk_callback_hsw+0x32e>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,99,50,0,0 // vbroadcastss 0x3263(%rip),%ymm13 # 5b54 <_sk_callback_hsw+0x332>
+ .byte 196,98,125,24,45,27,52,0,0 // vbroadcastss 0x341b(%rip),%ymm13 # 5d0c <_sk_callback_hsw+0x332>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,89,50,0,0 // vbroadcastss 0x3259(%rip),%ymm11 # 5b58 <_sk_callback_hsw+0x336>
+ .byte 196,98,125,24,29,17,52,0,0 // vbroadcastss 0x3411(%rip),%ymm11 # 5d10 <_sk_callback_hsw+0x336>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,79,50,0,0 // vbroadcastss 0x324f(%rip),%ymm12 # 5b5c <_sk_callback_hsw+0x33a>
+ .byte 196,98,125,24,37,7,52,0,0 // vbroadcastss 0x3407(%rip),%ymm12 # 5d14 <_sk_callback_hsw+0x33a>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,69,50,0,0 // vbroadcastss 0x3245(%rip),%ymm12 # 5b60 <_sk_callback_hsw+0x33e>
+ .byte 196,98,125,24,37,253,51,0,0 // vbroadcastss 0x33fd(%rip),%ymm12 # 5d18 <_sk_callback_hsw+0x33e>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,38,50,0,0 // vbroadcastss 0x3226(%rip),%ymm11 # 5b64 <_sk_callback_hsw+0x342>
+ .byte 196,98,125,24,29,222,51,0,0 // vbroadcastss 0x33de(%rip),%ymm11 # 5d1c <_sk_callback_hsw+0x342>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,28,50,0,0 // vbroadcastss 0x321c(%rip),%ymm11 # 5b68 <_sk_callback_hsw+0x346>
+ .byte 196,98,125,24,29,212,51,0,0 // vbroadcastss 0x33d4(%rip),%ymm11 # 5d20 <_sk_callback_hsw+0x346>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,18,50,0,0 // vbroadcastss 0x3212(%rip),%ymm2 # 5b6c <_sk_callback_hsw+0x34a>
+ .byte 196,226,125,24,21,202,51,0,0 // vbroadcastss 0x33ca(%rip),%ymm2 # 5d24 <_sk_callback_hsw+0x34a>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,8,50,0,0 // vbroadcastss 0x3208(%rip),%ymm10 # 5b70 <_sk_callback_hsw+0x34e>
+ .byte 196,98,125,24,21,192,51,0,0 // vbroadcastss 0x33c0(%rip),%ymm10 # 5d28 <_sk_callback_hsw+0x34e>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,251,49,0,0 // vbroadcastss 0x31fb(%rip),%ymm10 # 5b74 <_sk_callback_hsw+0x352>
+ .byte 196,98,125,24,21,179,51,0,0 // vbroadcastss 0x33b3(%rip),%ymm10 # 5d2c <_sk_callback_hsw+0x352>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15690,7 +15962,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,210,49,0,0 // vbroadcastss 0x31d2(%rip),%ymm8 # 5b78 <_sk_callback_hsw+0x356>
+ .byte 196,98,125,24,5,138,51,0,0 // vbroadcastss 0x338a(%rip),%ymm8 # 5d30 <_sk_callback_hsw+0x356>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15710,33 +15982,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,138,49,0,0 // vbroadcastss 0x318a(%rip),%ymm12 # 5b7c <_sk_callback_hsw+0x35a>
- .byte 196,98,125,24,45,133,49,0,0 // vbroadcastss 0x3185(%rip),%ymm13 # 5b80 <_sk_callback_hsw+0x35e>
+ .byte 196,98,125,24,37,66,51,0,0 // vbroadcastss 0x3342(%rip),%ymm12 # 5d34 <_sk_callback_hsw+0x35a>
+ .byte 196,98,125,24,45,61,51,0,0 // vbroadcastss 0x333d(%rip),%ymm13 # 5d38 <_sk_callback_hsw+0x35e>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,123,49,0,0 // vbroadcastss 0x317b(%rip),%ymm13 # 5b84 <_sk_callback_hsw+0x362>
+ .byte 196,98,125,24,45,51,51,0,0 // vbroadcastss 0x3333(%rip),%ymm13 # 5d3c <_sk_callback_hsw+0x362>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,113,49,0,0 // vbroadcastss 0x3171(%rip),%ymm13 # 5b88 <_sk_callback_hsw+0x366>
+ .byte 196,98,125,24,45,41,51,0,0 // vbroadcastss 0x3329(%rip),%ymm13 # 5d40 <_sk_callback_hsw+0x366>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,103,49,0,0 // vbroadcastss 0x3167(%rip),%ymm11 # 5b8c <_sk_callback_hsw+0x36a>
+ .byte 196,98,125,24,29,31,51,0,0 // vbroadcastss 0x331f(%rip),%ymm11 # 5d44 <_sk_callback_hsw+0x36a>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,93,49,0,0 // vbroadcastss 0x315d(%rip),%ymm12 # 5b90 <_sk_callback_hsw+0x36e>
+ .byte 196,98,125,24,37,21,51,0,0 // vbroadcastss 0x3315(%rip),%ymm12 # 5d48 <_sk_callback_hsw+0x36e>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,83,49,0,0 // vbroadcastss 0x3153(%rip),%ymm12 # 5b94 <_sk_callback_hsw+0x372>
+ .byte 196,98,125,24,37,11,51,0,0 // vbroadcastss 0x330b(%rip),%ymm12 # 5d4c <_sk_callback_hsw+0x372>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,52,49,0,0 // vbroadcastss 0x3134(%rip),%ymm11 # 5b98 <_sk_callback_hsw+0x376>
+ .byte 196,98,125,24,29,236,50,0,0 // vbroadcastss 0x32ec(%rip),%ymm11 # 5d50 <_sk_callback_hsw+0x376>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,42,49,0,0 // vbroadcastss 0x312a(%rip),%ymm11 # 5b9c <_sk_callback_hsw+0x37a>
+ .byte 196,98,125,24,29,226,50,0,0 // vbroadcastss 0x32e2(%rip),%ymm11 # 5d54 <_sk_callback_hsw+0x37a>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,32,49,0,0 // vbroadcastss 0x3120(%rip),%ymm3 # 5ba0 <_sk_callback_hsw+0x37e>
+ .byte 196,226,125,24,29,216,50,0,0 // vbroadcastss 0x32d8(%rip),%ymm3 # 5d58 <_sk_callback_hsw+0x37e>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,22,49,0,0 // vbroadcastss 0x3116(%rip),%ymm10 # 5ba4 <_sk_callback_hsw+0x382>
+ .byte 196,98,125,24,21,206,50,0,0 // vbroadcastss 0x32ce(%rip),%ymm10 # 5d5c <_sk_callback_hsw+0x382>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,9,49,0,0 // vbroadcastss 0x3109(%rip),%ymm10 # 5ba8 <_sk_callback_hsw+0x386>
+ .byte 196,98,125,24,21,193,50,0,0 // vbroadcastss 0x32c1(%rip),%ymm10 # 5d60 <_sk_callback_hsw+0x386>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -15744,35 +16016,124 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,224,48,0,0 // vbroadcastss 0x30e0(%rip),%ymm8 # 5bac <_sk_callback_hsw+0x38a>
+ .byte 196,98,125,24,5,152,50,0,0 // vbroadcastss 0x3298(%rip),%ymm8 # 5d64 <_sk_callback_hsw+0x38a>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_gamma_hsw
+.globl _sk_gamma_hsw
+FUNCTION(_sk_gamma_hsw)
+_sk_gamma_hsw:
+ .byte 72,131,236,56 // sub $0x38,%rsp
+ .byte 197,252,17,60,36 // vmovups %ymm7,(%rsp)
+ .byte 197,252,17,116,36,224 // vmovups %ymm6,-0x20(%rsp)
+ .byte 197,252,17,108,36,192 // vmovups %ymm5,-0x40(%rsp)
+ .byte 197,252,17,100,36,160 // vmovups %ymm4,-0x60(%rsp)
+ .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
+ .byte 197,252,40,250 // vmovaps %ymm2,%ymm7
+ .byte 197,252,40,241 // vmovaps %ymm1,%ymm6
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,124,91,208 // vcvtdq2ps %ymm0,%ymm10
+ .byte 196,98,125,24,29,91,50,0,0 // vbroadcastss 0x325b(%rip),%ymm11 # 5d68 <_sk_callback_hsw+0x38e>
+ .byte 196,226,125,24,45,86,50,0,0 // vbroadcastss 0x3256(%rip),%ymm5 # 5d6c <_sk_callback_hsw+0x392>
+ .byte 197,124,84,205 // vandps %ymm5,%ymm0,%ymm9
+ .byte 196,226,125,24,37,77,50,0,0 // vbroadcastss 0x324d(%rip),%ymm4 # 5d70 <_sk_callback_hsw+0x396>
+ .byte 197,52,86,228 // vorps %ymm4,%ymm9,%ymm12
+ .byte 196,98,125,24,45,68,50,0,0 // vbroadcastss 0x3244(%rip),%ymm13 # 5d74 <_sk_callback_hsw+0x39a>
+ .byte 196,66,37,168,213 // vfmadd213ps %ymm13,%ymm11,%ymm10
+ .byte 196,98,125,24,13,58,50,0,0 // vbroadcastss 0x323a(%rip),%ymm9 # 5d78 <_sk_callback_hsw+0x39e>
+ .byte 196,66,29,188,209 // vfnmadd231ps %ymm9,%ymm12,%ymm10
+ .byte 197,124,91,246 // vcvtdq2ps %ymm6,%ymm14
+ .byte 196,66,37,168,245 // vfmadd213ps %ymm13,%ymm11,%ymm14
+ .byte 197,124,91,255 // vcvtdq2ps %ymm7,%ymm15
+ .byte 196,66,37,168,253 // vfmadd213ps %ymm13,%ymm11,%ymm15
+ .byte 196,98,125,24,29,30,50,0,0 // vbroadcastss 0x321e(%rip),%ymm11 # 5d7c <_sk_callback_hsw+0x3a2>
+ .byte 196,65,28,88,227 // vaddps %ymm11,%ymm12,%ymm12
+ .byte 196,98,125,24,45,20,50,0,0 // vbroadcastss 0x3214(%rip),%ymm13 # 5d80 <_sk_callback_hsw+0x3a6>
+ .byte 196,65,20,94,228 // vdivps %ymm12,%ymm13,%ymm12
+ .byte 196,65,44,92,212 // vsubps %ymm12,%ymm10,%ymm10
+ .byte 196,98,125,24,32 // vbroadcastss (%rax),%ymm12
+ .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
+ .byte 196,67,125,8,194,1 // vroundps $0x1,%ymm10,%ymm8
+ .byte 196,65,44,92,192 // vsubps %ymm8,%ymm10,%ymm8
+ .byte 196,226,125,24,21,240,49,0,0 // vbroadcastss 0x31f0(%rip),%ymm2 # 5d84 <_sk_callback_hsw+0x3aa>
+ .byte 197,44,88,210 // vaddps %ymm2,%ymm10,%ymm10
+ .byte 196,226,125,24,29,231,49,0,0 // vbroadcastss 0x31e7(%rip),%ymm3 # 5d88 <_sk_callback_hsw+0x3ae>
+ .byte 196,98,61,188,211 // vfnmadd231ps %ymm3,%ymm8,%ymm10
+ .byte 196,226,125,24,13,221,49,0,0 // vbroadcastss 0x31dd(%rip),%ymm1 # 5d8c <_sk_callback_hsw+0x3b2>
+ .byte 196,65,116,92,192 // vsubps %ymm8,%ymm1,%ymm8
+ .byte 196,226,125,24,5,211,49,0,0 // vbroadcastss 0x31d3(%rip),%ymm0 # 5d90 <_sk_callback_hsw+0x3b6>
+ .byte 196,65,124,94,192 // vdivps %ymm8,%ymm0,%ymm8
+ .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
+ .byte 197,204,84,245 // vandps %ymm5,%ymm6,%ymm6
+ .byte 197,204,86,244 // vorps %ymm4,%ymm6,%ymm6
+ .byte 196,66,77,188,241 // vfnmadd231ps %ymm9,%ymm6,%ymm14
+ .byte 196,193,76,88,243 // vaddps %ymm11,%ymm6,%ymm6
+ .byte 197,148,94,246 // vdivps %ymm6,%ymm13,%ymm6
+ .byte 197,140,92,246 // vsubps %ymm6,%ymm14,%ymm6
+ .byte 196,193,76,89,244 // vmulps %ymm12,%ymm6,%ymm6
+ .byte 196,99,125,8,214,1 // vroundps $0x1,%ymm6,%ymm10
+ .byte 196,65,76,92,210 // vsubps %ymm10,%ymm6,%ymm10
+ .byte 197,204,88,242 // vaddps %ymm2,%ymm6,%ymm6
+ .byte 196,226,45,188,243 // vfnmadd231ps %ymm3,%ymm10,%ymm6
+ .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
+ .byte 196,65,124,94,210 // vdivps %ymm10,%ymm0,%ymm10
+ .byte 196,193,76,88,242 // vaddps %ymm10,%ymm6,%ymm6
+ .byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
+ .byte 197,212,86,228 // vorps %ymm4,%ymm5,%ymm4
+ .byte 196,66,93,188,249 // vfnmadd231ps %ymm9,%ymm4,%ymm15
+ .byte 196,193,92,88,227 // vaddps %ymm11,%ymm4,%ymm4
+ .byte 197,148,94,228 // vdivps %ymm4,%ymm13,%ymm4
+ .byte 197,132,92,228 // vsubps %ymm4,%ymm15,%ymm4
+ .byte 196,193,92,89,228 // vmulps %ymm12,%ymm4,%ymm4
+ .byte 196,227,125,8,236,1 // vroundps $0x1,%ymm4,%ymm5
+ .byte 197,220,92,237 // vsubps %ymm5,%ymm4,%ymm5
+ .byte 197,220,88,210 // vaddps %ymm2,%ymm4,%ymm2
+ .byte 196,226,85,188,211 // vfnmadd231ps %ymm3,%ymm5,%ymm2
+ .byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
+ .byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
+ .byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
+ .byte 196,226,125,24,13,68,49,0,0 // vbroadcastss 0x3144(%rip),%ymm1 # 5d94 <_sk_callback_hsw+0x3ba>
+ .byte 197,188,89,209 // vmulps %ymm1,%ymm8,%ymm2
+ .byte 197,204,89,217 // vmulps %ymm1,%ymm6,%ymm3
+ .byte 197,252,89,225 // vmulps %ymm1,%ymm0,%ymm4
+ .byte 197,253,91,194 // vcvtps2dq %ymm2,%ymm0
+ .byte 197,253,91,203 // vcvtps2dq %ymm3,%ymm1
+ .byte 197,253,91,212 // vcvtps2dq %ymm4,%ymm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,252,16,92,36,128 // vmovups -0x80(%rsp),%ymm3
+ .byte 197,252,16,100,36,160 // vmovups -0x60(%rsp),%ymm4
+ .byte 197,252,16,108,36,192 // vmovups -0x40(%rsp),%ymm5
+ .byte 197,252,16,116,36,224 // vmovups -0x20(%rsp),%ymm6
+ .byte 197,252,16,60,36 // vmovups (%rsp),%ymm7
+ .byte 72,131,196,56 // add $0x38,%rsp
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,210,48,0,0 // vbroadcastss 0x30d2(%rip),%ymm8 # 5bb0 <_sk_callback_hsw+0x38e>
- .byte 196,98,125,24,13,205,48,0,0 // vbroadcastss 0x30cd(%rip),%ymm9 # 5bb4 <_sk_callback_hsw+0x392>
- .byte 196,98,125,24,21,200,48,0,0 // vbroadcastss 0x30c8(%rip),%ymm10 # 5bb8 <_sk_callback_hsw+0x396>
+ .byte 196,98,125,24,5,2,49,0,0 // vbroadcastss 0x3102(%rip),%ymm8 # 5d98 <_sk_callback_hsw+0x3be>
+ .byte 196,98,125,24,13,253,48,0,0 // vbroadcastss 0x30fd(%rip),%ymm9 # 5d9c <_sk_callback_hsw+0x3c2>
+ .byte 196,98,125,24,21,248,48,0,0 // vbroadcastss 0x30f8(%rip),%ymm10 # 5da0 <_sk_callback_hsw+0x3c6>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,185,48,0,0 // vbroadcastss 0x30b9(%rip),%ymm9 # 5bbc <_sk_callback_hsw+0x39a>
+ .byte 196,98,125,24,13,233,48,0,0 // vbroadcastss 0x30e9(%rip),%ymm9 # 5da4 <_sk_callback_hsw+0x3ca>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,175,48,0,0 // vbroadcastss 0x30af(%rip),%ymm0 # 5bc0 <_sk_callback_hsw+0x39e>
+ .byte 196,226,125,24,5,223,48,0,0 // vbroadcastss 0x30df(%rip),%ymm0 # 5da8 <_sk_callback_hsw+0x3ce>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,166,48,0,0 // vbroadcastss 0x30a6(%rip),%ymm8 # 5bc4 <_sk_callback_hsw+0x3a2>
+ .byte 196,98,125,24,5,214,48,0,0 // vbroadcastss 0x30d6(%rip),%ymm8 # 5dac <_sk_callback_hsw+0x3d2>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,156,48,0,0 // vbroadcastss 0x309c(%rip),%ymm9 # 5bc8 <_sk_callback_hsw+0x3a6>
+ .byte 196,98,125,24,13,204,48,0,0 // vbroadcastss 0x30cc(%rip),%ymm9 # 5db0 <_sk_callback_hsw+0x3d6>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,137,48,0,0 // vbroadcastss 0x3089(%rip),%ymm2 # 5bcc <_sk_callback_hsw+0x3aa>
+ .byte 196,226,125,24,21,185,48,0,0 // vbroadcastss 0x30b9(%rip),%ymm2 # 5db4 <_sk_callback_hsw+0x3da>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,127,48,0,0 // vbroadcastss 0x307f(%rip),%ymm11 # 5bd0 <_sk_callback_hsw+0x3ae>
+ .byte 196,98,125,24,29,175,48,0,0 // vbroadcastss 0x30af(%rip),%ymm11 # 5db8 <_sk_callback_hsw+0x3de>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,117,48,0,0 // vbroadcastss 0x3075(%rip),%ymm12 # 5bd4 <_sk_callback_hsw+0x3b2>
+ .byte 196,98,125,24,37,165,48,0,0 // vbroadcastss 0x30a5(%rip),%ymm12 # 5dbc <_sk_callback_hsw+0x3e2>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -15787,9 +16148,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,42,48,0,0 // vbroadcastss 0x302a(%rip),%ymm0 # 5bd8 <_sk_callback_hsw+0x3b6>
+ .byte 196,226,125,24,5,90,48,0,0 // vbroadcastss 0x305a(%rip),%ymm0 # 5dc0 <_sk_callback_hsw+0x3e6>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,33,48,0,0 // vbroadcastss 0x3021(%rip),%ymm8 # 5bdc <_sk_callback_hsw+0x3ba>
+ .byte 196,98,125,24,5,81,48,0,0 // vbroadcastss 0x3051(%rip),%ymm8 # 5dc4 <_sk_callback_hsw+0x3ea>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -15806,12 +16167,12 @@ _sk_load_a8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 2c12 <_sk_load_a8_hsw+0x4e>
+ .byte 117,53 // jne 2dca <_sk_load_a8_hsw+0x4e>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,117,53,0,0 // vpand 0x3575(%rip),%xmm0,%xmm0 # 6160 <_sk_callback_hsw+0x93e>
+ .byte 197,249,219,5,157,53,0,0 // vpand 0x359d(%rip),%xmm0,%xmm0 # 6340 <_sk_callback_hsw+0x966>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,227,47,0,0 // vbroadcastss 0x2fe3(%rip),%ymm1 # 5be0 <_sk_callback_hsw+0x3be>
+ .byte 196,226,125,24,13,19,48,0,0 // vbroadcastss 0x3013(%rip),%ymm1 # 5dc8 <_sk_callback_hsw+0x3ee>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -15824,15 +16185,15 @@ _sk_load_a8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 2be3 <_sk_load_a8_hsw+0x1f>
+ .byte 119,189 // ja 2d9b <_sk_load_a8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 2ca8 <_sk_load_a8_hsw+0xe4>
+ .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 2e60 <_sk_load_a8_hsw+0xe4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,158 // jmp 2be3 <_sk_load_a8_hsw+0x1f>
+ .byte 235,158 // jmp 2d9b <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -15840,7 +16201,7 @@ _sk_load_a8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,118,255,255,255 // jmpq 2be3 <_sk_load_a8_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 2d9b <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -15851,7 +16212,7 @@ _sk_load_a8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,59,255,255,255 // jmpq 2be3 <_sk_load_a8_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 2d9b <_sk_load_a8_hsw+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -15884,12 +16245,12 @@ _sk_load_a8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 2d12 <_sk_load_a8_dst_hsw+0x4e>
+ .byte 117,53 // jne 2eca <_sk_load_a8_dst_hsw+0x4e>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,133,52,0,0 // vpand 0x3485(%rip),%xmm4,%xmm4 # 6170 <_sk_callback_hsw+0x94e>
+ .byte 197,217,219,37,173,52,0,0 // vpand 0x34ad(%rip),%xmm4,%xmm4 # 6350 <_sk_callback_hsw+0x976>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,231,46,0,0 // vbroadcastss 0x2ee7(%rip),%ymm5 # 5be4 <_sk_callback_hsw+0x3c2>
+ .byte 196,226,125,24,45,23,47,0,0 // vbroadcastss 0x2f17(%rip),%ymm5 # 5dcc <_sk_callback_hsw+0x3f2>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -15902,15 +16263,15 @@ _sk_load_a8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 2ce3 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 119,189 // ja 2e9b <_sk_load_a8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 2da8 <_sk_load_a8_dst_hsw+0xe4>
+ .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 2f60 <_sk_load_a8_dst_hsw+0xe4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,158 // jmp 2ce3 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 235,158 // jmp 2e9b <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -15918,7 +16279,7 @@ _sk_load_a8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,118,255,255,255 // jmpq 2ce3 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 2e9b <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -15929,7 +16290,7 @@ _sk_load_a8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,59,255,255,255 // jmpq 2ce3 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 2e9b <_sk_load_a8_dst_hsw+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -15990,7 +16351,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,110,45,0,0 // vbroadcastss 0x2d6e(%rip),%ymm1 # 5be8 <_sk_callback_hsw+0x3c6>
+ .byte 196,226,125,24,13,158,45,0,0 // vbroadcastss 0x2d9e(%rip),%ymm1 # 5dd0 <_sk_callback_hsw+0x3f6>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -16009,14 +16370,14 @@ _sk_store_a8_hsw:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,65,45,0,0 // vbroadcastss 0x2d41(%rip),%ymm8 # 5bec <_sk_callback_hsw+0x3ca>
+ .byte 196,98,125,24,5,113,45,0,0 // vbroadcastss 0x2d71(%rip),%ymm8 # 5dd4 <_sk_callback_hsw+0x3fa>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 2ed5 <_sk_store_a8_hsw+0x47>
+ .byte 117,11 // jne 308d <_sk_store_a8_hsw+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16025,25 +16386,25 @@ _sk_store_a8_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 2ed0 <_sk_store_a8_hsw+0x42>
+ .byte 119,235 // ja 3088 <_sk_store_a8_hsw+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 2f4c <_sk_store_a8_hsw+0xbe>
+ .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 3104 <_sk_store_a8_hsw+0xbe>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp 2ed0 <_sk_store_a8_hsw+0x42>
+ .byte 235,201 // jmp 3088 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,104,50,0,0 // vpshufb 0x3268(%rip),%xmm8,%xmm8 # 6180 <_sk_callback_hsw+0x95e>
+ .byte 196,98,57,0,5,144,50,0,0 // vpshufb 0x3290(%rip),%xmm8,%xmm8 # 6360 <_sk_callback_hsw+0x986>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp 2ed0 <_sk_store_a8_hsw+0x42>
+ .byte 235,175 // jmp 3088 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,78,50,0,0 // vpshufb 0x324e(%rip),%xmm8,%xmm8 # 6190 <_sk_callback_hsw+0x96e>
+ .byte 196,98,57,0,5,118,50,0,0 // vpshufb 0x3276(%rip),%xmm8,%xmm8 # 6370 <_sk_callback_hsw+0x996>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp 2ed0 <_sk_store_a8_hsw+0x42>
+ .byte 235,134 // jmp 3088 <_sk_store_a8_hsw+0x42>
.byte 102,144 // xchg %ax,%ax
.byte 178,255 // mov $0xff,%dl
.byte 255 // (bad)
@@ -16077,15 +16438,15 @@ _sk_load_g8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 2fbb <_sk_load_g8_hsw+0x53>
+ .byte 117,58 // jne 3173 <_sk_load_g8_hsw+0x53>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,17,50,0,0 // vpand 0x3211(%rip),%xmm0,%xmm0 # 61a0 <_sk_callback_hsw+0x97e>
+ .byte 197,249,219,5,57,50,0,0 // vpand 0x3239(%rip),%xmm0,%xmm0 # 6380 <_sk_callback_hsw+0x9a6>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,79,44,0,0 // vbroadcastss 0x2c4f(%rip),%ymm1 # 5bf0 <_sk_callback_hsw+0x3ce>
+ .byte 196,226,125,24,13,127,44,0,0 // vbroadcastss 0x2c7f(%rip),%ymm1 # 5dd8 <_sk_callback_hsw+0x3fe>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,68,44,0,0 // vbroadcastss 0x2c44(%rip),%ymm3 # 5bf4 <_sk_callback_hsw+0x3d2>
+ .byte 196,226,125,24,29,116,44,0,0 // vbroadcastss 0x2c74(%rip),%ymm3 # 5ddc <_sk_callback_hsw+0x402>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -16095,15 +16456,15 @@ _sk_load_g8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 2f87 <_sk_load_g8_hsw+0x1f>
+ .byte 119,184 // ja 313f <_sk_load_g8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3054 <_sk_load_g8_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 320c <_sk_load_g8_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,153 // jmp 2f87 <_sk_load_g8_hsw+0x1f>
+ .byte 235,153 // jmp 313f <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -16111,7 +16472,7 @@ _sk_load_g8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,113,255,255,255 // jmpq 2f87 <_sk_load_g8_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 313f <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -16122,7 +16483,7 @@ _sk_load_g8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,54,255,255,255 // jmpq 2f87 <_sk_load_g8_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 313f <_sk_load_g8_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -16156,15 +16517,15 @@ _sk_load_g8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 30c3 <_sk_load_g8_dst_hsw+0x53>
+ .byte 117,58 // jne 327b <_sk_load_g8_dst_hsw+0x53>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,25,49,0,0 // vpand 0x3119(%rip),%xmm4,%xmm4 # 61b0 <_sk_callback_hsw+0x98e>
+ .byte 197,217,219,37,65,49,0,0 // vpand 0x3141(%rip),%xmm4,%xmm4 # 6390 <_sk_callback_hsw+0x9b6>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,79,43,0,0 // vbroadcastss 0x2b4f(%rip),%ymm5 # 5bf8 <_sk_callback_hsw+0x3d6>
+ .byte 196,226,125,24,45,127,43,0,0 // vbroadcastss 0x2b7f(%rip),%ymm5 # 5de0 <_sk_callback_hsw+0x406>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,68,43,0,0 // vbroadcastss 0x2b44(%rip),%ymm7 # 5bfc <_sk_callback_hsw+0x3da>
+ .byte 196,226,125,24,61,116,43,0,0 // vbroadcastss 0x2b74(%rip),%ymm7 # 5de4 <_sk_callback_hsw+0x40a>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -16174,15 +16535,15 @@ _sk_load_g8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 308f <_sk_load_g8_dst_hsw+0x1f>
+ .byte 119,184 // ja 3247 <_sk_load_g8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 315c <_sk_load_g8_dst_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3314 <_sk_load_g8_dst_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,153 // jmp 308f <_sk_load_g8_dst_hsw+0x1f>
+ .byte 235,153 // jmp 3247 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -16190,7 +16551,7 @@ _sk_load_g8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,113,255,255,255 // jmpq 308f <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 3247 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -16201,7 +16562,7 @@ _sk_load_g8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,54,255,255,255 // jmpq 308f <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 3247 <_sk_load_g8_dst_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -16263,10 +16624,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,210,41,0,0 // vbroadcastss 0x29d2(%rip),%ymm1 # 5c00 <_sk_callback_hsw+0x3de>
+ .byte 196,226,125,24,13,2,42,0,0 // vbroadcastss 0x2a02(%rip),%ymm1 # 5de8 <_sk_callback_hsw+0x40e>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,199,41,0,0 // vbroadcastss 0x29c7(%rip),%ymm3 # 5c04 <_sk_callback_hsw+0x3e2>
+ .byte 196,226,125,24,29,247,41,0,0 // vbroadcastss 0x29f7(%rip),%ymm3 # 5dec <_sk_callback_hsw+0x412>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -16284,26 +16645,26 @@ _sk_load_565_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 32d6 <_sk_load_565_hsw+0x8f>
+ .byte 117,115 // jne 348e <_sk_load_565_hsw+0x8f>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,145,41,0,0 // vpbroadcastd 0x2991(%rip),%ymm0 # 5c08 <_sk_callback_hsw+0x3e6>
+ .byte 196,226,125,88,5,193,41,0,0 // vpbroadcastd 0x29c1(%rip),%ymm0 # 5df0 <_sk_callback_hsw+0x416>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,132,41,0,0 // vbroadcastss 0x2984(%rip),%ymm1 # 5c0c <_sk_callback_hsw+0x3ea>
+ .byte 196,226,125,24,13,180,41,0,0 // vbroadcastss 0x29b4(%rip),%ymm1 # 5df4 <_sk_callback_hsw+0x41a>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,123,41,0,0 // vpbroadcastd 0x297b(%rip),%ymm1 # 5c10 <_sk_callback_hsw+0x3ee>
+ .byte 196,226,125,88,13,171,41,0,0 // vpbroadcastd 0x29ab(%rip),%ymm1 # 5df8 <_sk_callback_hsw+0x41e>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,110,41,0,0 // vbroadcastss 0x296e(%rip),%ymm3 # 5c14 <_sk_callback_hsw+0x3f2>
+ .byte 196,226,125,24,29,158,41,0,0 // vbroadcastss 0x299e(%rip),%ymm3 # 5dfc <_sk_callback_hsw+0x422>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,101,41,0,0 // vpbroadcastd 0x2965(%rip),%ymm3 # 5c18 <_sk_callback_hsw+0x3f6>
+ .byte 196,226,125,88,29,149,41,0,0 // vpbroadcastd 0x2995(%rip),%ymm3 # 5e00 <_sk_callback_hsw+0x426>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,88,41,0,0 // vbroadcastss 0x2958(%rip),%ymm3 # 5c1c <_sk_callback_hsw+0x3fa>
+ .byte 196,226,125,24,29,136,41,0,0 // vbroadcastss 0x2988(%rip),%ymm3 # 5e04 <_sk_callback_hsw+0x42a>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,77,41,0,0 // vbroadcastss 0x294d(%rip),%ymm3 # 5c20 <_sk_callback_hsw+0x3fe>
+ .byte 196,226,125,24,29,125,41,0,0 // vbroadcastss 0x297d(%rip),%ymm3 # 5e08 <_sk_callback_hsw+0x42e>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -16311,27 +16672,27 @@ _sk_load_565_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 3269 <_sk_load_565_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 3421 <_sk_load_565_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 335c <_sk_load_565_hsw+0x115>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 3514 <_sk_load_565_hsw+0x115>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,89,255,255,255 // jmpq 3269 <_sk_load_565_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 3421 <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,60,255,255,255 // jmpq 3269 <_sk_load_565_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 3421 <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,15,255,255,255 // jmpq 3269 <_sk_load_565_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 3421 <_sk_load_565_hsw+0x22>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -16365,26 +16726,26 @@ _sk_load_565_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 3407 <_sk_load_565_dst_hsw+0x8f>
+ .byte 117,115 // jne 35bf <_sk_load_565_dst_hsw+0x8f>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6
- .byte 196,226,125,88,37,124,40,0,0 // vpbroadcastd 0x287c(%rip),%ymm4 # 5c24 <_sk_callback_hsw+0x402>
+ .byte 196,226,125,88,37,172,40,0,0 // vpbroadcastd 0x28ac(%rip),%ymm4 # 5e0c <_sk_callback_hsw+0x432>
.byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,111,40,0,0 // vbroadcastss 0x286f(%rip),%ymm5 # 5c28 <_sk_callback_hsw+0x406>
+ .byte 196,226,125,24,45,159,40,0,0 // vbroadcastss 0x289f(%rip),%ymm5 # 5e10 <_sk_callback_hsw+0x436>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,102,40,0,0 // vpbroadcastd 0x2866(%rip),%ymm5 # 5c2c <_sk_callback_hsw+0x40a>
+ .byte 196,226,125,88,45,150,40,0,0 // vpbroadcastd 0x2896(%rip),%ymm5 # 5e14 <_sk_callback_hsw+0x43a>
.byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,89,40,0,0 // vbroadcastss 0x2859(%rip),%ymm7 # 5c30 <_sk_callback_hsw+0x40e>
+ .byte 196,226,125,24,61,137,40,0,0 // vbroadcastss 0x2889(%rip),%ymm7 # 5e18 <_sk_callback_hsw+0x43e>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,88,61,80,40,0,0 // vpbroadcastd 0x2850(%rip),%ymm7 # 5c34 <_sk_callback_hsw+0x412>
+ .byte 196,226,125,88,61,128,40,0,0 // vpbroadcastd 0x2880(%rip),%ymm7 # 5e1c <_sk_callback_hsw+0x442>
.byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,67,40,0,0 // vbroadcastss 0x2843(%rip),%ymm7 # 5c38 <_sk_callback_hsw+0x416>
+ .byte 196,226,125,24,61,115,40,0,0 // vbroadcastss 0x2873(%rip),%ymm7 # 5e20 <_sk_callback_hsw+0x446>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,56,40,0,0 // vbroadcastss 0x2838(%rip),%ymm7 # 5c3c <_sk_callback_hsw+0x41a>
+ .byte 196,226,125,24,61,104,40,0,0 // vbroadcastss 0x2868(%rip),%ymm7 # 5e24 <_sk_callback_hsw+0x44a>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -16392,27 +16753,27 @@ _sk_load_565_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 339a <_sk_load_565_dst_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 3552 <_sk_load_565_dst_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 348c <_sk_load_565_dst_hsw+0x114>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3644 <_sk_load_565_dst_hsw+0x114>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,89,255,255,255 // jmpq 339a <_sk_load_565_dst_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 3552 <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,60,255,255,255 // jmpq 339a <_sk_load_565_dst_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 3552 <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,15,255,255,255 // jmpq 339a <_sk_load_565_dst_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 3552 <_sk_load_565_dst_hsw+0x22>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -16475,23 +16836,23 @@ _sk_gather_565_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,231,38,0,0 // vpbroadcastd 0x26e7(%rip),%ymm0 # 5c40 <_sk_callback_hsw+0x41e>
+ .byte 196,226,125,88,5,23,39,0,0 // vpbroadcastd 0x2717(%rip),%ymm0 # 5e28 <_sk_callback_hsw+0x44e>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,218,38,0,0 // vbroadcastss 0x26da(%rip),%ymm1 # 5c44 <_sk_callback_hsw+0x422>
+ .byte 196,226,125,24,13,10,39,0,0 // vbroadcastss 0x270a(%rip),%ymm1 # 5e2c <_sk_callback_hsw+0x452>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,209,38,0,0 // vpbroadcastd 0x26d1(%rip),%ymm1 # 5c48 <_sk_callback_hsw+0x426>
+ .byte 196,226,125,88,13,1,39,0,0 // vpbroadcastd 0x2701(%rip),%ymm1 # 5e30 <_sk_callback_hsw+0x456>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,196,38,0,0 // vbroadcastss 0x26c4(%rip),%ymm3 # 5c4c <_sk_callback_hsw+0x42a>
+ .byte 196,226,125,24,29,244,38,0,0 // vbroadcastss 0x26f4(%rip),%ymm3 # 5e34 <_sk_callback_hsw+0x45a>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,187,38,0,0 // vpbroadcastd 0x26bb(%rip),%ymm3 # 5c50 <_sk_callback_hsw+0x42e>
+ .byte 196,226,125,88,29,235,38,0,0 // vpbroadcastd 0x26eb(%rip),%ymm3 # 5e38 <_sk_callback_hsw+0x45e>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,174,38,0,0 // vbroadcastss 0x26ae(%rip),%ymm3 # 5c54 <_sk_callback_hsw+0x432>
+ .byte 196,226,125,24,29,222,38,0,0 // vbroadcastss 0x26de(%rip),%ymm3 # 5e3c <_sk_callback_hsw+0x462>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,163,38,0,0 // vbroadcastss 0x26a3(%rip),%ymm3 # 5c58 <_sk_callback_hsw+0x436>
+ .byte 196,226,125,24,29,211,38,0,0 // vbroadcastss 0x26d3(%rip),%ymm3 # 5e40 <_sk_callback_hsw+0x466>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_hsw
@@ -16506,11 +16867,11 @@ _sk_store_565_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,133,38,0,0 // vbroadcastss 0x2685(%rip),%ymm8 # 5c5c <_sk_callback_hsw+0x43a>
+ .byte 196,98,125,24,5,181,38,0,0 // vbroadcastss 0x26b5(%rip),%ymm8 # 5e44 <_sk_callback_hsw+0x46a>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,112,38,0,0 // vbroadcastss 0x2670(%rip),%ymm10 # 5c60 <_sk_callback_hsw+0x43e>
+ .byte 196,98,125,24,21,160,38,0,0 // vbroadcastss 0x26a0(%rip),%ymm10 # 5e48 <_sk_callback_hsw+0x46e>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -16521,7 +16882,7 @@ _sk_store_565_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 362f <_sk_store_565_hsw+0x78>
+ .byte 117,11 // jne 37e7 <_sk_store_565_hsw+0x78>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16530,22 +16891,22 @@ _sk_store_565_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 362a <_sk_store_565_hsw+0x73>
+ .byte 119,235 // ja 37e2 <_sk_store_565_hsw+0x73>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 368c <_sk_store_565_hsw+0xd5>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3844 <_sk_store_565_hsw+0xd5>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 362a <_sk_store_565_hsw+0x73>
+ .byte 235,206 // jmp 37e2 <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 362a <_sk_store_565_hsw+0x73>
+ .byte 235,190 // jmp 37e2 <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 362a <_sk_store_565_hsw+0x73>
+ .byte 235,158 // jmp 37e2 <_sk_store_565_hsw+0x73>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -16563,7 +16924,7 @@ _sk_store_565_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe10036a4 <_sk_callback_hsw+0xffffffffe0ffde82>
+ .byte 232,255,255,255,224 // callq ffffffffe100385c <_sk_callback_hsw+0xffffffffe0ffde82>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -16581,28 +16942,28 @@ _sk_load_4444_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 3753 <_sk_load_4444_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 390b <_sk_load_4444_hsw+0xab>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,136,37,0,0 // vpbroadcastd 0x2588(%rip),%ymm0 # 5c64 <_sk_callback_hsw+0x442>
+ .byte 196,226,125,88,5,184,37,0,0 // vpbroadcastd 0x25b8(%rip),%ymm0 # 5e4c <_sk_callback_hsw+0x472>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,123,37,0,0 // vbroadcastss 0x257b(%rip),%ymm1 # 5c68 <_sk_callback_hsw+0x446>
+ .byte 196,226,125,24,13,171,37,0,0 // vbroadcastss 0x25ab(%rip),%ymm1 # 5e50 <_sk_callback_hsw+0x476>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,114,37,0,0 // vpbroadcastd 0x2572(%rip),%ymm1 # 5c6c <_sk_callback_hsw+0x44a>
+ .byte 196,226,125,88,13,162,37,0,0 // vpbroadcastd 0x25a2(%rip),%ymm1 # 5e54 <_sk_callback_hsw+0x47a>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,101,37,0,0 // vbroadcastss 0x2565(%rip),%ymm2 # 5c70 <_sk_callback_hsw+0x44e>
+ .byte 196,226,125,24,21,149,37,0,0 // vbroadcastss 0x2595(%rip),%ymm2 # 5e58 <_sk_callback_hsw+0x47e>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,92,37,0,0 // vpbroadcastd 0x255c(%rip),%ymm2 # 5c74 <_sk_callback_hsw+0x452>
+ .byte 196,226,125,88,21,140,37,0,0 // vpbroadcastd 0x258c(%rip),%ymm2 # 5e5c <_sk_callback_hsw+0x482>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,79,37,0,0 // vbroadcastss 0x254f(%rip),%ymm8 # 5c78 <_sk_callback_hsw+0x456>
+ .byte 196,98,125,24,5,127,37,0,0 // vbroadcastss 0x257f(%rip),%ymm8 # 5e60 <_sk_callback_hsw+0x486>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,69,37,0,0 // vpbroadcastd 0x2545(%rip),%ymm8 # 5c7c <_sk_callback_hsw+0x45a>
+ .byte 196,98,125,88,5,117,37,0,0 // vpbroadcastd 0x2575(%rip),%ymm8 # 5e64 <_sk_callback_hsw+0x48a>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,55,37,0,0 // vbroadcastss 0x2537(%rip),%ymm8 # 5c80 <_sk_callback_hsw+0x45e>
+ .byte 196,98,125,24,5,103,37,0,0 // vbroadcastss 0x2567(%rip),%ymm8 # 5e68 <_sk_callback_hsw+0x48e>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16612,27 +16973,27 @@ _sk_load_4444_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 36ce <_sk_load_4444_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 3886 <_sk_load_4444_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 37d8 <_sk_load_4444_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3990 <_sk_load_4444_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,65,255,255,255 // jmpq 36ce <_sk_load_4444_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 3886 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,36,255,255,255 // jmpq 36ce <_sk_load_4444_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 3886 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,247,254,255,255 // jmpq 36ce <_sk_load_4444_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 3886 <_sk_load_4444_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -16667,28 +17028,28 @@ _sk_load_4444_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 389f <_sk_load_4444_dst_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 3a57 <_sk_load_4444_dst_hsw+0xab>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7
- .byte 196,226,125,88,37,92,36,0,0 // vpbroadcastd 0x245c(%rip),%ymm4 # 5c84 <_sk_callback_hsw+0x462>
+ .byte 196,226,125,88,37,140,36,0,0 // vpbroadcastd 0x248c(%rip),%ymm4 # 5e6c <_sk_callback_hsw+0x492>
.byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,79,36,0,0 // vbroadcastss 0x244f(%rip),%ymm5 # 5c88 <_sk_callback_hsw+0x466>
+ .byte 196,226,125,24,45,127,36,0,0 // vbroadcastss 0x247f(%rip),%ymm5 # 5e70 <_sk_callback_hsw+0x496>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,70,36,0,0 // vpbroadcastd 0x2446(%rip),%ymm5 # 5c8c <_sk_callback_hsw+0x46a>
+ .byte 196,226,125,88,45,118,36,0,0 // vpbroadcastd 0x2476(%rip),%ymm5 # 5e74 <_sk_callback_hsw+0x49a>
.byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,57,36,0,0 // vbroadcastss 0x2439(%rip),%ymm6 # 5c90 <_sk_callback_hsw+0x46e>
+ .byte 196,226,125,24,53,105,36,0,0 // vbroadcastss 0x2469(%rip),%ymm6 # 5e78 <_sk_callback_hsw+0x49e>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,88,53,48,36,0,0 // vpbroadcastd 0x2430(%rip),%ymm6 # 5c94 <_sk_callback_hsw+0x472>
+ .byte 196,226,125,88,53,96,36,0,0 // vpbroadcastd 0x2460(%rip),%ymm6 # 5e7c <_sk_callback_hsw+0x4a2>
.byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,35,36,0,0 // vbroadcastss 0x2423(%rip),%ymm8 # 5c98 <_sk_callback_hsw+0x476>
+ .byte 196,98,125,24,5,83,36,0,0 // vbroadcastss 0x2453(%rip),%ymm8 # 5e80 <_sk_callback_hsw+0x4a6>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,88,5,25,36,0,0 // vpbroadcastd 0x2419(%rip),%ymm8 # 5c9c <_sk_callback_hsw+0x47a>
+ .byte 196,98,125,88,5,73,36,0,0 // vpbroadcastd 0x2449(%rip),%ymm8 # 5e84 <_sk_callback_hsw+0x4aa>
.byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,11,36,0,0 // vbroadcastss 0x240b(%rip),%ymm8 # 5ca0 <_sk_callback_hsw+0x47e>
+ .byte 196,98,125,24,5,59,36,0,0 // vbroadcastss 0x243b(%rip),%ymm8 # 5e88 <_sk_callback_hsw+0x4ae>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16698,27 +17059,27 @@ _sk_load_4444_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 381a <_sk_load_4444_dst_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 39d2 <_sk_load_4444_dst_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3924 <_sk_load_4444_dst_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3adc <_sk_load_4444_dst_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,65,255,255,255 // jmpq 381a <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 39d2 <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,36,255,255,255 // jmpq 381a <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 39d2 <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,247,254,255,255 // jmpq 381a <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 39d2 <_sk_load_4444_dst_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -16781,25 +17142,25 @@ _sk_gather_4444_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,179,34,0,0 // vpbroadcastd 0x22b3(%rip),%ymm0 # 5ca4 <_sk_callback_hsw+0x482>
+ .byte 196,226,125,88,5,227,34,0,0 // vpbroadcastd 0x22e3(%rip),%ymm0 # 5e8c <_sk_callback_hsw+0x4b2>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,166,34,0,0 // vbroadcastss 0x22a6(%rip),%ymm1 # 5ca8 <_sk_callback_hsw+0x486>
+ .byte 196,226,125,24,13,214,34,0,0 // vbroadcastss 0x22d6(%rip),%ymm1 # 5e90 <_sk_callback_hsw+0x4b6>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,157,34,0,0 // vpbroadcastd 0x229d(%rip),%ymm1 # 5cac <_sk_callback_hsw+0x48a>
+ .byte 196,226,125,88,13,205,34,0,0 // vpbroadcastd 0x22cd(%rip),%ymm1 # 5e94 <_sk_callback_hsw+0x4ba>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,144,34,0,0 // vbroadcastss 0x2290(%rip),%ymm2 # 5cb0 <_sk_callback_hsw+0x48e>
+ .byte 196,226,125,24,21,192,34,0,0 // vbroadcastss 0x22c0(%rip),%ymm2 # 5e98 <_sk_callback_hsw+0x4be>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,135,34,0,0 // vpbroadcastd 0x2287(%rip),%ymm2 # 5cb4 <_sk_callback_hsw+0x492>
+ .byte 196,226,125,88,21,183,34,0,0 // vpbroadcastd 0x22b7(%rip),%ymm2 # 5e9c <_sk_callback_hsw+0x4c2>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,122,34,0,0 // vbroadcastss 0x227a(%rip),%ymm8 # 5cb8 <_sk_callback_hsw+0x496>
+ .byte 196,98,125,24,5,170,34,0,0 // vbroadcastss 0x22aa(%rip),%ymm8 # 5ea0 <_sk_callback_hsw+0x4c6>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,112,34,0,0 // vpbroadcastd 0x2270(%rip),%ymm8 # 5cbc <_sk_callback_hsw+0x49a>
+ .byte 196,98,125,88,5,160,34,0,0 // vpbroadcastd 0x22a0(%rip),%ymm8 # 5ea4 <_sk_callback_hsw+0x4ca>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,98,34,0,0 // vbroadcastss 0x2262(%rip),%ymm8 # 5cc0 <_sk_callback_hsw+0x49e>
+ .byte 196,98,125,24,5,146,34,0,0 // vbroadcastss 0x2292(%rip),%ymm8 # 5ea8 <_sk_callback_hsw+0x4ce>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16816,7 +17177,7 @@ _sk_store_4444_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,61,34,0,0 // vbroadcastss 0x223d(%rip),%ymm8 # 5cc4 <_sk_callback_hsw+0x4a2>
+ .byte 196,98,125,24,5,109,34,0,0 // vbroadcastss 0x226d(%rip),%ymm8 # 5eac <_sk_callback_hsw+0x4d2>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -16834,7 +17195,7 @@ _sk_store_4444_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3aeb <_sk_store_4444_hsw+0x84>
+ .byte 117,11 // jne 3ca3 <_sk_store_4444_hsw+0x84>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -16843,22 +17204,22 @@ _sk_store_4444_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3ae6 <_sk_store_4444_hsw+0x7f>
+ .byte 119,235 // ja 3c9e <_sk_store_4444_hsw+0x7f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3b48 <_sk_store_4444_hsw+0xe1>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3d00 <_sk_store_4444_hsw+0xe1>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 3ae6 <_sk_store_4444_hsw+0x7f>
+ .byte 235,206 // jmp 3c9e <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 3ae6 <_sk_store_4444_hsw+0x7f>
+ .byte 235,190 // jmp 3c9e <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 3ae6 <_sk_store_4444_hsw+0x7f>
+ .byte 235,158 // jmp 3c9e <_sk_store_4444_hsw+0x7f>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -16876,7 +17237,7 @@ _sk_store_4444_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe1003b60 <_sk_callback_hsw+0xffffffffe0ffe33e>
+ .byte 232,255,255,255,224 // callq ffffffffe1003d18 <_sk_callback_hsw+0xffffffffe0ffe33e>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -16895,16 +17256,16 @@ _sk_load_8888_hsw:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3bde <_sk_load_8888_hsw+0x7a>
+ .byte 117,87 // jne 3d96 <_sk_load_8888_hsw+0x7a>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,228,84,5,77,35,0,0 // vandps 0x234d(%rip),%ymm3,%ymm0 # 5ee0 <_sk_callback_hsw+0x6be>
+ .byte 197,228,84,5,117,35,0,0 // vandps 0x2375(%rip),%ymm3,%ymm0 # 60c0 <_sk_callback_hsw+0x6e6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,40,33,0,0 // vbroadcastss 0x2128(%rip),%ymm8 # 5cc8 <_sk_callback_hsw+0x4a6>
+ .byte 196,98,125,24,5,88,33,0,0 // vbroadcastss 0x2158(%rip),%ymm8 # 5eb0 <_sk_callback_hsw+0x4d6>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,82,35,0,0 // vpshufb 0x2352(%rip),%ymm3,%ymm1 # 5f00 <_sk_callback_hsw+0x6de>
+ .byte 196,226,101,0,13,122,35,0,0 // vpshufb 0x237a(%rip),%ymm3,%ymm1 # 60e0 <_sk_callback_hsw+0x706>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,96,35,0,0 // vpshufb 0x2360(%rip),%ymm3,%ymm2 # 5f20 <_sk_callback_hsw+0x6fe>
+ .byte 196,226,101,0,21,136,35,0,0 // vpshufb 0x2388(%rip),%ymm3,%ymm2 # 6100 <_sk_callback_hsw+0x726>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -16921,7 +17282,7 @@ _sk_load_8888_hsw:
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
- .byte 235,135 // jmp 3b8b <_sk_load_8888_hsw+0x27>
+ .byte 235,135 // jmp 3d43 <_sk_load_8888_hsw+0x27>
HIDDEN _sk_load_8888_dst_hsw
.globl _sk_load_8888_dst_hsw
@@ -16937,16 +17298,16 @@ _sk_load_8888_dst_hsw:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3c7e <_sk_load_8888_dst_hsw+0x7a>
+ .byte 117,87 // jne 3e36 <_sk_load_8888_dst_hsw+0x7a>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,196,84,37,13,35,0,0 // vandps 0x230d(%rip),%ymm7,%ymm4 # 5f40 <_sk_callback_hsw+0x71e>
+ .byte 197,196,84,37,53,35,0,0 // vandps 0x2335(%rip),%ymm7,%ymm4 # 6120 <_sk_callback_hsw+0x746>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,140,32,0,0 // vbroadcastss 0x208c(%rip),%ymm8 # 5ccc <_sk_callback_hsw+0x4aa>
+ .byte 196,98,125,24,5,188,32,0,0 // vbroadcastss 0x20bc(%rip),%ymm8 # 5eb4 <_sk_callback_hsw+0x4da>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
- .byte 196,226,69,0,45,18,35,0,0 // vpshufb 0x2312(%rip),%ymm7,%ymm5 # 5f60 <_sk_callback_hsw+0x73e>
+ .byte 196,226,69,0,45,58,35,0,0 // vpshufb 0x233a(%rip),%ymm7,%ymm5 # 6140 <_sk_callback_hsw+0x766>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
.byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5
- .byte 196,226,69,0,53,32,35,0,0 // vpshufb 0x2320(%rip),%ymm7,%ymm6 # 5f80 <_sk_callback_hsw+0x75e>
+ .byte 196,226,69,0,53,72,35,0,0 // vpshufb 0x2348(%rip),%ymm7,%ymm6 # 6160 <_sk_callback_hsw+0x786>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -16963,7 +17324,7 @@ _sk_load_8888_dst_hsw:
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,125,33,228 // vpmovsxbd %xmm4,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
- .byte 235,135 // jmp 3c2b <_sk_load_8888_dst_hsw+0x27>
+ .byte 235,135 // jmp 3de3 <_sk_load_8888_dst_hsw+0x27>
HIDDEN _sk_gather_8888_hsw
.globl _sk_gather_8888_hsw
@@ -16978,14 +17339,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,206,34,0,0 // vpand 0x22ce(%rip),%ymm3,%ymm0 # 5fa0 <_sk_callback_hsw+0x77e>
+ .byte 197,229,219,5,246,34,0,0 // vpand 0x22f6(%rip),%ymm3,%ymm0 # 6180 <_sk_callback_hsw+0x7a6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,241,31,0,0 // vbroadcastss 0x1ff1(%rip),%ymm8 # 5cd0 <_sk_callback_hsw+0x4ae>
+ .byte 196,98,125,24,5,33,32,0,0 // vbroadcastss 0x2021(%rip),%ymm8 # 5eb8 <_sk_callback_hsw+0x4de>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,211,34,0,0 // vpshufb 0x22d3(%rip),%ymm3,%ymm1 # 5fc0 <_sk_callback_hsw+0x79e>
+ .byte 196,226,101,0,13,251,34,0,0 // vpshufb 0x22fb(%rip),%ymm3,%ymm1 # 61a0 <_sk_callback_hsw+0x7c6>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,225,34,0,0 // vpshufb 0x22e1(%rip),%ymm3,%ymm2 # 5fe0 <_sk_callback_hsw+0x7be>
+ .byte 196,226,101,0,21,9,35,0,0 // vpshufb 0x2309(%rip),%ymm3,%ymm2 # 61c0 <_sk_callback_hsw+0x7e6>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17007,7 +17368,7 @@ _sk_store_8888_hsw:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,147,31,0,0 // vbroadcastss 0x1f93(%rip),%ymm8 # 5cd4 <_sk_callback_hsw+0x4b2>
+ .byte 196,98,125,24,5,195,31,0,0 // vbroadcastss 0x1fc3(%rip),%ymm8 # 5ebc <_sk_callback_hsw+0x4e2>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -17023,7 +17384,7 @@ _sk_store_8888_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3d9a <_sk_store_8888_hsw+0x80>
+ .byte 117,11 // jne 3f52 <_sk_store_8888_hsw+0x80>
.byte 197,124,17,0 // vmovups %ymm8,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -17036,7 +17397,7 @@ _sk_store_8888_hsw:
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
- .byte 235,211 // jmp 3d93 <_sk_store_8888_hsw+0x79>
+ .byte 235,211 // jmp 3f4b <_sk_store_8888_hsw+0x79>
HIDDEN _sk_load_bgra_hsw
.globl _sk_load_bgra_hsw
@@ -17052,16 +17413,16 @@ _sk_load_bgra_hsw:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3e3a <_sk_load_bgra_hsw+0x7a>
+ .byte 117,87 // jne 3ff2 <_sk_load_bgra_hsw+0x7a>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,228,84,5,17,34,0,0 // vandps 0x2211(%rip),%ymm3,%ymm0 # 6000 <_sk_callback_hsw+0x7de>
+ .byte 197,228,84,5,57,34,0,0 // vandps 0x2239(%rip),%ymm3,%ymm0 # 61e0 <_sk_callback_hsw+0x806>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,220,30,0,0 // vbroadcastss 0x1edc(%rip),%ymm8 # 5cd8 <_sk_callback_hsw+0x4b6>
+ .byte 196,98,125,24,5,12,31,0,0 // vbroadcastss 0x1f0c(%rip),%ymm8 # 5ec0 <_sk_callback_hsw+0x4e6>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,22,34,0,0 // vpshufb 0x2216(%rip),%ymm3,%ymm0 # 6020 <_sk_callback_hsw+0x7fe>
+ .byte 196,226,101,0,5,62,34,0,0 // vpshufb 0x223e(%rip),%ymm3,%ymm0 # 6200 <_sk_callback_hsw+0x826>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,36,34,0,0 // vpshufb 0x2224(%rip),%ymm3,%ymm0 # 6040 <_sk_callback_hsw+0x81e>
+ .byte 196,226,101,0,5,76,34,0,0 // vpshufb 0x224c(%rip),%ymm3,%ymm0 # 6220 <_sk_callback_hsw+0x846>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17078,7 +17439,7 @@ _sk_load_bgra_hsw:
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
- .byte 235,135 // jmp 3de7 <_sk_load_bgra_hsw+0x27>
+ .byte 235,135 // jmp 3f9f <_sk_load_bgra_hsw+0x27>
HIDDEN _sk_load_bgra_dst_hsw
.globl _sk_load_bgra_dst_hsw
@@ -17094,16 +17455,16 @@ _sk_load_bgra_dst_hsw:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 3eda <_sk_load_bgra_dst_hsw+0x7a>
+ .byte 117,87 // jne 4092 <_sk_load_bgra_dst_hsw+0x7a>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,196,84,37,209,33,0,0 // vandps 0x21d1(%rip),%ymm7,%ymm4 # 6060 <_sk_callback_hsw+0x83e>
+ .byte 197,196,84,37,249,33,0,0 // vandps 0x21f9(%rip),%ymm7,%ymm4 # 6240 <_sk_callback_hsw+0x866>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,64,30,0,0 // vbroadcastss 0x1e40(%rip),%ymm8 # 5cdc <_sk_callback_hsw+0x4ba>
+ .byte 196,98,125,24,5,112,30,0,0 // vbroadcastss 0x1e70(%rip),%ymm8 # 5ec4 <_sk_callback_hsw+0x4ea>
.byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6
- .byte 196,226,69,0,37,214,33,0,0 // vpshufb 0x21d6(%rip),%ymm7,%ymm4 # 6080 <_sk_callback_hsw+0x85e>
+ .byte 196,226,69,0,37,254,33,0,0 // vpshufb 0x21fe(%rip),%ymm7,%ymm4 # 6260 <_sk_callback_hsw+0x886>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5
- .byte 196,226,69,0,37,228,33,0,0 // vpshufb 0x21e4(%rip),%ymm7,%ymm4 # 60a0 <_sk_callback_hsw+0x87e>
+ .byte 196,226,69,0,37,12,34,0,0 // vpshufb 0x220c(%rip),%ymm7,%ymm4 # 6280 <_sk_callback_hsw+0x8a6>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -17120,7 +17481,7 @@ _sk_load_bgra_dst_hsw:
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,125,33,228 // vpmovsxbd %xmm4,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
- .byte 235,135 // jmp 3e87 <_sk_load_bgra_dst_hsw+0x27>
+ .byte 235,135 // jmp 403f <_sk_load_bgra_dst_hsw+0x27>
HIDDEN _sk_gather_bgra_hsw
.globl _sk_gather_bgra_hsw
@@ -17135,14 +17496,14 @@ _sk_gather_bgra_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,146,33,0,0 // vpand 0x2192(%rip),%ymm3,%ymm0 # 60c0 <_sk_callback_hsw+0x89e>
+ .byte 197,229,219,5,186,33,0,0 // vpand 0x21ba(%rip),%ymm3,%ymm0 # 62a0 <_sk_callback_hsw+0x8c6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,165,29,0,0 // vbroadcastss 0x1da5(%rip),%ymm8 # 5ce0 <_sk_callback_hsw+0x4be>
+ .byte 196,98,125,24,5,213,29,0,0 // vbroadcastss 0x1dd5(%rip),%ymm8 # 5ec8 <_sk_callback_hsw+0x4ee>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,151,33,0,0 // vpshufb 0x2197(%rip),%ymm3,%ymm0 # 60e0 <_sk_callback_hsw+0x8be>
+ .byte 196,226,101,0,5,191,33,0,0 // vpshufb 0x21bf(%rip),%ymm3,%ymm0 # 62c0 <_sk_callback_hsw+0x8e6>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,165,33,0,0 // vpshufb 0x21a5(%rip),%ymm3,%ymm0 # 6100 <_sk_callback_hsw+0x8de>
+ .byte 196,226,101,0,5,205,33,0,0 // vpshufb 0x21cd(%rip),%ymm3,%ymm0 # 62e0 <_sk_callback_hsw+0x906>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -17164,7 +17525,7 @@ _sk_store_bgra_hsw:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,71,29,0,0 // vbroadcastss 0x1d47(%rip),%ymm8 # 5ce4 <_sk_callback_hsw+0x4c2>
+ .byte 196,98,125,24,5,119,29,0,0 // vbroadcastss 0x1d77(%rip),%ymm8 # 5ecc <_sk_callback_hsw+0x4f2>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -17180,7 +17541,7 @@ _sk_store_bgra_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3ff6 <_sk_store_bgra_hsw+0x80>
+ .byte 117,11 // jne 41ae <_sk_store_bgra_hsw+0x80>
.byte 197,124,17,0 // vmovups %ymm8,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -17193,7 +17554,7 @@ _sk_store_bgra_hsw:
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
- .byte 235,211 // jmp 3fef <_sk_store_bgra_hsw+0x79>
+ .byte 235,211 // jmp 41a7 <_sk_store_bgra_hsw+0x79>
HIDDEN _sk_load_f16_hsw
.globl _sk_load_f16_hsw
@@ -17207,7 +17568,7 @@ _sk_load_f16_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 409d <_sk_load_f16_hsw+0x81>
+ .byte 117,101 // jne 4255 <_sk_load_f16_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,92,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm3
@@ -17233,29 +17594,29 @@ _sk_load_f16_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4103 <_sk_load_f16_hsw+0xe7>
+ .byte 116,85 // je 42bb <_sk_load_f16_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4103 <_sk_load_f16_hsw+0xe7>
+ .byte 114,72 // jb 42bb <_sk_load_f16_hsw+0xe7>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4110 <_sk_load_f16_hsw+0xf4>
+ .byte 116,72 // je 42c8 <_sk_load_f16_hsw+0xf4>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4110 <_sk_load_f16_hsw+0xf4>
+ .byte 114,59 // jb 42c8 <_sk_load_f16_hsw+0xf4>
.byte 196,193,123,16,92,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 4053 <_sk_load_f16_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 420b <_sk_load_f16_hsw+0x37>
.byte 196,193,97,22,92,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 4053 <_sk_load_f16_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 420b <_sk_load_f16_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 4053 <_sk_load_f16_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 420b <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,67,255,255,255 // jmpq 4053 <_sk_load_f16_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 420b <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,58,255,255,255 // jmpq 4053 <_sk_load_f16_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 420b <_sk_load_f16_hsw+0x37>
HIDDEN _sk_load_f16_dst_hsw
.globl _sk_load_f16_dst_hsw
@@ -17269,7 +17630,7 @@ _sk_load_f16_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 419a <_sk_load_f16_dst_hsw+0x81>
+ .byte 117,101 // jne 4352 <_sk_load_f16_dst_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,124,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm7
@@ -17295,29 +17656,29 @@ _sk_load_f16_dst_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4200 <_sk_load_f16_dst_hsw+0xe7>
+ .byte 116,85 // je 43b8 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4200 <_sk_load_f16_dst_hsw+0xe7>
+ .byte 114,72 // jb 43b8 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 420d <_sk_load_f16_dst_hsw+0xf4>
+ .byte 116,72 // je 43c5 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 420d <_sk_load_f16_dst_hsw+0xf4>
+ .byte 114,59 // jb 43c5 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,123,16,124,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm7
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 4308 <_sk_load_f16_dst_hsw+0x37>
.byte 196,193,65,22,124,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 4308 <_sk_load_f16_dst_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 4308 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,67,255,255,255 // jmpq 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 4308 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
- .byte 233,58,255,255,255 // jmpq 4150 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 4308 <_sk_load_f16_dst_hsw+0x37>
HIDDEN _sk_gather_f16_hsw
.globl _sk_gather_f16_hsw
@@ -17380,7 +17741,7 @@ _sk_store_f16_hsw:
.byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9
.byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 431b <_sk_store_f16_hsw+0x7b>
+ .byte 117,31 // jne 44d3 <_sk_store_f16_hsw+0x7b>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -17389,22 +17750,22 @@ _sk_store_f16_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4317 <_sk_store_f16_hsw+0x77>
+ .byte 116,240 // je 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4317 <_sk_store_f16_hsw+0x77>
+ .byte 114,227 // jb 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,218 // je 4317 <_sk_store_f16_hsw+0x77>
+ .byte 116,218 // je 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4317 <_sk_store_f16_hsw+0x77>
+ .byte 114,205 // jb 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,196 // je 4317 <_sk_store_f16_hsw+0x77>
+ .byte 116,196 // je 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4317 <_sk_store_f16_hsw+0x77>
+ .byte 114,183 // jb 44cf <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,174 // jmp 4317 <_sk_store_f16_hsw+0x77>
+ .byte 235,174 // jmp 44cf <_sk_store_f16_hsw+0x77>
HIDDEN _sk_load_u16_be_hsw
.globl _sk_load_u16_be_hsw
@@ -17419,7 +17780,7 @@ _sk_load_u16_be_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 445c <_sk_load_u16_be_hsw+0xf3>
+ .byte 15,133,204,0,0,0 // jne 4614 <_sk_load_u16_be_hsw+0xf3>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -17438,7 +17799,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,247,24,0,0 // vbroadcastss 0x18f7(%rip),%ymm10 # 5ce8 <_sk_callback_hsw+0x4c6>
+ .byte 196,98,125,24,21,39,25,0,0 // vbroadcastss 0x1927(%rip),%ymm10 # 5ed0 <_sk_callback_hsw+0x4f6>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -17466,29 +17827,29 @@ _sk_load_u16_be_hsw:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 44c2 <_sk_load_u16_be_hsw+0x159>
+ .byte 116,85 // je 467a <_sk_load_u16_be_hsw+0x159>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 44c2 <_sk_load_u16_be_hsw+0x159>
+ .byte 114,72 // jb 467a <_sk_load_u16_be_hsw+0x159>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 44cf <_sk_load_u16_be_hsw+0x166>
+ .byte 116,72 // je 4687 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 44cf <_sk_load_u16_be_hsw+0x166>
+ .byte 114,59 // jb 4687 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,6,255,255,255 // je 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 15,132,6,255,255,255 // je 4563 <_sk_load_u16_be_hsw+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,245,254,255,255 // jb 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 15,130,245,254,255,255 // jb 4563 <_sk_load_u16_be_hsw+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,233,254,255,255 // jmpq 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 233,233,254,255,255 // jmpq 4563 <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,220,254,255,255 // jmpq 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 233,220,254,255,255 // jmpq 4563 <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,211,254,255,255 // jmpq 43ab <_sk_load_u16_be_hsw+0x42>
+ .byte 233,211,254,255,255 // jmpq 4563 <_sk_load_u16_be_hsw+0x42>
HIDDEN _sk_load_rgb_u16_be_hsw
.globl _sk_load_rgb_u16_be_hsw
@@ -17505,7 +17866,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 45cf <_sk_load_rgb_u16_be_hsw+0xf7>
+ .byte 15,133,204,0,0,0 // jne 4787 <_sk_load_rgb_u16_be_hsw+0xf7>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -17529,7 +17890,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,111,23,0,0 // vbroadcastss 0x176f(%rip),%ymm10 # 5cec <_sk_callback_hsw+0x4ca>
+ .byte 196,98,125,24,21,159,23,0,0 // vbroadcastss 0x179f(%rip),%ymm10 # 5ed4 <_sk_callback_hsw+0x4fa>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -17546,41 +17907,41 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,35,23,0,0 // vbroadcastss 0x1723(%rip),%ymm3 # 5cf0 <_sk_callback_hsw+0x4ce>
+ .byte 196,226,125,24,29,83,23,0,0 // vbroadcastss 0x1753(%rip),%ymm3 # 5ed8 <_sk_callback_hsw+0x4fe>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 45e8 <_sk_load_rgb_u16_be_hsw+0x110>
- .byte 233,79,255,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,5 // jne 47a0 <_sk_load_rgb_u16_be_hsw+0x110>
+ .byte 233,79,255,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 4617 <_sk_load_rgb_u16_be_hsw+0x13f>
+ .byte 114,26 // jb 47cf <_sk_load_rgb_u16_be_hsw+0x13f>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 461c <_sk_load_rgb_u16_be_hsw+0x144>
- .byte 233,32,255,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,27,255,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,10 // jne 47d4 <_sk_load_rgb_u16_be_hsw+0x144>
+ .byte 233,32,255,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,27,255,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 464b <_sk_load_rgb_u16_be_hsw+0x173>
+ .byte 114,26 // jb 4803 <_sk_load_rgb_u16_be_hsw+0x173>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 4650 <_sk_load_rgb_u16_be_hsw+0x178>
- .byte 233,236,254,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,231,254,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 117,10 // jne 4808 <_sk_load_rgb_u16_be_hsw+0x178>
+ .byte 233,236,254,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,231,254,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 4679 <_sk_load_rgb_u16_be_hsw+0x1a1>
+ .byte 114,20 // jb 4831 <_sk_load_rgb_u16_be_hsw+0x1a1>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,190,254,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,185,254,255,255 // jmpq 4537 <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,190,254,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 233,185,254,255,255 // jmpq 46ef <_sk_load_rgb_u16_be_hsw+0x5f>
HIDDEN _sk_store_u16_be_hsw
.globl _sk_store_u16_be_hsw
@@ -17594,7 +17955,7 @@ _sk_store_u16_be_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,79,22,0,0 // vbroadcastss 0x164f(%rip),%ymm8 # 5cf4 <_sk_callback_hsw+0x4d2>
+ .byte 196,98,125,24,5,127,22,0,0 // vbroadcastss 0x167f(%rip),%ymm8 # 5edc <_sk_callback_hsw+0x502>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -17632,7 +17993,7 @@ _sk_store_u16_be_hsw:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 4789 <_sk_store_u16_be_hsw+0x10b>
+ .byte 117,31 // jne 4941 <_sk_store_u16_be_hsw+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -17641,22 +18002,22 @@ _sk_store_u16_be_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,240 // je 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,227 // jb 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,218 // je 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,205 // jb 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,196 // je 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,183 // jb 493d <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp 4785 <_sk_store_u16_be_hsw+0x107>
+ .byte 235,174 // jmp 493d <_sk_store_u16_be_hsw+0x107>
HIDDEN _sk_load_f32_hsw
.globl _sk_load_f32_hsw
@@ -17664,7 +18025,7 @@ FUNCTION(_sk_load_f32_hsw)
_sk_load_f32_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 4863 <_sk_load_f32_hsw+0x8c>
+ .byte 15,135,128,0,0,0 // ja 4a1b <_sk_load_f32_hsw+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -17672,7 +18033,7 @@ _sk_load_f32_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 488c <_sk_load_f32_hsw+0xb5>
+ .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 4a44 <_sk_load_f32_hsw+0xb5>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -17720,7 +18081,7 @@ FUNCTION(_sk_load_f32_dst_hsw)
_sk_load_f32_dst_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 4938 <_sk_load_f32_dst_hsw+0x8c>
+ .byte 15,135,128,0,0,0 // ja 4af0 <_sk_load_f32_dst_hsw+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -17728,7 +18089,7 @@ _sk_load_f32_dst_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 4960 <_sk_load_f32_dst_hsw+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 4b18 <_sk_load_f32_dst_hsw+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -17792,7 +18153,7 @@ _sk_store_f32_hsw:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne 49ff <_sk_store_f32_hsw+0x7f>
+ .byte 117,55 // jne 4bb7 <_sk_store_f32_hsw+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -17805,22 +18166,22 @@ _sk_store_f32_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 116,240 // je 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 114,227 // jb 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 116,218 // je 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 114,205 // jb 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 116,195 // je 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 114,181 // jb 4bb3 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp 49fb <_sk_store_f32_hsw+0x7b>
+ .byte 235,171 // jmp 4bb3 <_sk_store_f32_hsw+0x7b>
HIDDEN _sk_clamp_x_hsw
.globl _sk_clamp_x_hsw
@@ -17897,7 +18258,7 @@ _sk_mirror_x_hsw:
.byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8
- .byte 197,178,89,5,203,17,0,0 // vmulss 0x11cb(%rip),%xmm9,%xmm0 # 5cf8 <_sk_callback_hsw+0x4d6>
+ .byte 197,178,89,5,251,17,0,0 // vmulss 0x11fb(%rip),%xmm9,%xmm0 # 5ee0 <_sk_callback_hsw+0x506>
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
.byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0
@@ -17924,7 +18285,7 @@ _sk_mirror_y_hsw:
.byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8
- .byte 197,178,89,13,107,17,0,0 // vmulss 0x116b(%rip),%xmm9,%xmm1 # 5cfc <_sk_callback_hsw+0x4da>
+ .byte 197,178,89,13,155,17,0,0 // vmulss 0x119b(%rip),%xmm9,%xmm1 # 5ee4 <_sk_callback_hsw+0x50a>
.byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
.byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1
@@ -17946,7 +18307,7 @@ FUNCTION(_sk_clamp_x_1_hsw)
_sk_clamp_x_1_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,32,17,0,0 // vbroadcastss 0x1120(%rip),%ymm8 # 5d00 <_sk_callback_hsw+0x4de>
+ .byte 196,98,125,24,5,80,17,0,0 // vbroadcastss 0x1150(%rip),%ymm8 # 5ee8 <_sk_callback_hsw+0x50e>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -17964,9 +18325,9 @@ HIDDEN _sk_mirror_x_1_hsw
.globl _sk_mirror_x_1_hsw
FUNCTION(_sk_mirror_x_1_hsw)
_sk_mirror_x_1_hsw:
- .byte 196,98,125,24,5,3,17,0,0 // vbroadcastss 0x1103(%rip),%ymm8 # 5d04 <_sk_callback_hsw+0x4e2>
+ .byte 196,98,125,24,5,51,17,0,0 // vbroadcastss 0x1133(%rip),%ymm8 # 5eec <_sk_callback_hsw+0x512>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,249,16,0,0 // vbroadcastss 0x10f9(%rip),%ymm9 # 5d08 <_sk_callback_hsw+0x4e6>
+ .byte 196,98,125,24,13,41,17,0,0 // vbroadcastss 0x1129(%rip),%ymm9 # 5ef0 <_sk_callback_hsw+0x516>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -17982,11 +18343,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,201,16,0,0 // vbroadcastss 0x10c9(%rip),%ymm3 # 5d0c <_sk_callback_hsw+0x4ea>
- .byte 196,98,125,24,5,196,16,0,0 // vbroadcastss 0x10c4(%rip),%ymm8 # 5d10 <_sk_callback_hsw+0x4ee>
+ .byte 196,226,125,24,29,249,16,0,0 // vbroadcastss 0x10f9(%rip),%ymm3 # 5ef4 <_sk_callback_hsw+0x51a>
+ .byte 196,98,125,24,5,244,16,0,0 // vbroadcastss 0x10f4(%rip),%ymm8 # 5ef8 <_sk_callback_hsw+0x51e>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,181,16,0,0 // vbroadcastss 0x10b5(%rip),%ymm3 # 5d14 <_sk_callback_hsw+0x4f2>
+ .byte 196,226,125,24,29,229,16,0,0 // vbroadcastss 0x10e5(%rip),%ymm3 # 5efc <_sk_callback_hsw+0x522>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -18186,9 +18547,9 @@ _sk_evenly_spaced_gradient_hsw:
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 77,137,211 // mov %r10,%r11
.byte 73,255,203 // dec %r11
- .byte 120,7 // js 4f58 <_sk_evenly_spaced_gradient_hsw+0x19>
+ .byte 120,7 // js 5110 <_sk_evenly_spaced_gradient_hsw+0x19>
.byte 196,193,242,42,203 // vcvtsi2ss %r11,%xmm1,%xmm1
- .byte 235,22 // jmp 4f6e <_sk_evenly_spaced_gradient_hsw+0x2f>
+ .byte 235,22 // jmp 5126 <_sk_evenly_spaced_gradient_hsw+0x2f>
.byte 76,137,219 // mov %r11,%rbx
.byte 72,209,235 // shr %rbx
.byte 65,131,227,1 // and $0x1,%r11d
@@ -18199,7 +18560,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1
.byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11
.byte 73,131,250,8 // cmp $0x8,%r10
- .byte 119,70 // ja 4fc7 <_sk_evenly_spaced_gradient_hsw+0x88>
+ .byte 119,70 // ja 517f <_sk_evenly_spaced_gradient_hsw+0x88>
.byte 196,66,37,22,1 // vpermps (%r9),%ymm11,%ymm8
.byte 72,139,88,40 // mov 0x28(%rax),%rbx
.byte 196,98,37,22,11 // vpermps (%rbx),%ymm11,%ymm9
@@ -18215,7 +18576,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 196,226,37,22,27 // vpermps (%rbx),%ymm11,%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13
- .byte 235,110 // jmp 5035 <_sk_evenly_spaced_gradient_hsw+0xf6>
+ .byte 235,110 // jmp 51ed <_sk_evenly_spaced_gradient_hsw+0xf6>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,153 // vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -18252,14 +18613,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw
.globl _sk_gauss_a_to_rgba_hsw
FUNCTION(_sk_gauss_a_to_rgba_hsw)
_sk_gauss_a_to_rgba_hsw:
- .byte 196,226,125,24,5,189,12,0,0 // vbroadcastss 0xcbd(%rip),%ymm0 # 5d18 <_sk_callback_hsw+0x4f6>
- .byte 196,226,125,24,13,184,12,0,0 // vbroadcastss 0xcb8(%rip),%ymm1 # 5d1c <_sk_callback_hsw+0x4fa>
+ .byte 196,226,125,24,5,237,12,0,0 // vbroadcastss 0xced(%rip),%ymm0 # 5f00 <_sk_callback_hsw+0x526>
+ .byte 196,226,125,24,13,232,12,0,0 // vbroadcastss 0xce8(%rip),%ymm1 # 5f04 <_sk_callback_hsw+0x52a>
.byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,174,12,0,0 // vbroadcastss 0xcae(%rip),%ymm0 # 5d20 <_sk_callback_hsw+0x4fe>
+ .byte 196,226,125,24,5,222,12,0,0 // vbroadcastss 0xcde(%rip),%ymm0 # 5f08 <_sk_callback_hsw+0x52e>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
- .byte 196,226,125,24,13,164,12,0,0 // vbroadcastss 0xca4(%rip),%ymm1 # 5d24 <_sk_callback_hsw+0x502>
+ .byte 196,226,125,24,13,212,12,0,0 // vbroadcastss 0xcd4(%rip),%ymm1 # 5f0c <_sk_callback_hsw+0x532>
.byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,154,12,0,0 // vbroadcastss 0xc9a(%rip),%ymm0 # 5d28 <_sk_callback_hsw+0x506>
+ .byte 196,226,125,24,5,202,12,0,0 // vbroadcastss 0xcca(%rip),%ymm0 # 5f10 <_sk_callback_hsw+0x536>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -18274,11 +18635,11 @@ _sk_gradient_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 73,131,249,1 // cmp $0x1,%r9
- .byte 15,134,180,0,0,0 // jbe 5166 <_sk_gradient_hsw+0xc3>
+ .byte 15,134,180,0,0,0 // jbe 531e <_sk_gradient_hsw+0xc3>
.byte 76,139,80,72 // mov 0x48(%rax),%r10
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 65,187,1,0,0,0 // mov $0x1,%r11d
- .byte 196,226,125,24,21,99,12,0,0 // vbroadcastss 0xc63(%rip),%ymm2 # 5d2c <_sk_callback_hsw+0x50a>
+ .byte 196,226,125,24,21,147,12,0,0 // vbroadcastss 0xc93(%rip),%ymm2 # 5f14 <_sk_callback_hsw+0x53a>
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
.byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3
.byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3
@@ -18286,10 +18647,10 @@ _sk_gradient_hsw:
.byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9
.byte 73,255,195 // inc %r11
.byte 77,57,217 // cmp %r11,%r9
- .byte 117,226 // jne 50ce <_sk_gradient_hsw+0x2b>
+ .byte 117,226 // jne 5286 <_sk_gradient_hsw+0x2b>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 73,131,249,8 // cmp $0x8,%r9
- .byte 118,121 // jbe 516f <_sk_gradient_hsw+0xcc>
+ .byte 118,121 // jbe 5327 <_sk_gradient_hsw+0xcc>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,138 // vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -18313,7 +18674,7 @@ _sk_gradient_hsw:
.byte 196,130,21,146,28,137 // vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- .byte 235,77 // jmp 51b3 <_sk_gradient_hsw+0x110>
+ .byte 235,77 // jmp 536b <_sk_gradient_hsw+0x110>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 196,66,53,22,2 // vpermps (%r10),%ymm9,%ymm8
@@ -18373,24 +18734,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,226,10,0,0 // vbroadcastss 0xae2(%rip),%ymm13 # 5d30 <_sk_callback_hsw+0x50e>
- .byte 196,98,125,24,53,221,10,0,0 // vbroadcastss 0xadd(%rip),%ymm14 # 5d34 <_sk_callback_hsw+0x512>
+ .byte 196,98,125,24,45,18,11,0,0 // vbroadcastss 0xb12(%rip),%ymm13 # 5f18 <_sk_callback_hsw+0x53e>
+ .byte 196,98,125,24,53,13,11,0,0 // vbroadcastss 0xb0d(%rip),%ymm14 # 5f1c <_sk_callback_hsw+0x542>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,211,10,0,0 // vbroadcastss 0xad3(%rip),%ymm13 # 5d38 <_sk_callback_hsw+0x516>
+ .byte 196,98,125,24,45,3,11,0,0 // vbroadcastss 0xb03(%rip),%ymm13 # 5f20 <_sk_callback_hsw+0x546>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,201,10,0,0 // vbroadcastss 0xac9(%rip),%ymm14 # 5d3c <_sk_callback_hsw+0x51a>
+ .byte 196,98,125,24,53,249,10,0,0 // vbroadcastss 0xaf9(%rip),%ymm14 # 5f24 <_sk_callback_hsw+0x54a>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,180,10,0,0 // vbroadcastss 0xab4(%rip),%ymm10 # 5d40 <_sk_callback_hsw+0x51e>
+ .byte 196,98,125,24,21,228,10,0,0 // vbroadcastss 0xae4(%rip),%ymm10 # 5f28 <_sk_callback_hsw+0x54e>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,158,10,0,0 // vbroadcastss 0xa9e(%rip),%ymm10 # 5d44 <_sk_callback_hsw+0x522>
+ .byte 196,98,125,24,21,206,10,0,0 // vbroadcastss 0xace(%rip),%ymm10 # 5f2c <_sk_callback_hsw+0x552>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,136,10,0,0 // vbroadcastss 0xa88(%rip),%ymm10 # 5d48 <_sk_callback_hsw+0x526>
+ .byte 196,98,125,24,21,184,10,0,0 // vbroadcastss 0xab8(%rip),%ymm10 # 5f30 <_sk_callback_hsw+0x556>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -18418,23 +18779,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,60,10,0,0 // vbroadcastss 0xa3c(%rip),%ymm11 # 5d4c <_sk_callback_hsw+0x52a>
+ .byte 196,98,125,24,29,108,10,0,0 // vbroadcastss 0xa6c(%rip),%ymm11 # 5f34 <_sk_callback_hsw+0x55a>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,27,10,0,0 // vbroadcastss 0xa1b(%rip),%ymm9 # 5d50 <_sk_callback_hsw+0x52e>
+ .byte 196,98,125,24,13,75,10,0,0 // vbroadcastss 0xa4b(%rip),%ymm9 # 5f38 <_sk_callback_hsw+0x55e>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,254,9,0,0 // vbroadcastss 0x9fe(%rip),%ymm9 # 5d54 <_sk_callback_hsw+0x532>
+ .byte 196,98,125,24,13,46,10,0,0 // vbroadcastss 0xa2e(%rip),%ymm9 # 5f3c <_sk_callback_hsw+0x562>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,239,9,0,0 // vbroadcastss 0x9ef(%rip),%ymm11 # 5d58 <_sk_callback_hsw+0x536>
+ .byte 196,98,125,24,29,31,10,0,0 // vbroadcastss 0xa1f(%rip),%ymm11 # 5f40 <_sk_callback_hsw+0x566>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -18453,23 +18814,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,180,9,0,0 // vbroadcastss 0x9b4(%rip),%ymm11 # 5d5c <_sk_callback_hsw+0x53a>
+ .byte 196,98,125,24,29,228,9,0,0 // vbroadcastss 0x9e4(%rip),%ymm11 # 5f44 <_sk_callback_hsw+0x56a>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,147,9,0,0 // vbroadcastss 0x993(%rip),%ymm9 # 5d60 <_sk_callback_hsw+0x53e>
+ .byte 196,98,125,24,13,195,9,0,0 // vbroadcastss 0x9c3(%rip),%ymm9 # 5f48 <_sk_callback_hsw+0x56e>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,118,9,0,0 // vbroadcastss 0x976(%rip),%ymm9 # 5d64 <_sk_callback_hsw+0x542>
+ .byte 196,98,125,24,13,166,9,0,0 // vbroadcastss 0x9a6(%rip),%ymm9 # 5f4c <_sk_callback_hsw+0x572>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,103,9,0,0 // vbroadcastss 0x967(%rip),%ymm11 # 5d68 <_sk_callback_hsw+0x546>
+ .byte 196,98,125,24,29,151,9,0,0 // vbroadcastss 0x997(%rip),%ymm11 # 5f50 <_sk_callback_hsw+0x576>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -18487,14 +18848,14 @@ _sk_xy_to_2pt_conical_linear_hsw:
.byte 197,58,89,72,44 // vmulss 0x2c(%rax),%xmm8,%xmm9
.byte 196,66,125,24,201 // vbroadcastss %xmm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,50,9,0,0 // vbroadcastss 0x932(%rip),%ymm10 # 5d6c <_sk_callback_hsw+0x54a>
+ .byte 196,98,125,24,21,98,9,0,0 // vbroadcastss 0x962(%rip),%ymm10 # 5f54 <_sk_callback_hsw+0x57a>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
.byte 196,98,125,184,208 // vfmadd231ps %ymm0,%ymm0,%ymm10
.byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,17,9,0,0 // vbroadcastss 0x911(%rip),%ymm8 # 5d70 <_sk_callback_hsw+0x54e>
+ .byte 196,98,125,24,5,65,9,0,0 // vbroadcastss 0x941(%rip),%ymm8 # 5f58 <_sk_callback_hsw+0x57e>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18534,7 +18895,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,177,8,0,0 // vbroadcastss 0x8b1(%rip),%ymm8 # 5d74 <_sk_callback_hsw+0x552>
+ .byte 196,98,125,24,5,225,8,0,0 // vbroadcastss 0x8e1(%rip),%ymm8 # 5f5c <_sk_callback_hsw+0x582>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -18568,9 +18929,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,69,8,0,0 // vbroadcastss 0x845(%rip),%ymm0 # 5d78 <_sk_callback_hsw+0x556>
+ .byte 196,226,125,24,5,117,8,0,0 // vbroadcastss 0x875(%rip),%ymm0 # 5f60 <_sk_callback_hsw+0x586>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,60,8,0,0 // vbroadcastss 0x83c(%rip),%ymm8 # 5d7c <_sk_callback_hsw+0x55a>
+ .byte 196,98,125,24,5,108,8,0,0 // vbroadcastss 0x86c(%rip),%ymm8 # 5f64 <_sk_callback_hsw+0x58a>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18581,7 +18942,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,36,8,0,0 // vbroadcastss 0x824(%rip),%ymm0 # 5d80 <_sk_callback_hsw+0x55e>
+ .byte 196,226,125,24,5,84,8,0,0 // vbroadcastss 0x854(%rip),%ymm0 # 5f68 <_sk_callback_hsw+0x58e>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18593,9 +18954,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,8,8,0,0 // vbroadcastss 0x808(%rip),%ymm1 # 5d84 <_sk_callback_hsw+0x562>
+ .byte 196,226,125,24,13,56,8,0,0 // vbroadcastss 0x838(%rip),%ymm1 # 5f6c <_sk_callback_hsw+0x592>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,254,7,0,0 // vbroadcastss 0x7fe(%rip),%ymm8 # 5d88 <_sk_callback_hsw+0x566>
+ .byte 196,98,125,24,5,46,8,0,0 // vbroadcastss 0x82e(%rip),%ymm8 # 5f70 <_sk_callback_hsw+0x596>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18606,7 +18967,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,230,7,0,0 // vbroadcastss 0x7e6(%rip),%ymm1 # 5d8c <_sk_callback_hsw+0x56a>
+ .byte 196,226,125,24,13,22,8,0,0 // vbroadcastss 0x816(%rip),%ymm1 # 5f74 <_sk_callback_hsw+0x59a>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -18618,13 +18979,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,201,7,0,0 // vbroadcastss 0x7c9(%rip),%ymm0 # 5d90 <_sk_callback_hsw+0x56e>
+ .byte 196,226,125,24,5,249,7,0,0 // vbroadcastss 0x7f9(%rip),%ymm0 # 5f78 <_sk_callback_hsw+0x59e>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,192,7,0,0 // vbroadcastss 0x7c0(%rip),%ymm8 # 5d94 <_sk_callback_hsw+0x572>
+ .byte 196,98,125,24,5,240,7,0,0 // vbroadcastss 0x7f0(%rip),%ymm8 # 5f7c <_sk_callback_hsw+0x5a2>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,177,7,0,0 // vbroadcastss 0x7b1(%rip),%ymm10 # 5d98 <_sk_callback_hsw+0x576>
- .byte 196,98,125,24,29,172,7,0,0 // vbroadcastss 0x7ac(%rip),%ymm11 # 5d9c <_sk_callback_hsw+0x57a>
+ .byte 196,98,125,24,21,225,7,0,0 // vbroadcastss 0x7e1(%rip),%ymm10 # 5f80 <_sk_callback_hsw+0x5a6>
+ .byte 196,98,125,24,29,220,7,0,0 // vbroadcastss 0x7dc(%rip),%ymm11 # 5f84 <_sk_callback_hsw+0x5aa>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18636,16 +18997,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,143,7,0,0 // vbroadcastss 0x78f(%rip),%ymm0 # 5da0 <_sk_callback_hsw+0x57e>
+ .byte 196,226,125,24,5,191,7,0,0 // vbroadcastss 0x7bf(%rip),%ymm0 # 5f88 <_sk_callback_hsw+0x5ae>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,134,7,0,0 // vbroadcastss 0x786(%rip),%ymm8 # 5da4 <_sk_callback_hsw+0x582>
+ .byte 196,98,125,24,5,182,7,0,0 // vbroadcastss 0x7b6(%rip),%ymm8 # 5f8c <_sk_callback_hsw+0x5b2>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,124,7,0,0 // vbroadcastss 0x77c(%rip),%ymm9 # 5da8 <_sk_callback_hsw+0x586>
- .byte 196,98,125,24,21,119,7,0,0 // vbroadcastss 0x777(%rip),%ymm10 # 5dac <_sk_callback_hsw+0x58a>
+ .byte 196,98,125,24,13,172,7,0,0 // vbroadcastss 0x7ac(%rip),%ymm9 # 5f90 <_sk_callback_hsw+0x5b6>
+ .byte 196,98,125,24,21,167,7,0,0 // vbroadcastss 0x7a7(%rip),%ymm10 # 5f94 <_sk_callback_hsw+0x5ba>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,109,7,0,0 // vbroadcastss 0x76d(%rip),%ymm9 # 5db0 <_sk_callback_hsw+0x58e>
+ .byte 196,98,125,24,13,157,7,0,0 // vbroadcastss 0x79d(%rip),%ymm9 # 5f98 <_sk_callback_hsw+0x5be>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,99,7,0,0 // vbroadcastss 0x763(%rip),%ymm10 # 5db4 <_sk_callback_hsw+0x592>
+ .byte 196,98,125,24,21,147,7,0,0 // vbroadcastss 0x793(%rip),%ymm10 # 5f9c <_sk_callback_hsw+0x5c2>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18656,14 +19017,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,75,7,0,0 // vbroadcastss 0x74b(%rip),%ymm8 # 5db8 <_sk_callback_hsw+0x596>
+ .byte 196,98,125,24,5,123,7,0,0 // vbroadcastss 0x77b(%rip),%ymm8 # 5fa0 <_sk_callback_hsw+0x5c6>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,61,7,0,0 // vbroadcastss 0x73d(%rip),%ymm10 # 5dbc <_sk_callback_hsw+0x59a>
- .byte 196,98,125,24,29,56,7,0,0 // vbroadcastss 0x738(%rip),%ymm11 # 5dc0 <_sk_callback_hsw+0x59e>
+ .byte 196,98,125,24,21,109,7,0,0 // vbroadcastss 0x76d(%rip),%ymm10 # 5fa4 <_sk_callback_hsw+0x5ca>
+ .byte 196,98,125,24,29,104,7,0,0 // vbroadcastss 0x768(%rip),%ymm11 # 5fa8 <_sk_callback_hsw+0x5ce>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,41,7,0,0 // vbroadcastss 0x729(%rip),%ymm8 # 5dc4 <_sk_callback_hsw+0x5a2>
+ .byte 196,98,125,24,5,89,7,0,0 // vbroadcastss 0x759(%rip),%ymm8 # 5fac <_sk_callback_hsw+0x5d2>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18674,12 +19035,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,17,7,0,0 // vbroadcastss 0x711(%rip),%ymm0 # 5dc8 <_sk_callback_hsw+0x5a6>
+ .byte 196,226,125,24,5,65,7,0,0 // vbroadcastss 0x741(%rip),%ymm0 # 5fb0 <_sk_callback_hsw+0x5d6>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,254,6,0,0 // vbroadcastss 0x6fe(%rip),%ymm10 # 5dcc <_sk_callback_hsw+0x5aa>
- .byte 196,98,125,24,29,249,6,0,0 // vbroadcastss 0x6f9(%rip),%ymm11 # 5dd0 <_sk_callback_hsw+0x5ae>
+ .byte 196,98,125,24,21,46,7,0,0 // vbroadcastss 0x72e(%rip),%ymm10 # 5fb4 <_sk_callback_hsw+0x5da>
+ .byte 196,98,125,24,29,41,7,0,0 // vbroadcastss 0x729(%rip),%ymm11 # 5fb8 <_sk_callback_hsw+0x5de>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -18691,13 +19052,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,220,6,0,0 // vbroadcastss 0x6dc(%rip),%ymm1 # 5dd4 <_sk_callback_hsw+0x5b2>
+ .byte 196,226,125,24,13,12,7,0,0 // vbroadcastss 0x70c(%rip),%ymm1 # 5fbc <_sk_callback_hsw+0x5e2>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,210,6,0,0 // vbroadcastss 0x6d2(%rip),%ymm8 # 5dd8 <_sk_callback_hsw+0x5b6>
+ .byte 196,98,125,24,5,2,7,0,0 // vbroadcastss 0x702(%rip),%ymm8 # 5fc0 <_sk_callback_hsw+0x5e6>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,195,6,0,0 // vbroadcastss 0x6c3(%rip),%ymm10 # 5ddc <_sk_callback_hsw+0x5ba>
- .byte 196,98,125,24,29,190,6,0,0 // vbroadcastss 0x6be(%rip),%ymm11 # 5de0 <_sk_callback_hsw+0x5be>
+ .byte 196,98,125,24,21,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm10 # 5fc4 <_sk_callback_hsw+0x5ea>
+ .byte 196,98,125,24,29,238,6,0,0 // vbroadcastss 0x6ee(%rip),%ymm11 # 5fc8 <_sk_callback_hsw+0x5ee>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -18709,16 +19070,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,161,6,0,0 // vbroadcastss 0x6a1(%rip),%ymm1 # 5de4 <_sk_callback_hsw+0x5c2>
+ .byte 196,226,125,24,13,209,6,0,0 // vbroadcastss 0x6d1(%rip),%ymm1 # 5fcc <_sk_callback_hsw+0x5f2>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,151,6,0,0 // vbroadcastss 0x697(%rip),%ymm8 # 5de8 <_sk_callback_hsw+0x5c6>
+ .byte 196,98,125,24,5,199,6,0,0 // vbroadcastss 0x6c7(%rip),%ymm8 # 5fd0 <_sk_callback_hsw+0x5f6>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,141,6,0,0 // vbroadcastss 0x68d(%rip),%ymm9 # 5dec <_sk_callback_hsw+0x5ca>
- .byte 196,98,125,24,21,136,6,0,0 // vbroadcastss 0x688(%rip),%ymm10 # 5df0 <_sk_callback_hsw+0x5ce>
+ .byte 196,98,125,24,13,189,6,0,0 // vbroadcastss 0x6bd(%rip),%ymm9 # 5fd4 <_sk_callback_hsw+0x5fa>
+ .byte 196,98,125,24,21,184,6,0,0 // vbroadcastss 0x6b8(%rip),%ymm10 # 5fd8 <_sk_callback_hsw+0x5fe>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,126,6,0,0 // vbroadcastss 0x67e(%rip),%ymm9 # 5df4 <_sk_callback_hsw+0x5d2>
+ .byte 196,98,125,24,13,174,6,0,0 // vbroadcastss 0x6ae(%rip),%ymm9 # 5fdc <_sk_callback_hsw+0x602>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,116,6,0,0 // vbroadcastss 0x674(%rip),%ymm10 # 5df8 <_sk_callback_hsw+0x5d6>
+ .byte 196,98,125,24,21,164,6,0,0 // vbroadcastss 0x6a4(%rip),%ymm10 # 5fe0 <_sk_callback_hsw+0x606>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18729,14 +19090,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,92,6,0,0 // vbroadcastss 0x65c(%rip),%ymm8 # 5dfc <_sk_callback_hsw+0x5da>
+ .byte 196,98,125,24,5,140,6,0,0 // vbroadcastss 0x68c(%rip),%ymm8 # 5fe4 <_sk_callback_hsw+0x60a>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,77,6,0,0 // vbroadcastss 0x64d(%rip),%ymm10 # 5e00 <_sk_callback_hsw+0x5de>
- .byte 196,98,125,24,29,72,6,0,0 // vbroadcastss 0x648(%rip),%ymm11 # 5e04 <_sk_callback_hsw+0x5e2>
+ .byte 196,98,125,24,21,125,6,0,0 // vbroadcastss 0x67d(%rip),%ymm10 # 5fe8 <_sk_callback_hsw+0x60e>
+ .byte 196,98,125,24,29,120,6,0,0 // vbroadcastss 0x678(%rip),%ymm11 # 5fec <_sk_callback_hsw+0x612>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,57,6,0,0 // vbroadcastss 0x639(%rip),%ymm8 # 5e08 <_sk_callback_hsw+0x5e6>
+ .byte 196,98,125,24,5,105,6,0,0 // vbroadcastss 0x669(%rip),%ymm8 # 5ff0 <_sk_callback_hsw+0x616>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -18747,12 +19108,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,33,6,0,0 // vbroadcastss 0x621(%rip),%ymm1 # 5e0c <_sk_callback_hsw+0x5ea>
+ .byte 196,226,125,24,13,81,6,0,0 // vbroadcastss 0x651(%rip),%ymm1 # 5ff4 <_sk_callback_hsw+0x61a>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,13,6,0,0 // vbroadcastss 0x60d(%rip),%ymm10 # 5e10 <_sk_callback_hsw+0x5ee>
- .byte 196,98,125,24,29,8,6,0,0 // vbroadcastss 0x608(%rip),%ymm11 # 5e14 <_sk_callback_hsw+0x5f2>
+ .byte 196,98,125,24,21,61,6,0,0 // vbroadcastss 0x63d(%rip),%ymm10 # 5ff8 <_sk_callback_hsw+0x61e>
+ .byte 196,98,125,24,29,56,6,0,0 // vbroadcastss 0x638(%rip),%ymm11 # 5ffc <_sk_callback_hsw+0x622>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -18884,25 +19245,25 @@ BALIGN4
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5a1d <.literal4+0xb9>
+ .byte 71,225,61 // rex.RXB loope 5bd5 <.literal4+0xb9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5a2d <.literal4+0xc9>
+ .byte 71,225,61 // rex.RXB loope 5be5 <.literal4+0xc9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5a3d <.literal4+0xd9>
+ .byte 71,225,61 // rex.RXB loope 5bf5 <.literal4+0xd9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 5a4d <.literal4+0xe9>
+ .byte 71,225,61 // rex.RXB loope 5c05 <.literal4+0xe9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
@@ -18965,7 +19326,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5ac1 <.literal4+0x15d>
+ .byte 224,7 // loopne 5c79 <.literal4+0x15d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -18981,10 +19342,10 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 5ae8 <.literal4+0x184>
+ .byte 127,0 // jg 5ca0 <.literal4+0x184>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5b61 <.literal4+0x1fd>
+ .byte 119,115 // ja 5d19 <.literal4+0x1fd>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -18998,10 +19359,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5b1c <.literal4+0x1b8>
+ .byte 127,0 // jg 5cd4 <.literal4+0x1b8>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5b95 <.literal4+0x231>
+ .byte 119,115 // ja 5d4d <.literal4+0x231>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19015,10 +19376,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5b50 <.literal4+0x1ec>
+ .byte 127,0 // jg 5d08 <.literal4+0x1ec>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5bc9 <.literal4+0x265>
+ .byte 119,115 // ja 5d81 <.literal4+0x265>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19032,10 +19393,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5b84 <.literal4+0x220>
+ .byte 127,0 // jg 5d3c <.literal4+0x220>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5bfd <.literal4+0x299>
+ .byte 119,115 // ja 5db5 <.literal4+0x299>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -19046,9 +19407,26 @@ BALIGN4
.byte 210,221 // rcr %cl,%ch
.byte 65,0,0 // add %al,(%r8)
.byte 0,75,0 // add %cl,0x0(%rbx)
- .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax)
+ .byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 5d70 <.literal4+0x254>
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 119,115 // ja 5de9 <.literal4+0x2cd>
+ .byte 248 // clc
+ .byte 194,117,191 // retq $0xbf75
+ .byte 191,63,249,68,180 // mov $0xb444f93f,%edi
+ .byte 62,163,233,220,63,81,140,242,66,141 // movabs %eax,%ds:0x8d42f28c513fdce9
+ .byte 188,190,63,248,245 // mov $0xf5f83fbe,%esp
+ .byte 154 // (bad)
+ .byte 64,254 // rex (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,200 // add %cl,%al
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 5bfb <.literal4+0x297>
+ .byte 127,67 // jg 5de3 <.literal4+0x2c7>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -19060,7 +19438,7 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 5c1b <.literal4+0x2b7>
+ .byte 118,63 // jbe 5e03 <.literal4+0x2e7>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
@@ -19082,7 +19460,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5c35 <.literal4+0x2d1>
+ .byte 224,7 // loopne 5e1d <.literal4+0x301>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19094,7 +19472,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5c51 <.literal4+0x2ed>
+ .byte 224,7 // loopne 5e39 <.literal4+0x31d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -19105,7 +19483,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 5ca6 <.literal4+0x342>
+ .byte 124,66 // jl 5e8e <.literal4+0x372>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -19131,7 +19509,7 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 5d09 <.literal4+0x3a5>
+ .byte 112,65 // jo 5ef1 <.literal4+0x3d5>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
@@ -19145,7 +19523,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 5d3f <.literal4+0x3db>
+ .byte 127,71 // jg 5f27 <.literal4+0x40b>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -19272,16 +19650,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005e48 <_sk_callback_hsw+0xa000626>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006028 <_sk_callback_hsw+0xa00064e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005e50 <_sk_callback_hsw+0x1200062e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006030 <_sk_callback_hsw+0x12000656>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005e58 <_sk_callback_hsw+0x1a000636>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006038 <_sk_callback_hsw+0x1a00065e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005e60 <_sk_callback_hsw+0x300063e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006040 <_sk_callback_hsw+0x3000666>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19324,16 +19702,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005ea8 <_sk_callback_hsw+0xa000686>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006088 <_sk_callback_hsw+0xa0006ae>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005eb0 <_sk_callback_hsw+0x1200068e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006090 <_sk_callback_hsw+0x120006b6>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005eb8 <_sk_callback_hsw+0x1a000696>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006098 <_sk_callback_hsw+0x1a0006be>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005ec0 <_sk_callback_hsw+0x300069e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30060a0 <_sk_callback_hsw+0x30006c6>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19376,16 +19754,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005f08 <_sk_callback_hsw+0xa0006e6>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0060e8 <_sk_callback_hsw+0xa00070e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005f10 <_sk_callback_hsw+0x120006ee>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120060f0 <_sk_callback_hsw+0x12000716>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005f18 <_sk_callback_hsw+0x1a0006f6>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0060f8 <_sk_callback_hsw+0x1a00071e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005f20 <_sk_callback_hsw+0x30006fe>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006100 <_sk_callback_hsw+0x3000726>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19428,16 +19806,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005f68 <_sk_callback_hsw+0xa000746>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006148 <_sk_callback_hsw+0xa00076e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005f70 <_sk_callback_hsw+0x1200074e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006150 <_sk_callback_hsw+0x12000776>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005f78 <_sk_callback_hsw+0x1a000756>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006158 <_sk_callback_hsw+0x1a00077e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005f80 <_sk_callback_hsw+0x300075e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006160 <_sk_callback_hsw+0x3000786>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19480,16 +19858,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005fc8 <_sk_callback_hsw+0xa0007a6>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0061a8 <_sk_callback_hsw+0xa0007ce>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005fd0 <_sk_callback_hsw+0x120007ae>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120061b0 <_sk_callback_hsw+0x120007d6>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005fd8 <_sk_callback_hsw+0x1a0007b6>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0061b8 <_sk_callback_hsw+0x1a0007de>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005fe0 <_sk_callback_hsw+0x30007be>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30061c0 <_sk_callback_hsw+0x30007e6>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19532,16 +19910,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006028 <_sk_callback_hsw+0xa000806>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006208 <_sk_callback_hsw+0xa00082e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006030 <_sk_callback_hsw+0x1200080e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006210 <_sk_callback_hsw+0x12000836>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006038 <_sk_callback_hsw+0x1a000816>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006218 <_sk_callback_hsw+0x1a00083e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006040 <_sk_callback_hsw+0x300081e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006220 <_sk_callback_hsw+0x3000846>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19584,16 +19962,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006088 <_sk_callback_hsw+0xa000866>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006268 <_sk_callback_hsw+0xa00088e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006090 <_sk_callback_hsw+0x1200086e>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12006270 <_sk_callback_hsw+0x12000896>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006098 <_sk_callback_hsw+0x1a000876>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a006278 <_sk_callback_hsw+0x1a00089e>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30060a0 <_sk_callback_hsw+0x300087e>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006280 <_sk_callback_hsw+0x30008a6>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19636,16 +20014,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0060e8 <_sk_callback_hsw+0xa0008c6>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0062c8 <_sk_callback_hsw+0xa0008ee>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120060f0 <_sk_callback_hsw+0x120008ce>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120062d0 <_sk_callback_hsw+0x120008f6>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0060f8 <_sk_callback_hsw+0x1a0008d6>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0062d8 <_sk_callback_hsw+0x1a0008fe>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3006100 <_sk_callback_hsw+0x30008de>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30062e0 <_sk_callback_hsw+0x3000906>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -19835,7 +20213,7 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,4,121,0,0 // vbroadcastss 0x7904(%rip),%ymm1 # 79d4 <_sk_callback_avx+0x144>
+ .byte 196,226,125,24,13,228,122,0,0 // vbroadcastss 0x7ae4(%rip),%ymm1 # 7bb4 <_sk_callback_avx+0x144>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -19844,7 +20222,7 @@ _sk_seed_shader_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,222,120,0,0 // vbroadcastss 0x78de(%rip),%ymm2 # 79d8 <_sk_callback_avx+0x148>
+ .byte 196,226,125,24,21,190,122,0,0 // vbroadcastss 0x7abe(%rip),%ymm2 # 7bb8 <_sk_callback_avx+0x148>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -19868,7 +20246,7 @@ _sk_dither_avx:
.byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,135,120,0,0 // vbroadcastss 0x7887(%rip),%ymm11 # 79dc <_sk_callback_avx+0x14c>
+ .byte 196,98,125,24,29,103,122,0,0 // vbroadcastss 0x7a67(%rip),%ymm11 # 7bbc <_sk_callback_avx+0x14c>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -19879,8 +20257,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,72,120,0,0 // vbroadcastss 0x7848(%rip),%ymm12 # 79e0 <_sk_callback_avx+0x150>
- .byte 196,98,125,24,45,67,120,0,0 // vbroadcastss 0x7843(%rip),%ymm13 # 79e4 <_sk_callback_avx+0x154>
+ .byte 196,98,125,24,37,40,122,0,0 // vbroadcastss 0x7a28(%rip),%ymm12 # 7bc0 <_sk_callback_avx+0x150>
+ .byte 196,98,125,24,45,35,122,0,0 // vbroadcastss 0x7a23(%rip),%ymm13 # 7bc4 <_sk_callback_avx+0x154>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -19907,9 +20285,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,174,119,0,0 // vbroadcastss 0x77ae(%rip),%ymm9 # 79e8 <_sk_callback_avx+0x158>
+ .byte 196,98,125,24,13,142,121,0,0 // vbroadcastss 0x798e(%rip),%ymm9 # 7bc8 <_sk_callback_avx+0x158>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,164,119,0,0 // vbroadcastss 0x77a4(%rip),%ymm9 # 79ec <_sk_callback_avx+0x15c>
+ .byte 196,98,125,24,13,132,121,0,0 // vbroadcastss 0x7984(%rip),%ymm9 # 7bcc <_sk_callback_avx+0x15c>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
@@ -19943,7 +20321,7 @@ HIDDEN _sk_black_color_avx
FUNCTION(_sk_black_color_avx)
_sk_black_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,68,119,0,0 // vbroadcastss 0x7744(%rip),%ymm3 # 79f0 <_sk_callback_avx+0x160>
+ .byte 196,226,125,24,29,36,121,0,0 // vbroadcastss 0x7924(%rip),%ymm3 # 7bd0 <_sk_callback_avx+0x160>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -19954,7 +20332,7 @@ HIDDEN _sk_white_color_avx
FUNCTION(_sk_white_color_avx)
_sk_white_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,47,119,0,0 // vbroadcastss 0x772f(%rip),%ymm0 # 79f4 <_sk_callback_avx+0x164>
+ .byte 196,226,125,24,5,15,121,0,0 // vbroadcastss 0x790f(%rip),%ymm0 # 7bd4 <_sk_callback_avx+0x164>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -20000,7 +20378,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,210,118,0,0 // vbroadcastss 0x76d2(%rip),%ymm8 # 79f8 <_sk_callback_avx+0x168>
+ .byte 196,98,125,24,5,178,120,0,0 // vbroadcastss 0x78b2(%rip),%ymm8 # 7bd8 <_sk_callback_avx+0x168>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -20021,7 +20399,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,148,118,0,0 // vbroadcastss 0x7694(%rip),%ymm9 # 79fc <_sk_callback_avx+0x16c>
+ .byte 196,98,125,24,13,116,120,0,0 // vbroadcastss 0x7874(%rip),%ymm9 # 7bdc <_sk_callback_avx+0x16c>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -20063,7 +20441,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,51,118,0,0 // vbroadcastss 0x7633(%rip),%ymm8 # 7a00 <_sk_callback_avx+0x170>
+ .byte 196,98,125,24,5,19,120,0,0 // vbroadcastss 0x7813(%rip),%ymm8 # 7be0 <_sk_callback_avx+0x170>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -20076,7 +20454,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,22,118,0,0 // vbroadcastss 0x7616(%rip),%ymm0 # 7a04 <_sk_callback_avx+0x174>
+ .byte 196,226,125,24,5,246,119,0,0 // vbroadcastss 0x77f6(%rip),%ymm0 # 7be4 <_sk_callback_avx+0x174>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -20089,7 +20467,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,249,117,0,0 // vbroadcastss 0x75f9(%rip),%ymm8 # 7a08 <_sk_callback_avx+0x178>
+ .byte 196,98,125,24,5,217,119,0,0 // vbroadcastss 0x77d9(%rip),%ymm8 # 7be8 <_sk_callback_avx+0x178>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -20106,7 +20484,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,204,117,0,0 // vbroadcastss 0x75cc(%rip),%ymm8 # 7a0c <_sk_callback_avx+0x17c>
+ .byte 196,98,125,24,5,172,119,0,0 // vbroadcastss 0x77ac(%rip),%ymm8 # 7bec <_sk_callback_avx+0x17c>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -20134,7 +20512,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,139,117,0,0 // vbroadcastss 0x758b(%rip),%ymm8 # 7a10 <_sk_callback_avx+0x180>
+ .byte 196,98,125,24,5,107,119,0,0 // vbroadcastss 0x776b(%rip),%ymm8 # 7bf0 <_sk_callback_avx+0x180>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20194,7 +20572,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,218,116,0,0 // vbroadcastss 0x74da(%rip),%ymm8 # 7a14 <_sk_callback_avx+0x184>
+ .byte 196,98,125,24,5,186,118,0,0 // vbroadcastss 0x76ba(%rip),%ymm8 # 7bf4 <_sk_callback_avx+0x184>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20231,7 +20609,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,90,116,0,0 // vbroadcastss 0x745a(%rip),%ymm8 # 7a18 <_sk_callback_avx+0x188>
+ .byte 196,98,125,24,5,58,118,0,0 // vbroadcastss 0x763a(%rip),%ymm8 # 7bf8 <_sk_callback_avx+0x188>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20257,7 +20635,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,6,116,0,0 // vbroadcastss 0x7406(%rip),%ymm8 # 7a1c <_sk_callback_avx+0x18c>
+ .byte 196,98,125,24,5,230,117,0,0 // vbroadcastss 0x75e6(%rip),%ymm8 # 7bfc <_sk_callback_avx+0x18c>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20286,7 +20664,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,166,115,0,0 // vbroadcastss 0x73a6(%rip),%ymm8 # 7a20 <_sk_callback_avx+0x190>
+ .byte 196,98,125,24,5,134,117,0,0 // vbroadcastss 0x7586(%rip),%ymm8 # 7c00 <_sk_callback_avx+0x190>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20309,7 +20687,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,97,115,0,0 // vbroadcastss 0x7361(%rip),%ymm8 # 7a24 <_sk_callback_avx+0x194>
+ .byte 196,98,125,24,5,65,117,0,0 // vbroadcastss 0x7541(%rip),%ymm8 # 7c04 <_sk_callback_avx+0x194>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -20320,7 +20698,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,76,115,0,0 // vbroadcastss 0x734c(%rip),%ymm8 # 7a28 <_sk_callback_avx+0x198>
+ .byte 196,98,125,24,5,44,117,0,0 // vbroadcastss 0x752c(%rip),%ymm8 # 7c08 <_sk_callback_avx+0x198>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -20382,7 +20760,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,72,114,0,0 // vbroadcastss 0x7248(%rip),%ymm9 # 7a2c <_sk_callback_avx+0x19c>
+ .byte 196,98,125,24,13,40,116,0,0 // vbroadcastss 0x7428(%rip),%ymm9 # 7c0c <_sk_callback_avx+0x19c>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -20439,7 +20817,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,90,113,0,0 // vbroadcastss 0x715a(%rip),%ymm8 # 7a30 <_sk_callback_avx+0x1a0>
+ .byte 196,98,125,24,5,58,115,0,0 // vbroadcastss 0x733a(%rip),%ymm8 # 7c10 <_sk_callback_avx+0x1a0>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20494,7 +20872,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,131,112,0,0 // vbroadcastss 0x7083(%rip),%ymm8 # 7a34 <_sk_callback_avx+0x1a4>
+ .byte 196,98,125,24,5,99,114,0,0 // vbroadcastss 0x7263(%rip),%ymm8 # 7c14 <_sk_callback_avx+0x1a4>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20560,10 +20938,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,122,111,0,0 // vbroadcastss 0x6f7a(%rip),%ymm11 # 7a3c <_sk_callback_avx+0x1ac>
+ .byte 196,98,125,24,29,90,113,0,0 // vbroadcastss 0x715a(%rip),%ymm11 # 7c1c <_sk_callback_avx+0x1ac>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,107,111,0,0 // vbroadcastss 0x6f6b(%rip),%ymm13 # 7a40 <_sk_callback_avx+0x1b0>
+ .byte 196,98,125,24,45,75,113,0,0 // vbroadcastss 0x714b(%rip),%ymm13 # 7c20 <_sk_callback_avx+0x1b0>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -20574,7 +20952,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,41,111,0,0 // vbroadcastss 0x6f29(%rip),%ymm8 # 7a38 <_sk_callback_avx+0x1a8>
+ .byte 196,98,125,24,5,9,113,0,0 // vbroadcastss 0x7109(%rip),%ymm8 # 7c18 <_sk_callback_avx+0x1a8>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -20701,12 +21079,12 @@ _sk_hue_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,248,108,0,0 // vbroadcastss 0x6cf8(%rip),%ymm14 # 7a44 <_sk_callback_avx+0x1b4>
+ .byte 196,98,125,24,53,216,110,0,0 // vbroadcastss 0x6ed8(%rip),%ymm14 # 7c24 <_sk_callback_avx+0x1b4>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,238,108,0,0 // vbroadcastss 0x6cee(%rip),%ymm15 # 7a48 <_sk_callback_avx+0x1b8>
+ .byte 196,98,125,24,61,206,110,0,0 // vbroadcastss 0x6ece(%rip),%ymm15 # 7c28 <_sk_callback_avx+0x1b8>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,223,108,0,0 // vbroadcastss 0x6cdf(%rip),%ymm0 # 7a4c <_sk_callback_avx+0x1bc>
+ .byte 196,226,125,24,5,191,110,0,0 // vbroadcastss 0x6ebf(%rip),%ymm0 # 7c2c <_sk_callback_avx+0x1bc>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -20767,7 +21145,7 @@ _sk_hue_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,184,107,0,0 // vbroadcastss 0x6bb8(%rip),%ymm8 # 7a50 <_sk_callback_avx+0x1c0>
+ .byte 196,98,125,24,5,152,109,0,0 // vbroadcastss 0x6d98(%rip),%ymm8 # 7c30 <_sk_callback_avx+0x1c0>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20824,12 +21202,12 @@ _sk_saturation_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,198,106,0,0 // vbroadcastss 0x6ac6(%rip),%ymm14 # 7a54 <_sk_callback_avx+0x1c4>
+ .byte 196,98,125,24,53,166,108,0,0 // vbroadcastss 0x6ca6(%rip),%ymm14 # 7c34 <_sk_callback_avx+0x1c4>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,188,106,0,0 // vbroadcastss 0x6abc(%rip),%ymm15 # 7a58 <_sk_callback_avx+0x1c8>
+ .byte 196,98,125,24,61,156,108,0,0 // vbroadcastss 0x6c9c(%rip),%ymm15 # 7c38 <_sk_callback_avx+0x1c8>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,173,106,0,0 // vbroadcastss 0x6aad(%rip),%ymm0 # 7a5c <_sk_callback_avx+0x1cc>
+ .byte 196,226,125,24,5,141,108,0,0 // vbroadcastss 0x6c8d(%rip),%ymm0 # 7c3c <_sk_callback_avx+0x1cc>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -20890,7 +21268,7 @@ _sk_saturation_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,134,105,0,0 // vbroadcastss 0x6986(%rip),%ymm8 # 7a60 <_sk_callback_avx+0x1d0>
+ .byte 196,98,125,24,5,102,107,0,0 // vbroadcastss 0x6b66(%rip),%ymm8 # 7c40 <_sk_callback_avx+0x1d0>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -20919,12 +21297,12 @@ _sk_color_avx:
.byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
.byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
.byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
- .byte 196,98,125,24,45,28,105,0,0 // vbroadcastss 0x691c(%rip),%ymm13 # 7a64 <_sk_callback_avx+0x1d4>
+ .byte 196,98,125,24,45,252,106,0,0 // vbroadcastss 0x6afc(%rip),%ymm13 # 7c44 <_sk_callback_avx+0x1d4>
.byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
- .byte 196,98,125,24,53,18,105,0,0 // vbroadcastss 0x6912(%rip),%ymm14 # 7a68 <_sk_callback_avx+0x1d8>
+ .byte 196,98,125,24,53,242,106,0,0 // vbroadcastss 0x6af2(%rip),%ymm14 # 7c48 <_sk_callback_avx+0x1d8>
.byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,3,105,0,0 // vbroadcastss 0x6903(%rip),%ymm15 # 7a6c <_sk_callback_avx+0x1dc>
+ .byte 196,98,125,24,61,227,106,0,0 // vbroadcastss 0x6ae3(%rip),%ymm15 # 7c4c <_sk_callback_avx+0x1dc>
.byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -20987,7 +21365,7 @@ _sk_color_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,202,103,0,0 // vbroadcastss 0x67ca(%rip),%ymm0 # 7a70 <_sk_callback_avx+0x1e0>
+ .byte 196,226,125,24,5,170,105,0,0 // vbroadcastss 0x69aa(%rip),%ymm0 # 7c50 <_sk_callback_avx+0x1e0>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -21017,12 +21395,12 @@ _sk_luminosity_avx:
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
- .byte 196,98,125,24,45,92,103,0,0 // vbroadcastss 0x675c(%rip),%ymm13 # 7a74 <_sk_callback_avx+0x1e4>
+ .byte 196,98,125,24,45,60,105,0,0 // vbroadcastss 0x693c(%rip),%ymm13 # 7c54 <_sk_callback_avx+0x1e4>
.byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
- .byte 196,98,125,24,53,82,103,0,0 // vbroadcastss 0x6752(%rip),%ymm14 # 7a78 <_sk_callback_avx+0x1e8>
+ .byte 196,98,125,24,53,50,105,0,0 // vbroadcastss 0x6932(%rip),%ymm14 # 7c58 <_sk_callback_avx+0x1e8>
.byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,67,103,0,0 // vbroadcastss 0x6743(%rip),%ymm15 # 7a7c <_sk_callback_avx+0x1ec>
+ .byte 196,98,125,24,61,35,105,0,0 // vbroadcastss 0x6923(%rip),%ymm15 # 7c5c <_sk_callback_avx+0x1ec>
.byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -21085,7 +21463,7 @@ _sk_luminosity_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,10,102,0,0 // vbroadcastss 0x660a(%rip),%ymm0 # 7a80 <_sk_callback_avx+0x1f0>
+ .byte 196,226,125,24,5,234,103,0,0 // vbroadcastss 0x67ea(%rip),%ymm0 # 7c60 <_sk_callback_avx+0x1f0>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -21121,7 +21499,7 @@ _sk_srcover_rgba_8888_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,41,1,0,0 // jne 1611 <_sk_srcover_rgba_8888_avx+0x150>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,124,40,13,108,107,0,0 // vmovaps 0x6b6c(%rip),%ymm9 # 8060 <_sk_callback_avx+0x7d0>
+ .byte 197,124,40,13,140,109,0,0 // vmovaps 0x6d8c(%rip),%ymm9 # 8280 <_sk_callback_avx+0x810>
.byte 196,193,68,84,225 // vandps %ymm9,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
@@ -21139,9 +21517,9 @@ _sk_srcover_rgba_8888_avx:
.byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7
.byte 196,227,53,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,47,101,0,0 // vbroadcastss 0x652f(%rip),%ymm8 # 7a84 <_sk_callback_avx+0x1f4>
+ .byte 196,98,125,24,5,15,103,0,0 // vbroadcastss 0x670f(%rip),%ymm8 # 7c64 <_sk_callback_avx+0x1f4>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,38,101,0,0 // vbroadcastss 0x6526(%rip),%ymm9 # 7a88 <_sk_callback_avx+0x1f8>
+ .byte 196,98,125,24,13,6,103,0,0 // vbroadcastss 0x6706(%rip),%ymm9 # 7c68 <_sk_callback_avx+0x1f8>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
@@ -21186,9 +21564,9 @@ _sk_srcover_rgba_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,135,104,0,0 // vpshufb 0x6887(%rip),%xmm4,%xmm5 # 7ec0 <_sk_callback_avx+0x630>
+ .byte 196,226,89,0,45,151,106,0,0 // vpshufb 0x6a97(%rip),%xmm4,%xmm5 # 80d0 <_sk_callback_avx+0x660>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,137,104,0,0 // vpshufb 0x6889(%rip),%xmm4,%xmm4 # 7ed0 <_sk_callback_avx+0x640>
+ .byte 196,226,89,0,37,153,106,0,0 // vpshufb 0x6a99(%rip),%xmm4,%xmm4 # 80e0 <_sk_callback_avx+0x670>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
@@ -21200,9 +21578,9 @@ _sk_srcover_rgba_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,60,104,0,0 // vpshufb 0x683c(%rip),%xmm9,%xmm10 # 7ec0 <_sk_callback_avx+0x630>
+ .byte 196,98,49,0,21,76,106,0,0 // vpshufb 0x6a4c(%rip),%xmm9,%xmm10 # 80d0 <_sk_callback_avx+0x660>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,62,104,0,0 // vpshufb 0x683e(%rip),%xmm9,%xmm9 # 7ed0 <_sk_callback_avx+0x640>
+ .byte 196,98,49,0,13,78,106,0,0 // vpshufb 0x6a4e(%rip),%xmm9,%xmm9 # 80e0 <_sk_callback_avx+0x670>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
@@ -21224,7 +21602,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,191,99,0,0 // vbroadcastss 0x63bf(%rip),%ymm8 # 7a8c <_sk_callback_avx+0x1fc>
+ .byte 196,98,125,24,5,159,101,0,0 // vbroadcastss 0x659f(%rip),%ymm8 # 7c6c <_sk_callback_avx+0x1fc>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -21236,7 +21614,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,162,99,0,0 // vbroadcastss 0x63a2(%rip),%ymm8 # 7a90 <_sk_callback_avx+0x200>
+ .byte 196,98,125,24,5,130,101,0,0 // vbroadcastss 0x6582(%rip),%ymm8 # 7c70 <_sk_callback_avx+0x200>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -21248,7 +21626,7 @@ HIDDEN _sk_clamp_a_dst_avx
.globl _sk_clamp_a_dst_avx
FUNCTION(_sk_clamp_a_dst_avx)
_sk_clamp_a_dst_avx:
- .byte 196,98,125,24,5,136,99,0,0 // vbroadcastss 0x6388(%rip),%ymm8 # 7a94 <_sk_callback_avx+0x204>
+ .byte 196,98,125,24,5,104,101,0,0 // vbroadcastss 0x6568(%rip),%ymm8 # 7c74 <_sk_callback_avx+0x204>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -21281,7 +21659,7 @@ HIDDEN _sk_invert_avx
.globl _sk_invert_avx
FUNCTION(_sk_invert_avx)
_sk_invert_avx:
- .byte 196,98,125,24,5,71,99,0,0 // vbroadcastss 0x6347(%rip),%ymm8 # 7a98 <_sk_callback_avx+0x208>
+ .byte 196,98,125,24,5,39,101,0,0 // vbroadcastss 0x6527(%rip),%ymm8 # 7c78 <_sk_callback_avx+0x208>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -21337,7 +21715,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,219,98,0,0 // vbroadcastss 0x62db(%rip),%ymm10 # 7a9c <_sk_callback_avx+0x20c>
+ .byte 196,98,125,24,21,187,100,0,0 // vbroadcastss 0x64bb(%rip),%ymm10 # 7c7c <_sk_callback_avx+0x20c>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -21350,17 +21728,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,188,98,0,0 // vbroadcastss 0x62bc(%rip),%ymm8 # 7aa0 <_sk_callback_avx+0x210>
+ .byte 196,98,125,24,5,156,100,0,0 // vbroadcastss 0x649c(%rip),%ymm8 # 7c80 <_sk_callback_avx+0x210>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,174,98,0,0 // vbroadcastss 0x62ae(%rip),%ymm11 # 7aa4 <_sk_callback_avx+0x214>
+ .byte 196,98,125,24,29,142,100,0,0 // vbroadcastss 0x648e(%rip),%ymm11 # 7c84 <_sk_callback_avx+0x214>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,164,98,0,0 // vbroadcastss 0x62a4(%rip),%ymm13 # 7aa8 <_sk_callback_avx+0x218>
+ .byte 196,98,125,24,45,132,100,0,0 // vbroadcastss 0x6484(%rip),%ymm13 # 7c88 <_sk_callback_avx+0x218>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,149,98,0,0 // vbroadcastss 0x6295(%rip),%ymm12 # 7aac <_sk_callback_avx+0x21c>
+ .byte 196,98,125,24,37,117,100,0,0 // vbroadcastss 0x6475(%rip),%ymm12 # 7c8c <_sk_callback_avx+0x21c>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,139,98,0,0 // vbroadcastss 0x628b(%rip),%ymm14 # 7ab0 <_sk_callback_avx+0x220>
+ .byte 196,98,125,24,53,107,100,0,0 // vbroadcastss 0x646b(%rip),%ymm14 # 7c90 <_sk_callback_avx+0x220>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -21386,17 +21764,17 @@ HIDDEN _sk_from_srgb_dst_avx
.globl _sk_from_srgb_dst_avx
FUNCTION(_sk_from_srgb_dst_avx)
_sk_from_srgb_dst_avx:
- .byte 196,98,125,24,5,36,98,0,0 // vbroadcastss 0x6224(%rip),%ymm8 # 7ab4 <_sk_callback_avx+0x224>
+ .byte 196,98,125,24,5,4,100,0,0 // vbroadcastss 0x6404(%rip),%ymm8 # 7c94 <_sk_callback_avx+0x224>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,22,98,0,0 // vbroadcastss 0x6216(%rip),%ymm11 # 7ab8 <_sk_callback_avx+0x228>
+ .byte 196,98,125,24,29,246,99,0,0 // vbroadcastss 0x63f6(%rip),%ymm11 # 7c98 <_sk_callback_avx+0x228>
.byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12
- .byte 196,98,125,24,45,12,98,0,0 // vbroadcastss 0x620c(%rip),%ymm13 # 7abc <_sk_callback_avx+0x22c>
+ .byte 196,98,125,24,45,236,99,0,0 // vbroadcastss 0x63ec(%rip),%ymm13 # 7c9c <_sk_callback_avx+0x22c>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,253,97,0,0 // vbroadcastss 0x61fd(%rip),%ymm12 # 7ac0 <_sk_callback_avx+0x230>
+ .byte 196,98,125,24,37,221,99,0,0 // vbroadcastss 0x63dd(%rip),%ymm12 # 7ca0 <_sk_callback_avx+0x230>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,243,97,0,0 // vbroadcastss 0x61f3(%rip),%ymm14 # 7ac4 <_sk_callback_avx+0x234>
+ .byte 196,98,125,24,53,211,99,0,0 // vbroadcastss 0x63d3(%rip),%ymm14 # 7ca4 <_sk_callback_avx+0x234>
.byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4
.byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -21423,20 +21801,20 @@ HIDDEN _sk_to_srgb_avx
FUNCTION(_sk_to_srgb_avx)
_sk_to_srgb_avx:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,136,97,0,0 // vbroadcastss 0x6188(%rip),%ymm8 # 7ac8 <_sk_callback_avx+0x238>
+ .byte 196,98,125,24,5,104,99,0,0 // vbroadcastss 0x6368(%rip),%ymm8 # 7ca8 <_sk_callback_avx+0x238>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,126,97,0,0 // vbroadcastss 0x617e(%rip),%ymm11 # 7acc <_sk_callback_avx+0x23c>
+ .byte 196,98,125,24,29,94,99,0,0 // vbroadcastss 0x635e(%rip),%ymm11 # 7cac <_sk_callback_avx+0x23c>
.byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12
- .byte 196,98,125,24,45,116,97,0,0 // vbroadcastss 0x6174(%rip),%ymm13 # 7ad0 <_sk_callback_avx+0x240>
+ .byte 196,98,125,24,45,84,99,0,0 // vbroadcastss 0x6354(%rip),%ymm13 # 7cb0 <_sk_callback_avx+0x240>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12
- .byte 196,98,125,24,53,101,97,0,0 // vbroadcastss 0x6165(%rip),%ymm14 # 7ad4 <_sk_callback_avx+0x244>
+ .byte 196,98,125,24,53,69,99,0,0 // vbroadcastss 0x6345(%rip),%ymm14 # 7cb4 <_sk_callback_avx+0x244>
.byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12
- .byte 196,98,125,24,61,91,97,0,0 // vbroadcastss 0x615b(%rip),%ymm15 # 7ad8 <_sk_callback_avx+0x248>
+ .byte 196,98,125,24,61,59,99,0,0 // vbroadcastss 0x633b(%rip),%ymm15 # 7cb8 <_sk_callback_avx+0x248>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,37,71,97,0,0 // vbroadcastss 0x6147(%rip),%ymm12 # 7adc <_sk_callback_avx+0x24c>
+ .byte 196,98,125,24,37,39,99,0,0 // vbroadcastss 0x6327(%rip),%ymm12 # 7cbc <_sk_callback_avx+0x24c>
.byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -21473,7 +21851,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,173,96,0,0 // vbroadcastss 0x60ad(%rip),%ymm11 # 7ae0 <_sk_callback_avx+0x250>
+ .byte 196,98,125,24,29,141,98,0,0 // vbroadcastss 0x628d(%rip),%ymm11 # 7cc0 <_sk_callback_avx+0x250>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -21483,19 +21861,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,134,96,0,0 // vbroadcastss 0x6086(%rip),%ymm11 # 7aec <_sk_callback_avx+0x25c>
+ .byte 196,98,125,24,29,102,98,0,0 // vbroadcastss 0x6266(%rip),%ymm11 # 7ccc <_sk_callback_avx+0x25c>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,116,96,0,0 // vbroadcastss 0x6074(%rip),%ymm11 # 7ae8 <_sk_callback_avx+0x258>
+ .byte 196,98,125,24,29,84,98,0,0 // vbroadcastss 0x6254(%rip),%ymm11 # 7cc8 <_sk_callback_avx+0x258>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,92,96,0,0 // vbroadcastss 0x605c(%rip),%ymm2 # 7ae4 <_sk_callback_avx+0x254>
+ .byte 196,226,125,24,21,60,98,0,0 // vbroadcastss 0x623c(%rip),%ymm2 # 7cc4 <_sk_callback_avx+0x254>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,67,96,0,0 // vbroadcastss 0x6043(%rip),%ymm12 # 7af4 <_sk_callback_avx+0x264>
+ .byte 196,98,125,24,37,35,98,0,0 // vbroadcastss 0x6223(%rip),%ymm12 # 7cd4 <_sk_callback_avx+0x264>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -21505,7 +21883,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,6,96,0,0 // vbroadcastss 0x6006(%rip),%ymm8 # 7af0 <_sk_callback_avx+0x260>
+ .byte 196,98,125,24,5,230,97,0,0 // vbroadcastss 0x61e6(%rip),%ymm8 # 7cd0 <_sk_callback_avx+0x260>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -21522,7 +21900,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,211,95,0,0 // vbroadcastss 0x5fd3(%rip),%ymm8 # 7af8 <_sk_callback_avx+0x268>
+ .byte 196,98,125,24,5,179,97,0,0 // vbroadcastss 0x61b3(%rip),%ymm8 # 7cd8 <_sk_callback_avx+0x268>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -21530,23 +21908,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,173,95,0,0 // vbroadcastss 0x5fad(%rip),%ymm11 # 7afc <_sk_callback_avx+0x26c>
+ .byte 196,98,125,24,29,141,97,0,0 // vbroadcastss 0x618d(%rip),%ymm11 # 7cdc <_sk_callback_avx+0x26c>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,151,95,0,0 // vbroadcastss 0x5f97(%rip),%ymm12 # 7b04 <_sk_callback_avx+0x274>
+ .byte 196,98,125,24,37,119,97,0,0 // vbroadcastss 0x6177(%rip),%ymm12 # 7ce4 <_sk_callback_avx+0x274>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,141,95,0,0 // vbroadcastss 0x5f8d(%rip),%ymm13 # 7b08 <_sk_callback_avx+0x278>
+ .byte 196,98,125,24,45,109,97,0,0 // vbroadcastss 0x616d(%rip),%ymm13 # 7ce8 <_sk_callback_avx+0x278>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,110,95,0,0 // vbroadcastss 0x5f6e(%rip),%ymm1 # 7b00 <_sk_callback_avx+0x270>
+ .byte 196,226,125,24,13,78,97,0,0 // vbroadcastss 0x614e(%rip),%ymm1 # 7ce0 <_sk_callback_avx+0x270>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,89,95,0,0 // vbroadcastss 0x5f59(%rip),%ymm14 # 7b0c <_sk_callback_avx+0x27c>
+ .byte 196,98,125,24,53,57,97,0,0 // vbroadcastss 0x6139(%rip),%ymm14 # 7cec <_sk_callback_avx+0x27c>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -21565,7 +21943,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,251,94,0,0 // vbroadcastss 0x5efb(%rip),%ymm0 # 7b10 <_sk_callback_avx+0x280>
+ .byte 196,226,125,24,5,219,96,0,0 // vbroadcastss 0x60db(%rip),%ymm0 # 7cf0 <_sk_callback_avx+0x280>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -21622,13 +22000,13 @@ _sk_scale_u8_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,75 // jne 1d1c <_sk_scale_u8_avx+0x64>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,1,98,0,0 // vpand 0x6201(%rip),%xmm8,%xmm8 # 7ee0 <_sk_callback_avx+0x650>
+ .byte 197,57,219,5,17,100,0,0 // vpand 0x6411(%rip),%xmm8,%xmm8 # 80f0 <_sk_callback_avx+0x680>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,18,94,0,0 // vbroadcastss 0x5e12(%rip),%ymm9 # 7b14 <_sk_callback_avx+0x284>
+ .byte 196,98,125,24,13,242,95,0,0 // vbroadcastss 0x5ff2(%rip),%ymm9 # 7cf4 <_sk_callback_avx+0x284>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -21726,13 +22104,13 @@ _sk_lerp_u8_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,111 // jne 1e9b <_sk_lerp_u8_avx+0x88>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,182,96,0,0 // vpand 0x60b6(%rip),%xmm8,%xmm8 # 7ef0 <_sk_callback_avx+0x660>
+ .byte 197,57,219,5,198,98,0,0 // vpand 0x62c6(%rip),%xmm8,%xmm8 # 8100 <_sk_callback_avx+0x690>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,187,92,0,0 // vbroadcastss 0x5cbb(%rip),%ymm9 # 7b18 <_sk_callback_avx+0x288>
+ .byte 196,98,125,24,13,155,94,0,0 // vbroadcastss 0x5e9b(%rip),%ymm9 # 7cf8 <_sk_callback_avx+0x288>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -21789,7 +22167,7 @@ _sk_lerp_u8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf001f48 <_sk_callback_avx+0xffffffffdeffa6b8>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf001f48 <_sk_callback_avx+0xffffffffdeffa4d8>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -21819,20 +22197,20 @@ _sk_lerp_565_avx:
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,132,91,0,0 // vbroadcastss 0x5b84(%rip),%ymm9 # 7b1c <_sk_callback_avx+0x28c>
+ .byte 196,98,125,24,13,100,93,0,0 // vbroadcastss 0x5d64(%rip),%ymm9 # 7cfc <_sk_callback_avx+0x28c>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,117,91,0,0 // vbroadcastss 0x5b75(%rip),%ymm10 # 7b20 <_sk_callback_avx+0x290>
+ .byte 196,98,125,24,21,85,93,0,0 // vbroadcastss 0x5d55(%rip),%ymm10 # 7d00 <_sk_callback_avx+0x290>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,107,91,0,0 // vbroadcastss 0x5b6b(%rip),%ymm10 # 7b24 <_sk_callback_avx+0x294>
+ .byte 196,98,125,24,21,75,93,0,0 // vbroadcastss 0x5d4b(%rip),%ymm10 # 7d04 <_sk_callback_avx+0x294>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,92,91,0,0 // vbroadcastss 0x5b5c(%rip),%ymm11 # 7b28 <_sk_callback_avx+0x298>
+ .byte 196,98,125,24,29,60,93,0,0 // vbroadcastss 0x5d3c(%rip),%ymm11 # 7d08 <_sk_callback_avx+0x298>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,82,91,0,0 // vbroadcastss 0x5b52(%rip),%ymm11 # 7b2c <_sk_callback_avx+0x29c>
+ .byte 196,98,125,24,29,50,93,0,0 // vbroadcastss 0x5d32(%rip),%ymm11 # 7d0c <_sk_callback_avx+0x29c>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,67,91,0,0 // vbroadcastss 0x5b43(%rip),%ymm11 # 7b30 <_sk_callback_avx+0x2a0>
+ .byte 196,98,125,24,29,35,93,0,0 // vbroadcastss 0x5d23(%rip),%ymm11 # 7d10 <_sk_callback_avx+0x2a0>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
@@ -21913,7 +22291,7 @@ _sk_load_tables_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,248,1,0,0 // jne 2300 <_sk_load_tables_avx+0x218>
.byte 196,65,124,16,18 // vmovups (%r10),%ymm10
- .byte 197,124,40,13,107,95,0,0 // vmovaps 0x5f6b(%rip),%ymm9 # 8080 <_sk_callback_avx+0x7f0>
+ .byte 197,124,40,13,139,97,0,0 // vmovaps 0x618b(%rip),%ymm9 # 82a0 <_sk_callback_avx+0x830>
.byte 196,193,44,84,201 // vandps %ymm9,%ymm10,%ymm1
.byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0
.byte 196,193,249,126,195 // vmovq %xmm0,%r11
@@ -22005,7 +22383,7 @@ _sk_load_tables_avx:
.byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,70,88,0,0 // vbroadcastss 0x5846(%rip),%ymm7 # 7b34 <_sk_callback_avx+0x2a4>
+ .byte 196,226,125,24,61,38,90,0,0 // vbroadcastss 0x5a26(%rip),%ymm7 # 7d14 <_sk_callback_avx+0x2a4>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -22019,9 +22397,9 @@ _sk_load_tables_avx:
.byte 73,211,235 // shr %cl,%r11
.byte 196,193,249,110,195 // vmovq %r11,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,216,91,0,0 // vpshufb 0x5bd8(%rip),%xmm0,%xmm1 # 7f00 <_sk_callback_avx+0x670>
+ .byte 196,226,121,0,13,232,93,0,0 // vpshufb 0x5de8(%rip),%xmm0,%xmm1 # 8110 <_sk_callback_avx+0x6a0>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,218,91,0,0 // vpshufb 0x5bda(%rip),%xmm0,%xmm0 # 7f10 <_sk_callback_avx+0x680>
+ .byte 196,226,121,0,5,234,93,0,0 // vpshufb 0x5dea(%rip),%xmm0,%xmm0 # 8120 <_sk_callback_avx+0x6b0>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,66,125,44,18 // vmaskmovps (%r10),%ymm0,%ymm10
@@ -22051,7 +22429,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11
.byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1
.byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12
- .byte 197,121,111,21,108,91,0,0 // vmovdqa 0x5b6c(%rip),%xmm10 # 7f20 <_sk_callback_avx+0x690>
+ .byte 197,121,111,21,124,93,0,0 // vmovdqa 0x5d7c(%rip),%xmm10 # 8130 <_sk_callback_avx+0x6c0>
.byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -22149,7 +22527,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,139,85,0,0 // vbroadcastss 0x558b(%rip),%ymm7 # 7b38 <_sk_callback_avx+0x2a8>
+ .byte 196,226,125,24,61,107,87,0,0 // vbroadcastss 0x576b(%rip),%ymm7 # 7d18 <_sk_callback_avx+0x2a8>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -22212,7 +22590,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,113,88,0,0 // vmovdqa 0x5871(%rip),%xmm9 # 7f30 <_sk_callback_avx+0x6a0>
+ .byte 197,121,111,13,129,90,0,0 // vmovdqa 0x5a81(%rip),%xmm9 # 8140 <_sk_callback_avx+0x6d0>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -22302,7 +22680,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2
.byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,174,82,0,0 // vbroadcastss 0x52ae(%rip),%ymm3 # 7b3c <_sk_callback_avx+0x2ac>
+ .byte 196,226,125,24,29,142,84,0,0 // vbroadcastss 0x548e(%rip),%ymm3 # 7d1c <_sk_callback_avx+0x2ac>
.byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
.byte 255,224 // jmpq *%rax
@@ -22345,7 +22723,7 @@ HIDDEN _sk_byte_tables_avx
FUNCTION(_sk_byte_tables_avx)
_sk_byte_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,234,81,0,0 // vbroadcastss 0x51ea(%rip),%ymm8 # 7b40 <_sk_callback_avx+0x2b0>
+ .byte 196,98,125,24,5,202,83,0,0 // vbroadcastss 0x53ca(%rip),%ymm8 # 7d20 <_sk_callback_avx+0x2b0>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -22464,7 +22842,7 @@ _sk_byte_tables_avx:
.byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1
.byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- .byte 196,98,125,24,13,148,79,0,0 // vbroadcastss 0x4f94(%rip),%ymm9 # 7b44 <_sk_callback_avx+0x2b4>
+ .byte 196,98,125,24,13,116,81,0,0 // vbroadcastss 0x5174(%rip),%ymm9 # 7d24 <_sk_callback_avx+0x2b4>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -22580,7 +22958,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,117,77,0,0 // vbroadcastss 0x4d75(%rip),%ymm9 # 7b48 <_sk_callback_avx+0x2b8>
+ .byte 196,98,125,24,13,85,79,0,0 // vbroadcastss 0x4f55(%rip),%ymm9 # 7d28 <_sk_callback_avx+0x2b8>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1
.byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2
@@ -22785,36 +23163,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,34,74,0,0 // vbroadcastss 0x4a22(%rip),%ymm12 # 7b4c <_sk_callback_avx+0x2bc>
+ .byte 196,98,125,24,37,2,76,0,0 // vbroadcastss 0x4c02(%rip),%ymm12 # 7d2c <_sk_callback_avx+0x2bc>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,24,74,0,0 // vbroadcastss 0x4a18(%rip),%ymm12 # 7b50 <_sk_callback_avx+0x2c0>
+ .byte 196,98,125,24,37,248,75,0,0 // vbroadcastss 0x4bf8(%rip),%ymm12 # 7d30 <_sk_callback_avx+0x2c0>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,14,74,0,0 // vbroadcastss 0x4a0e(%rip),%ymm12 # 7b54 <_sk_callback_avx+0x2c4>
+ .byte 196,98,125,24,37,238,75,0,0 // vbroadcastss 0x4bee(%rip),%ymm12 # 7d34 <_sk_callback_avx+0x2c4>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,4,74,0,0 // vbroadcastss 0x4a04(%rip),%ymm12 # 7b58 <_sk_callback_avx+0x2c8>
+ .byte 196,98,125,24,37,228,75,0,0 // vbroadcastss 0x4be4(%rip),%ymm12 # 7d38 <_sk_callback_avx+0x2c8>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,250,73,0,0 // vbroadcastss 0x49fa(%rip),%ymm12 # 7b5c <_sk_callback_avx+0x2cc>
+ .byte 196,98,125,24,37,218,75,0,0 // vbroadcastss 0x4bda(%rip),%ymm12 # 7d3c <_sk_callback_avx+0x2cc>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,235,73,0,0 // vbroadcastss 0x49eb(%rip),%ymm12 # 7b60 <_sk_callback_avx+0x2d0>
+ .byte 196,98,125,24,37,203,75,0,0 // vbroadcastss 0x4bcb(%rip),%ymm12 # 7d40 <_sk_callback_avx+0x2d0>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,225,73,0,0 // vbroadcastss 0x49e1(%rip),%ymm12 # 7b64 <_sk_callback_avx+0x2d4>
+ .byte 196,98,125,24,37,193,75,0,0 // vbroadcastss 0x4bc1(%rip),%ymm12 # 7d44 <_sk_callback_avx+0x2d4>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,197,73,0,0 // vbroadcastss 0x49c5(%rip),%ymm11 # 7b68 <_sk_callback_avx+0x2d8>
+ .byte 196,98,125,24,29,165,75,0,0 // vbroadcastss 0x4ba5(%rip),%ymm11 # 7d48 <_sk_callback_avx+0x2d8>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,187,73,0,0 // vbroadcastss 0x49bb(%rip),%ymm11 # 7b6c <_sk_callback_avx+0x2dc>
+ .byte 196,98,125,24,29,155,75,0,0 // vbroadcastss 0x4b9b(%rip),%ymm11 # 7d4c <_sk_callback_avx+0x2dc>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,172,73,0,0 // vbroadcastss 0x49ac(%rip),%ymm11 # 7b70 <_sk_callback_avx+0x2e0>
+ .byte 196,98,125,24,29,140,75,0,0 // vbroadcastss 0x4b8c(%rip),%ymm11 # 7d50 <_sk_callback_avx+0x2e0>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,162,73,0,0 // vbroadcastss 0x49a2(%rip),%ymm11 # 7b74 <_sk_callback_avx+0x2e4>
+ .byte 196,98,125,24,29,130,75,0,0 // vbroadcastss 0x4b82(%rip),%ymm11 # 7d54 <_sk_callback_avx+0x2e4>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,147,73,0,0 // vbroadcastss 0x4993(%rip),%ymm10 # 7b78 <_sk_callback_avx+0x2e8>
+ .byte 196,98,125,24,21,115,75,0,0 // vbroadcastss 0x4b73(%rip),%ymm10 # 7d58 <_sk_callback_avx+0x2e8>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -22822,7 +23200,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,106,73,0,0 // vbroadcastss 0x496a(%rip),%ymm8 # 7b7c <_sk_callback_avx+0x2ec>
+ .byte 196,98,125,24,5,74,75,0,0 // vbroadcastss 0x4b4a(%rip),%ymm8 # 7d5c <_sk_callback_avx+0x2ec>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -22844,36 +23222,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,27,73,0,0 // vbroadcastss 0x491b(%rip),%ymm12 # 7b80 <_sk_callback_avx+0x2f0>
+ .byte 196,98,125,24,37,251,74,0,0 // vbroadcastss 0x4afb(%rip),%ymm12 # 7d60 <_sk_callback_avx+0x2f0>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,17,73,0,0 // vbroadcastss 0x4911(%rip),%ymm12 # 7b84 <_sk_callback_avx+0x2f4>
+ .byte 196,98,125,24,37,241,74,0,0 // vbroadcastss 0x4af1(%rip),%ymm12 # 7d64 <_sk_callback_avx+0x2f4>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,7,73,0,0 // vbroadcastss 0x4907(%rip),%ymm12 # 7b88 <_sk_callback_avx+0x2f8>
+ .byte 196,98,125,24,37,231,74,0,0 // vbroadcastss 0x4ae7(%rip),%ymm12 # 7d68 <_sk_callback_avx+0x2f8>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,253,72,0,0 // vbroadcastss 0x48fd(%rip),%ymm12 # 7b8c <_sk_callback_avx+0x2fc>
+ .byte 196,98,125,24,37,221,74,0,0 // vbroadcastss 0x4add(%rip),%ymm12 # 7d6c <_sk_callback_avx+0x2fc>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,243,72,0,0 // vbroadcastss 0x48f3(%rip),%ymm12 # 7b90 <_sk_callback_avx+0x300>
+ .byte 196,98,125,24,37,211,74,0,0 // vbroadcastss 0x4ad3(%rip),%ymm12 # 7d70 <_sk_callback_avx+0x300>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,228,72,0,0 // vbroadcastss 0x48e4(%rip),%ymm12 # 7b94 <_sk_callback_avx+0x304>
+ .byte 196,98,125,24,37,196,74,0,0 // vbroadcastss 0x4ac4(%rip),%ymm12 # 7d74 <_sk_callback_avx+0x304>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,218,72,0,0 // vbroadcastss 0x48da(%rip),%ymm12 # 7b98 <_sk_callback_avx+0x308>
+ .byte 196,98,125,24,37,186,74,0,0 // vbroadcastss 0x4aba(%rip),%ymm12 # 7d78 <_sk_callback_avx+0x308>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,190,72,0,0 // vbroadcastss 0x48be(%rip),%ymm11 # 7b9c <_sk_callback_avx+0x30c>
+ .byte 196,98,125,24,29,158,74,0,0 // vbroadcastss 0x4a9e(%rip),%ymm11 # 7d7c <_sk_callback_avx+0x30c>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,180,72,0,0 // vbroadcastss 0x48b4(%rip),%ymm11 # 7ba0 <_sk_callback_avx+0x310>
+ .byte 196,98,125,24,29,148,74,0,0 // vbroadcastss 0x4a94(%rip),%ymm11 # 7d80 <_sk_callback_avx+0x310>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,165,72,0,0 // vbroadcastss 0x48a5(%rip),%ymm11 # 7ba4 <_sk_callback_avx+0x314>
+ .byte 196,98,125,24,29,133,74,0,0 // vbroadcastss 0x4a85(%rip),%ymm11 # 7d84 <_sk_callback_avx+0x314>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,155,72,0,0 // vbroadcastss 0x489b(%rip),%ymm11 # 7ba8 <_sk_callback_avx+0x318>
+ .byte 196,98,125,24,29,123,74,0,0 // vbroadcastss 0x4a7b(%rip),%ymm11 # 7d88 <_sk_callback_avx+0x318>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,140,72,0,0 // vbroadcastss 0x488c(%rip),%ymm10 # 7bac <_sk_callback_avx+0x31c>
+ .byte 196,98,125,24,21,108,74,0,0 // vbroadcastss 0x4a6c(%rip),%ymm10 # 7d8c <_sk_callback_avx+0x31c>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -22881,7 +23259,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,99,72,0,0 // vbroadcastss 0x4863(%rip),%ymm8 # 7bb0 <_sk_callback_avx+0x320>
+ .byte 196,98,125,24,5,67,74,0,0 // vbroadcastss 0x4a43(%rip),%ymm8 # 7d90 <_sk_callback_avx+0x320>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -22903,36 +23281,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,20,72,0,0 // vbroadcastss 0x4814(%rip),%ymm12 # 7bb4 <_sk_callback_avx+0x324>
+ .byte 196,98,125,24,37,244,73,0,0 // vbroadcastss 0x49f4(%rip),%ymm12 # 7d94 <_sk_callback_avx+0x324>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,10,72,0,0 // vbroadcastss 0x480a(%rip),%ymm12 # 7bb8 <_sk_callback_avx+0x328>
+ .byte 196,98,125,24,37,234,73,0,0 // vbroadcastss 0x49ea(%rip),%ymm12 # 7d98 <_sk_callback_avx+0x328>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,0,72,0,0 // vbroadcastss 0x4800(%rip),%ymm12 # 7bbc <_sk_callback_avx+0x32c>
+ .byte 196,98,125,24,37,224,73,0,0 // vbroadcastss 0x49e0(%rip),%ymm12 # 7d9c <_sk_callback_avx+0x32c>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,246,71,0,0 // vbroadcastss 0x47f6(%rip),%ymm12 # 7bc0 <_sk_callback_avx+0x330>
+ .byte 196,98,125,24,37,214,73,0,0 // vbroadcastss 0x49d6(%rip),%ymm12 # 7da0 <_sk_callback_avx+0x330>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,236,71,0,0 // vbroadcastss 0x47ec(%rip),%ymm12 # 7bc4 <_sk_callback_avx+0x334>
+ .byte 196,98,125,24,37,204,73,0,0 // vbroadcastss 0x49cc(%rip),%ymm12 # 7da4 <_sk_callback_avx+0x334>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,221,71,0,0 // vbroadcastss 0x47dd(%rip),%ymm12 # 7bc8 <_sk_callback_avx+0x338>
+ .byte 196,98,125,24,37,189,73,0,0 // vbroadcastss 0x49bd(%rip),%ymm12 # 7da8 <_sk_callback_avx+0x338>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,211,71,0,0 // vbroadcastss 0x47d3(%rip),%ymm12 # 7bcc <_sk_callback_avx+0x33c>
+ .byte 196,98,125,24,37,179,73,0,0 // vbroadcastss 0x49b3(%rip),%ymm12 # 7dac <_sk_callback_avx+0x33c>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,183,71,0,0 // vbroadcastss 0x47b7(%rip),%ymm11 # 7bd0 <_sk_callback_avx+0x340>
+ .byte 196,98,125,24,29,151,73,0,0 // vbroadcastss 0x4997(%rip),%ymm11 # 7db0 <_sk_callback_avx+0x340>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,173,71,0,0 // vbroadcastss 0x47ad(%rip),%ymm11 # 7bd4 <_sk_callback_avx+0x344>
+ .byte 196,98,125,24,29,141,73,0,0 // vbroadcastss 0x498d(%rip),%ymm11 # 7db4 <_sk_callback_avx+0x344>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,158,71,0,0 // vbroadcastss 0x479e(%rip),%ymm11 # 7bd8 <_sk_callback_avx+0x348>
+ .byte 196,98,125,24,29,126,73,0,0 // vbroadcastss 0x497e(%rip),%ymm11 # 7db8 <_sk_callback_avx+0x348>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,148,71,0,0 // vbroadcastss 0x4794(%rip),%ymm11 # 7bdc <_sk_callback_avx+0x34c>
+ .byte 196,98,125,24,29,116,73,0,0 // vbroadcastss 0x4974(%rip),%ymm11 # 7dbc <_sk_callback_avx+0x34c>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,133,71,0,0 // vbroadcastss 0x4785(%rip),%ymm10 # 7be0 <_sk_callback_avx+0x350>
+ .byte 196,98,125,24,21,101,73,0,0 // vbroadcastss 0x4965(%rip),%ymm10 # 7dc0 <_sk_callback_avx+0x350>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -22940,7 +23318,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,92,71,0,0 // vbroadcastss 0x475c(%rip),%ymm8 # 7be4 <_sk_callback_avx+0x354>
+ .byte 196,98,125,24,5,60,73,0,0 // vbroadcastss 0x493c(%rip),%ymm8 # 7dc4 <_sk_callback_avx+0x354>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -22962,36 +23340,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,13,71,0,0 // vbroadcastss 0x470d(%rip),%ymm12 # 7be8 <_sk_callback_avx+0x358>
+ .byte 196,98,125,24,37,237,72,0,0 // vbroadcastss 0x48ed(%rip),%ymm12 # 7dc8 <_sk_callback_avx+0x358>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,3,71,0,0 // vbroadcastss 0x4703(%rip),%ymm12 # 7bec <_sk_callback_avx+0x35c>
+ .byte 196,98,125,24,37,227,72,0,0 // vbroadcastss 0x48e3(%rip),%ymm12 # 7dcc <_sk_callback_avx+0x35c>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,249,70,0,0 // vbroadcastss 0x46f9(%rip),%ymm12 # 7bf0 <_sk_callback_avx+0x360>
+ .byte 196,98,125,24,37,217,72,0,0 // vbroadcastss 0x48d9(%rip),%ymm12 # 7dd0 <_sk_callback_avx+0x360>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,239,70,0,0 // vbroadcastss 0x46ef(%rip),%ymm12 # 7bf4 <_sk_callback_avx+0x364>
+ .byte 196,98,125,24,37,207,72,0,0 // vbroadcastss 0x48cf(%rip),%ymm12 # 7dd4 <_sk_callback_avx+0x364>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,229,70,0,0 // vbroadcastss 0x46e5(%rip),%ymm12 # 7bf8 <_sk_callback_avx+0x368>
+ .byte 196,98,125,24,37,197,72,0,0 // vbroadcastss 0x48c5(%rip),%ymm12 # 7dd8 <_sk_callback_avx+0x368>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,214,70,0,0 // vbroadcastss 0x46d6(%rip),%ymm12 # 7bfc <_sk_callback_avx+0x36c>
+ .byte 196,98,125,24,37,182,72,0,0 // vbroadcastss 0x48b6(%rip),%ymm12 # 7ddc <_sk_callback_avx+0x36c>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,204,70,0,0 // vbroadcastss 0x46cc(%rip),%ymm12 # 7c00 <_sk_callback_avx+0x370>
+ .byte 196,98,125,24,37,172,72,0,0 // vbroadcastss 0x48ac(%rip),%ymm12 # 7de0 <_sk_callback_avx+0x370>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,176,70,0,0 // vbroadcastss 0x46b0(%rip),%ymm11 # 7c04 <_sk_callback_avx+0x374>
+ .byte 196,98,125,24,29,144,72,0,0 // vbroadcastss 0x4890(%rip),%ymm11 # 7de4 <_sk_callback_avx+0x374>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,166,70,0,0 // vbroadcastss 0x46a6(%rip),%ymm11 # 7c08 <_sk_callback_avx+0x378>
+ .byte 196,98,125,24,29,134,72,0,0 // vbroadcastss 0x4886(%rip),%ymm11 # 7de8 <_sk_callback_avx+0x378>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,151,70,0,0 // vbroadcastss 0x4697(%rip),%ymm11 # 7c0c <_sk_callback_avx+0x37c>
+ .byte 196,98,125,24,29,119,72,0,0 // vbroadcastss 0x4877(%rip),%ymm11 # 7dec <_sk_callback_avx+0x37c>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,141,70,0,0 // vbroadcastss 0x468d(%rip),%ymm11 # 7c10 <_sk_callback_avx+0x380>
+ .byte 196,98,125,24,29,109,72,0,0 // vbroadcastss 0x486d(%rip),%ymm11 # 7df0 <_sk_callback_avx+0x380>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,126,70,0,0 // vbroadcastss 0x467e(%rip),%ymm10 # 7c14 <_sk_callback_avx+0x384>
+ .byte 196,98,125,24,21,94,72,0,0 // vbroadcastss 0x485e(%rip),%ymm10 # 7df4 <_sk_callback_avx+0x384>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -22999,40 +23377,139 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,85,70,0,0 // vbroadcastss 0x4655(%rip),%ymm8 # 7c18 <_sk_callback_avx+0x388>
+ .byte 196,98,125,24,5,53,72,0,0 // vbroadcastss 0x4835(%rip),%ymm8 # 7df8 <_sk_callback_avx+0x388>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_gamma_avx
+.globl _sk_gamma_avx
+FUNCTION(_sk_gamma_avx)
+_sk_gamma_avx:
+ .byte 72,131,236,88 // sub $0x58,%rsp
+ .byte 197,252,17,124,36,32 // vmovups %ymm7,0x20(%rsp)
+ .byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
+ .byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
+ .byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
+ .byte 197,252,17,92,36,160 // vmovups %ymm3,-0x60(%rsp)
+ .byte 197,252,40,250 // vmovaps %ymm2,%ymm7
+ .byte 197,252,40,233 // vmovaps %ymm1,%ymm5
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,252,91,200 // vcvtdq2ps %ymm0,%ymm1
+ .byte 196,98,125,24,5,248,71,0,0 // vbroadcastss 0x47f8(%rip),%ymm8 # 7dfc <_sk_callback_avx+0x38c>
+ .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
+ .byte 196,98,125,24,13,238,71,0,0 // vbroadcastss 0x47ee(%rip),%ymm9 # 7e00 <_sk_callback_avx+0x390>
+ .byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
+ .byte 196,226,125,24,37,228,71,0,0 // vbroadcastss 0x47e4(%rip),%ymm4 # 7e04 <_sk_callback_avx+0x394>
+ .byte 197,252,86,196 // vorps %ymm4,%ymm0,%ymm0
+ .byte 196,98,125,24,21,219,71,0,0 // vbroadcastss 0x47db(%rip),%ymm10 # 7e08 <_sk_callback_avx+0x398>
+ .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
+ .byte 196,98,125,24,29,209,71,0,0 // vbroadcastss 0x47d1(%rip),%ymm11 # 7e0c <_sk_callback_avx+0x39c>
+ .byte 196,193,124,89,211 // vmulps %ymm11,%ymm0,%ymm2
+ .byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
+ .byte 196,98,125,24,37,195,71,0,0 // vbroadcastss 0x47c3(%rip),%ymm12 # 7e10 <_sk_callback_avx+0x3a0>
+ .byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
+ .byte 196,98,125,24,45,185,71,0,0 // vbroadcastss 0x47b9(%rip),%ymm13 # 7e14 <_sk_callback_avx+0x3a4>
+ .byte 197,148,94,192 // vdivps %ymm0,%ymm13,%ymm0
+ .byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
+ .byte 196,98,125,24,48 // vbroadcastss (%rax),%ymm14
+ .byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
+ .byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
+ .byte 197,252,92,241 // vsubps %ymm1,%ymm0,%ymm6
+ .byte 196,98,125,24,61,152,71,0,0 // vbroadcastss 0x4798(%rip),%ymm15 # 7e18 <_sk_callback_avx+0x3a8>
+ .byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
+ .byte 196,226,125,24,29,142,71,0,0 // vbroadcastss 0x478e(%rip),%ymm3 # 7e1c <_sk_callback_avx+0x3ac>
+ .byte 197,204,89,203 // vmulps %ymm3,%ymm6,%ymm1
+ .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
+ .byte 196,226,125,24,21,129,71,0,0 // vbroadcastss 0x4781(%rip),%ymm2 # 7e20 <_sk_callback_avx+0x3b0>
+ .byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0
+ .byte 196,226,125,24,53,120,71,0,0 // vbroadcastss 0x4778(%rip),%ymm6 # 7e24 <_sk_callback_avx+0x3b4>
+ .byte 197,204,94,192 // vdivps %ymm0,%ymm6,%ymm0
+ .byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
+ .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
+ .byte 197,252,91,205 // vcvtdq2ps %ymm5,%ymm1
+ .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
+ .byte 196,193,84,84,233 // vandps %ymm9,%ymm5,%ymm5
+ .byte 197,212,86,236 // vorps %ymm4,%ymm5,%ymm5
+ .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
+ .byte 196,193,84,89,195 // vmulps %ymm11,%ymm5,%ymm0
+ .byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
+ .byte 196,193,84,88,204 // vaddps %ymm12,%ymm5,%ymm1
+ .byte 197,148,94,201 // vdivps %ymm1,%ymm13,%ymm1
+ .byte 197,252,92,193 // vsubps %ymm1,%ymm0,%ymm0
+ .byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
+ .byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
+ .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
+ .byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
+ .byte 197,244,89,235 // vmulps %ymm3,%ymm1,%ymm5
+ .byte 197,252,92,197 // vsubps %ymm5,%ymm0,%ymm0
+ .byte 197,236,92,201 // vsubps %ymm1,%ymm2,%ymm1
+ .byte 197,204,94,201 // vdivps %ymm1,%ymm6,%ymm1
+ .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
+ .byte 197,252,91,207 // vcvtdq2ps %ymm7,%ymm1
+ .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
+ .byte 196,193,68,84,233 // vandps %ymm9,%ymm7,%ymm5
+ .byte 197,212,86,228 // vorps %ymm4,%ymm5,%ymm4
+ .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
+ .byte 196,193,92,89,235 // vmulps %ymm11,%ymm4,%ymm5
+ .byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
+ .byte 196,193,92,88,228 // vaddps %ymm12,%ymm4,%ymm4
+ .byte 197,148,94,228 // vdivps %ymm4,%ymm13,%ymm4
+ .byte 197,244,92,204 // vsubps %ymm4,%ymm1,%ymm1
+ .byte 196,193,116,89,206 // vmulps %ymm14,%ymm1,%ymm1
+ .byte 196,227,125,8,225,1 // vroundps $0x1,%ymm1,%ymm4
+ .byte 197,244,92,228 // vsubps %ymm4,%ymm1,%ymm4
+ .byte 196,193,116,88,207 // vaddps %ymm15,%ymm1,%ymm1
+ .byte 197,220,89,219 // vmulps %ymm3,%ymm4,%ymm3
+ .byte 197,244,92,203 // vsubps %ymm3,%ymm1,%ymm1
+ .byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
+ .byte 197,204,94,210 // vdivps %ymm2,%ymm6,%ymm2
+ .byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
+ .byte 196,226,125,24,21,187,70,0,0 // vbroadcastss 0x46bb(%rip),%ymm2 # 7e28 <_sk_callback_avx+0x3b8>
+ .byte 197,236,89,92,36,128 // vmulps -0x80(%rsp),%ymm2,%ymm3
+ .byte 197,252,89,226 // vmulps %ymm2,%ymm0,%ymm4
+ .byte 197,244,89,210 // vmulps %ymm2,%ymm1,%ymm2
+ .byte 197,253,91,195 // vcvtps2dq %ymm3,%ymm0
+ .byte 197,253,91,204 // vcvtps2dq %ymm4,%ymm1
+ .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,252,16,92,36,160 // vmovups -0x60(%rsp),%ymm3
+ .byte 197,252,16,100,36,192 // vmovups -0x40(%rsp),%ymm4
+ .byte 197,252,16,108,36,224 // vmovups -0x20(%rsp),%ymm5
+ .byte 197,252,16,52,36 // vmovups (%rsp),%ymm6
+ .byte 197,252,16,124,36,32 // vmovups 0x20(%rsp),%ymm7
+ .byte 72,131,196,88 // add $0x58,%rsp
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,71,70,0,0 // vbroadcastss 0x4647(%rip),%ymm8 # 7c1c <_sk_callback_avx+0x38c>
+ .byte 196,98,125,24,5,119,70,0,0 // vbroadcastss 0x4677(%rip),%ymm8 # 7e2c <_sk_callback_avx+0x3bc>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,61,70,0,0 // vbroadcastss 0x463d(%rip),%ymm8 # 7c20 <_sk_callback_avx+0x390>
+ .byte 196,98,125,24,5,109,70,0,0 // vbroadcastss 0x466d(%rip),%ymm8 # 7e30 <_sk_callback_avx+0x3c0>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,51,70,0,0 // vbroadcastss 0x4633(%rip),%ymm9 # 7c24 <_sk_callback_avx+0x394>
+ .byte 196,98,125,24,13,99,70,0,0 // vbroadcastss 0x4663(%rip),%ymm9 # 7e34 <_sk_callback_avx+0x3c4>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,31,70,0,0 // vbroadcastss 0x461f(%rip),%ymm8 # 7c28 <_sk_callback_avx+0x398>
+ .byte 196,98,125,24,5,79,70,0,0 // vbroadcastss 0x464f(%rip),%ymm8 # 7e38 <_sk_callback_avx+0x3c8>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,21,70,0,0 // vbroadcastss 0x4615(%rip),%ymm8 # 7c2c <_sk_callback_avx+0x39c>
+ .byte 196,98,125,24,5,69,70,0,0 // vbroadcastss 0x4645(%rip),%ymm8 # 7e3c <_sk_callback_avx+0x3cc>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,11,70,0,0 // vbroadcastss 0x460b(%rip),%ymm8 # 7c30 <_sk_callback_avx+0x3a0>
+ .byte 196,98,125,24,5,59,70,0,0 // vbroadcastss 0x463b(%rip),%ymm8 # 7e40 <_sk_callback_avx+0x3d0>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,253,69,0,0 // vbroadcastss 0x45fd(%rip),%ymm8 # 7c34 <_sk_callback_avx+0x3a4>
+ .byte 196,98,125,24,5,45,70,0,0 // vbroadcastss 0x462d(%rip),%ymm8 # 7e44 <_sk_callback_avx+0x3d4>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,230,69,0,0 // vbroadcastss 0x45e6(%rip),%ymm9 # 7c38 <_sk_callback_avx+0x3a8>
+ .byte 196,98,125,24,13,22,70,0,0 // vbroadcastss 0x4616(%rip),%ymm9 # 7e48 <_sk_callback_avx+0x3d8>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,219,69,0,0 // vbroadcastss 0x45db(%rip),%ymm11 # 7c3c <_sk_callback_avx+0x3ac>
+ .byte 196,98,125,24,29,11,70,0,0 // vbroadcastss 0x460b(%rip),%ymm11 # 7e4c <_sk_callback_avx+0x3dc>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,209,69,0,0 // vbroadcastss 0x45d1(%rip),%ymm12 # 7c40 <_sk_callback_avx+0x3b0>
+ .byte 196,98,125,24,37,1,70,0,0 // vbroadcastss 0x4601(%rip),%ymm12 # 7e50 <_sk_callback_avx+0x3e0>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -23047,9 +23524,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,135,69,0,0 // vbroadcastss 0x4587(%rip),%ymm0 # 7c44 <_sk_callback_avx+0x3b4>
+ .byte 196,226,125,24,5,183,69,0,0 // vbroadcastss 0x45b7(%rip),%ymm0 # 7e54 <_sk_callback_avx+0x3e4>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,126,69,0,0 // vbroadcastss 0x457e(%rip),%ymm8 # 7c48 <_sk_callback_avx+0x3b8>
+ .byte 196,98,125,24,5,174,69,0,0 // vbroadcastss 0x45ae(%rip),%ymm8 # 7e58 <_sk_callback_avx+0x3e8>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -23066,15 +23543,15 @@ _sk_load_a8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne 372f <_sk_load_a8_avx+0x5c>
+ .byte 117,67 // jne 390f <_sk_load_a8_avx+0x5c>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,70,72,0,0 // vpand 0x4846(%rip),%xmm0,%xmm0 # 7f40 <_sk_callback_avx+0x6b0>
+ .byte 197,249,219,5,118,72,0,0 // vpand 0x4876(%rip),%xmm0,%xmm0 # 8150 <_sk_callback_avx+0x6e0>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,50,69,0,0 // vbroadcastss 0x4532(%rip),%ymm1 # 7c4c <_sk_callback_avx+0x3bc>
+ .byte 196,226,125,24,13,98,69,0,0 // vbroadcastss 0x4562(%rip),%ymm1 # 7e5c <_sk_callback_avx+0x3ec>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -23087,15 +23564,15 @@ _sk_load_a8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja 36f2 <_sk_load_a8_avx+0x1f>
+ .byte 119,175 // ja 38d2 <_sk_load_a8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 37c8 <_sk_load_a8_avx+0xf5>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 39a8 <_sk_load_a8_avx+0xf5>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,144 // jmp 36f2 <_sk_load_a8_avx+0x1f>
+ .byte 235,144 // jmp 38d2 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -23103,7 +23580,7 @@ _sk_load_a8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,104,255,255,255 // jmpq 36f2 <_sk_load_a8_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq 38d2 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -23114,7 +23591,7 @@ _sk_load_a8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,45,255,255,255 // jmpq 36f2 <_sk_load_a8_avx+0x1f>
+ .byte 233,45,255,255,255 // jmpq 38d2 <_sk_load_a8_avx+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -23148,15 +23625,15 @@ _sk_load_a8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne 3840 <_sk_load_a8_dst_avx+0x5c>
+ .byte 117,67 // jne 3a20 <_sk_load_a8_dst_avx+0x5c>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,69,71,0,0 // vpand 0x4745(%rip),%xmm4,%xmm4 # 7f50 <_sk_callback_avx+0x6c0>
+ .byte 197,217,219,37,117,71,0,0 // vpand 0x4775(%rip),%xmm4,%xmm4 # 8160 <_sk_callback_avx+0x6f0>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,37,68,0,0 // vbroadcastss 0x4425(%rip),%ymm5 # 7c50 <_sk_callback_avx+0x3c0>
+ .byte 196,226,125,24,45,85,68,0,0 // vbroadcastss 0x4455(%rip),%ymm5 # 7e60 <_sk_callback_avx+0x3f0>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -23169,15 +23646,15 @@ _sk_load_a8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja 3803 <_sk_load_a8_dst_avx+0x1f>
+ .byte 119,175 // ja 39e3 <_sk_load_a8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 38d8 <_sk_load_a8_dst_avx+0xf4>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 3ab8 <_sk_load_a8_dst_avx+0xf4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,144 // jmp 3803 <_sk_load_a8_dst_avx+0x1f>
+ .byte 235,144 // jmp 39e3 <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -23185,7 +23662,7 @@ _sk_load_a8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,104,255,255,255 // jmpq 3803 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq 39e3 <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -23196,7 +23673,7 @@ _sk_load_a8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,45,255,255,255 // jmpq 3803 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,45,255,255,255 // jmpq 39e3 <_sk_load_a8_dst_avx+0x1f>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -23205,7 +23682,7 @@ _sk_load_a8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde0038e8 <_sk_callback_avx+0xffffffffddffc058>
+ .byte 232,255,255,255,221 // callq ffffffffde003ac8 <_sk_callback_avx+0xffffffffddffc058>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -23260,7 +23737,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,148,66,0,0 // vbroadcastss 0x4294(%rip),%ymm1 # 7c54 <_sk_callback_avx+0x3c4>
+ .byte 196,226,125,24,13,196,66,0,0 // vbroadcastss 0x42c4(%rip),%ymm1 # 7e64 <_sk_callback_avx+0x3f4>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -23279,14 +23756,14 @@ _sk_store_a8_avx:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,103,66,0,0 // vbroadcastss 0x4267(%rip),%ymm8 # 7c58 <_sk_callback_avx+0x3c8>
+ .byte 196,98,125,24,5,151,66,0,0 // vbroadcastss 0x4297(%rip),%ymm8 # 7e68 <_sk_callback_avx+0x3f8>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3a1b <_sk_store_a8_avx+0x47>
+ .byte 117,11 // jne 3bfb <_sk_store_a8_avx+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -23295,25 +23772,25 @@ _sk_store_a8_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3a16 <_sk_store_a8_avx+0x42>
+ .byte 119,235 // ja 3bf6 <_sk_store_a8_avx+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 3a90 <_sk_store_a8_avx+0xbc>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 3c70 <_sk_store_a8_avx+0xbc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp 3a16 <_sk_store_a8_avx+0x42>
+ .byte 235,201 // jmp 3bf6 <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,2,69,0,0 // vpshufb 0x4502(%rip),%xmm8,%xmm8 # 7f60 <_sk_callback_avx+0x6d0>
+ .byte 196,98,57,0,5,50,69,0,0 // vpshufb 0x4532(%rip),%xmm8,%xmm8 # 8170 <_sk_callback_avx+0x700>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp 3a16 <_sk_store_a8_avx+0x42>
+ .byte 235,175 // jmp 3bf6 <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,232,68,0,0 // vpshufb 0x44e8(%rip),%xmm8,%xmm8 # 7f70 <_sk_callback_avx+0x6e0>
+ .byte 196,98,57,0,5,24,69,0,0 // vpshufb 0x4518(%rip),%xmm8,%xmm8 # 8180 <_sk_callback_avx+0x710>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp 3a16 <_sk_store_a8_avx+0x42>
+ .byte 235,134 // jmp 3bf6 <_sk_store_a8_avx+0x42>
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
.byte 255,197 // inc %ebp
@@ -23346,18 +23823,18 @@ _sk_load_g8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 3b0d <_sk_load_g8_avx+0x61>
+ .byte 117,72 // jne 3ced <_sk_load_g8_avx+0x61>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,173,68,0,0 // vpand 0x44ad(%rip),%xmm0,%xmm0 # 7f80 <_sk_callback_avx+0x6f0>
+ .byte 197,249,219,5,221,68,0,0 // vpand 0x44dd(%rip),%xmm0,%xmm0 # 8190 <_sk_callback_avx+0x720>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,105,65,0,0 // vbroadcastss 0x4169(%rip),%ymm1 # 7c5c <_sk_callback_avx+0x3cc>
+ .byte 196,226,125,24,13,153,65,0,0 // vbroadcastss 0x4199(%rip),%ymm1 # 7e6c <_sk_callback_avx+0x3fc>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,94,65,0,0 // vbroadcastss 0x415e(%rip),%ymm3 # 7c60 <_sk_callback_avx+0x3d0>
+ .byte 196,226,125,24,29,142,65,0,0 // vbroadcastss 0x418e(%rip),%ymm3 # 7e70 <_sk_callback_avx+0x400>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -23367,15 +23844,15 @@ _sk_load_g8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja 3acb <_sk_load_g8_avx+0x1f>
+ .byte 119,170 // ja 3cab <_sk_load_g8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # 3ba4 <_sk_load_g8_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # 3d84 <_sk_load_g8_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,139 // jmp 3acb <_sk_load_g8_avx+0x1f>
+ .byte 235,139 // jmp 3cab <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -23383,7 +23860,7 @@ _sk_load_g8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,99,255,255,255 // jmpq 3acb <_sk_load_g8_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq 3cab <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -23394,7 +23871,7 @@ _sk_load_g8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,40,255,255,255 // jmpq 3acb <_sk_load_g8_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq 3cab <_sk_load_g8_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -23403,7 +23880,7 @@ _sk_load_g8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf003bb4 <_sk_callback_avx+0xffffffffdeffc324>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf003d94 <_sk_callback_avx+0xffffffffdeffc324>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -23426,18 +23903,18 @@ _sk_load_g8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 3c21 <_sk_load_g8_dst_avx+0x61>
+ .byte 117,72 // jne 3e01 <_sk_load_g8_dst_avx+0x61>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,169,67,0,0 // vpand 0x43a9(%rip),%xmm4,%xmm4 # 7f90 <_sk_callback_avx+0x700>
+ .byte 197,217,219,37,217,67,0,0 // vpand 0x43d9(%rip),%xmm4,%xmm4 # 81a0 <_sk_callback_avx+0x730>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,93,64,0,0 // vbroadcastss 0x405d(%rip),%ymm5 # 7c64 <_sk_callback_avx+0x3d4>
+ .byte 196,226,125,24,45,141,64,0,0 // vbroadcastss 0x408d(%rip),%ymm5 # 7e74 <_sk_callback_avx+0x404>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,82,64,0,0 // vbroadcastss 0x4052(%rip),%ymm7 # 7c68 <_sk_callback_avx+0x3d8>
+ .byte 196,226,125,24,61,130,64,0,0 // vbroadcastss 0x4082(%rip),%ymm7 # 7e78 <_sk_callback_avx+0x408>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -23447,15 +23924,15 @@ _sk_load_g8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja 3bdf <_sk_load_g8_dst_avx+0x1f>
+ .byte 119,170 // ja 3dbf <_sk_load_g8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # 3cb8 <_sk_load_g8_dst_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # 3e98 <_sk_load_g8_dst_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,139 // jmp 3bdf <_sk_load_g8_dst_avx+0x1f>
+ .byte 235,139 // jmp 3dbf <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -23463,7 +23940,7 @@ _sk_load_g8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,99,255,255,255 // jmpq 3bdf <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq 3dbf <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -23474,7 +23951,7 @@ _sk_load_g8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,40,255,255,255 // jmpq 3bdf <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq 3dbf <_sk_load_g8_dst_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -23483,7 +23960,7 @@ _sk_load_g8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf003cc8 <_sk_callback_avx+0xffffffffdeffc438>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf003ea8 <_sk_callback_avx+0xffffffffdeffc438>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -23538,10 +24015,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,204,62,0,0 // vbroadcastss 0x3ecc(%rip),%ymm1 # 7c6c <_sk_callback_avx+0x3dc>
+ .byte 196,226,125,24,13,252,62,0,0 // vbroadcastss 0x3efc(%rip),%ymm1 # 7e7c <_sk_callback_avx+0x40c>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,193,62,0,0 // vbroadcastss 0x3ec1(%rip),%ymm3 # 7c70 <_sk_callback_avx+0x3e0>
+ .byte 196,226,125,24,29,241,62,0,0 // vbroadcastss 0x3ef1(%rip),%ymm3 # 7e80 <_sk_callback_avx+0x410>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -23559,29 +24036,29 @@ _sk_load_565_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne 3e5a <_sk_load_565_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne 403a <_sk_load_565_avx+0xa1>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,121,62,0,0 // vbroadcastss 0x3e79(%rip),%ymm0 # 7c74 <_sk_callback_avx+0x3e4>
+ .byte 196,226,125,24,5,169,62,0,0 // vbroadcastss 0x3ea9(%rip),%ymm0 # 7e84 <_sk_callback_avx+0x414>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,108,62,0,0 // vbroadcastss 0x3e6c(%rip),%ymm1 # 7c78 <_sk_callback_avx+0x3e8>
+ .byte 196,226,125,24,13,156,62,0,0 // vbroadcastss 0x3e9c(%rip),%ymm1 # 7e88 <_sk_callback_avx+0x418>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,99,62,0,0 // vbroadcastss 0x3e63(%rip),%ymm1 # 7c7c <_sk_callback_avx+0x3ec>
+ .byte 196,226,125,24,13,147,62,0,0 // vbroadcastss 0x3e93(%rip),%ymm1 # 7e8c <_sk_callback_avx+0x41c>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,86,62,0,0 // vbroadcastss 0x3e56(%rip),%ymm3 # 7c80 <_sk_callback_avx+0x3f0>
+ .byte 196,226,125,24,29,134,62,0,0 // vbroadcastss 0x3e86(%rip),%ymm3 # 7e90 <_sk_callback_avx+0x420>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,77,62,0,0 // vbroadcastss 0x3e4d(%rip),%ymm3 # 7c84 <_sk_callback_avx+0x3f4>
+ .byte 196,226,125,24,29,125,62,0,0 // vbroadcastss 0x3e7d(%rip),%ymm3 # 7e94 <_sk_callback_avx+0x424>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,64,62,0,0 // vbroadcastss 0x3e40(%rip),%ymm3 # 7c88 <_sk_callback_avx+0x3f8>
+ .byte 196,226,125,24,29,112,62,0,0 // vbroadcastss 0x3e70(%rip),%ymm3 # 7e98 <_sk_callback_avx+0x428>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,53,62,0,0 // vbroadcastss 0x3e35(%rip),%ymm3 # 7c8c <_sk_callback_avx+0x3fc>
+ .byte 196,226,125,24,29,101,62,0,0 // vbroadcastss 0x3e65(%rip),%ymm3 # 7e9c <_sk_callback_avx+0x42c>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -23589,27 +24066,27 @@ _sk_load_565_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja 3ddf <_sk_load_565_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja 3fbf <_sk_load_565_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 3ee0 <_sk_load_565_avx+0x127>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 40c0 <_sk_load_565_avx+0x127>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,75,255,255,255 // jmpq 3ddf <_sk_load_565_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq 3fbf <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,46,255,255,255 // jmpq 3ddf <_sk_load_565_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq 3fbf <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,1,255,255,255 // jmpq 3ddf <_sk_load_565_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq 3fbf <_sk_load_565_avx+0x26>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -23643,29 +24120,29 @@ _sk_load_565_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne 3f9d <_sk_load_565_dst_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne 417d <_sk_load_565_dst_avx+0xa1>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- .byte 196,226,125,24,37,82,61,0,0 // vbroadcastss 0x3d52(%rip),%ymm4 # 7c90 <_sk_callback_avx+0x400>
+ .byte 196,226,125,24,37,130,61,0,0 // vbroadcastss 0x3d82(%rip),%ymm4 # 7ea0 <_sk_callback_avx+0x430>
.byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,69,61,0,0 // vbroadcastss 0x3d45(%rip),%ymm5 # 7c94 <_sk_callback_avx+0x404>
+ .byte 196,226,125,24,45,117,61,0,0 // vbroadcastss 0x3d75(%rip),%ymm5 # 7ea4 <_sk_callback_avx+0x434>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,60,61,0,0 // vbroadcastss 0x3d3c(%rip),%ymm5 # 7c98 <_sk_callback_avx+0x408>
+ .byte 196,226,125,24,45,108,61,0,0 // vbroadcastss 0x3d6c(%rip),%ymm5 # 7ea8 <_sk_callback_avx+0x438>
.byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,47,61,0,0 // vbroadcastss 0x3d2f(%rip),%ymm7 # 7c9c <_sk_callback_avx+0x40c>
+ .byte 196,226,125,24,61,95,61,0,0 // vbroadcastss 0x3d5f(%rip),%ymm7 # 7eac <_sk_callback_avx+0x43c>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,24,61,38,61,0,0 // vbroadcastss 0x3d26(%rip),%ymm7 # 7ca0 <_sk_callback_avx+0x410>
+ .byte 196,226,125,24,61,86,61,0,0 // vbroadcastss 0x3d56(%rip),%ymm7 # 7eb0 <_sk_callback_avx+0x440>
.byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,25,61,0,0 // vbroadcastss 0x3d19(%rip),%ymm7 # 7ca4 <_sk_callback_avx+0x414>
+ .byte 196,226,125,24,61,73,61,0,0 // vbroadcastss 0x3d49(%rip),%ymm7 # 7eb4 <_sk_callback_avx+0x444>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,14,61,0,0 // vbroadcastss 0x3d0e(%rip),%ymm7 # 7ca8 <_sk_callback_avx+0x418>
+ .byte 196,226,125,24,61,62,61,0,0 // vbroadcastss 0x3d3e(%rip),%ymm7 # 7eb8 <_sk_callback_avx+0x448>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -23673,27 +24150,27 @@ _sk_load_565_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja 3f22 <_sk_load_565_dst_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja 4102 <_sk_load_565_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 4024 <_sk_load_565_dst_avx+0x128>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 4204 <_sk_load_565_dst_avx+0x128>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,75,255,255,255 // jmpq 3f22 <_sk_load_565_dst_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq 4102 <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,46,255,255,255 // jmpq 3f22 <_sk_load_565_dst_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq 4102 <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,1,255,255,255 // jmpq 3f22 <_sk_load_565_dst_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq 4102 <_sk_load_565_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -23765,23 +24242,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,154,59,0,0 // vbroadcastss 0x3b9a(%rip),%ymm0 # 7cac <_sk_callback_avx+0x41c>
+ .byte 196,226,125,24,5,202,59,0,0 // vbroadcastss 0x3bca(%rip),%ymm0 # 7ebc <_sk_callback_avx+0x44c>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,141,59,0,0 // vbroadcastss 0x3b8d(%rip),%ymm1 # 7cb0 <_sk_callback_avx+0x420>
+ .byte 196,226,125,24,13,189,59,0,0 // vbroadcastss 0x3bbd(%rip),%ymm1 # 7ec0 <_sk_callback_avx+0x450>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,132,59,0,0 // vbroadcastss 0x3b84(%rip),%ymm1 # 7cb4 <_sk_callback_avx+0x424>
+ .byte 196,226,125,24,13,180,59,0,0 // vbroadcastss 0x3bb4(%rip),%ymm1 # 7ec4 <_sk_callback_avx+0x454>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,119,59,0,0 // vbroadcastss 0x3b77(%rip),%ymm3 # 7cb8 <_sk_callback_avx+0x428>
+ .byte 196,226,125,24,29,167,59,0,0 // vbroadcastss 0x3ba7(%rip),%ymm3 # 7ec8 <_sk_callback_avx+0x458>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,110,59,0,0 // vbroadcastss 0x3b6e(%rip),%ymm3 # 7cbc <_sk_callback_avx+0x42c>
+ .byte 196,226,125,24,29,158,59,0,0 // vbroadcastss 0x3b9e(%rip),%ymm3 # 7ecc <_sk_callback_avx+0x45c>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,97,59,0,0 // vbroadcastss 0x3b61(%rip),%ymm3 # 7cc0 <_sk_callback_avx+0x430>
+ .byte 196,226,125,24,29,145,59,0,0 // vbroadcastss 0x3b91(%rip),%ymm3 # 7ed0 <_sk_callback_avx+0x460>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,86,59,0,0 // vbroadcastss 0x3b56(%rip),%ymm3 # 7cc4 <_sk_callback_avx+0x434>
+ .byte 196,226,125,24,29,134,59,0,0 // vbroadcastss 0x3b86(%rip),%ymm3 # 7ed4 <_sk_callback_avx+0x464>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_avx
@@ -23796,14 +24273,14 @@ _sk_store_565_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,56,59,0,0 // vbroadcastss 0x3b38(%rip),%ymm8 # 7cc8 <_sk_callback_avx+0x438>
+ .byte 196,98,125,24,5,104,59,0,0 // vbroadcastss 0x3b68(%rip),%ymm8 # 7ed8 <_sk_callback_avx+0x468>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,17,59,0,0 // vbroadcastss 0x3b11(%rip),%ymm10 # 7ccc <_sk_callback_avx+0x43c>
+ .byte 196,98,125,24,21,65,59,0,0 // vbroadcastss 0x3b41(%rip),%ymm10 # 7edc <_sk_callback_avx+0x46c>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -23817,7 +24294,7 @@ _sk_store_565_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 420c <_sk_store_565_avx+0x9c>
+ .byte 117,11 // jne 43ec <_sk_store_565_avx+0x9c>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -23826,22 +24303,22 @@ _sk_store_565_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 4207 <_sk_store_565_avx+0x97>
+ .byte 119,235 // ja 43e7 <_sk_store_565_avx+0x97>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # 426c <_sk_store_565_avx+0xfc>
+ .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # 444c <_sk_store_565_avx+0xfc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 4207 <_sk_store_565_avx+0x97>
+ .byte 235,206 // jmp 43e7 <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 4207 <_sk_store_565_avx+0x97>
+ .byte 235,190 // jmp 43e7 <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 4207 <_sk_store_565_avx+0x97>
+ .byte 235,158 // jmp 43e7 <_sk_store_565_avx+0x97>
.byte 15,31,0 // nopl (%rax)
.byte 196 // (bad)
.byte 255 // (bad)
@@ -23880,31 +24357,31 @@ _sk_load_4444_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne 4341 <_sk_load_4444_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne 4521 <_sk_load_4444_avx+0xb9>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,6,58,0,0 // vbroadcastss 0x3a06(%rip),%ymm0 # 7cd0 <_sk_callback_avx+0x440>
+ .byte 196,226,125,24,5,54,58,0,0 // vbroadcastss 0x3a36(%rip),%ymm0 # 7ee0 <_sk_callback_avx+0x470>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,249,57,0,0 // vbroadcastss 0x39f9(%rip),%ymm1 # 7cd4 <_sk_callback_avx+0x444>
+ .byte 196,226,125,24,13,41,58,0,0 // vbroadcastss 0x3a29(%rip),%ymm1 # 7ee4 <_sk_callback_avx+0x474>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,240,57,0,0 // vbroadcastss 0x39f0(%rip),%ymm1 # 7cd8 <_sk_callback_avx+0x448>
+ .byte 196,226,125,24,13,32,58,0,0 // vbroadcastss 0x3a20(%rip),%ymm1 # 7ee8 <_sk_callback_avx+0x478>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,227,57,0,0 // vbroadcastss 0x39e3(%rip),%ymm2 # 7cdc <_sk_callback_avx+0x44c>
+ .byte 196,226,125,24,21,19,58,0,0 // vbroadcastss 0x3a13(%rip),%ymm2 # 7eec <_sk_callback_avx+0x47c>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,218,57,0,0 // vbroadcastss 0x39da(%rip),%ymm2 # 7ce0 <_sk_callback_avx+0x450>
+ .byte 196,226,125,24,21,10,58,0,0 // vbroadcastss 0x3a0a(%rip),%ymm2 # 7ef0 <_sk_callback_avx+0x480>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,205,57,0,0 // vbroadcastss 0x39cd(%rip),%ymm8 # 7ce4 <_sk_callback_avx+0x454>
+ .byte 196,98,125,24,5,253,57,0,0 // vbroadcastss 0x39fd(%rip),%ymm8 # 7ef4 <_sk_callback_avx+0x484>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,195,57,0,0 // vbroadcastss 0x39c3(%rip),%ymm8 # 7ce8 <_sk_callback_avx+0x458>
+ .byte 196,98,125,24,5,243,57,0,0 // vbroadcastss 0x39f3(%rip),%ymm8 # 7ef8 <_sk_callback_avx+0x488>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,181,57,0,0 // vbroadcastss 0x39b5(%rip),%ymm8 # 7cec <_sk_callback_avx+0x45c>
+ .byte 196,98,125,24,5,229,57,0,0 // vbroadcastss 0x39e5(%rip),%ymm8 # 7efc <_sk_callback_avx+0x48c>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -23914,27 +24391,27 @@ _sk_load_4444_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja 42ae <_sk_load_4444_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja 448e <_sk_load_4444_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 43c8 <_sk_load_4444_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 45a8 <_sk_load_4444_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,51,255,255,255 // jmpq 42ae <_sk_load_4444_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq 448e <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,22,255,255,255 // jmpq 42ae <_sk_load_4444_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq 448e <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,233,254,255,255 // jmpq 42ae <_sk_load_4444_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq 448e <_sk_load_4444_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -23971,31 +24448,31 @@ _sk_load_4444_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne 449d <_sk_load_4444_dst_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne 467d <_sk_load_4444_dst_avx+0xb9>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- .byte 196,226,125,24,37,202,56,0,0 // vbroadcastss 0x38ca(%rip),%ymm4 # 7cf0 <_sk_callback_avx+0x460>
+ .byte 196,226,125,24,37,250,56,0,0 // vbroadcastss 0x38fa(%rip),%ymm4 # 7f00 <_sk_callback_avx+0x490>
.byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,189,56,0,0 // vbroadcastss 0x38bd(%rip),%ymm5 # 7cf4 <_sk_callback_avx+0x464>
+ .byte 196,226,125,24,45,237,56,0,0 // vbroadcastss 0x38ed(%rip),%ymm5 # 7f04 <_sk_callback_avx+0x494>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,180,56,0,0 // vbroadcastss 0x38b4(%rip),%ymm5 # 7cf8 <_sk_callback_avx+0x468>
+ .byte 196,226,125,24,45,228,56,0,0 // vbroadcastss 0x38e4(%rip),%ymm5 # 7f08 <_sk_callback_avx+0x498>
.byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,167,56,0,0 // vbroadcastss 0x38a7(%rip),%ymm6 # 7cfc <_sk_callback_avx+0x46c>
+ .byte 196,226,125,24,53,215,56,0,0 // vbroadcastss 0x38d7(%rip),%ymm6 # 7f0c <_sk_callback_avx+0x49c>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,24,53,158,56,0,0 // vbroadcastss 0x389e(%rip),%ymm6 # 7d00 <_sk_callback_avx+0x470>
+ .byte 196,226,125,24,53,206,56,0,0 // vbroadcastss 0x38ce(%rip),%ymm6 # 7f10 <_sk_callback_avx+0x4a0>
.byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,145,56,0,0 // vbroadcastss 0x3891(%rip),%ymm8 # 7d04 <_sk_callback_avx+0x474>
+ .byte 196,98,125,24,5,193,56,0,0 // vbroadcastss 0x38c1(%rip),%ymm8 # 7f14 <_sk_callback_avx+0x4a4>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,24,5,135,56,0,0 // vbroadcastss 0x3887(%rip),%ymm8 # 7d08 <_sk_callback_avx+0x478>
+ .byte 196,98,125,24,5,183,56,0,0 // vbroadcastss 0x38b7(%rip),%ymm8 # 7f18 <_sk_callback_avx+0x4a8>
.byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,121,56,0,0 // vbroadcastss 0x3879(%rip),%ymm8 # 7d0c <_sk_callback_avx+0x47c>
+ .byte 196,98,125,24,5,169,56,0,0 // vbroadcastss 0x38a9(%rip),%ymm8 # 7f1c <_sk_callback_avx+0x4ac>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -24005,27 +24482,27 @@ _sk_load_4444_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja 440a <_sk_load_4444_dst_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja 45ea <_sk_load_4444_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 4524 <_sk_load_4444_dst_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # 4704 <_sk_load_4444_dst_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,51,255,255,255 // jmpq 440a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq 45ea <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,22,255,255,255 // jmpq 440a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq 45ea <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,233,254,255,255 // jmpq 440a <_sk_load_4444_dst_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq 45ea <_sk_load_4444_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -24097,25 +24574,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,254,54,0,0 // vbroadcastss 0x36fe(%rip),%ymm0 # 7d10 <_sk_callback_avx+0x480>
+ .byte 196,226,125,24,5,46,55,0,0 // vbroadcastss 0x372e(%rip),%ymm0 # 7f20 <_sk_callback_avx+0x4b0>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,241,54,0,0 // vbroadcastss 0x36f1(%rip),%ymm1 # 7d14 <_sk_callback_avx+0x484>
+ .byte 196,226,125,24,13,33,55,0,0 // vbroadcastss 0x3721(%rip),%ymm1 # 7f24 <_sk_callback_avx+0x4b4>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,232,54,0,0 // vbroadcastss 0x36e8(%rip),%ymm1 # 7d18 <_sk_callback_avx+0x488>
+ .byte 196,226,125,24,13,24,55,0,0 // vbroadcastss 0x3718(%rip),%ymm1 # 7f28 <_sk_callback_avx+0x4b8>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,219,54,0,0 // vbroadcastss 0x36db(%rip),%ymm2 # 7d1c <_sk_callback_avx+0x48c>
+ .byte 196,226,125,24,21,11,55,0,0 // vbroadcastss 0x370b(%rip),%ymm2 # 7f2c <_sk_callback_avx+0x4bc>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,210,54,0,0 // vbroadcastss 0x36d2(%rip),%ymm2 # 7d20 <_sk_callback_avx+0x490>
+ .byte 196,226,125,24,21,2,55,0,0 // vbroadcastss 0x3702(%rip),%ymm2 # 7f30 <_sk_callback_avx+0x4c0>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,197,54,0,0 // vbroadcastss 0x36c5(%rip),%ymm8 # 7d24 <_sk_callback_avx+0x494>
+ .byte 196,98,125,24,5,245,54,0,0 // vbroadcastss 0x36f5(%rip),%ymm8 # 7f34 <_sk_callback_avx+0x4c4>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,187,54,0,0 // vbroadcastss 0x36bb(%rip),%ymm8 # 7d28 <_sk_callback_avx+0x498>
+ .byte 196,98,125,24,5,235,54,0,0 // vbroadcastss 0x36eb(%rip),%ymm8 # 7f38 <_sk_callback_avx+0x4c8>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,173,54,0,0 // vbroadcastss 0x36ad(%rip),%ymm8 # 7d2c <_sk_callback_avx+0x49c>
+ .byte 196,98,125,24,5,221,54,0,0 // vbroadcastss 0x36dd(%rip),%ymm8 # 7f3c <_sk_callback_avx+0x4cc>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -24132,7 +24609,7 @@ _sk_store_4444_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,136,54,0,0 // vbroadcastss 0x3688(%rip),%ymm8 # 7d30 <_sk_callback_avx+0x4a0>
+ .byte 196,98,125,24,5,184,54,0,0 // vbroadcastss 0x36b8(%rip),%ymm8 # 7f40 <_sk_callback_avx+0x4d0>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -24159,7 +24636,7 @@ _sk_store_4444_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 4742 <_sk_store_4444_avx+0xba>
+ .byte 117,11 // jne 4922 <_sk_store_4444_avx+0xba>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -24168,22 +24645,22 @@ _sk_store_4444_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 473d <_sk_store_4444_avx+0xb5>
+ .byte 119,235 // ja 491d <_sk_store_4444_avx+0xb5>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # 47a0 <_sk_store_4444_avx+0x118>
+ .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # 4980 <_sk_store_4444_avx+0x118>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 473d <_sk_store_4444_avx+0xb5>
+ .byte 235,206 // jmp 491d <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 473d <_sk_store_4444_avx+0xb5>
+ .byte 235,190 // jmp 491d <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 473d <_sk_store_4444_avx+0xb5>
+ .byte 235,158 // jmp 491d <_sk_store_4444_avx+0xb5>
.byte 144 // nop
.byte 198 // (bad)
.byte 255 // (bad)
@@ -24223,12 +24700,12 @@ _sk_load_8888_avx:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne 486b <_sk_load_8888_avx+0xaf>
+ .byte 15,133,136,0,0,0 // jne 4a4b <_sk_load_8888_avx+0xaf>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,124,40,21,177,56,0,0 // vmovaps 0x38b1(%rip),%ymm10 # 80a0 <_sk_callback_avx+0x810>
+ .byte 197,124,40,21,241,56,0,0 // vmovaps 0x38f1(%rip),%ymm10 # 82c0 <_sk_callback_avx+0x850>
.byte 196,193,100,84,194 // vandps %ymm10,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,51,53,0,0 // vbroadcastss 0x3533(%rip),%ymm8 # 7d34 <_sk_callback_avx+0x4a4>
+ .byte 196,98,125,24,5,99,53,0,0 // vbroadcastss 0x3563(%rip),%ymm8 # 7f44 <_sk_callback_avx+0x4d4>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
.byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9
@@ -24258,13 +24735,13 @@ _sk_load_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,13,55,0,0 // vpshufb 0x370d(%rip),%xmm0,%xmm1 # 7fa0 <_sk_callback_avx+0x710>
+ .byte 196,226,121,0,13,61,55,0,0 // vpshufb 0x373d(%rip),%xmm0,%xmm1 # 81b0 <_sk_callback_avx+0x740>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,15,55,0,0 // vpshufb 0x370f(%rip),%xmm0,%xmm0 # 7fb0 <_sk_callback_avx+0x720>
+ .byte 196,226,121,0,5,63,55,0,0 // vpshufb 0x373f(%rip),%xmm0,%xmm0 # 81c0 <_sk_callback_avx+0x750>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
- .byte 233,49,255,255,255 // jmpq 47e7 <_sk_load_8888_avx+0x2b>
+ .byte 233,49,255,255,255 // jmpq 49c7 <_sk_load_8888_avx+0x2b>
HIDDEN _sk_load_8888_dst_avx
.globl _sk_load_8888_dst_avx
@@ -24280,12 +24757,12 @@ _sk_load_8888_dst_avx:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne 4965 <_sk_load_8888_dst_avx+0xaf>
+ .byte 15,133,136,0,0,0 // jne 4b45 <_sk_load_8888_dst_avx+0xaf>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,124,40,21,215,55,0,0 // vmovaps 0x37d7(%rip),%ymm10 # 80c0 <_sk_callback_avx+0x830>
+ .byte 197,124,40,21,23,56,0,0 // vmovaps 0x3817(%rip),%ymm10 # 82e0 <_sk_callback_avx+0x870>
.byte 196,193,68,84,226 // vandps %ymm10,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,61,52,0,0 // vbroadcastss 0x343d(%rip),%ymm8 # 7d38 <_sk_callback_avx+0x4a8>
+ .byte 196,98,125,24,5,109,52,0,0 // vbroadcastss 0x346d(%rip),%ymm8 # 7f48 <_sk_callback_avx+0x4d8>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
.byte 196,195,125,25,249,1 // vextractf128 $0x1,%ymm7,%xmm9
@@ -24315,13 +24792,13 @@ _sk_load_8888_dst_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,51,54,0,0 // vpshufb 0x3633(%rip),%xmm4,%xmm5 # 7fc0 <_sk_callback_avx+0x730>
+ .byte 196,226,89,0,45,99,54,0,0 // vpshufb 0x3663(%rip),%xmm4,%xmm5 # 81d0 <_sk_callback_avx+0x760>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,53,54,0,0 // vpshufb 0x3635(%rip),%xmm4,%xmm4 # 7fd0 <_sk_callback_avx+0x740>
+ .byte 196,226,89,0,37,101,54,0,0 // vpshufb 0x3665(%rip),%xmm4,%xmm4 # 81e0 <_sk_callback_avx+0x770>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
- .byte 233,49,255,255,255 // jmpq 48e1 <_sk_load_8888_dst_avx+0x2b>
+ .byte 233,49,255,255,255 // jmpq 4ac1 <_sk_load_8888_dst_avx+0x2b>
HIDDEN _sk_gather_8888_avx
.globl _sk_gather_8888_avx
@@ -24360,10 +24837,10 @@ _sk_gather_8888_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,133,54,0,0 // vmovaps 0x3685(%rip),%ymm10 # 80e0 <_sk_callback_avx+0x850>
+ .byte 197,124,40,21,197,54,0,0 // vmovaps 0x36c5(%rip),%ymm10 # 8300 <_sk_callback_avx+0x890>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,207,50,0,0 // vbroadcastss 0x32cf(%rip),%ymm9 # 7d3c <_sk_callback_avx+0x4ac>
+ .byte 196,98,125,24,13,255,50,0,0 // vbroadcastss 0x32ff(%rip),%ymm9 # 7f4c <_sk_callback_avx+0x4dc>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -24398,7 +24875,7 @@ _sk_store_8888_avx:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,75,50,0,0 // vbroadcastss 0x324b(%rip),%ymm8 # 7d40 <_sk_callback_avx+0x4b0>
+ .byte 196,98,125,24,5,123,50,0,0 // vbroadcastss 0x327b(%rip),%ymm8 # 7f50 <_sk_callback_avx+0x4e0>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -24423,7 +24900,7 @@ _sk_store_8888_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 4b84 <_sk_store_8888_avx+0xb6>
+ .byte 117,11 // jne 4d64 <_sk_store_8888_avx+0xb6>
.byte 197,124,17,0 // vmovups %ymm8,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -24435,13 +24912,13 @@ _sk_store_8888_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,52,52,0,0 // vpshufb 0x3434(%rip),%xmm9,%xmm10 # 7fe0 <_sk_callback_avx+0x750>
+ .byte 196,98,49,0,21,100,52,0,0 // vpshufb 0x3464(%rip),%xmm9,%xmm10 # 81f0 <_sk_callback_avx+0x780>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,54,52,0,0 // vpshufb 0x3436(%rip),%xmm9,%xmm9 # 7ff0 <_sk_callback_avx+0x760>
+ .byte 196,98,49,0,13,102,52,0,0 // vpshufb 0x3466(%rip),%xmm9,%xmm9 # 8200 <_sk_callback_avx+0x790>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
- .byte 235,177 // jmp 4b7d <_sk_store_8888_avx+0xaf>
+ .byte 235,177 // jmp 4d5d <_sk_store_8888_avx+0xaf>
HIDDEN _sk_load_bgra_avx
.globl _sk_load_bgra_avx
@@ -24457,12 +24934,12 @@ _sk_load_bgra_avx:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne 4c7b <_sk_load_bgra_avx+0xaf>
+ .byte 15,133,136,0,0,0 // jne 4e5b <_sk_load_bgra_avx+0xaf>
.byte 197,252,16,24 // vmovups (%rax),%ymm3
- .byte 197,124,40,21,1,53,0,0 // vmovaps 0x3501(%rip),%ymm10 # 8100 <_sk_callback_avx+0x870>
+ .byte 197,124,40,21,65,53,0,0 // vmovaps 0x3541(%rip),%ymm10 # 8320 <_sk_callback_avx+0x8b0>
.byte 196,193,100,84,202 // vandps %ymm10,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,98,125,24,5,51,49,0,0 // vbroadcastss 0x3133(%rip),%ymm8 # 7d44 <_sk_callback_avx+0x4b4>
+ .byte 196,98,125,24,5,99,49,0,0 // vbroadcastss 0x3163(%rip),%ymm8 # 7f54 <_sk_callback_avx+0x4e4>
.byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
.byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9
@@ -24492,13 +24969,13 @@ _sk_load_bgra_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,194 // vmovq %r10,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,93,51,0,0 // vpshufb 0x335d(%rip),%xmm0,%xmm1 # 8000 <_sk_callback_avx+0x770>
+ .byte 196,226,121,0,13,141,51,0,0 // vpshufb 0x338d(%rip),%xmm0,%xmm1 # 8210 <_sk_callback_avx+0x7a0>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,95,51,0,0 // vpshufb 0x335f(%rip),%xmm0,%xmm0 # 8010 <_sk_callback_avx+0x780>
+ .byte 196,226,121,0,5,143,51,0,0 // vpshufb 0x338f(%rip),%xmm0,%xmm0 # 8220 <_sk_callback_avx+0x7b0>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,226,125,44,24 // vmaskmovps (%rax),%ymm0,%ymm3
- .byte 233,49,255,255,255 // jmpq 4bf7 <_sk_load_bgra_avx+0x2b>
+ .byte 233,49,255,255,255 // jmpq 4dd7 <_sk_load_bgra_avx+0x2b>
HIDDEN _sk_load_bgra_dst_avx
.globl _sk_load_bgra_dst_avx
@@ -24514,12 +24991,12 @@ _sk_load_bgra_dst_avx:
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne 4d75 <_sk_load_bgra_dst_avx+0xaf>
+ .byte 15,133,136,0,0,0 // jne 4f55 <_sk_load_bgra_dst_avx+0xaf>
.byte 197,252,16,56 // vmovups (%rax),%ymm7
- .byte 197,124,40,21,39,52,0,0 // vmovaps 0x3427(%rip),%ymm10 # 8120 <_sk_callback_avx+0x890>
+ .byte 197,124,40,21,103,52,0,0 // vmovaps 0x3467(%rip),%ymm10 # 8340 <_sk_callback_avx+0x8d0>
.byte 196,193,68,84,234 // vandps %ymm10,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,98,125,24,5,61,48,0,0 // vbroadcastss 0x303d(%rip),%ymm8 # 7d48 <_sk_callback_avx+0x4b8>
+ .byte 196,98,125,24,5,109,48,0,0 // vbroadcastss 0x306d(%rip),%ymm8 # 7f58 <_sk_callback_avx+0x4e8>
.byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
.byte 196,195,125,25,249,1 // vextractf128 $0x1,%ymm7,%xmm9
@@ -24549,13 +25026,13 @@ _sk_load_bgra_dst_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,193,249,110,226 // vmovq %r10,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,131,50,0,0 // vpshufb 0x3283(%rip),%xmm4,%xmm5 # 8020 <_sk_callback_avx+0x790>
+ .byte 196,226,89,0,45,179,50,0,0 // vpshufb 0x32b3(%rip),%xmm4,%xmm5 # 8230 <_sk_callback_avx+0x7c0>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,133,50,0,0 // vpshufb 0x3285(%rip),%xmm4,%xmm4 # 8030 <_sk_callback_avx+0x7a0>
+ .byte 196,226,89,0,37,181,50,0,0 // vpshufb 0x32b5(%rip),%xmm4,%xmm4 # 8240 <_sk_callback_avx+0x7d0>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,226,93,44,56 // vmaskmovps (%rax),%ymm4,%ymm7
- .byte 233,49,255,255,255 // jmpq 4cf1 <_sk_load_bgra_dst_avx+0x2b>
+ .byte 233,49,255,255,255 // jmpq 4ed1 <_sk_load_bgra_dst_avx+0x2b>
HIDDEN _sk_gather_bgra_avx
.globl _sk_gather_bgra_avx
@@ -24594,10 +25071,10 @@ _sk_gather_bgra_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,13,213,50,0,0 // vmovaps 0x32d5(%rip),%ymm9 # 8140 <_sk_callback_avx+0x8b0>
+ .byte 197,124,40,13,21,51,0,0 // vmovaps 0x3315(%rip),%ymm9 # 8360 <_sk_callback_avx+0x8f0>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,207,46,0,0 // vbroadcastss 0x2ecf(%rip),%ymm10 # 7d4c <_sk_callback_avx+0x4bc>
+ .byte 196,98,125,24,21,255,46,0,0 // vbroadcastss 0x2eff(%rip),%ymm10 # 7f5c <_sk_callback_avx+0x4ec>
.byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2
.byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
@@ -24632,7 +25109,7 @@ _sk_store_bgra_avx:
.byte 72,3,8 // add (%rax),%rcx
.byte 72,99,194 // movslq %edx,%rax
.byte 72,141,4,129 // lea (%rcx,%rax,4),%rax
- .byte 196,98,125,24,5,75,46,0,0 // vbroadcastss 0x2e4b(%rip),%ymm8 # 7d50 <_sk_callback_avx+0x4c0>
+ .byte 196,98,125,24,5,123,46,0,0 // vbroadcastss 0x2e7b(%rip),%ymm8 # 7f60 <_sk_callback_avx+0x4f0>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -24657,7 +25134,7 @@ _sk_store_bgra_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 4f94 <_sk_store_bgra_avx+0xb6>
+ .byte 117,11 // jne 5174 <_sk_store_bgra_avx+0xb6>
.byte 197,124,17,0 // vmovups %ymm8,(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -24669,13 +25146,13 @@ _sk_store_bgra_avx:
.byte 73,211,234 // shr %cl,%r10
.byte 196,65,249,110,202 // vmovq %r10,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,132,48,0,0 // vpshufb 0x3084(%rip),%xmm9,%xmm10 # 8040 <_sk_callback_avx+0x7b0>
+ .byte 196,98,49,0,21,180,48,0,0 // vpshufb 0x30b4(%rip),%xmm9,%xmm10 # 8250 <_sk_callback_avx+0x7e0>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,134,48,0,0 // vpshufb 0x3086(%rip),%xmm9,%xmm9 # 8050 <_sk_callback_avx+0x7c0>
+ .byte 196,98,49,0,13,182,48,0,0 // vpshufb 0x30b6(%rip),%xmm9,%xmm9 # 8260 <_sk_callback_avx+0x7f0>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,98,53,46,0 // vmaskmovps %ymm8,%ymm9,(%rax)
- .byte 235,177 // jmp 4f8d <_sk_store_bgra_avx+0xaf>
+ .byte 235,177 // jmp 516d <_sk_store_bgra_avx+0xaf>
HIDDEN _sk_load_f16_avx
.globl _sk_load_f16_avx
@@ -24694,7 +25171,7 @@ _sk_load_f16_avx:
.byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp)
.byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp)
.byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne 52a9 <_sk_load_f16_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne 5489 <_sk_load_f16_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,76,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm1
@@ -24712,13 +25189,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,223,44,0,0 // vbroadcastss 0x2cdf(%rip),%ymm12 # 7d54 <_sk_callback_avx+0x4c4>
+ .byte 196,98,125,24,37,15,45,0,0 // vbroadcastss 0x2d0f(%rip),%ymm12 # 7f64 <_sk_callback_avx+0x4f4>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,203,44,0,0 // vbroadcastss 0x2ccb(%rip),%xmm11 # 7d58 <_sk_callback_avx+0x4c8>
+ .byte 196,98,121,24,29,251,44,0,0 // vbroadcastss 0x2cfb(%rip),%xmm11 # 7f68 <_sk_callback_avx+0x4f8>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,193,44,0,0 // vbroadcastss 0x2cc1(%rip),%xmm13 # 7d5c <_sk_callback_avx+0x4cc>
+ .byte 196,98,121,24,45,241,44,0,0 // vbroadcastss 0x2cf1(%rip),%xmm13 # 7f6c <_sk_callback_avx+0x4fc>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -24732,7 +25209,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,119,44,0,0 // vbroadcastss 0x2c77(%rip),%xmm3 # 7d60 <_sk_callback_avx+0x4d0>
+ .byte 196,226,121,24,29,167,44,0,0 // vbroadcastss 0x2ca7(%rip),%xmm3 # 7f70 <_sk_callback_avx+0x500>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -24825,29 +25302,29 @@ _sk_load_f16_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 530f <_sk_load_f16_avx+0x333>
+ .byte 116,85 // je 54ef <_sk_load_f16_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 530f <_sk_load_f16_avx+0x333>
+ .byte 114,72 // jb 54ef <_sk_load_f16_avx+0x333>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 531c <_sk_load_f16_avx+0x340>
+ .byte 116,72 // je 54fc <_sk_load_f16_avx+0x340>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 531c <_sk_load_f16_avx+0x340>
+ .byte 114,59 // jb 54fc <_sk_load_f16_avx+0x340>
.byte 196,193,123,16,76,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je 5033 <_sk_load_f16_avx+0x57>
+ .byte 15,132,65,253,255,255 // je 5213 <_sk_load_f16_avx+0x57>
.byte 196,193,113,22,76,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb 5033 <_sk_load_f16_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb 5213 <_sk_load_f16_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq 5033 <_sk_load_f16_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq 5213 <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,23,253,255,255 // jmpq 5033 <_sk_load_f16_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq 5213 <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
- .byte 233,14,253,255,255 // jmpq 5033 <_sk_load_f16_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq 5213 <_sk_load_f16_avx+0x57>
HIDDEN _sk_load_f16_dst_avx
.globl _sk_load_f16_dst_avx
@@ -24866,7 +25343,7 @@ _sk_load_f16_dst_avx:
.byte 197,252,17,84,36,192 // vmovups %ymm2,-0x40(%rsp)
.byte 197,252,17,76,36,160 // vmovups %ymm1,-0x60(%rsp)
.byte 197,254,127,68,36,128 // vmovdqu %ymm0,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne 55f2 <_sk_load_f16_dst_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne 57d2 <_sk_load_f16_dst_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,108,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm5
@@ -24884,13 +25361,13 @@ _sk_load_f16_dst_avx:
.byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- .byte 196,98,125,24,37,166,41,0,0 // vbroadcastss 0x29a6(%rip),%ymm12 # 7d64 <_sk_callback_avx+0x4d4>
+ .byte 196,98,125,24,37,214,41,0,0 // vbroadcastss 0x29d6(%rip),%ymm12 # 7f74 <_sk_callback_avx+0x504>
.byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5
.byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4
.byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14
- .byte 196,98,121,24,29,146,41,0,0 // vbroadcastss 0x2992(%rip),%xmm11 # 7d68 <_sk_callback_avx+0x4d8>
+ .byte 196,98,121,24,29,194,41,0,0 // vbroadcastss 0x29c2(%rip),%xmm11 # 7f78 <_sk_callback_avx+0x508>
.byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7
- .byte 196,98,121,24,45,136,41,0,0 // vbroadcastss 0x2988(%rip),%xmm13 # 7d6c <_sk_callback_avx+0x4dc>
+ .byte 196,98,121,24,45,184,41,0,0 // vbroadcastss 0x29b8(%rip),%xmm13 # 7f7c <_sk_callback_avx+0x50c>
.byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7
.byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -24904,7 +25381,7 @@ _sk_load_f16_dst_avx:
.byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
.byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4
.byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5
- .byte 196,226,121,24,61,62,41,0,0 // vbroadcastss 0x293e(%rip),%xmm7 # 7d70 <_sk_callback_avx+0x4e0>
+ .byte 196,226,121,24,61,110,41,0,0 // vbroadcastss 0x296e(%rip),%xmm7 # 7f80 <_sk_callback_avx+0x510>
.byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5
.byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -24997,29 +25474,29 @@ _sk_load_f16_dst_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 5658 <_sk_load_f16_dst_avx+0x333>
+ .byte 116,85 // je 5838 <_sk_load_f16_dst_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 5658 <_sk_load_f16_dst_avx+0x333>
+ .byte 114,72 // jb 5838 <_sk_load_f16_dst_avx+0x333>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 5665 <_sk_load_f16_dst_avx+0x340>
+ .byte 116,72 // je 5845 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 5665 <_sk_load_f16_dst_avx+0x340>
+ .byte 114,59 // jb 5845 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,123,16,108,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm5
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 15,132,65,253,255,255 // je 555c <_sk_load_f16_dst_avx+0x57>
.byte 196,193,81,22,108,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb 555c <_sk_load_f16_dst_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq 555c <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,23,253,255,255 // jmpq 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq 555c <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
- .byte 233,14,253,255,255 // jmpq 537c <_sk_load_f16_dst_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq 555c <_sk_load_f16_dst_avx+0x57>
HIDDEN _sk_gather_f16_avx
.globl _sk_gather_f16_avx
@@ -25080,13 +25557,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,252,37,0,0 // vbroadcastss 0x25fc(%rip),%ymm12 # 7d74 <_sk_callback_avx+0x4e4>
+ .byte 196,98,125,24,37,44,38,0,0 // vbroadcastss 0x262c(%rip),%ymm12 # 7f84 <_sk_callback_avx+0x514>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,232,37,0,0 // vbroadcastss 0x25e8(%rip),%xmm11 # 7d78 <_sk_callback_avx+0x4e8>
+ .byte 196,98,121,24,29,24,38,0,0 // vbroadcastss 0x2618(%rip),%xmm11 # 7f88 <_sk_callback_avx+0x518>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,222,37,0,0 // vbroadcastss 0x25de(%rip),%xmm13 # 7d7c <_sk_callback_avx+0x4ec>
+ .byte 196,98,121,24,45,14,38,0,0 // vbroadcastss 0x260e(%rip),%xmm13 # 7f8c <_sk_callback_avx+0x51c>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -25100,7 +25577,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,148,37,0,0 // vbroadcastss 0x2594(%rip),%xmm3 # 7d80 <_sk_callback_avx+0x4f0>
+ .byte 196,226,121,24,29,196,37,0,0 // vbroadcastss 0x25c4(%rip),%xmm3 # 7f90 <_sk_callback_avx+0x520>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -25200,12 +25677,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,180,35,0,0 // vbroadcastss 0x23b4(%rip),%ymm9 # 7d84 <_sk_callback_avx+0x4f4>
+ .byte 196,98,125,24,13,228,35,0,0 // vbroadcastss 0x23e4(%rip),%ymm9 # 7f94 <_sk_callback_avx+0x524>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,153,35,0,0 // vbroadcastss 0x2399(%rip),%xmm8 # 7d88 <_sk_callback_avx+0x4f8>
+ .byte 196,98,121,24,5,201,35,0,0 // vbroadcastss 0x23c9(%rip),%xmm8 # 7f98 <_sk_callback_avx+0x528>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -25215,7 +25692,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,96,35,0,0 // vbroadcastss 0x2360(%rip),%ymm10 # 7d8c <_sk_callback_avx+0x4fc>
+ .byte 196,98,125,24,21,144,35,0,0 // vbroadcastss 0x2390(%rip),%ymm10 # 7f9c <_sk_callback_avx+0x52c>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -25302,7 +25779,7 @@ _sk_store_f16_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,70 // jne 5c20 <_sk_store_f16_avx+0x274>
+ .byte 117,70 // jne 5e00 <_sk_store_f16_avx+0x274>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -25318,22 +25795,22 @@ _sk_store_f16_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,201 // je 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 116,201 // je 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,188 // jb 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 114,188 // jb 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,179 // je 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 116,179 // je 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,166 // jb 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 114,166 // jb 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,157 // je 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 116,157 // je 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,144 // jb 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 114,144 // jb 5dd5 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,135 // jmp 5bf5 <_sk_store_f16_avx+0x249>
+ .byte 235,135 // jmp 5dd5 <_sk_store_f16_avx+0x249>
HIDDEN _sk_load_u16_be_avx
.globl _sk_load_u16_be_avx
@@ -25348,7 +25825,7 @@ _sk_load_u16_be_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,253,0,0,0 // jne 5d92 <_sk_load_u16_be_avx+0x124>
+ .byte 15,133,253,0,0,0 // jne 5f72 <_sk_load_u16_be_avx+0x124>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -25370,7 +25847,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,138,32,0,0 // vbroadcastss 0x208a(%rip),%ymm11 # 7d90 <_sk_callback_avx+0x500>
+ .byte 196,98,125,24,29,186,32,0,0 // vbroadcastss 0x20ba(%rip),%ymm11 # 7fa0 <_sk_callback_avx+0x530>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -25404,29 +25881,29 @@ _sk_load_u16_be_avx:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 5df8 <_sk_load_u16_be_avx+0x18a>
+ .byte 116,85 // je 5fd8 <_sk_load_u16_be_avx+0x18a>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 5df8 <_sk_load_u16_be_avx+0x18a>
+ .byte 114,72 // jb 5fd8 <_sk_load_u16_be_avx+0x18a>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 5e05 <_sk_load_u16_be_avx+0x197>
+ .byte 116,72 // je 5fe5 <_sk_load_u16_be_avx+0x197>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 5e05 <_sk_load_u16_be_avx+0x197>
+ .byte 114,59 // jb 5fe5 <_sk_load_u16_be_avx+0x197>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,213,254,255,255 // je 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 15,132,213,254,255,255 // je 5e90 <_sk_load_u16_be_avx+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,196,254,255,255 // jb 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 15,130,196,254,255,255 // jb 5e90 <_sk_load_u16_be_avx+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,184,254,255,255 // jmpq 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 233,184,254,255,255 // jmpq 5e90 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,171,254,255,255 // jmpq 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 233,171,254,255,255 // jmpq 5e90 <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,162,254,255,255 // jmpq 5cb0 <_sk_load_u16_be_avx+0x42>
+ .byte 233,162,254,255,255 // jmpq 5e90 <_sk_load_u16_be_avx+0x42>
HIDDEN _sk_load_rgb_u16_be_avx
.globl _sk_load_rgb_u16_be_avx
@@ -25443,7 +25920,7 @@ _sk_load_rgb_u16_be_avx:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,243,0,0,0 // jne 5f2c <_sk_load_rgb_u16_be_avx+0x11e>
+ .byte 15,133,243,0,0,0 // jne 610c <_sk_load_rgb_u16_be_avx+0x11e>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -25470,7 +25947,7 @@ _sk_load_rgb_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,209,30,0,0 // vbroadcastss 0x1ed1(%rip),%ymm11 # 7d94 <_sk_callback_avx+0x504>
+ .byte 196,98,125,24,29,1,31,0,0 // vbroadcastss 0x1f01(%rip),%ymm11 # 7fa4 <_sk_callback_avx+0x534>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -25491,41 +25968,41 @@ _sk_load_rgb_u16_be_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,110,30,0,0 // vbroadcastss 0x1e6e(%rip),%ymm3 # 7d98 <_sk_callback_avx+0x508>
+ .byte 196,226,125,24,29,158,30,0,0 // vbroadcastss 0x1e9e(%rip),%ymm3 # 7fa8 <_sk_callback_avx+0x538>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 5f45 <_sk_load_rgb_u16_be_avx+0x137>
- .byte 233,40,255,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,5 // jne 6125 <_sk_load_rgb_u16_be_avx+0x137>
+ .byte 233,40,255,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 5f74 <_sk_load_rgb_u16_be_avx+0x166>
+ .byte 114,26 // jb 6154 <_sk_load_rgb_u16_be_avx+0x166>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 5f79 <_sk_load_rgb_u16_be_avx+0x16b>
- .byte 233,249,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,244,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,10 // jne 6159 <_sk_load_rgb_u16_be_avx+0x16b>
+ .byte 233,249,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,244,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 5fa8 <_sk_load_rgb_u16_be_avx+0x19a>
+ .byte 114,26 // jb 6188 <_sk_load_rgb_u16_be_avx+0x19a>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 5fad <_sk_load_rgb_u16_be_avx+0x19f>
- .byte 233,197,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,192,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 117,10 // jne 618d <_sk_load_rgb_u16_be_avx+0x19f>
+ .byte 233,197,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,192,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 5fd6 <_sk_load_rgb_u16_be_avx+0x1c8>
+ .byte 114,20 // jb 61b6 <_sk_load_rgb_u16_be_avx+0x1c8>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,151,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,146,254,255,255 // jmpq 5e6d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,151,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 233,146,254,255,255 // jmpq 604d <_sk_load_rgb_u16_be_avx+0x5f>
HIDDEN _sk_store_u16_be_avx
.globl _sk_store_u16_be_avx
@@ -25539,7 +26016,7 @@ _sk_store_u16_be_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,154,29,0,0 // vbroadcastss 0x1d9a(%rip),%ymm8 # 7d9c <_sk_callback_avx+0x50c>
+ .byte 196,98,125,24,5,202,29,0,0 // vbroadcastss 0x1dca(%rip),%ymm8 # 7fac <_sk_callback_avx+0x53c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -25577,7 +26054,7 @@ _sk_store_u16_be_avx:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 60e6 <_sk_store_u16_be_avx+0x10b>
+ .byte 117,31 // jne 62c6 <_sk_store_u16_be_avx+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -25586,22 +26063,22 @@ _sk_store_u16_be_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 116,240 // je 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 114,227 // jb 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 116,218 // je 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 114,205 // jb 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 116,196 // je 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 114,183 // jb 62c2 <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp 60e2 <_sk_store_u16_be_avx+0x107>
+ .byte 235,174 // jmp 62c2 <_sk_store_u16_be_avx+0x107>
HIDDEN _sk_load_f32_avx
.globl _sk_load_f32_avx
@@ -25609,7 +26086,7 @@ FUNCTION(_sk_load_f32_avx)
_sk_load_f32_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 61c0 <_sk_load_f32_avx+0x8c>
+ .byte 15,135,128,0,0,0 // ja 63a0 <_sk_load_f32_avx+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -25617,7 +26094,7 @@ _sk_load_f32_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 61e8 <_sk_load_f32_avx+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 63c8 <_sk_load_f32_avx+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -25666,7 +26143,7 @@ FUNCTION(_sk_load_f32_dst_avx)
_sk_load_f32_dst_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 6294 <_sk_load_f32_dst_avx+0x8c>
+ .byte 15,135,128,0,0,0 // ja 6474 <_sk_load_f32_dst_avx+0x8c>
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -25674,7 +26151,7 @@ _sk_load_f32_dst_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 62bc <_sk_load_f32_dst_avx+0xb4>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 649c <_sk_load_f32_dst_avx+0xb4>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -25738,7 +26215,7 @@ _sk_store_f32_avx:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne 635b <_sk_store_f32_avx+0x7f>
+ .byte 117,55 // jne 653b <_sk_store_f32_avx+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -25751,22 +26228,22 @@ _sk_store_f32_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 6357 <_sk_store_f32_avx+0x7b>
+ .byte 116,240 // je 6537 <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 6357 <_sk_store_f32_avx+0x7b>
+ .byte 114,227 // jb 6537 <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je 6357 <_sk_store_f32_avx+0x7b>
+ .byte 116,218 // je 6537 <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 6357 <_sk_store_f32_avx+0x7b>
+ .byte 114,205 // jb 6537 <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je 6357 <_sk_store_f32_avx+0x7b>
+ .byte 116,195 // je 6537 <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb 6357 <_sk_store_f32_avx+0x7b>
+ .byte 114,181 // jb 6537 <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp 6357 <_sk_store_f32_avx+0x7b>
+ .byte 235,171 // jmp 6537 <_sk_store_f32_avx+0x7b>
HIDDEN _sk_clamp_x_avx
.globl _sk_clamp_x_avx
@@ -25859,7 +26336,7 @@ _sk_mirror_x_avx:
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- .byte 197,178,89,5,191,24,0,0 // vmulss 0x18bf(%rip),%xmm9,%xmm0 # 7da0 <_sk_callback_avx+0x510>
+ .byte 197,178,89,5,239,24,0,0 // vmulss 0x18ef(%rip),%xmm9,%xmm0 # 7fb0 <_sk_callback_avx+0x540>
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
@@ -25893,7 +26370,7 @@ _sk_mirror_y_avx:
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- .byte 197,178,89,13,54,24,0,0 // vmulss 0x1836(%rip),%xmm9,%xmm1 # 7da4 <_sk_callback_avx+0x514>
+ .byte 197,178,89,13,102,24,0,0 // vmulss 0x1866(%rip),%xmm9,%xmm1 # 7fb4 <_sk_callback_avx+0x544>
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
@@ -25920,7 +26397,7 @@ FUNCTION(_sk_clamp_x_1_avx)
_sk_clamp_x_1_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,208,23,0,0 // vbroadcastss 0x17d0(%rip),%ymm8 # 7da8 <_sk_callback_avx+0x518>
+ .byte 196,98,125,24,5,0,24,0,0 // vbroadcastss 0x1800(%rip),%ymm8 # 7fb8 <_sk_callback_avx+0x548>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -25938,9 +26415,9 @@ HIDDEN _sk_mirror_x_1_avx
.globl _sk_mirror_x_1_avx
FUNCTION(_sk_mirror_x_1_avx)
_sk_mirror_x_1_avx:
- .byte 196,98,125,24,5,179,23,0,0 // vbroadcastss 0x17b3(%rip),%ymm8 # 7dac <_sk_callback_avx+0x51c>
+ .byte 196,98,125,24,5,227,23,0,0 // vbroadcastss 0x17e3(%rip),%ymm8 # 7fbc <_sk_callback_avx+0x54c>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,169,23,0,0 // vbroadcastss 0x17a9(%rip),%ymm9 # 7db0 <_sk_callback_avx+0x520>
+ .byte 196,98,125,24,13,217,23,0,0 // vbroadcastss 0x17d9(%rip),%ymm9 # 7fc0 <_sk_callback_avx+0x550>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -25956,12 +26433,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,121,23,0,0 // vbroadcastss 0x1779(%rip),%ymm3 # 7db4 <_sk_callback_avx+0x524>
+ .byte 196,226,125,24,29,169,23,0,0 // vbroadcastss 0x17a9(%rip),%ymm3 # 7fc4 <_sk_callback_avx+0x554>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,112,23,0,0 // vbroadcastss 0x1770(%rip),%ymm3 # 7db8 <_sk_callback_avx+0x528>
+ .byte 196,226,125,24,29,160,23,0,0 // vbroadcastss 0x17a0(%rip),%ymm3 # 7fc8 <_sk_callback_avx+0x558>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,99,23,0,0 // vbroadcastss 0x1763(%rip),%ymm1 # 7dbc <_sk_callback_avx+0x52c>
+ .byte 196,226,125,24,13,147,23,0,0 // vbroadcastss 0x1793(%rip),%ymm1 # 7fcc <_sk_callback_avx+0x55c>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26209,9 +26686,9 @@ _sk_evenly_spaced_gradient_avx:
.byte 72,139,24 // mov (%rax),%rbx
.byte 72,139,104,8 // mov 0x8(%rax),%rbp
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 69fd <_sk_evenly_spaced_gradient_avx+0x25>
+ .byte 120,7 // js 6bdd <_sk_evenly_spaced_gradient_avx+0x25>
.byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1
- .byte 235,21 // jmp 6a12 <_sk_evenly_spaced_gradient_avx+0x3a>
+ .byte 235,21 // jmp 6bf2 <_sk_evenly_spaced_gradient_avx+0x3a>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -26369,18 +26846,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx
.globl _sk_gauss_a_to_rgba_avx
FUNCTION(_sk_gauss_a_to_rgba_avx)
_sk_gauss_a_to_rgba_avx:
- .byte 196,226,125,24,5,74,16,0,0 // vbroadcastss 0x104a(%rip),%ymm0 # 7dc0 <_sk_callback_avx+0x530>
+ .byte 196,226,125,24,5,122,16,0,0 // vbroadcastss 0x107a(%rip),%ymm0 # 7fd0 <_sk_callback_avx+0x560>
.byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
- .byte 196,226,125,24,13,65,16,0,0 // vbroadcastss 0x1041(%rip),%ymm1 # 7dc4 <_sk_callback_avx+0x534>
+ .byte 196,226,125,24,13,113,16,0,0 // vbroadcastss 0x1071(%rip),%ymm1 # 7fd4 <_sk_callback_avx+0x564>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,52,16,0,0 // vbroadcastss 0x1034(%rip),%ymm1 # 7dc8 <_sk_callback_avx+0x538>
+ .byte 196,226,125,24,13,100,16,0,0 // vbroadcastss 0x1064(%rip),%ymm1 # 7fd8 <_sk_callback_avx+0x568>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,39,16,0,0 // vbroadcastss 0x1027(%rip),%ymm1 # 7dcc <_sk_callback_avx+0x53c>
+ .byte 196,226,125,24,13,87,16,0,0 // vbroadcastss 0x1057(%rip),%ymm1 # 7fdc <_sk_callback_avx+0x56c>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,26,16,0,0 // vbroadcastss 0x101a(%rip),%ymm1 # 7dd0 <_sk_callback_avx+0x540>
+ .byte 196,226,125,24,13,74,16,0,0 // vbroadcastss 0x104a(%rip),%ymm1 # 7fe0 <_sk_callback_avx+0x570>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -26403,12 +26880,12 @@ _sk_gradient_avx:
.byte 76,139,8 // mov (%rax),%r9
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,80 // jb 6e39 <_sk_gradient_avx+0x6f>
+ .byte 114,80 // jb 7019 <_sk_gradient_avx+0x6f>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
- .byte 196,98,125,24,21,210,15,0,0 // vbroadcastss 0xfd2(%rip),%ymm10 # 7dd4 <_sk_callback_avx+0x544>
+ .byte 196,98,125,24,21,2,16,0,0 // vbroadcastss 0x1002(%rip),%ymm10 # 7fe4 <_sk_callback_avx+0x574>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8
.byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8
@@ -26420,7 +26897,7 @@ _sk_gradient_avx:
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,205 // jne 6e06 <_sk_gradient_avx+0x3c>
+ .byte 117,205 // jne 6fe6 <_sk_gradient_avx+0x3c>
.byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -26603,27 +27080,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,200,11,0,0 // vbroadcastss 0xbc8(%rip),%ymm13 # 7dd8 <_sk_callback_avx+0x548>
+ .byte 196,98,125,24,45,248,11,0,0 // vbroadcastss 0xbf8(%rip),%ymm13 # 7fe8 <_sk_callback_avx+0x578>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,190,11,0,0 // vbroadcastss 0xbbe(%rip),%ymm14 # 7ddc <_sk_callback_avx+0x54c>
+ .byte 196,98,125,24,53,238,11,0,0 // vbroadcastss 0xbee(%rip),%ymm14 # 7fec <_sk_callback_avx+0x57c>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,175,11,0,0 // vbroadcastss 0xbaf(%rip),%ymm14 # 7de0 <_sk_callback_avx+0x550>
+ .byte 196,98,125,24,53,223,11,0,0 // vbroadcastss 0xbdf(%rip),%ymm14 # 7ff0 <_sk_callback_avx+0x580>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,160,11,0,0 // vbroadcastss 0xba0(%rip),%ymm13 # 7de4 <_sk_callback_avx+0x554>
+ .byte 196,98,125,24,45,208,11,0,0 // vbroadcastss 0xbd0(%rip),%ymm13 # 7ff4 <_sk_callback_avx+0x584>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,139,11,0,0 // vbroadcastss 0xb8b(%rip),%ymm10 # 7de8 <_sk_callback_avx+0x558>
+ .byte 196,98,125,24,21,187,11,0,0 // vbroadcastss 0xbbb(%rip),%ymm10 # 7ff8 <_sk_callback_avx+0x588>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,117,11,0,0 // vbroadcastss 0xb75(%rip),%ymm10 # 7dec <_sk_callback_avx+0x55c>
+ .byte 196,98,125,24,21,165,11,0,0 // vbroadcastss 0xba5(%rip),%ymm10 # 7ffc <_sk_callback_avx+0x58c>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,95,11,0,0 // vbroadcastss 0xb5f(%rip),%ymm10 # 7df0 <_sk_callback_avx+0x560>
+ .byte 196,98,125,24,21,143,11,0,0 // vbroadcastss 0xb8f(%rip),%ymm10 # 8000 <_sk_callback_avx+0x590>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -26653,7 +27130,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,9,11,0,0 // vbroadcastss 0xb09(%rip),%ymm11 # 7df4 <_sk_callback_avx+0x564>
+ .byte 196,98,125,24,29,57,11,0,0 // vbroadcastss 0xb39(%rip),%ymm11 # 8004 <_sk_callback_avx+0x594>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -26662,17 +27139,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,221,10,0,0 // vbroadcastss 0xadd(%rip),%ymm9 # 7df8 <_sk_callback_avx+0x568>
+ .byte 196,98,125,24,13,13,11,0,0 // vbroadcastss 0xb0d(%rip),%ymm9 # 8008 <_sk_callback_avx+0x598>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,187,10,0,0 // vbroadcastss 0xabb(%rip),%ymm9 # 7dfc <_sk_callback_avx+0x56c>
+ .byte 196,98,125,24,13,235,10,0,0 // vbroadcastss 0xaeb(%rip),%ymm9 # 800c <_sk_callback_avx+0x59c>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,172,10,0,0 // vbroadcastss 0xaac(%rip),%ymm11 # 7e00 <_sk_callback_avx+0x570>
+ .byte 196,98,125,24,29,220,10,0,0 // vbroadcastss 0xadc(%rip),%ymm11 # 8010 <_sk_callback_avx+0x5a0>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -26692,7 +27169,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,107,10,0,0 // vbroadcastss 0xa6b(%rip),%ymm11 # 7e04 <_sk_callback_avx+0x574>
+ .byte 196,98,125,24,29,155,10,0,0 // vbroadcastss 0xa9b(%rip),%ymm11 # 8014 <_sk_callback_avx+0x5a4>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -26701,17 +27178,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,63,10,0,0 // vbroadcastss 0xa3f(%rip),%ymm9 # 7e08 <_sk_callback_avx+0x578>
+ .byte 196,98,125,24,13,111,10,0,0 // vbroadcastss 0xa6f(%rip),%ymm9 # 8018 <_sk_callback_avx+0x5a8>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,29,10,0,0 // vbroadcastss 0xa1d(%rip),%ymm9 # 7e0c <_sk_callback_avx+0x57c>
+ .byte 196,98,125,24,13,77,10,0,0 // vbroadcastss 0xa4d(%rip),%ymm9 # 801c <_sk_callback_avx+0x5ac>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,14,10,0,0 // vbroadcastss 0xa0e(%rip),%ymm11 # 7e10 <_sk_callback_avx+0x580>
+ .byte 196,98,125,24,29,62,10,0,0 // vbroadcastss 0xa3e(%rip),%ymm11 # 8020 <_sk_callback_avx+0x5b0>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -26730,7 +27207,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,67,121,4,201,0 // vpermilps $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,211,9,0,0 // vbroadcastss 0x9d3(%rip),%ymm10 # 7e14 <_sk_callback_avx+0x584>
+ .byte 196,98,125,24,21,3,10,0,0 // vbroadcastss 0xa03(%rip),%ymm10 # 8024 <_sk_callback_avx+0x5b4>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
@@ -26739,7 +27216,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,167,9,0,0 // vbroadcastss 0x9a7(%rip),%ymm8 # 7e18 <_sk_callback_avx+0x588>
+ .byte 196,98,125,24,5,215,9,0,0 // vbroadcastss 0x9d7(%rip),%ymm8 # 8028 <_sk_callback_avx+0x5b8>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26780,7 +27257,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,67,9,0,0 // vbroadcastss 0x943(%rip),%ymm8 # 7e1c <_sk_callback_avx+0x58c>
+ .byte 196,98,125,24,5,115,9,0,0 // vbroadcastss 0x973(%rip),%ymm8 # 802c <_sk_callback_avx+0x5bc>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -26817,9 +27294,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,207,8,0,0 // vbroadcastss 0x8cf(%rip),%ymm0 # 7e20 <_sk_callback_avx+0x590>
+ .byte 196,226,125,24,5,255,8,0,0 // vbroadcastss 0x8ff(%rip),%ymm0 # 8030 <_sk_callback_avx+0x5c0>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,198,8,0,0 // vbroadcastss 0x8c6(%rip),%ymm8 # 7e24 <_sk_callback_avx+0x594>
+ .byte 196,98,125,24,5,246,8,0,0 // vbroadcastss 0x8f6(%rip),%ymm8 # 8034 <_sk_callback_avx+0x5c4>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26830,7 +27307,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,174,8,0,0 // vbroadcastss 0x8ae(%rip),%ymm0 # 7e28 <_sk_callback_avx+0x598>
+ .byte 196,226,125,24,5,222,8,0,0 // vbroadcastss 0x8de(%rip),%ymm0 # 8038 <_sk_callback_avx+0x5c8>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -26842,9 +27319,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,146,8,0,0 // vbroadcastss 0x892(%rip),%ymm1 # 7e2c <_sk_callback_avx+0x59c>
+ .byte 196,226,125,24,13,194,8,0,0 // vbroadcastss 0x8c2(%rip),%ymm1 # 803c <_sk_callback_avx+0x5cc>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,136,8,0,0 // vbroadcastss 0x888(%rip),%ymm8 # 7e30 <_sk_callback_avx+0x5a0>
+ .byte 196,98,125,24,5,184,8,0,0 // vbroadcastss 0x8b8(%rip),%ymm8 # 8040 <_sk_callback_avx+0x5d0>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26855,7 +27332,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,112,8,0,0 // vbroadcastss 0x870(%rip),%ymm1 # 7e34 <_sk_callback_avx+0x5a4>
+ .byte 196,226,125,24,13,160,8,0,0 // vbroadcastss 0x8a0(%rip),%ymm1 # 8044 <_sk_callback_avx+0x5d4>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -26867,14 +27344,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,83,8,0,0 // vbroadcastss 0x853(%rip),%ymm0 # 7e38 <_sk_callback_avx+0x5a8>
+ .byte 196,226,125,24,5,131,8,0,0 // vbroadcastss 0x883(%rip),%ymm0 # 8048 <_sk_callback_avx+0x5d8>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,74,8,0,0 // vbroadcastss 0x84a(%rip),%ymm8 # 7e3c <_sk_callback_avx+0x5ac>
+ .byte 196,98,125,24,5,122,8,0,0 // vbroadcastss 0x87a(%rip),%ymm8 # 804c <_sk_callback_avx+0x5dc>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,59,8,0,0 // vbroadcastss 0x83b(%rip),%ymm10 # 7e40 <_sk_callback_avx+0x5b0>
+ .byte 196,98,125,24,21,107,8,0,0 // vbroadcastss 0x86b(%rip),%ymm10 # 8050 <_sk_callback_avx+0x5e0>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,49,8,0,0 // vbroadcastss 0x831(%rip),%ymm10 # 7e44 <_sk_callback_avx+0x5b4>
+ .byte 196,98,125,24,21,97,8,0,0 // vbroadcastss 0x861(%rip),%ymm10 # 8054 <_sk_callback_avx+0x5e4>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -26886,19 +27363,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,20,8,0,0 // vbroadcastss 0x814(%rip),%ymm0 # 7e48 <_sk_callback_avx+0x5b8>
+ .byte 196,226,125,24,5,68,8,0,0 // vbroadcastss 0x844(%rip),%ymm0 # 8058 <_sk_callback_avx+0x5e8>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,11,8,0,0 // vbroadcastss 0x80b(%rip),%ymm8 # 7e4c <_sk_callback_avx+0x5bc>
+ .byte 196,98,125,24,5,59,8,0,0 // vbroadcastss 0x83b(%rip),%ymm8 # 805c <_sk_callback_avx+0x5ec>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,1,8,0,0 // vbroadcastss 0x801(%rip),%ymm9 # 7e50 <_sk_callback_avx+0x5c0>
+ .byte 196,98,125,24,13,49,8,0,0 // vbroadcastss 0x831(%rip),%ymm9 # 8060 <_sk_callback_avx+0x5f0>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,247,7,0,0 // vbroadcastss 0x7f7(%rip),%ymm10 # 7e54 <_sk_callback_avx+0x5c4>
+ .byte 196,98,125,24,21,39,8,0,0 // vbroadcastss 0x827(%rip),%ymm10 # 8064 <_sk_callback_avx+0x5f4>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,232,7,0,0 // vbroadcastss 0x7e8(%rip),%ymm10 # 7e58 <_sk_callback_avx+0x5c8>
+ .byte 196,98,125,24,21,24,8,0,0 // vbroadcastss 0x818(%rip),%ymm10 # 8068 <_sk_callback_avx+0x5f8>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,217,7,0,0 // vbroadcastss 0x7d9(%rip),%ymm9 # 7e5c <_sk_callback_avx+0x5cc>
+ .byte 196,98,125,24,13,9,8,0,0 // vbroadcastss 0x809(%rip),%ymm9 # 806c <_sk_callback_avx+0x5fc>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26909,17 +27386,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,193,7,0,0 // vbroadcastss 0x7c1(%rip),%ymm8 # 7e60 <_sk_callback_avx+0x5d0>
+ .byte 196,98,125,24,5,241,7,0,0 // vbroadcastss 0x7f1(%rip),%ymm8 # 8070 <_sk_callback_avx+0x600>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,179,7,0,0 // vbroadcastss 0x7b3(%rip),%ymm10 # 7e64 <_sk_callback_avx+0x5d4>
+ .byte 196,98,125,24,21,227,7,0,0 // vbroadcastss 0x7e3(%rip),%ymm10 # 8074 <_sk_callback_avx+0x604>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,169,7,0,0 // vbroadcastss 0x7a9(%rip),%ymm11 # 7e68 <_sk_callback_avx+0x5d8>
+ .byte 196,98,125,24,29,217,7,0,0 // vbroadcastss 0x7d9(%rip),%ymm11 # 8078 <_sk_callback_avx+0x608>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,144,7,0,0 // vbroadcastss 0x790(%rip),%ymm9 # 7e6c <_sk_callback_avx+0x5dc>
+ .byte 196,98,125,24,13,192,7,0,0 // vbroadcastss 0x7c0(%rip),%ymm9 # 807c <_sk_callback_avx+0x60c>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26930,13 +27407,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,120,7,0,0 // vbroadcastss 0x778(%rip),%ymm0 # 7e70 <_sk_callback_avx+0x5e0>
+ .byte 196,226,125,24,5,168,7,0,0 // vbroadcastss 0x7a8(%rip),%ymm0 # 8080 <_sk_callback_avx+0x610>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,101,7,0,0 // vbroadcastss 0x765(%rip),%ymm10 # 7e74 <_sk_callback_avx+0x5e4>
+ .byte 196,98,125,24,21,149,7,0,0 // vbroadcastss 0x795(%rip),%ymm10 # 8084 <_sk_callback_avx+0x614>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,91,7,0,0 // vbroadcastss 0x75b(%rip),%ymm10 # 7e78 <_sk_callback_avx+0x5e8>
+ .byte 196,98,125,24,21,139,7,0,0 // vbroadcastss 0x78b(%rip),%ymm10 # 8088 <_sk_callback_avx+0x618>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -26948,14 +27425,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,62,7,0,0 // vbroadcastss 0x73e(%rip),%ymm1 # 7e7c <_sk_callback_avx+0x5ec>
+ .byte 196,226,125,24,13,110,7,0,0 // vbroadcastss 0x76e(%rip),%ymm1 # 808c <_sk_callback_avx+0x61c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,52,7,0,0 // vbroadcastss 0x734(%rip),%ymm8 # 7e80 <_sk_callback_avx+0x5f0>
+ .byte 196,98,125,24,5,100,7,0,0 // vbroadcastss 0x764(%rip),%ymm8 # 8090 <_sk_callback_avx+0x620>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,37,7,0,0 // vbroadcastss 0x725(%rip),%ymm10 # 7e84 <_sk_callback_avx+0x5f4>
+ .byte 196,98,125,24,21,85,7,0,0 // vbroadcastss 0x755(%rip),%ymm10 # 8094 <_sk_callback_avx+0x624>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,27,7,0,0 // vbroadcastss 0x71b(%rip),%ymm10 # 7e88 <_sk_callback_avx+0x5f8>
+ .byte 196,98,125,24,21,75,7,0,0 // vbroadcastss 0x74b(%rip),%ymm10 # 8098 <_sk_callback_avx+0x628>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -26967,19 +27444,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,254,6,0,0 // vbroadcastss 0x6fe(%rip),%ymm1 # 7e8c <_sk_callback_avx+0x5fc>
+ .byte 196,226,125,24,13,46,7,0,0 // vbroadcastss 0x72e(%rip),%ymm1 # 809c <_sk_callback_avx+0x62c>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,244,6,0,0 // vbroadcastss 0x6f4(%rip),%ymm8 # 7e90 <_sk_callback_avx+0x600>
+ .byte 196,98,125,24,5,36,7,0,0 // vbroadcastss 0x724(%rip),%ymm8 # 80a0 <_sk_callback_avx+0x630>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,234,6,0,0 // vbroadcastss 0x6ea(%rip),%ymm9 # 7e94 <_sk_callback_avx+0x604>
+ .byte 196,98,125,24,13,26,7,0,0 // vbroadcastss 0x71a(%rip),%ymm9 # 80a4 <_sk_callback_avx+0x634>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,224,6,0,0 // vbroadcastss 0x6e0(%rip),%ymm10 # 7e98 <_sk_callback_avx+0x608>
+ .byte 196,98,125,24,21,16,7,0,0 // vbroadcastss 0x710(%rip),%ymm10 # 80a8 <_sk_callback_avx+0x638>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,209,6,0,0 // vbroadcastss 0x6d1(%rip),%ymm10 # 7e9c <_sk_callback_avx+0x60c>
+ .byte 196,98,125,24,21,1,7,0,0 // vbroadcastss 0x701(%rip),%ymm10 # 80ac <_sk_callback_avx+0x63c>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,194,6,0,0 // vbroadcastss 0x6c2(%rip),%ymm9 # 7ea0 <_sk_callback_avx+0x610>
+ .byte 196,98,125,24,13,242,6,0,0 // vbroadcastss 0x6f2(%rip),%ymm9 # 80b0 <_sk_callback_avx+0x640>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -26990,17 +27467,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,170,6,0,0 // vbroadcastss 0x6aa(%rip),%ymm8 # 7ea4 <_sk_callback_avx+0x614>
+ .byte 196,98,125,24,5,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm8 # 80b4 <_sk_callback_avx+0x644>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,155,6,0,0 // vbroadcastss 0x69b(%rip),%ymm10 # 7ea8 <_sk_callback_avx+0x618>
+ .byte 196,98,125,24,21,203,6,0,0 // vbroadcastss 0x6cb(%rip),%ymm10 # 80b8 <_sk_callback_avx+0x648>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,145,6,0,0 // vbroadcastss 0x691(%rip),%ymm11 # 7eac <_sk_callback_avx+0x61c>
+ .byte 196,98,125,24,29,193,6,0,0 // vbroadcastss 0x6c1(%rip),%ymm11 # 80bc <_sk_callback_avx+0x64c>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,120,6,0,0 // vbroadcastss 0x678(%rip),%ymm9 # 7eb0 <_sk_callback_avx+0x620>
+ .byte 196,98,125,24,13,168,6,0,0 // vbroadcastss 0x6a8(%rip),%ymm9 # 80c0 <_sk_callback_avx+0x650>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27011,13 +27488,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,96,6,0,0 // vbroadcastss 0x660(%rip),%ymm1 # 7eb4 <_sk_callback_avx+0x624>
+ .byte 196,226,125,24,13,144,6,0,0 // vbroadcastss 0x690(%rip),%ymm1 # 80c4 <_sk_callback_avx+0x654>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,76,6,0,0 // vbroadcastss 0x64c(%rip),%ymm10 # 7eb8 <_sk_callback_avx+0x628>
+ .byte 196,98,125,24,21,124,6,0,0 // vbroadcastss 0x67c(%rip),%ymm10 # 80c8 <_sk_callback_avx+0x658>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,66,6,0,0 // vbroadcastss 0x642(%rip),%ymm10 # 7ebc <_sk_callback_avx+0x62c>
+ .byte 196,98,125,24,21,114,6,0,0 // vbroadcastss 0x672(%rip),%ymm10 # 80cc <_sk_callback_avx+0x65c>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -27149,25 +27626,25 @@ BALIGN4
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7a8d <.literal4+0xb9>
+ .byte 71,225,61 // rex.RXB loope 7c6d <.literal4+0xb9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7a9d <.literal4+0xc9>
+ .byte 71,225,61 // rex.RXB loope 7c7d <.literal4+0xc9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7aad <.literal4+0xd9>
+ .byte 71,225,61 // rex.RXB loope 7c8d <.literal4+0xd9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 7abd <.literal4+0xe9>
+ .byte 71,225,61 // rex.RXB loope 7c9d <.literal4+0xe9>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
@@ -27232,7 +27709,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7b2d <.literal4+0x159>
+ .byte 224,7 // loopne 7d0d <.literal4+0x159>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -27248,10 +27725,27 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 7b54 <.literal4+0x180>
+ .byte 127,0 // jg 7d34 <.literal4+0x180>
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 119,115 // ja 7dad <.literal4+0x1f9>
+ .byte 248 // clc
+ .byte 194,117,191 // retq $0xbf75
+ .byte 191,63,249,68,180 // mov $0xb444f93f,%edi
+ .byte 62,163,233,220,63,81,140,242,66,141 // movabs %eax,%ds:0x8d42f28c513fdce9
+ .byte 188,190,63,248,245 // mov $0xf5f83fbe,%esp
+ .byte 154 // (bad)
+ .byte 64,254 // rex (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 7d68 <.literal4+0x1b4>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7bcd <.literal4+0x1f9>
+ .byte 119,115 // ja 7de1 <.literal4+0x22d>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27265,10 +27759,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7b88 <.literal4+0x1b4>
+ .byte 127,0 // jg 7d9c <.literal4+0x1e8>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7c01 <.literal4+0x22d>
+ .byte 119,115 // ja 7e15 <.literal4+0x261>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27282,10 +27776,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7bbc <.literal4+0x1e8>
+ .byte 127,0 // jg 7dd0 <.literal4+0x21c>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7c35 <.literal4+0x261>
+ .byte 119,115 // ja 7e49 <.literal4+0x295>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27299,10 +27793,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7bf0 <.literal4+0x21c>
+ .byte 127,0 // jg 7e04 <.literal4+0x250>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 7c69 <.literal4+0x295>
+ .byte 119,115 // ja 7e7d <.literal4+0x2c9>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -27313,9 +27807,9 @@ BALIGN4
.byte 210,221 // rcr %cl,%ch
.byte 65,0,0 // add %al,(%r8)
.byte 0,75,0 // add %cl,0x0(%rbx)
- .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax)
+ .byte 0,200 // add %cl,%al
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 7c67 <.literal4+0x293>
+ .byte 127,67 // jg 7e77 <.literal4+0x2c3>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -27327,7 +27821,7 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 7c87 <.literal4+0x2b3>
+ .byte 118,63 // jbe 7e97 <.literal4+0x2e3>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
@@ -27349,7 +27843,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7ca1 <.literal4+0x2cd>
+ .byte 224,7 // loopne 7eb1 <.literal4+0x2fd>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -27361,7 +27855,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 7cbd <.literal4+0x2e9>
+ .byte 224,7 // loopne 7ecd <.literal4+0x319>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -27372,7 +27866,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 7d12 <.literal4+0x33e>
+ .byte 124,66 // jl 7f22 <.literal4+0x36e>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -27398,7 +27892,7 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 7d75 <.literal4+0x3a1>
+ .byte 112,65 // jo 7f85 <.literal4+0x3d1>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
@@ -27424,7 +27918,7 @@ BALIGN4
.byte 0,128,55,0,0,128 // add %al,-0x7fffffc9(%rax)
.byte 63 // (bad)
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7de7 <.literal4+0x413>
+ .byte 127,71 // jg 7ff7 <.literal4+0x443>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -27959,7 +28453,7 @@ _sk_seed_shader_sse41:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,28,93,0,0 // movaps 0x5d1c(%rip),%xmm2 # 5de0 <_sk_callback_sse41+0xf2>
+ .byte 15,40,21,220,94,0,0 // movaps 0x5edc(%rip),%xmm2 # 5fa0 <_sk_callback_sse41+0xf4>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -27968,7 +28462,7 @@ _sk_seed_shader_sse41:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,11,93,0,0 // movaps 0x5d0b(%rip),%xmm2 # 5df0 <_sk_callback_sse41+0x102>
+ .byte 15,40,21,203,94,0,0 // movaps 0x5ecb(%rip),%xmm2 # 5fb0 <_sk_callback_sse41+0x104>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -27988,14 +28482,14 @@ _sk_dither_sse41:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,217,92,0,0 // movdqa 0x5cd9(%rip),%xmm10 # 5e00 <_sk_callback_sse41+0x112>
+ .byte 102,68,15,111,21,153,94,0,0 // movdqa 0x5e99(%rip),%xmm10 # 5fc0 <_sk_callback_sse41+0x114>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,197,92,0,0 // movdqa 0x5cc5(%rip),%xmm12 # 5e10 <_sk_callback_sse41+0x122>
- .byte 102,68,15,111,45,204,92,0,0 // movdqa 0x5ccc(%rip),%xmm13 # 5e20 <_sk_callback_sse41+0x132>
+ .byte 102,68,15,111,37,133,94,0,0 // movdqa 0x5e85(%rip),%xmm12 # 5fd0 <_sk_callback_sse41+0x124>
+ .byte 102,68,15,111,45,140,94,0,0 // movdqa 0x5e8c(%rip),%xmm13 # 5fe0 <_sk_callback_sse41+0x134>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -28011,8 +28505,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,135,92,0,0 // mulps 0x5c87(%rip),%xmm8 # 5e30 <_sk_callback_sse41+0x142>
- .byte 68,15,88,5,143,92,0,0 // addps 0x5c8f(%rip),%xmm8 # 5e40 <_sk_callback_sse41+0x152>
+ .byte 68,15,89,5,71,94,0,0 // mulps 0x5e47(%rip),%xmm8 # 5ff0 <_sk_callback_sse41+0x144>
+ .byte 68,15,88,5,79,94,0,0 // addps 0x5e4f(%rip),%xmm8 # 6000 <_sk_callback_sse41+0x154>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -28054,7 +28548,7 @@ HIDDEN _sk_black_color_sse41
FUNCTION(_sk_black_color_sse41)
_sk_black_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,37,92,0,0 // movaps 0x5c25(%rip),%xmm3 # 5e50 <_sk_callback_sse41+0x162>
+ .byte 15,40,29,229,93,0,0 // movaps 0x5de5(%rip),%xmm3 # 6010 <_sk_callback_sse41+0x164>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -28065,7 +28559,7 @@ HIDDEN _sk_white_color_sse41
FUNCTION(_sk_white_color_sse41)
_sk_white_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,33,92,0,0 // movaps 0x5c21(%rip),%xmm0 # 5e60 <_sk_callback_sse41+0x172>
+ .byte 15,40,5,225,93,0,0 // movaps 0x5de1(%rip),%xmm0 # 6020 <_sk_callback_sse41+0x174>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -28111,7 +28605,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,225,91,0,0 // movaps 0x5be1(%rip),%xmm8 # 5e70 <_sk_callback_sse41+0x182>
+ .byte 68,15,40,5,161,93,0,0 // movaps 0x5da1(%rip),%xmm8 # 6030 <_sk_callback_sse41+0x184>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -28136,7 +28630,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,164,91,0,0 // movaps 0x5ba4(%rip),%xmm9 # 5e80 <_sk_callback_sse41+0x192>
+ .byte 68,15,40,13,100,93,0,0 // movaps 0x5d64(%rip),%xmm9 # 6040 <_sk_callback_sse41+0x194>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -28183,7 +28677,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,72,91,0,0 // movaps 0x5b48(%rip),%xmm8 # 5e90 <_sk_callback_sse41+0x1a2>
+ .byte 68,15,40,5,8,93,0,0 // movaps 0x5d08(%rip),%xmm8 # 6050 <_sk_callback_sse41+0x1a4>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -28196,7 +28690,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,56,91,0,0 // movaps 0x5b38(%rip),%xmm8 # 5ea0 <_sk_callback_sse41+0x1b2>
+ .byte 68,15,40,5,248,92,0,0 // movaps 0x5cf8(%rip),%xmm8 # 6060 <_sk_callback_sse41+0x1b4>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -28213,7 +28707,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,27,91,0,0 // movaps 0x5b1b(%rip),%xmm8 # 5eb0 <_sk_callback_sse41+0x1c2>
+ .byte 68,15,40,5,219,92,0,0 // movaps 0x5cdb(%rip),%xmm8 # 6070 <_sk_callback_sse41+0x1c4>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -28233,7 +28727,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,239,90,0,0 // movaps 0x5aef(%rip),%xmm8 # 5ec0 <_sk_callback_sse41+0x1d2>
+ .byte 68,15,40,5,175,92,0,0 // movaps 0x5caf(%rip),%xmm8 # 6080 <_sk_callback_sse41+0x1d4>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -28261,7 +28755,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,195,90,0,0 // movaps 0x5ac3(%rip),%xmm8 # 5ed0 <_sk_callback_sse41+0x1e2>
+ .byte 68,15,40,5,131,92,0,0 // movaps 0x5c83(%rip),%xmm8 # 6090 <_sk_callback_sse41+0x1e4>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -28336,7 +28830,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,248,89,0,0 // movaps 0x59f8(%rip),%xmm3 # 5ee0 <_sk_callback_sse41+0x1f2>
+ .byte 15,40,29,184,91,0,0 // movaps 0x5bb8(%rip),%xmm3 # 60a0 <_sk_callback_sse41+0x1f4>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -28384,7 +28878,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,99,89,0,0 // movaps 0x5963(%rip),%xmm2 # 5ef0 <_sk_callback_sse41+0x202>
+ .byte 15,40,21,35,91,0,0 // movaps 0x5b23(%rip),%xmm2 # 60b0 <_sk_callback_sse41+0x204>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28418,7 +28912,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,8,89,0,0 // movaps 0x5908(%rip),%xmm2 # 5f00 <_sk_callback_sse41+0x212>
+ .byte 15,40,21,200,90,0,0 // movaps 0x5ac8(%rip),%xmm2 # 60c0 <_sk_callback_sse41+0x214>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28455,7 +28949,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,162,88,0,0 // movaps 0x58a2(%rip),%xmm2 # 5f10 <_sk_callback_sse41+0x222>
+ .byte 15,40,21,98,90,0,0 // movaps 0x5a62(%rip),%xmm2 # 60d0 <_sk_callback_sse41+0x224>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28483,7 +28977,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,98,88,0,0 // movaps 0x5862(%rip),%xmm2 # 5f20 <_sk_callback_sse41+0x232>
+ .byte 15,40,21,34,90,0,0 // movaps 0x5a22(%rip),%xmm2 # 60e0 <_sk_callback_sse41+0x234>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -28496,7 +28990,7 @@ HIDDEN _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,85,88,0,0 // movaps 0x5855(%rip),%xmm10 # 5f30 <_sk_callback_sse41+0x242>
+ .byte 68,15,40,21,21,90,0,0 // movaps 0x5a15(%rip),%xmm10 # 60f0 <_sk_callback_sse41+0x244>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,203 // movaps %xmm11,%xmm9
@@ -28578,7 +29072,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,51,87,0,0 // movaps 0x5733(%rip),%xmm10 # 5f40 <_sk_callback_sse41+0x252>
+ .byte 68,15,40,21,243,88,0,0 // movaps 0x58f3(%rip),%xmm10 # 6100 <_sk_callback_sse41+0x254>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -28660,7 +29154,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,12,86,0,0 // movaps 0x560c(%rip),%xmm10 # 5f50 <_sk_callback_sse41+0x262>
+ .byte 68,15,40,21,204,87,0,0 // movaps 0x57cc(%rip),%xmm10 # 6110 <_sk_callback_sse41+0x264>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -28743,7 +29237,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,241,84,0,0 // movaps 0x54f1(%rip),%xmm10 # 5f60 <_sk_callback_sse41+0x272>
+ .byte 68,15,40,21,177,86,0,0 // movaps 0x56b1(%rip),%xmm10 # 6120 <_sk_callback_sse41+0x274>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -28828,7 +29322,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,200,83,0,0 // movaps 0x53c8(%rip),%xmm1 # 5f70 <_sk_callback_sse41+0x282>
+ .byte 15,40,13,136,85,0,0 // movaps 0x5588(%rip),%xmm1 # 6130 <_sk_callback_sse41+0x284>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -28841,10 +29335,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,166,83,0,0 // movaps 0x53a6(%rip),%xmm13 # 5f80 <_sk_callback_sse41+0x292>
+ .byte 68,15,40,45,102,85,0,0 // movaps 0x5566(%rip),%xmm13 # 6140 <_sk_callback_sse41+0x294>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,166,83,0,0 // movaps 0x53a6(%rip),%xmm12 # 5f90 <_sk_callback_sse41+0x2a2>
+ .byte 68,15,40,37,102,85,0,0 // movaps 0x5566(%rip),%xmm12 # 6150 <_sk_callback_sse41+0x2a4>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -29030,12 +29524,12 @@ _sk_hue_sse41:
.byte 68,15,84,208 // andps %xmm0,%xmm10
.byte 15,84,200 // andps %xmm0,%xmm1
.byte 68,15,84,232 // andps %xmm0,%xmm13
- .byte 15,40,5,17,81,0,0 // movaps 0x5111(%rip),%xmm0 # 5fa0 <_sk_callback_sse41+0x2b2>
+ .byte 15,40,5,209,82,0,0 // movaps 0x52d1(%rip),%xmm0 # 6160 <_sk_callback_sse41+0x2b4>
.byte 68,15,89,224 // mulps %xmm0,%xmm12
- .byte 15,40,21,22,81,0,0 // movaps 0x5116(%rip),%xmm2 # 5fb0 <_sk_callback_sse41+0x2c2>
+ .byte 15,40,21,214,82,0,0 // movaps 0x52d6(%rip),%xmm2 # 6170 <_sk_callback_sse41+0x2c4>
.byte 15,89,250 // mulps %xmm2,%xmm7
.byte 65,15,88,252 // addps %xmm12,%xmm7
- .byte 68,15,40,53,23,81,0,0 // movaps 0x5117(%rip),%xmm14 # 5fc0 <_sk_callback_sse41+0x2d2>
+ .byte 68,15,40,53,215,82,0,0 // movaps 0x52d7(%rip),%xmm14 # 6180 <_sk_callback_sse41+0x2d4>
.byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,255 // addps %xmm7,%xmm15
@@ -29118,7 +29612,7 @@ _sk_hue_sse41:
.byte 65,15,88,214 // addps %xmm14,%xmm2
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,40,13,219,79,0,0 // movaps 0x4fdb(%rip),%xmm9 # 5fd0 <_sk_callback_sse41+0x2e2>
+ .byte 68,15,40,13,155,81,0,0 // movaps 0x519b(%rip),%xmm9 # 6190 <_sk_callback_sse41+0x2e4>
.byte 65,15,40,225 // movaps %xmm9,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
@@ -29212,14 +29706,14 @@ _sk_saturation_sse41:
.byte 68,15,84,215 // andps %xmm7,%xmm10
.byte 68,15,84,223 // andps %xmm7,%xmm11
.byte 68,15,84,199 // andps %xmm7,%xmm8
- .byte 15,40,21,149,78,0,0 // movaps 0x4e95(%rip),%xmm2 # 5fe0 <_sk_callback_sse41+0x2f2>
+ .byte 15,40,21,85,80,0,0 // movaps 0x5055(%rip),%xmm2 # 61a0 <_sk_callback_sse41+0x2f4>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,40,13,152,78,0,0 // movaps 0x4e98(%rip),%xmm1 # 5ff0 <_sk_callback_sse41+0x302>
+ .byte 15,40,13,88,80,0,0 // movaps 0x5058(%rip),%xmm1 # 61b0 <_sk_callback_sse41+0x304>
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,251 // addps %xmm3,%xmm7
- .byte 68,15,40,45,151,78,0,0 // movaps 0x4e97(%rip),%xmm13 # 6000 <_sk_callback_sse41+0x312>
+ .byte 68,15,40,45,87,80,0,0 // movaps 0x5057(%rip),%xmm13 # 61c0 <_sk_callback_sse41+0x314>
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 68,15,88,247 // addps %xmm7,%xmm14
.byte 65,15,40,218 // movaps %xmm10,%xmm3
@@ -29300,7 +29794,7 @@ _sk_saturation_sse41:
.byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
- .byte 68,15,40,13,93,77,0,0 // movaps 0x4d5d(%rip),%xmm9 # 6010 <_sk_callback_sse41+0x322>
+ .byte 68,15,40,13,29,79,0,0 // movaps 0x4f1d(%rip),%xmm9 # 61d0 <_sk_callback_sse41+0x324>
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 68,15,92,204 // subps %xmm4,%xmm9
.byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
@@ -29355,14 +29849,14 @@ _sk_color_sse41:
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 68,15,89,244 // mulps %xmm4,%xmm14
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 68,15,40,13,168,76,0,0 // movaps 0x4ca8(%rip),%xmm9 # 6020 <_sk_callback_sse41+0x332>
+ .byte 68,15,40,13,104,78,0,0 // movaps 0x4e68(%rip),%xmm9 # 61e0 <_sk_callback_sse41+0x334>
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 65,15,89,249 // mulps %xmm9,%xmm7
- .byte 68,15,40,21,168,76,0,0 // movaps 0x4ca8(%rip),%xmm10 # 6030 <_sk_callback_sse41+0x342>
+ .byte 68,15,40,21,104,78,0,0 // movaps 0x4e68(%rip),%xmm10 # 61f0 <_sk_callback_sse41+0x344>
.byte 65,15,40,219 // movaps %xmm11,%xmm3
.byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,40,29,165,76,0,0 // movaps 0x4ca5(%rip),%xmm11 # 6040 <_sk_callback_sse41+0x352>
+ .byte 68,15,40,29,101,78,0,0 // movaps 0x4e65(%rip),%xmm11 # 6200 <_sk_callback_sse41+0x354>
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
@@ -29447,7 +29941,7 @@ _sk_color_sse41:
.byte 65,15,88,251 // addps %xmm11,%xmm7
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
- .byte 68,15,40,13,97,75,0,0 // movaps 0x4b61(%rip),%xmm9 # 6050 <_sk_callback_sse41+0x362>
+ .byte 68,15,40,13,33,77,0,0 // movaps 0x4d21(%rip),%xmm9 # 6210 <_sk_callback_sse41+0x364>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 68,15,89,192 // mulps %xmm0,%xmm8
@@ -29499,13 +29993,13 @@ _sk_luminosity_sse41:
.byte 69,15,89,216 // mulps %xmm8,%xmm11
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,89,205 // mulps %xmm5,%xmm9
- .byte 68,15,40,5,185,74,0,0 // movaps 0x4ab9(%rip),%xmm8 # 6060 <_sk_callback_sse41+0x372>
+ .byte 68,15,40,5,121,76,0,0 // movaps 0x4c79(%rip),%xmm8 # 6220 <_sk_callback_sse41+0x374>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,21,189,74,0,0 // movaps 0x4abd(%rip),%xmm10 # 6070 <_sk_callback_sse41+0x382>
+ .byte 68,15,40,21,125,76,0,0 // movaps 0x4c7d(%rip),%xmm10 # 6230 <_sk_callback_sse41+0x384>
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 65,15,89,234 // mulps %xmm10,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 68,15,40,37,187,74,0,0 // movaps 0x4abb(%rip),%xmm12 # 6080 <_sk_callback_sse41+0x392>
+ .byte 68,15,40,37,123,76,0,0 // movaps 0x4c7b(%rip),%xmm12 # 6240 <_sk_callback_sse41+0x394>
.byte 68,15,40,242 // movaps %xmm2,%xmm14
.byte 69,15,89,244 // mulps %xmm12,%xmm14
.byte 68,15,88,245 // addps %xmm5,%xmm14
@@ -29590,7 +30084,7 @@ _sk_luminosity_sse41:
.byte 65,15,88,244 // addps %xmm12,%xmm6
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
- .byte 15,40,5,113,73,0,0 // movaps 0x4971(%rip),%xmm0 # 6090 <_sk_callback_sse41+0x3a2>
+ .byte 15,40,5,49,75,0,0 // movaps 0x4b31(%rip),%xmm0 # 6250 <_sk_callback_sse41+0x3a4>
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,226 // mulps %xmm2,%xmm4
@@ -29638,20 +30132,20 @@ _sk_srcover_rgba_8888_sse41:
.byte 15,133,219,0,0,0 // jne 1887 <_sk_srcover_rgba_8888_sse41+0xfb>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,227,72,0,0 // movdqa 0x48e3(%rip),%xmm4 # 60a0 <_sk_callback_sse41+0x3b2>
+ .byte 102,15,111,37,163,74,0,0 // movdqa 0x4aa3(%rip),%xmm4 # 6260 <_sk_callback_sse41+0x3b4>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,223,72,0,0 // pshufb 0x48df(%rip),%xmm5 # 60b0 <_sk_callback_sse41+0x3c2>
+ .byte 102,15,56,0,45,159,74,0,0 // pshufb 0x4a9f(%rip),%xmm5 # 6270 <_sk_callback_sse41+0x3c4>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,223,72,0,0 // pshufb 0x48df(%rip),%xmm6 # 60c0 <_sk_callback_sse41+0x3d2>
+ .byte 102,15,56,0,53,159,74,0,0 // pshufb 0x4a9f(%rip),%xmm6 # 6280 <_sk_callback_sse41+0x3d4>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 68,15,40,5,220,72,0,0 // movaps 0x48dc(%rip),%xmm8 # 60d0 <_sk_callback_sse41+0x3e2>
+ .byte 68,15,40,5,156,74,0,0 // movaps 0x4a9c(%rip),%xmm8 # 6290 <_sk_callback_sse41+0x3e4>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,224,72,0,0 // movaps 0x48e0(%rip),%xmm12 # 60e0 <_sk_callback_sse41+0x3f2>
+ .byte 68,15,40,37,160,74,0,0 // movaps 0x4aa0(%rip),%xmm12 # 62a0 <_sk_callback_sse41+0x3f4>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -29731,7 +30225,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,203,71,0,0 // movaps 0x47cb(%rip),%xmm8 # 60f0 <_sk_callback_sse41+0x402>
+ .byte 68,15,40,5,139,73,0,0 // movaps 0x498b(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x404>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -29743,7 +30237,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,192,71,0,0 // minps 0x47c0(%rip),%xmm3 # 6100 <_sk_callback_sse41+0x412>
+ .byte 15,93,29,128,73,0,0 // minps 0x4980(%rip),%xmm3 # 62c0 <_sk_callback_sse41+0x414>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -29754,7 +30248,7 @@ HIDDEN _sk_clamp_a_dst_sse41
.globl _sk_clamp_a_dst_sse41
FUNCTION(_sk_clamp_a_dst_sse41)
_sk_clamp_a_dst_sse41:
- .byte 15,93,61,188,71,0,0 // minps 0x47bc(%rip),%xmm7 # 6110 <_sk_callback_sse41+0x422>
+ .byte 15,93,61,124,73,0,0 // minps 0x497c(%rip),%xmm7 # 62d0 <_sk_callback_sse41+0x424>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -29789,7 +30283,7 @@ HIDDEN _sk_invert_sse41
.globl _sk_invert_sse41
FUNCTION(_sk_invert_sse41)
_sk_invert_sse41:
- .byte 68,15,40,5,136,71,0,0 // movaps 0x4788(%rip),%xmm8 # 6120 <_sk_callback_sse41+0x432>
+ .byte 68,15,40,5,72,73,0,0 // movaps 0x4948(%rip),%xmm8 # 62e0 <_sk_callback_sse41+0x434>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -29851,7 +30345,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,34,71,0,0 // movaps 0x4722(%rip),%xmm9 # 6130 <_sk_callback_sse41+0x442>
+ .byte 68,15,40,13,226,72,0,0 // movaps 0x48e2(%rip),%xmm9 # 62f0 <_sk_callback_sse41+0x444>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -29865,20 +30359,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,13,71,0,0 // movaps 0x470d(%rip),%xmm11 # 6140 <_sk_callback_sse41+0x452>
+ .byte 68,15,40,29,205,72,0,0 // movaps 0x48cd(%rip),%xmm11 # 6300 <_sk_callback_sse41+0x454>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,5,71,0,0 // movaps 0x4705(%rip),%xmm12 # 6150 <_sk_callback_sse41+0x462>
+ .byte 68,15,40,37,197,72,0,0 // movaps 0x48c5(%rip),%xmm12 # 6310 <_sk_callback_sse41+0x464>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,5,71,0,0 // movaps 0x4705(%rip),%xmm13 # 6160 <_sk_callback_sse41+0x472>
+ .byte 68,15,40,45,197,72,0,0 // movaps 0x48c5(%rip),%xmm13 # 6320 <_sk_callback_sse41+0x474>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,5,71,0,0 // movaps 0x4705(%rip),%xmm14 # 6170 <_sk_callback_sse41+0x482>
+ .byte 68,15,40,53,197,72,0,0 // movaps 0x48c5(%rip),%xmm14 # 6330 <_sk_callback_sse41+0x484>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,9,71,0,0 // movaps 0x4709(%rip),%xmm15 # 6180 <_sk_callback_sse41+0x492>
+ .byte 68,15,40,61,201,72,0,0 // movaps 0x48c9(%rip),%xmm15 # 6340 <_sk_callback_sse41+0x494>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -29915,19 +30409,19 @@ FUNCTION(_sk_from_srgb_dst_sse41)
_sk_from_srgb_dst_sse41:
.byte 68,15,40,204 // movaps %xmm4,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,29,148,70,0,0 // movaps 0x4694(%rip),%xmm11 # 6190 <_sk_callback_sse41+0x4a2>
+ .byte 68,15,40,29,84,72,0,0 // movaps 0x4854(%rip),%xmm11 # 6350 <_sk_callback_sse41+0x4a4>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 68,15,40,37,141,70,0,0 // movaps 0x468d(%rip),%xmm12 # 61a0 <_sk_callback_sse41+0x4b2>
+ .byte 68,15,40,37,77,72,0,0 // movaps 0x484d(%rip),%xmm12 # 6360 <_sk_callback_sse41+0x4b4>
.byte 65,15,89,228 // mulps %xmm12,%xmm4
- .byte 68,15,40,45,145,70,0,0 // movaps 0x4691(%rip),%xmm13 # 61b0 <_sk_callback_sse41+0x4c2>
+ .byte 68,15,40,45,81,72,0,0 // movaps 0x4851(%rip),%xmm13 # 6370 <_sk_callback_sse41+0x4c4>
.byte 65,15,88,229 // addps %xmm13,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 68,15,40,53,146,70,0,0 // movaps 0x4692(%rip),%xmm14 # 61c0 <_sk_callback_sse41+0x4d2>
+ .byte 68,15,40,53,82,72,0,0 // movaps 0x4852(%rip),%xmm14 # 6380 <_sk_callback_sse41+0x4d4>
.byte 65,15,88,230 // addps %xmm14,%xmm4
- .byte 68,15,40,61,150,70,0,0 // movaps 0x4696(%rip),%xmm15 # 61d0 <_sk_callback_sse41+0x4e2>
+ .byte 68,15,40,61,86,72,0,0 // movaps 0x4856(%rip),%xmm15 # 6390 <_sk_callback_sse41+0x4e4>
.byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4
@@ -29971,22 +30465,22 @@ _sk_to_srgb_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
- .byte 68,15,40,29,10,70,0,0 // movaps 0x460a(%rip),%xmm11 # 61e0 <_sk_callback_sse41+0x4f2>
+ .byte 68,15,40,29,202,71,0,0 // movaps 0x47ca(%rip),%xmm11 # 63a0 <_sk_callback_sse41+0x4f4>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 68,15,40,37,10,70,0,0 // movaps 0x460a(%rip),%xmm12 # 61f0 <_sk_callback_sse41+0x502>
+ .byte 68,15,40,37,202,71,0,0 // movaps 0x47ca(%rip),%xmm12 # 63b0 <_sk_callback_sse41+0x504>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,40,21,10,70,0,0 // movaps 0x460a(%rip),%xmm10 # 6200 <_sk_callback_sse41+0x512>
+ .byte 68,15,40,21,202,71,0,0 // movaps 0x47ca(%rip),%xmm10 # 63c0 <_sk_callback_sse41+0x514>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 68,15,40,45,10,70,0,0 // movaps 0x460a(%rip),%xmm13 # 6210 <_sk_callback_sse41+0x522>
+ .byte 68,15,40,45,202,71,0,0 // movaps 0x47ca(%rip),%xmm13 # 63d0 <_sk_callback_sse41+0x524>
.byte 69,15,88,253 // addps %xmm13,%xmm15
- .byte 68,15,40,53,14,70,0,0 // movaps 0x460e(%rip),%xmm14 # 6220 <_sk_callback_sse41+0x532>
+ .byte 68,15,40,53,206,71,0,0 // movaps 0x47ce(%rip),%xmm14 # 63e0 <_sk_callback_sse41+0x534>
.byte 69,15,88,198 // addps %xmm14,%xmm8
.byte 69,15,83,192 // rcpps %xmm8,%xmm8
.byte 69,15,89,199 // mulps %xmm15,%xmm8
- .byte 68,15,40,61,10,70,0,0 // movaps 0x460a(%rip),%xmm15 # 6230 <_sk_callback_sse41+0x542>
+ .byte 68,15,40,61,202,71,0,0 // movaps 0x47ca(%rip),%xmm15 # 63f0 <_sk_callback_sse41+0x544>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,82,202 // rsqrtps %xmm2,%xmm9
@@ -30039,7 +30533,7 @@ _sk_rgb_to_hsl_sse41:
.byte 68,15,93,226 // minps %xmm2,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,87,69,0,0 // movaps 0x4557(%rip),%xmm14 # 6240 <_sk_callback_sse41+0x552>
+ .byte 68,15,40,53,23,71,0,0 // movaps 0x4717(%rip),%xmm14 # 6400 <_sk_callback_sse41+0x554>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -30048,27 +30542,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,62,69,0,0 // andps 0x453e(%rip),%xmm15 # 6250 <_sk_callback_sse41+0x562>
+ .byte 68,15,84,61,254,70,0,0 // andps 0x46fe(%rip),%xmm15 # 6410 <_sk_callback_sse41+0x564>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,49,69,0,0 // movaps 0x4531(%rip),%xmm13 # 6260 <_sk_callback_sse41+0x572>
+ .byte 68,15,40,45,241,70,0,0 // movaps 0x46f1(%rip),%xmm13 # 6420 <_sk_callback_sse41+0x574>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,45,69,0,0 // addps 0x452d(%rip),%xmm8 # 6270 <_sk_callback_sse41+0x582>
+ .byte 68,15,88,5,237,70,0,0 // addps 0x46ed(%rip),%xmm8 # 6430 <_sk_callback_sse41+0x584>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,37,69,0,0 // mulps 0x4525(%rip),%xmm8 # 6280 <_sk_callback_sse41+0x592>
+ .byte 68,15,89,5,229,70,0,0 // mulps 0x46e5(%rip),%xmm8 # 6440 <_sk_callback_sse41+0x594>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,25,69,0,0 // movaps 0x4519(%rip),%xmm0 # 6290 <_sk_callback_sse41+0x5a2>
+ .byte 15,40,5,217,70,0,0 // movaps 0x46d9(%rip),%xmm0 # 6450 <_sk_callback_sse41+0x5a4>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -30090,7 +30584,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,223,68,0,0 // movaps 0x44df(%rip),%xmm9 # 62a0 <_sk_callback_sse41+0x5b2>
+ .byte 68,15,40,13,159,70,0,0 // movaps 0x469f(%rip),%xmm9 # 6460 <_sk_callback_sse41+0x5b4>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -30103,19 +30597,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,186,68,0,0 // movaps 0x44ba(%rip),%xmm14 # 62b0 <_sk_callback_sse41+0x5c2>
+ .byte 68,15,40,53,122,70,0,0 // movaps 0x467a(%rip),%xmm14 # 6470 <_sk_callback_sse41+0x5c4>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,179,68,0,0 // movaps 0x44b3(%rip),%xmm11 # 62c0 <_sk_callback_sse41+0x5d2>
+ .byte 68,15,40,29,115,70,0,0 // movaps 0x4673(%rip),%xmm11 # 6480 <_sk_callback_sse41+0x5d4>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,172,68,0,0 // movaps 0x44ac(%rip),%xmm7 # 62d0 <_sk_callback_sse41+0x5e2>
+ .byte 15,40,61,108,70,0,0 // movaps 0x466c(%rip),%xmm7 # 6490 <_sk_callback_sse41+0x5e4>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,173,68,0,0 // movaps 0x44ad(%rip),%xmm3 # 62e0 <_sk_callback_sse41+0x5f2>
+ .byte 15,40,29,109,70,0,0 // movaps 0x466d(%rip),%xmm3 # 64a0 <_sk_callback_sse41+0x5f4>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -30125,7 +30619,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,140,68,0,0 // movaps 0x448c(%rip),%xmm12 # 62f0 <_sk_callback_sse41+0x602>
+ .byte 68,15,40,37,76,70,0,0 // movaps 0x464c(%rip),%xmm12 # 64b0 <_sk_callback_sse41+0x604>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -30159,7 +30653,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,4,68,0,0 // addps 0x4404(%rip),%xmm10 # 6300 <_sk_callback_sse41+0x612>
+ .byte 68,15,88,21,196,69,0,0 // addps 0x45c4(%rip),%xmm10 # 64c0 <_sk_callback_sse41+0x614>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -30216,9 +30710,9 @@ _sk_scale_u8_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,52 // jne 1fe3 <_sk_scale_u8_sse41+0x4c>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,81,67,0,0 // pand 0x4351(%rip),%xmm8 # 6310 <_sk_callback_sse41+0x622>
+ .byte 102,68,15,219,5,17,69,0,0 // pand 0x4511(%rip),%xmm8 # 64d0 <_sk_callback_sse41+0x624>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,85,67,0,0 // mulps 0x4355(%rip),%xmm8 # 6320 <_sk_callback_sse41+0x632>
+ .byte 68,15,89,5,21,69,0,0 // mulps 0x4515(%rip),%xmm8 # 64e0 <_sk_callback_sse41+0x634>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -30282,9 +30776,9 @@ _sk_lerp_u8_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 117,72 // jne 20d2 <_sk_lerp_u8_sse41+0x60>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,150,66,0,0 // pand 0x4296(%rip),%xmm8 # 6330 <_sk_callback_sse41+0x642>
+ .byte 102,68,15,219,5,86,68,0,0 // pand 0x4456(%rip),%xmm8 # 64f0 <_sk_callback_sse41+0x644>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,154,66,0,0 // mulps 0x429a(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x652>
+ .byte 68,15,89,5,90,68,0,0 // mulps 0x445a(%rip),%xmm8 # 6500 <_sk_callback_sse41+0x654>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -30334,17 +30828,17 @@ _sk_lerp_565_sse41:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,152,0,0,0 // jne 21e3 <_sk_lerp_565_sse41+0xb7>
.byte 102,71,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm10
- .byte 102,68,15,111,5,245,65,0,0 // movdqa 0x41f5(%rip),%xmm8 # 6350 <_sk_callback_sse41+0x662>
+ .byte 102,68,15,111,5,181,67,0,0 // movdqa 0x43b5(%rip),%xmm8 # 6510 <_sk_callback_sse41+0x664>
.byte 102,69,15,219,194 // pand %xmm10,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,244,65,0,0 // mulps 0x41f4(%rip),%xmm8 # 6360 <_sk_callback_sse41+0x672>
- .byte 102,68,15,111,13,251,65,0,0 // movdqa 0x41fb(%rip),%xmm9 # 6370 <_sk_callback_sse41+0x682>
+ .byte 68,15,89,5,180,67,0,0 // mulps 0x43b4(%rip),%xmm8 # 6520 <_sk_callback_sse41+0x674>
+ .byte 102,68,15,111,13,187,67,0,0 // movdqa 0x43bb(%rip),%xmm9 # 6530 <_sk_callback_sse41+0x684>
.byte 102,69,15,219,202 // pand %xmm10,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,250,65,0,0 // mulps 0x41fa(%rip),%xmm9 # 6380 <_sk_callback_sse41+0x692>
- .byte 102,68,15,219,21,1,66,0,0 // pand 0x4201(%rip),%xmm10 # 6390 <_sk_callback_sse41+0x6a2>
+ .byte 68,15,89,13,186,67,0,0 // mulps 0x43ba(%rip),%xmm9 # 6540 <_sk_callback_sse41+0x694>
+ .byte 102,68,15,219,21,193,67,0,0 // pand 0x43c1(%rip),%xmm10 # 6550 <_sk_callback_sse41+0x6a4>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,5,66,0,0 // mulps 0x4205(%rip),%xmm10 # 63a0 <_sk_callback_sse41+0x6b2>
+ .byte 68,15,89,21,197,67,0,0 // mulps 0x43c5(%rip),%xmm10 # 6560 <_sk_callback_sse41+0x6b4>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -30398,7 +30892,7 @@ _sk_load_tables_sse41:
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,15,111,5,82,65,0,0 // movdqa 0x4152(%rip),%xmm0 # 63b0 <_sk_callback_sse41+0x6c2>
+ .byte 102,15,111,5,18,67,0,0 // movdqa 0x4312(%rip),%xmm0 # 6570 <_sk_callback_sse41+0x6c4>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -30413,7 +30907,7 @@ _sk_load_tables_sse41:
.byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0
.byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,13,65,0,0 // pshufb 0x410d(%rip),%xmm1 # 63c0 <_sk_callback_sse41+0x6d2>
+ .byte 102,15,56,0,13,205,66,0,0 // pshufb 0x42cd(%rip),%xmm1 # 6580 <_sk_callback_sse41+0x6d4>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
.byte 68,15,182,211 // movzbl %bl,%r10d
@@ -30428,7 +30922,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,72,24 // mov 0x18(%rax),%r9
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,201,64,0,0 // pshufb 0x40c9(%rip),%xmm2 # 63d0 <_sk_callback_sse41+0x6e2>
+ .byte 102,15,56,0,21,137,66,0,0 // pshufb 0x4289(%rip),%xmm2 # 6590 <_sk_callback_sse41+0x6e4>
.byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,208 // movzbl %al,%r10d
@@ -30443,7 +30937,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,134,64,0,0 // mulps 0x4086(%rip),%xmm3 # 63e0 <_sk_callback_sse41+0x6f2>
+ .byte 15,89,29,70,66,0,0 // mulps 0x4246(%rip),%xmm3 # 65a0 <_sk_callback_sse41+0x6f4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -30486,7 +30980,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,244,63,0,0 // movdqa 0x3ff4(%rip),%xmm8 # 63f0 <_sk_callback_sse41+0x702>
+ .byte 102,68,15,111,5,180,65,0,0 // movdqa 0x41b4(%rip),%xmm8 # 65b0 <_sk_callback_sse41+0x704>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -30504,7 +30998,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
.byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
- .byte 102,15,56,0,13,163,63,0,0 // pshufb 0x3fa3(%rip),%xmm1 # 6400 <_sk_callback_sse41+0x712>
+ .byte 102,15,56,0,13,99,65,0,0 // pshufb 0x4163(%rip),%xmm1 # 65c0 <_sk_callback_sse41+0x714>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -30540,7 +31034,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,241,62,0,0 // mulps 0x3ef1(%rip),%xmm3 # 6410 <_sk_callback_sse41+0x722>
+ .byte 15,89,29,177,64,0,0 // mulps 0x40b1(%rip),%xmm3 # 65d0 <_sk_callback_sse41+0x724>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -30582,7 +31076,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,102,62,0,0 // movdqa 0x3e66(%rip),%xmm8 # 6420 <_sk_callback_sse41+0x732>
+ .byte 102,68,15,111,5,38,64,0,0 // movdqa 0x4026(%rip),%xmm8 # 65e0 <_sk_callback_sse41+0x734>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -30600,7 +31094,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0
.byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
- .byte 102,15,56,0,13,21,62,0,0 // pshufb 0x3e15(%rip),%xmm1 # 6430 <_sk_callback_sse41+0x742>
+ .byte 102,15,56,0,13,213,63,0,0 // pshufb 0x3fd5(%rip),%xmm1 # 65f0 <_sk_callback_sse41+0x744>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -30631,7 +31125,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,128,61,0,0 // movaps 0x3d80(%rip),%xmm3 # 6440 <_sk_callback_sse41+0x752>
+ .byte 15,40,29,64,63,0,0 // movaps 0x3f40(%rip),%xmm3 # 6600 <_sk_callback_sse41+0x754>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -30665,7 +31159,7 @@ _sk_byte_tables_sse41:
.byte 65,84 // push %r12
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,24,61,0,0 // movaps 0x3d18(%rip),%xmm8 # 6450 <_sk_callback_sse41+0x762>
+ .byte 68,15,40,5,216,62,0,0 // movaps 0x3ed8(%rip),%xmm8 # 6610 <_sk_callback_sse41+0x764>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
@@ -30684,7 +31178,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,201,60,0,0 // movaps 0x3cc9(%rip),%xmm9 # 6460 <_sk_callback_sse41+0x772>
+ .byte 68,15,40,13,137,62,0,0 // movaps 0x3e89(%rip),%xmm9 # 6620 <_sk_callback_sse41+0x774>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -30780,7 +31274,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,65,59,0,0 // movaps 0x3b41(%rip),%xmm9 # 6470 <_sk_callback_sse41+0x782>
+ .byte 68,15,40,13,1,61,0,0 // movaps 0x3d01(%rip),%xmm9 # 6630 <_sk_callback_sse41+0x784>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -30967,31 +31461,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,137,56,0,0 // mulps 0x3889(%rip),%xmm8 # 6480 <_sk_callback_sse41+0x792>
- .byte 68,15,84,21,145,56,0,0 // andps 0x3891(%rip),%xmm10 # 6490 <_sk_callback_sse41+0x7a2>
- .byte 68,15,86,21,153,56,0,0 // orps 0x3899(%rip),%xmm10 # 64a0 <_sk_callback_sse41+0x7b2>
- .byte 68,15,88,5,161,56,0,0 // addps 0x38a1(%rip),%xmm8 # 64b0 <_sk_callback_sse41+0x7c2>
- .byte 68,15,40,37,169,56,0,0 // movaps 0x38a9(%rip),%xmm12 # 64c0 <_sk_callback_sse41+0x7d2>
+ .byte 68,15,89,5,73,58,0,0 // mulps 0x3a49(%rip),%xmm8 # 6640 <_sk_callback_sse41+0x794>
+ .byte 68,15,84,21,81,58,0,0 // andps 0x3a51(%rip),%xmm10 # 6650 <_sk_callback_sse41+0x7a4>
+ .byte 68,15,86,21,89,58,0,0 // orps 0x3a59(%rip),%xmm10 # 6660 <_sk_callback_sse41+0x7b4>
+ .byte 68,15,88,5,97,58,0,0 // addps 0x3a61(%rip),%xmm8 # 6670 <_sk_callback_sse41+0x7c4>
+ .byte 68,15,40,37,105,58,0,0 // movaps 0x3a69(%rip),%xmm12 # 6680 <_sk_callback_sse41+0x7d4>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,169,56,0,0 // addps 0x38a9(%rip),%xmm10 # 64d0 <_sk_callback_sse41+0x7e2>
- .byte 68,15,40,37,177,56,0,0 // movaps 0x38b1(%rip),%xmm12 # 64e0 <_sk_callback_sse41+0x7f2>
+ .byte 68,15,88,21,105,58,0,0 // addps 0x3a69(%rip),%xmm10 # 6690 <_sk_callback_sse41+0x7e4>
+ .byte 68,15,40,37,113,58,0,0 // movaps 0x3a71(%rip),%xmm12 # 66a0 <_sk_callback_sse41+0x7f4>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,158,56,0,0 // addps 0x389e(%rip),%xmm8 # 64f0 <_sk_callback_sse41+0x802>
- .byte 68,15,40,21,166,56,0,0 // movaps 0x38a6(%rip),%xmm10 # 6500 <_sk_callback_sse41+0x812>
+ .byte 68,15,88,5,94,58,0,0 // addps 0x3a5e(%rip),%xmm8 # 66b0 <_sk_callback_sse41+0x804>
+ .byte 68,15,40,21,102,58,0,0 // movaps 0x3a66(%rip),%xmm10 # 66c0 <_sk_callback_sse41+0x814>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,166,56,0,0 // movaps 0x38a6(%rip),%xmm10 # 6510 <_sk_callback_sse41+0x822>
+ .byte 68,15,40,21,102,58,0,0 // movaps 0x3a66(%rip),%xmm10 # 66d0 <_sk_callback_sse41+0x824>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,170,56,0,0 // movaps 0x38aa(%rip),%xmm11 # 6520 <_sk_callback_sse41+0x832>
+ .byte 68,15,40,29,106,58,0,0 // movaps 0x3a6a(%rip),%xmm11 # 66e0 <_sk_callback_sse41+0x834>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,170,56,0,0 // mulps 0x38aa(%rip),%xmm11 # 6530 <_sk_callback_sse41+0x842>
+ .byte 68,15,89,29,106,58,0,0 // mulps 0x3a6a(%rip),%xmm11 # 66f0 <_sk_callback_sse41+0x844>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -30999,7 +31493,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,145,56,0,0 // minps 0x3891(%rip),%xmm8 # 6540 <_sk_callback_sse41+0x852>
+ .byte 68,15,93,5,81,58,0,0 // minps 0x3a51(%rip),%xmm8 # 6700 <_sk_callback_sse41+0x854>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31029,31 +31523,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,50,56,0,0 // mulps 0x3832(%rip),%xmm12 # 6550 <_sk_callback_sse41+0x862>
- .byte 68,15,84,29,58,56,0,0 // andps 0x383a(%rip),%xmm11 # 6560 <_sk_callback_sse41+0x872>
- .byte 68,15,86,29,66,56,0,0 // orps 0x3842(%rip),%xmm11 # 6570 <_sk_callback_sse41+0x882>
- .byte 68,15,88,37,74,56,0,0 // addps 0x384a(%rip),%xmm12 # 6580 <_sk_callback_sse41+0x892>
- .byte 15,40,13,83,56,0,0 // movaps 0x3853(%rip),%xmm1 # 6590 <_sk_callback_sse41+0x8a2>
+ .byte 68,15,89,37,242,57,0,0 // mulps 0x39f2(%rip),%xmm12 # 6710 <_sk_callback_sse41+0x864>
+ .byte 68,15,84,29,250,57,0,0 // andps 0x39fa(%rip),%xmm11 # 6720 <_sk_callback_sse41+0x874>
+ .byte 68,15,86,29,2,58,0,0 // orps 0x3a02(%rip),%xmm11 # 6730 <_sk_callback_sse41+0x884>
+ .byte 68,15,88,37,10,58,0,0 // addps 0x3a0a(%rip),%xmm12 # 6740 <_sk_callback_sse41+0x894>
+ .byte 15,40,13,19,58,0,0 // movaps 0x3a13(%rip),%xmm1 # 6750 <_sk_callback_sse41+0x8a4>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,83,56,0,0 // addps 0x3853(%rip),%xmm11 # 65a0 <_sk_callback_sse41+0x8b2>
- .byte 15,40,13,92,56,0,0 // movaps 0x385c(%rip),%xmm1 # 65b0 <_sk_callback_sse41+0x8c2>
+ .byte 68,15,88,29,19,58,0,0 // addps 0x3a13(%rip),%xmm11 # 6760 <_sk_callback_sse41+0x8b4>
+ .byte 15,40,13,28,58,0,0 // movaps 0x3a1c(%rip),%xmm1 # 6770 <_sk_callback_sse41+0x8c4>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,73,56,0,0 // addps 0x3849(%rip),%xmm12 # 65c0 <_sk_callback_sse41+0x8d2>
- .byte 15,40,13,82,56,0,0 // movaps 0x3852(%rip),%xmm1 # 65d0 <_sk_callback_sse41+0x8e2>
+ .byte 68,15,88,37,9,58,0,0 // addps 0x3a09(%rip),%xmm12 # 6780 <_sk_callback_sse41+0x8d4>
+ .byte 15,40,13,18,58,0,0 // movaps 0x3a12(%rip),%xmm1 # 6790 <_sk_callback_sse41+0x8e4>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,82,56,0,0 // movaps 0x3852(%rip),%xmm10 # 65e0 <_sk_callback_sse41+0x8f2>
+ .byte 68,15,40,21,18,58,0,0 // movaps 0x3a12(%rip),%xmm10 # 67a0 <_sk_callback_sse41+0x8f4>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,87,56,0,0 // movaps 0x3857(%rip),%xmm1 # 65f0 <_sk_callback_sse41+0x902>
+ .byte 15,40,13,23,58,0,0 // movaps 0x3a17(%rip),%xmm1 # 67b0 <_sk_callback_sse41+0x904>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,88,56,0,0 // mulps 0x3858(%rip),%xmm1 # 6600 <_sk_callback_sse41+0x912>
+ .byte 15,89,13,24,58,0,0 // mulps 0x3a18(%rip),%xmm1 # 67c0 <_sk_callback_sse41+0x914>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -31061,7 +31555,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,67,56,0,0 // minps 0x3843(%rip),%xmm1 # 6610 <_sk_callback_sse41+0x922>
+ .byte 15,93,13,3,58,0,0 // minps 0x3a03(%rip),%xmm1 # 67d0 <_sk_callback_sse41+0x924>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31091,31 +31585,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,228,55,0,0 // mulps 0x37e4(%rip),%xmm12 # 6620 <_sk_callback_sse41+0x932>
- .byte 68,15,84,29,236,55,0,0 // andps 0x37ec(%rip),%xmm11 # 6630 <_sk_callback_sse41+0x942>
- .byte 68,15,86,29,244,55,0,0 // orps 0x37f4(%rip),%xmm11 # 6640 <_sk_callback_sse41+0x952>
- .byte 68,15,88,37,252,55,0,0 // addps 0x37fc(%rip),%xmm12 # 6650 <_sk_callback_sse41+0x962>
- .byte 15,40,21,5,56,0,0 // movaps 0x3805(%rip),%xmm2 # 6660 <_sk_callback_sse41+0x972>
+ .byte 68,15,89,37,164,57,0,0 // mulps 0x39a4(%rip),%xmm12 # 67e0 <_sk_callback_sse41+0x934>
+ .byte 68,15,84,29,172,57,0,0 // andps 0x39ac(%rip),%xmm11 # 67f0 <_sk_callback_sse41+0x944>
+ .byte 68,15,86,29,180,57,0,0 // orps 0x39b4(%rip),%xmm11 # 6800 <_sk_callback_sse41+0x954>
+ .byte 68,15,88,37,188,57,0,0 // addps 0x39bc(%rip),%xmm12 # 6810 <_sk_callback_sse41+0x964>
+ .byte 15,40,21,197,57,0,0 // movaps 0x39c5(%rip),%xmm2 # 6820 <_sk_callback_sse41+0x974>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,5,56,0,0 // addps 0x3805(%rip),%xmm11 # 6670 <_sk_callback_sse41+0x982>
- .byte 15,40,21,14,56,0,0 // movaps 0x380e(%rip),%xmm2 # 6680 <_sk_callback_sse41+0x992>
+ .byte 68,15,88,29,197,57,0,0 // addps 0x39c5(%rip),%xmm11 # 6830 <_sk_callback_sse41+0x984>
+ .byte 15,40,21,206,57,0,0 // movaps 0x39ce(%rip),%xmm2 # 6840 <_sk_callback_sse41+0x994>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,251,55,0,0 // addps 0x37fb(%rip),%xmm12 # 6690 <_sk_callback_sse41+0x9a2>
- .byte 15,40,21,4,56,0,0 // movaps 0x3804(%rip),%xmm2 # 66a0 <_sk_callback_sse41+0x9b2>
+ .byte 68,15,88,37,187,57,0,0 // addps 0x39bb(%rip),%xmm12 # 6850 <_sk_callback_sse41+0x9a4>
+ .byte 15,40,21,196,57,0,0 // movaps 0x39c4(%rip),%xmm2 # 6860 <_sk_callback_sse41+0x9b4>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,4,56,0,0 // movaps 0x3804(%rip),%xmm10 # 66b0 <_sk_callback_sse41+0x9c2>
+ .byte 68,15,40,21,196,57,0,0 // movaps 0x39c4(%rip),%xmm10 # 6870 <_sk_callback_sse41+0x9c4>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,9,56,0,0 // movaps 0x3809(%rip),%xmm2 # 66c0 <_sk_callback_sse41+0x9d2>
+ .byte 15,40,21,201,57,0,0 // movaps 0x39c9(%rip),%xmm2 # 6880 <_sk_callback_sse41+0x9d4>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,10,56,0,0 // mulps 0x380a(%rip),%xmm2 # 66d0 <_sk_callback_sse41+0x9e2>
+ .byte 15,89,21,202,57,0,0 // mulps 0x39ca(%rip),%xmm2 # 6890 <_sk_callback_sse41+0x9e4>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -31123,7 +31617,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,245,55,0,0 // minps 0x37f5(%rip),%xmm2 # 66e0 <_sk_callback_sse41+0x9f2>
+ .byte 15,93,21,181,57,0,0 // minps 0x39b5(%rip),%xmm2 # 68a0 <_sk_callback_sse41+0x9f4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31153,31 +31647,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,150,55,0,0 // mulps 0x3796(%rip),%xmm12 # 66f0 <_sk_callback_sse41+0xa02>
- .byte 68,15,84,29,158,55,0,0 // andps 0x379e(%rip),%xmm11 # 6700 <_sk_callback_sse41+0xa12>
- .byte 68,15,86,29,166,55,0,0 // orps 0x37a6(%rip),%xmm11 # 6710 <_sk_callback_sse41+0xa22>
- .byte 68,15,88,37,174,55,0,0 // addps 0x37ae(%rip),%xmm12 # 6720 <_sk_callback_sse41+0xa32>
- .byte 15,40,29,183,55,0,0 // movaps 0x37b7(%rip),%xmm3 # 6730 <_sk_callback_sse41+0xa42>
+ .byte 68,15,89,37,86,57,0,0 // mulps 0x3956(%rip),%xmm12 # 68b0 <_sk_callback_sse41+0xa04>
+ .byte 68,15,84,29,94,57,0,0 // andps 0x395e(%rip),%xmm11 # 68c0 <_sk_callback_sse41+0xa14>
+ .byte 68,15,86,29,102,57,0,0 // orps 0x3966(%rip),%xmm11 # 68d0 <_sk_callback_sse41+0xa24>
+ .byte 68,15,88,37,110,57,0,0 // addps 0x396e(%rip),%xmm12 # 68e0 <_sk_callback_sse41+0xa34>
+ .byte 15,40,29,119,57,0,0 // movaps 0x3977(%rip),%xmm3 # 68f0 <_sk_callback_sse41+0xa44>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,183,55,0,0 // addps 0x37b7(%rip),%xmm11 # 6740 <_sk_callback_sse41+0xa52>
- .byte 15,40,29,192,55,0,0 // movaps 0x37c0(%rip),%xmm3 # 6750 <_sk_callback_sse41+0xa62>
+ .byte 68,15,88,29,119,57,0,0 // addps 0x3977(%rip),%xmm11 # 6900 <_sk_callback_sse41+0xa54>
+ .byte 15,40,29,128,57,0,0 // movaps 0x3980(%rip),%xmm3 # 6910 <_sk_callback_sse41+0xa64>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,173,55,0,0 // addps 0x37ad(%rip),%xmm12 # 6760 <_sk_callback_sse41+0xa72>
- .byte 15,40,29,182,55,0,0 // movaps 0x37b6(%rip),%xmm3 # 6770 <_sk_callback_sse41+0xa82>
+ .byte 68,15,88,37,109,57,0,0 // addps 0x396d(%rip),%xmm12 # 6920 <_sk_callback_sse41+0xa74>
+ .byte 15,40,29,118,57,0,0 // movaps 0x3976(%rip),%xmm3 # 6930 <_sk_callback_sse41+0xa84>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,182,55,0,0 // movaps 0x37b6(%rip),%xmm10 # 6780 <_sk_callback_sse41+0xa92>
+ .byte 68,15,40,21,118,57,0,0 // movaps 0x3976(%rip),%xmm10 # 6940 <_sk_callback_sse41+0xa94>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,187,55,0,0 // movaps 0x37bb(%rip),%xmm3 # 6790 <_sk_callback_sse41+0xaa2>
+ .byte 15,40,29,123,57,0,0 // movaps 0x397b(%rip),%xmm3 # 6950 <_sk_callback_sse41+0xaa4>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,188,55,0,0 // mulps 0x37bc(%rip),%xmm3 # 67a0 <_sk_callback_sse41+0xab2>
+ .byte 15,89,29,124,57,0,0 // mulps 0x397c(%rip),%xmm3 # 6960 <_sk_callback_sse41+0xab4>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -31185,39 +31679,149 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,167,55,0,0 // minps 0x37a7(%rip),%xmm3 # 67b0 <_sk_callback_sse41+0xac2>
+ .byte 15,93,29,103,57,0,0 // minps 0x3967(%rip),%xmm3 # 6970 <_sk_callback_sse41+0xac4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_gamma_sse41
+.globl _sk_gamma_sse41
+FUNCTION(_sk_gamma_sse41)
+_sk_gamma_sse41:
+ .byte 15,41,124,36,232 // movaps %xmm7,-0x18(%rsp)
+ .byte 15,41,116,36,216 // movaps %xmm6,-0x28(%rsp)
+ .byte 15,41,108,36,200 // movaps %xmm5,-0x38(%rsp)
+ .byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
+ .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
+ .byte 15,89,5,70,57,0,0 // mulps 0x3946(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xad4>
+ .byte 68,15,40,53,78,57,0,0 // movaps 0x394e(%rip),%xmm14 # 6990 <_sk_callback_sse41+0xae4>
+ .byte 65,15,84,214 // andps %xmm14,%xmm2
+ .byte 68,15,40,37,82,57,0,0 // movaps 0x3952(%rip),%xmm12 # 69a0 <_sk_callback_sse41+0xaf4>
+ .byte 65,15,86,212 // orps %xmm12,%xmm2
+ .byte 68,15,40,21,86,57,0,0 // movaps 0x3956(%rip),%xmm10 # 69b0 <_sk_callback_sse41+0xb04>
+ .byte 65,15,88,194 // addps %xmm10,%xmm0
+ .byte 68,15,40,29,90,57,0,0 // movaps 0x395a(%rip),%xmm11 # 69c0 <_sk_callback_sse41+0xb14>
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 65,15,89,227 // mulps %xmm11,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 68,15,40,13,88,57,0,0 // movaps 0x3958(%rip),%xmm9 # 69d0 <_sk_callback_sse41+0xb24>
+ .byte 65,15,88,209 // addps %xmm9,%xmm2
+ .byte 68,15,40,45,92,57,0,0 // movaps 0x395c(%rip),%xmm13 # 69e0 <_sk_callback_sse41+0xb34>
+ .byte 65,15,40,229 // movaps %xmm13,%xmm4
+ .byte 15,94,226 // divps %xmm2,%xmm4
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 243,68,15,16,0 // movss (%rax),%xmm8
+ .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 102,15,58,8,208,1 // roundps $0x1,%xmm0,%xmm2
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,92,226 // subps %xmm2,%xmm4
+ .byte 15,40,53,63,57,0,0 // movaps 0x393f(%rip),%xmm6 # 69f0 <_sk_callback_sse41+0xb44>
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,40,61,85,57,0,0 // movaps 0x3955(%rip),%xmm7 # 6a10 <_sk_callback_sse41+0xb64>
+ .byte 15,40,239 // movaps %xmm7,%xmm5
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 15,40,212 // movaps %xmm4,%xmm2
+ .byte 15,40,37,53,57,0,0 // movaps 0x3935(%rip),%xmm4 # 6a00 <_sk_callback_sse41+0xb54>
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,92,194 // subps %xmm2,%xmm0
+ .byte 68,15,40,61,71,57,0,0 // movaps 0x3947(%rip),%xmm15 # 6a20 <_sk_callback_sse41+0xb74>
+ .byte 65,15,40,215 // movaps %xmm15,%xmm2
+ .byte 15,94,213 // divps %xmm5,%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
+ .byte 15,89,5,147,56,0,0 // mulps 0x3893(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xad4>
+ .byte 65,15,84,206 // andps %xmm14,%xmm1
+ .byte 65,15,86,204 // orps %xmm12,%xmm1
+ .byte 65,15,88,194 // addps %xmm10,%xmm0
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 65,15,89,235 // mulps %xmm11,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,88,201 // addps %xmm9,%xmm1
+ .byte 69,15,40,241 // movaps %xmm9,%xmm14
+ .byte 65,15,40,237 // movaps %xmm13,%xmm5
+ .byte 15,94,233 // divps %xmm1,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 102,15,58,8,200,1 // roundps $0x1,%xmm0,%xmm1
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 68,15,40,206 // movaps %xmm6,%xmm9
+ .byte 15,40,247 // movaps %xmm7,%xmm6
+ .byte 15,92,245 // subps %xmm5,%xmm6
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,40,207 // movaps %xmm15,%xmm1
+ .byte 15,94,206 // divps %xmm6,%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
+ .byte 15,89,5,52,56,0,0 // mulps 0x3834(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xad4>
+ .byte 15,84,29,61,56,0,0 // andps 0x383d(%rip),%xmm3 # 6990 <_sk_callback_sse41+0xae4>
+ .byte 65,15,86,220 // orps %xmm12,%xmm3
+ .byte 65,15,88,194 // addps %xmm10,%xmm0
+ .byte 68,15,89,219 // mulps %xmm3,%xmm11
+ .byte 65,15,92,195 // subps %xmm11,%xmm0
+ .byte 65,15,88,222 // addps %xmm14,%xmm3
+ .byte 68,15,94,235 // divps %xmm3,%xmm13
+ .byte 65,15,92,197 // subps %xmm13,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 102,15,58,8,216,1 // roundps $0x1,%xmm0,%xmm3
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,92,235 // subps %xmm3,%xmm5
+ .byte 65,15,88,193 // addps %xmm9,%xmm0
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,92,253 // subps %xmm5,%xmm7
+ .byte 68,15,94,255 // divps %xmm7,%xmm15
+ .byte 68,15,88,248 // addps %xmm0,%xmm15
+ .byte 15,40,5,149,56,0,0 // movaps 0x3895(%rip),%xmm0 # 6a30 <_sk_callback_sse41+0xb84>
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 68,15,89,248 // mulps %xmm0,%xmm15
+ .byte 102,15,91,194 // cvtps2dq %xmm2,%xmm0
+ .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
+ .byte 102,65,15,91,215 // cvtps2dq %xmm15,%xmm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,92,36,168 // movaps -0x58(%rsp),%xmm3
+ .byte 15,40,100,36,184 // movaps -0x48(%rsp),%xmm4
+ .byte 15,40,108,36,200 // movaps -0x38(%rsp),%xmm5
+ .byte 15,40,116,36,216 // movaps -0x28(%rsp),%xmm6
+ .byte 15,40,124,36,232 // movaps -0x18(%rsp),%xmm7
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_lab_to_xyz_sse41
.globl _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,163,55,0,0 // mulps 0x37a3(%rip),%xmm8 # 67c0 <_sk_callback_sse41+0xad2>
- .byte 68,15,40,13,171,55,0,0 // movaps 0x37ab(%rip),%xmm9 # 67d0 <_sk_callback_sse41+0xae2>
+ .byte 68,15,89,5,101,56,0,0 // mulps 0x3865(%rip),%xmm8 # 6a40 <_sk_callback_sse41+0xb94>
+ .byte 68,15,40,13,109,56,0,0 // movaps 0x386d(%rip),%xmm9 # 6a50 <_sk_callback_sse41+0xba4>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,176,55,0,0 // movaps 0x37b0(%rip),%xmm0 # 67e0 <_sk_callback_sse41+0xaf2>
+ .byte 15,40,5,114,56,0,0 // movaps 0x3872(%rip),%xmm0 # 6a60 <_sk_callback_sse41+0xbb4>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,174,55,0,0 // addps 0x37ae(%rip),%xmm8 # 67f0 <_sk_callback_sse41+0xb02>
- .byte 68,15,89,5,182,55,0,0 // mulps 0x37b6(%rip),%xmm8 # 6800 <_sk_callback_sse41+0xb12>
- .byte 15,89,13,191,55,0,0 // mulps 0x37bf(%rip),%xmm1 # 6810 <_sk_callback_sse41+0xb22>
+ .byte 68,15,88,5,112,56,0,0 // addps 0x3870(%rip),%xmm8 # 6a70 <_sk_callback_sse41+0xbc4>
+ .byte 68,15,89,5,120,56,0,0 // mulps 0x3878(%rip),%xmm8 # 6a80 <_sk_callback_sse41+0xbd4>
+ .byte 15,89,13,129,56,0,0 // mulps 0x3881(%rip),%xmm1 # 6a90 <_sk_callback_sse41+0xbe4>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,196,55,0,0 // mulps 0x37c4(%rip),%xmm2 # 6820 <_sk_callback_sse41+0xb32>
+ .byte 15,89,21,134,56,0,0 // mulps 0x3886(%rip),%xmm2 # 6aa0 <_sk_callback_sse41+0xbf4>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,184,55,0,0 // movaps 0x37b8(%rip),%xmm9 # 6830 <_sk_callback_sse41+0xb42>
+ .byte 68,15,40,13,122,56,0,0 // movaps 0x387a(%rip),%xmm9 # 6ab0 <_sk_callback_sse41+0xc04>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,184,55,0,0 // movaps 0x37b8(%rip),%xmm2 # 6840 <_sk_callback_sse41+0xb52>
+ .byte 15,40,21,122,56,0,0 // movaps 0x387a(%rip),%xmm2 # 6ac0 <_sk_callback_sse41+0xc14>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,189,55,0,0 // movaps 0x37bd(%rip),%xmm12 # 6850 <_sk_callback_sse41+0xb62>
+ .byte 68,15,40,37,127,56,0,0 // movaps 0x387f(%rip),%xmm12 # 6ad0 <_sk_callback_sse41+0xc24>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -31236,8 +31840,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,118,55,0,0 // mulps 0x3776(%rip),%xmm1 # 6860 <_sk_callback_sse41+0xb72>
- .byte 15,89,21,127,55,0,0 // mulps 0x377f(%rip),%xmm2 # 6870 <_sk_callback_sse41+0xb82>
+ .byte 15,89,13,56,56,0,0 // mulps 0x3838(%rip),%xmm1 # 6ae0 <_sk_callback_sse41+0xc34>
+ .byte 15,89,21,65,56,0,0 // mulps 0x3841(%rip),%xmm2 # 6af0 <_sk_callback_sse41+0xc44>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -31254,11 +31858,11 @@ _sk_load_a8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 313b <_sk_load_a8_sse41+0x3f>
+ .byte 117,39 // jne 32f9 <_sk_load_a8_sse41+0x3f>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,93,55,0,0 // pand 0x375d(%rip),%xmm0 # 6880 <_sk_callback_sse41+0xb92>
+ .byte 102,15,219,5,31,56,0,0 // pand 0x381f(%rip),%xmm0 # 6b00 <_sk_callback_sse41+0xc54>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,99,55,0,0 // mulps 0x3763(%rip),%xmm3 # 6890 <_sk_callback_sse41+0xba2>
+ .byte 15,89,29,37,56,0,0 // mulps 0x3825(%rip),%xmm3 # 6b10 <_sk_callback_sse41+0xc64>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -31267,12 +31871,12 @@ _sk_load_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 317d <_sk_load_a8_sse41+0x81>
+ .byte 116,53 // je 333b <_sk_load_a8_sse41+0x81>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3167 <_sk_load_a8_sse41+0x6b>
+ .byte 116,21 // je 3325 <_sk_load_a8_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 311b <_sk_load_a8_sse41+0x1f>
+ .byte 117,195 // jne 32d9 <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -31280,10 +31884,10 @@ _sk_load_a8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,158 // jmp 311b <_sk_load_a8_sse41+0x1f>
+ .byte 235,158 // jmp 32d9 <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,147 // jmp 311b <_sk_load_a8_sse41+0x1f>
+ .byte 235,147 // jmp 32d9 <_sk_load_a8_sse41+0x1f>
HIDDEN _sk_load_a8_dst_sse41
.globl _sk_load_a8_dst_sse41
@@ -31296,11 +31900,11 @@ _sk_load_a8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 31c7 <_sk_load_a8_dst_sse41+0x3f>
+ .byte 117,39 // jne 3385 <_sk_load_a8_dst_sse41+0x3f>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,241,54,0,0 // pand 0x36f1(%rip),%xmm4 # 68a0 <_sk_callback_sse41+0xbb2>
+ .byte 102,15,219,37,179,55,0,0 // pand 0x37b3(%rip),%xmm4 # 6b20 <_sk_callback_sse41+0xc74>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,247,54,0,0 // mulps 0x36f7(%rip),%xmm7 # 68b0 <_sk_callback_sse41+0xbc2>
+ .byte 15,89,61,185,55,0,0 // mulps 0x37b9(%rip),%xmm7 # 6b30 <_sk_callback_sse41+0xc84>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
@@ -31309,12 +31913,12 @@ _sk_load_a8_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3209 <_sk_load_a8_dst_sse41+0x81>
+ .byte 116,53 // je 33c7 <_sk_load_a8_dst_sse41+0x81>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 31f3 <_sk_load_a8_dst_sse41+0x6b>
+ .byte 116,21 // je 33b1 <_sk_load_a8_dst_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 31a7 <_sk_load_a8_dst_sse41+0x1f>
+ .byte 117,195 // jne 3365 <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -31322,10 +31926,10 @@ _sk_load_a8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,158 // jmp 31a7 <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,158 // jmp 3365 <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,147 // jmp 31a7 <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,147 // jmp 3365 <_sk_load_a8_dst_sse41+0x1f>
HIDDEN _sk_gather_a8_sse41
.globl _sk_gather_a8_sse41
@@ -31354,7 +31958,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,60,54,0,0 // mulps 0x363c(%rip),%xmm3 # 68c0 <_sk_callback_sse41+0xbd2>
+ .byte 15,89,29,254,54,0,0 // mulps 0x36fe(%rip),%xmm3 # 6b40 <_sk_callback_sse41+0xc94>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -31372,13 +31976,13 @@ _sk_store_a8_sse41:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,33,54,0,0 // movaps 0x3621(%rip),%xmm8 # 68d0 <_sk_callback_sse41+0xbe2>
+ .byte 68,15,40,5,227,54,0,0 // movaps 0x36e3(%rip),%xmm8 # 6b50 <_sk_callback_sse41+0xca4>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 32d5 <_sk_store_a8_sse41+0x41>
+ .byte 117,13 // jne 3493 <_sk_store_a8_sse41+0x41>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -31387,17 +31991,17 @@ _sk_store_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 3311 <_sk_store_a8_sse41+0x7d>
+ .byte 116,41 // je 34cf <_sk_store_a8_sse41+0x7d>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 32fd <_sk_store_a8_sse41+0x69>
+ .byte 116,15 // je 34bb <_sk_store_a8_sse41+0x69>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 32d1 <_sk_store_a8_sse41+0x3d>
+ .byte 117,221 // jne 348f <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,68,25,2,8 // pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- .byte 102,68,15,56,0,5,217,53,0,0 // pshufb 0x35d9(%rip),%xmm8 # 68e0 <_sk_callback_sse41+0xbf2>
+ .byte 102,68,15,56,0,5,155,54,0,0 // pshufb 0x369b(%rip),%xmm8 # 6b60 <_sk_callback_sse41+0xcb4>
.byte 102,71,15,58,21,4,25,0 // pextrw $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,192 // jmp 32d1 <_sk_store_a8_sse41+0x3d>
+ .byte 235,192 // jmp 348f <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,4,25,0 // pextrb $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,182 // jmp 32d1 <_sk_store_a8_sse41+0x3d>
+ .byte 235,182 // jmp 348f <_sk_store_a8_sse41+0x3d>
HIDDEN _sk_load_g8_sse41
.globl _sk_load_g8_sse41
@@ -31410,25 +32014,25 @@ _sk_load_g8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 335d <_sk_load_g8_sse41+0x42>
+ .byte 117,42 // jne 351b <_sk_load_g8_sse41+0x42>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,174,53,0,0 // pand 0x35ae(%rip),%xmm0 # 68f0 <_sk_callback_sse41+0xc02>
+ .byte 102,15,219,5,112,54,0,0 // pand 0x3670(%rip),%xmm0 # 6b70 <_sk_callback_sse41+0xcc4>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,180,53,0,0 // mulps 0x35b4(%rip),%xmm0 # 6900 <_sk_callback_sse41+0xc12>
+ .byte 15,89,5,118,54,0,0 // mulps 0x3676(%rip),%xmm0 # 6b80 <_sk_callback_sse41+0xcd4>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,187,53,0,0 // movaps 0x35bb(%rip),%xmm3 # 6910 <_sk_callback_sse41+0xc22>
+ .byte 15,40,29,125,54,0,0 // movaps 0x367d(%rip),%xmm3 # 6b90 <_sk_callback_sse41+0xce4>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 339f <_sk_load_g8_sse41+0x84>
+ .byte 116,53 // je 355d <_sk_load_g8_sse41+0x84>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3389 <_sk_load_g8_sse41+0x6e>
+ .byte 116,21 // je 3547 <_sk_load_g8_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 333a <_sk_load_g8_sse41+0x1f>
+ .byte 117,192 // jne 34f8 <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -31436,10 +32040,10 @@ _sk_load_g8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,155 // jmp 333a <_sk_load_g8_sse41+0x1f>
+ .byte 235,155 // jmp 34f8 <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,144 // jmp 333a <_sk_load_g8_sse41+0x1f>
+ .byte 235,144 // jmp 34f8 <_sk_load_g8_sse41+0x1f>
HIDDEN _sk_load_g8_dst_sse41
.globl _sk_load_g8_dst_sse41
@@ -31452,25 +32056,25 @@ _sk_load_g8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 33ec <_sk_load_g8_dst_sse41+0x42>
+ .byte 117,42 // jne 35aa <_sk_load_g8_dst_sse41+0x42>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,79,53,0,0 // pand 0x354f(%rip),%xmm4 # 6920 <_sk_callback_sse41+0xc32>
+ .byte 102,15,219,37,17,54,0,0 // pand 0x3611(%rip),%xmm4 # 6ba0 <_sk_callback_sse41+0xcf4>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,85,53,0,0 // mulps 0x3555(%rip),%xmm4 # 6930 <_sk_callback_sse41+0xc42>
+ .byte 15,89,37,23,54,0,0 // mulps 0x3617(%rip),%xmm4 # 6bb0 <_sk_callback_sse41+0xd04>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,92,53,0,0 // movaps 0x355c(%rip),%xmm7 # 6940 <_sk_callback_sse41+0xc52>
+ .byte 15,40,61,30,54,0,0 // movaps 0x361e(%rip),%xmm7 # 6bc0 <_sk_callback_sse41+0xd14>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 342e <_sk_load_g8_dst_sse41+0x84>
+ .byte 116,53 // je 35ec <_sk_load_g8_dst_sse41+0x84>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3418 <_sk_load_g8_dst_sse41+0x6e>
+ .byte 116,21 // je 35d6 <_sk_load_g8_dst_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 33c9 <_sk_load_g8_dst_sse41+0x1f>
+ .byte 117,192 // jne 3587 <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -31478,10 +32082,10 @@ _sk_load_g8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,155 // jmp 33c9 <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,155 // jmp 3587 <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,144 // jmp 33c9 <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,144 // jmp 3587 <_sk_load_g8_dst_sse41+0x1f>
HIDDEN _sk_gather_g8_sse41
.globl _sk_gather_g8_sse41
@@ -31510,9 +32114,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,167,52,0,0 // mulps 0x34a7(%rip),%xmm0 # 6950 <_sk_callback_sse41+0xc62>
+ .byte 15,89,5,105,53,0,0 // mulps 0x3569(%rip),%xmm0 # 6bd0 <_sk_callback_sse41+0xd24>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,174,52,0,0 // movaps 0x34ae(%rip),%xmm3 # 6960 <_sk_callback_sse41+0xc72>
+ .byte 15,40,29,112,53,0,0 // movaps 0x3570(%rip),%xmm3 # 6be0 <_sk_callback_sse41+0xd34>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -31530,41 +32134,41 @@ _sk_load_565_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 3526 <_sk_load_565_sse41+0x6b>
+ .byte 117,80 // jne 36e4 <_sk_load_565_sse41+0x6b>
.byte 102,67,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm2
- .byte 102,15,111,5,139,52,0,0 // movdqa 0x348b(%rip),%xmm0 # 6970 <_sk_callback_sse41+0xc82>
+ .byte 102,15,111,5,77,53,0,0 // movdqa 0x354d(%rip),%xmm0 # 6bf0 <_sk_callback_sse41+0xd44>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,141,52,0,0 // mulps 0x348d(%rip),%xmm0 # 6980 <_sk_callback_sse41+0xc92>
- .byte 102,15,111,13,149,52,0,0 // movdqa 0x3495(%rip),%xmm1 # 6990 <_sk_callback_sse41+0xca2>
+ .byte 15,89,5,79,53,0,0 // mulps 0x354f(%rip),%xmm0 # 6c00 <_sk_callback_sse41+0xd54>
+ .byte 102,15,111,13,87,53,0,0 // movdqa 0x3557(%rip),%xmm1 # 6c10 <_sk_callback_sse41+0xd64>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,151,52,0,0 // mulps 0x3497(%rip),%xmm1 # 69a0 <_sk_callback_sse41+0xcb2>
- .byte 102,15,219,21,159,52,0,0 // pand 0x349f(%rip),%xmm2 # 69b0 <_sk_callback_sse41+0xcc2>
+ .byte 15,89,13,89,53,0,0 // mulps 0x3559(%rip),%xmm1 # 6c20 <_sk_callback_sse41+0xd74>
+ .byte 102,15,219,21,97,53,0,0 // pand 0x3561(%rip),%xmm2 # 6c30 <_sk_callback_sse41+0xd84>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,165,52,0,0 // mulps 0x34a5(%rip),%xmm2 # 69c0 <_sk_callback_sse41+0xcd2>
+ .byte 15,89,21,103,53,0,0 // mulps 0x3567(%rip),%xmm2 # 6c40 <_sk_callback_sse41+0xd94>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,172,52,0,0 // movaps 0x34ac(%rip),%xmm3 # 69d0 <_sk_callback_sse41+0xce2>
+ .byte 15,40,29,110,53,0,0 // movaps 0x356e(%rip),%xmm3 # 6c50 <_sk_callback_sse41+0xda4>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3568 <_sk_load_565_sse41+0xad>
+ .byte 116,53 // je 3726 <_sk_load_565_sse41+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3552 <_sk_load_565_sse41+0x97>
+ .byte 116,21 // je 3710 <_sk_load_565_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 34dd <_sk_load_565_sse41+0x22>
+ .byte 117,154 // jne 369b <_sk_load_565_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm2
- .byte 233,117,255,255,255 // jmpq 34dd <_sk_load_565_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 369b <_sk_load_565_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,103,255,255,255 // jmpq 34dd <_sk_load_565_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 369b <_sk_load_565_sse41+0x22>
HIDDEN _sk_load_565_dst_sse41
.globl _sk_load_565_dst_sse41
@@ -31578,41 +32182,41 @@ _sk_load_565_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 35e1 <_sk_load_565_dst_sse41+0x6b>
+ .byte 117,80 // jne 379f <_sk_load_565_dst_sse41+0x6b>
.byte 102,67,15,56,51,52,89 // pmovzxwd (%r9,%r11,2),%xmm6
- .byte 102,15,111,37,64,52,0,0 // movdqa 0x3440(%rip),%xmm4 # 69e0 <_sk_callback_sse41+0xcf2>
+ .byte 102,15,111,37,2,53,0,0 // movdqa 0x3502(%rip),%xmm4 # 6c60 <_sk_callback_sse41+0xdb4>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,66,52,0,0 // mulps 0x3442(%rip),%xmm4 # 69f0 <_sk_callback_sse41+0xd02>
- .byte 102,15,111,45,74,52,0,0 // movdqa 0x344a(%rip),%xmm5 # 6a00 <_sk_callback_sse41+0xd12>
+ .byte 15,89,37,4,53,0,0 // mulps 0x3504(%rip),%xmm4 # 6c70 <_sk_callback_sse41+0xdc4>
+ .byte 102,15,111,45,12,53,0,0 // movdqa 0x350c(%rip),%xmm5 # 6c80 <_sk_callback_sse41+0xdd4>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,76,52,0,0 // mulps 0x344c(%rip),%xmm5 # 6a10 <_sk_callback_sse41+0xd22>
- .byte 102,15,219,53,84,52,0,0 // pand 0x3454(%rip),%xmm6 # 6a20 <_sk_callback_sse41+0xd32>
+ .byte 15,89,45,14,53,0,0 // mulps 0x350e(%rip),%xmm5 # 6c90 <_sk_callback_sse41+0xde4>
+ .byte 102,15,219,53,22,53,0,0 // pand 0x3516(%rip),%xmm6 # 6ca0 <_sk_callback_sse41+0xdf4>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,90,52,0,0 // mulps 0x345a(%rip),%xmm6 # 6a30 <_sk_callback_sse41+0xd42>
+ .byte 15,89,53,28,53,0,0 // mulps 0x351c(%rip),%xmm6 # 6cb0 <_sk_callback_sse41+0xe04>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,97,52,0,0 // movaps 0x3461(%rip),%xmm7 # 6a40 <_sk_callback_sse41+0xd52>
+ .byte 15,40,61,35,53,0,0 // movaps 0x3523(%rip),%xmm7 # 6cc0 <_sk_callback_sse41+0xe14>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3623 <_sk_load_565_dst_sse41+0xad>
+ .byte 116,53 // je 37e1 <_sk_load_565_dst_sse41+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 360d <_sk_load_565_dst_sse41+0x97>
+ .byte 116,21 // je 37cb <_sk_load_565_dst_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 3598 <_sk_load_565_dst_sse41+0x22>
+ .byte 117,154 // jne 3756 <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,117,255,255,255 // jmpq 3598 <_sk_load_565_dst_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 3756 <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,103,255,255,255 // jmpq 3598 <_sk_load_565_dst_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 3756 <_sk_load_565_dst_sse41+0x22>
HIDDEN _sk_gather_565_sse41
.globl _sk_gather_565_sse41
@@ -31640,19 +32244,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,181,51,0,0 // movdqa 0x33b5(%rip),%xmm0 # 6a50 <_sk_callback_sse41+0xd62>
+ .byte 102,15,111,5,119,52,0,0 // movdqa 0x3477(%rip),%xmm0 # 6cd0 <_sk_callback_sse41+0xe24>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,183,51,0,0 // mulps 0x33b7(%rip),%xmm0 # 6a60 <_sk_callback_sse41+0xd72>
- .byte 102,15,111,13,191,51,0,0 // movdqa 0x33bf(%rip),%xmm1 # 6a70 <_sk_callback_sse41+0xd82>
+ .byte 15,89,5,121,52,0,0 // mulps 0x3479(%rip),%xmm0 # 6ce0 <_sk_callback_sse41+0xe34>
+ .byte 102,15,111,13,129,52,0,0 // movdqa 0x3481(%rip),%xmm1 # 6cf0 <_sk_callback_sse41+0xe44>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,193,51,0,0 // mulps 0x33c1(%rip),%xmm1 # 6a80 <_sk_callback_sse41+0xd92>
- .byte 102,15,219,21,201,51,0,0 // pand 0x33c9(%rip),%xmm2 # 6a90 <_sk_callback_sse41+0xda2>
+ .byte 15,89,13,131,52,0,0 // mulps 0x3483(%rip),%xmm1 # 6d00 <_sk_callback_sse41+0xe54>
+ .byte 102,15,219,21,139,52,0,0 // pand 0x348b(%rip),%xmm2 # 6d10 <_sk_callback_sse41+0xe64>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,207,51,0,0 // mulps 0x33cf(%rip),%xmm2 # 6aa0 <_sk_callback_sse41+0xdb2>
+ .byte 15,89,21,145,52,0,0 // mulps 0x3491(%rip),%xmm2 # 6d20 <_sk_callback_sse41+0xe74>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,214,51,0,0 // movaps 0x33d6(%rip),%xmm3 # 6ab0 <_sk_callback_sse41+0xdc2>
+ .byte 15,40,29,152,52,0,0 // movaps 0x3498(%rip),%xmm3 # 6d30 <_sk_callback_sse41+0xe84>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -31667,12 +32271,12 @@ _sk_store_565_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,197,51,0,0 // movaps 0x33c5(%rip),%xmm8 # 6ac0 <_sk_callback_sse41+0xdd2>
+ .byte 68,15,40,5,135,52,0,0 // movaps 0x3487(%rip),%xmm8 # 6d40 <_sk_callback_sse41+0xe94>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,186,51,0,0 // movaps 0x33ba(%rip),%xmm10 # 6ad0 <_sk_callback_sse41+0xde2>
+ .byte 68,15,40,21,124,52,0,0 // movaps 0x347c(%rip),%xmm10 # 6d50 <_sk_callback_sse41+0xea4>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -31682,7 +32286,7 @@ _sk_store_565_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 374d <_sk_store_565_sse41+0x70>
+ .byte 117,10 // jne 390b <_sk_store_565_sse41+0x70>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -31690,17 +32294,17 @@ _sk_store_565_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 3783 <_sk_store_565_sse41+0xa6>
+ .byte 116,35 // je 3941 <_sk_store_565_sse41+0xa6>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 3775 <_sk_store_565_sse41+0x98>
+ .byte 116,15 // je 3933 <_sk_store_565_sse41+0x98>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 3749 <_sk_store_565_sse41+0x6c>
+ .byte 117,221 // jne 3907 <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 3749 <_sk_store_565_sse41+0x6c>
+ .byte 235,198 // jmp 3907 <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 3749 <_sk_store_565_sse41+0x6c>
+ .byte 235,188 // jmp 3907 <_sk_store_565_sse41+0x6c>
HIDDEN _sk_load_4444_sse41
.globl _sk_load_4444_sse41
@@ -31714,44 +32318,44 @@ _sk_load_4444_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 3807 <_sk_load_4444_sse41+0x7a>
+ .byte 117,95 // jne 39c5 <_sk_load_4444_sse41+0x7a>
.byte 102,67,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm3
- .byte 102,15,111,5,41,51,0,0 // movdqa 0x3329(%rip),%xmm0 # 6ae0 <_sk_callback_sse41+0xdf2>
+ .byte 102,15,111,5,235,51,0,0 // movdqa 0x33eb(%rip),%xmm0 # 6d60 <_sk_callback_sse41+0xeb4>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,43,51,0,0 // mulps 0x332b(%rip),%xmm0 # 6af0 <_sk_callback_sse41+0xe02>
- .byte 102,15,111,13,51,51,0,0 // movdqa 0x3333(%rip),%xmm1 # 6b00 <_sk_callback_sse41+0xe12>
+ .byte 15,89,5,237,51,0,0 // mulps 0x33ed(%rip),%xmm0 # 6d70 <_sk_callback_sse41+0xec4>
+ .byte 102,15,111,13,245,51,0,0 // movdqa 0x33f5(%rip),%xmm1 # 6d80 <_sk_callback_sse41+0xed4>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,53,51,0,0 // mulps 0x3335(%rip),%xmm1 # 6b10 <_sk_callback_sse41+0xe22>
- .byte 102,15,111,21,61,51,0,0 // movdqa 0x333d(%rip),%xmm2 # 6b20 <_sk_callback_sse41+0xe32>
+ .byte 15,89,13,247,51,0,0 // mulps 0x33f7(%rip),%xmm1 # 6d90 <_sk_callback_sse41+0xee4>
+ .byte 102,15,111,21,255,51,0,0 // movdqa 0x33ff(%rip),%xmm2 # 6da0 <_sk_callback_sse41+0xef4>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,63,51,0,0 // mulps 0x333f(%rip),%xmm2 # 6b30 <_sk_callback_sse41+0xe42>
- .byte 102,15,219,29,71,51,0,0 // pand 0x3347(%rip),%xmm3 # 6b40 <_sk_callback_sse41+0xe52>
+ .byte 15,89,21,1,52,0,0 // mulps 0x3401(%rip),%xmm2 # 6db0 <_sk_callback_sse41+0xf04>
+ .byte 102,15,219,29,9,52,0,0 // pand 0x3409(%rip),%xmm3 # 6dc0 <_sk_callback_sse41+0xf14>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,77,51,0,0 // mulps 0x334d(%rip),%xmm3 # 6b50 <_sk_callback_sse41+0xe62>
+ .byte 15,89,29,15,52,0,0 // mulps 0x340f(%rip),%xmm3 # 6dd0 <_sk_callback_sse41+0xf24>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3849 <_sk_load_4444_sse41+0xbc>
+ .byte 116,53 // je 3a07 <_sk_load_4444_sse41+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3833 <_sk_load_4444_sse41+0xa6>
+ .byte 116,21 // je 39f1 <_sk_load_4444_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 37af <_sk_load_4444_sse41+0x22>
+ .byte 117,139 // jne 396d <_sk_load_4444_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,102,255,255,255 // jmpq 37af <_sk_load_4444_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 396d <_sk_load_4444_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,88,255,255,255 // jmpq 37af <_sk_load_4444_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 396d <_sk_load_4444_sse41+0x22>
HIDDEN _sk_load_4444_dst_sse41
.globl _sk_load_4444_dst_sse41
@@ -31765,44 +32369,44 @@ _sk_load_4444_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 38d1 <_sk_load_4444_dst_sse41+0x7a>
+ .byte 117,95 // jne 3a8f <_sk_load_4444_dst_sse41+0x7a>
.byte 102,67,15,56,51,60,89 // pmovzxwd (%r9,%r11,2),%xmm7
- .byte 102,15,111,37,223,50,0,0 // movdqa 0x32df(%rip),%xmm4 # 6b60 <_sk_callback_sse41+0xe72>
+ .byte 102,15,111,37,161,51,0,0 // movdqa 0x33a1(%rip),%xmm4 # 6de0 <_sk_callback_sse41+0xf34>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,225,50,0,0 // mulps 0x32e1(%rip),%xmm4 # 6b70 <_sk_callback_sse41+0xe82>
- .byte 102,15,111,45,233,50,0,0 // movdqa 0x32e9(%rip),%xmm5 # 6b80 <_sk_callback_sse41+0xe92>
+ .byte 15,89,37,163,51,0,0 // mulps 0x33a3(%rip),%xmm4 # 6df0 <_sk_callback_sse41+0xf44>
+ .byte 102,15,111,45,171,51,0,0 // movdqa 0x33ab(%rip),%xmm5 # 6e00 <_sk_callback_sse41+0xf54>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,235,50,0,0 // mulps 0x32eb(%rip),%xmm5 # 6b90 <_sk_callback_sse41+0xea2>
- .byte 102,15,111,53,243,50,0,0 // movdqa 0x32f3(%rip),%xmm6 # 6ba0 <_sk_callback_sse41+0xeb2>
+ .byte 15,89,45,173,51,0,0 // mulps 0x33ad(%rip),%xmm5 # 6e10 <_sk_callback_sse41+0xf64>
+ .byte 102,15,111,53,181,51,0,0 // movdqa 0x33b5(%rip),%xmm6 # 6e20 <_sk_callback_sse41+0xf74>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,245,50,0,0 // mulps 0x32f5(%rip),%xmm6 # 6bb0 <_sk_callback_sse41+0xec2>
- .byte 102,15,219,61,253,50,0,0 // pand 0x32fd(%rip),%xmm7 # 6bc0 <_sk_callback_sse41+0xed2>
+ .byte 15,89,53,183,51,0,0 // mulps 0x33b7(%rip),%xmm6 # 6e30 <_sk_callback_sse41+0xf84>
+ .byte 102,15,219,61,191,51,0,0 // pand 0x33bf(%rip),%xmm7 # 6e40 <_sk_callback_sse41+0xf94>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,3,51,0,0 // mulps 0x3303(%rip),%xmm7 # 6bd0 <_sk_callback_sse41+0xee2>
+ .byte 15,89,61,197,51,0,0 // mulps 0x33c5(%rip),%xmm7 # 6e50 <_sk_callback_sse41+0xfa4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 3913 <_sk_load_4444_dst_sse41+0xbc>
+ .byte 116,53 // je 3ad1 <_sk_load_4444_dst_sse41+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 38fd <_sk_load_4444_dst_sse41+0xa6>
+ .byte 116,21 // je 3abb <_sk_load_4444_dst_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 3879 <_sk_load_4444_dst_sse41+0x22>
+ .byte 117,139 // jne 3a37 <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,102,255,255,255 // jmpq 3879 <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 3a37 <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,88,255,255,255 // jmpq 3879 <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 3a37 <_sk_load_4444_dst_sse41+0x22>
HIDDEN _sk_gather_4444_sse41
.globl _sk_gather_4444_sse41
@@ -31830,21 +32434,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,85,50,0,0 // movdqa 0x3255(%rip),%xmm0 # 6be0 <_sk_callback_sse41+0xef2>
+ .byte 102,15,111,5,23,51,0,0 // movdqa 0x3317(%rip),%xmm0 # 6e60 <_sk_callback_sse41+0xfb4>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,87,50,0,0 // mulps 0x3257(%rip),%xmm0 # 6bf0 <_sk_callback_sse41+0xf02>
- .byte 102,15,111,13,95,50,0,0 // movdqa 0x325f(%rip),%xmm1 # 6c00 <_sk_callback_sse41+0xf12>
+ .byte 15,89,5,25,51,0,0 // mulps 0x3319(%rip),%xmm0 # 6e70 <_sk_callback_sse41+0xfc4>
+ .byte 102,15,111,13,33,51,0,0 // movdqa 0x3321(%rip),%xmm1 # 6e80 <_sk_callback_sse41+0xfd4>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,97,50,0,0 // mulps 0x3261(%rip),%xmm1 # 6c10 <_sk_callback_sse41+0xf22>
- .byte 102,15,111,21,105,50,0,0 // movdqa 0x3269(%rip),%xmm2 # 6c20 <_sk_callback_sse41+0xf32>
+ .byte 15,89,13,35,51,0,0 // mulps 0x3323(%rip),%xmm1 # 6e90 <_sk_callback_sse41+0xfe4>
+ .byte 102,15,111,21,43,51,0,0 // movdqa 0x332b(%rip),%xmm2 # 6ea0 <_sk_callback_sse41+0xff4>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,107,50,0,0 // mulps 0x326b(%rip),%xmm2 # 6c30 <_sk_callback_sse41+0xf42>
- .byte 102,15,219,29,115,50,0,0 // pand 0x3273(%rip),%xmm3 # 6c40 <_sk_callback_sse41+0xf52>
+ .byte 15,89,21,45,51,0,0 // mulps 0x332d(%rip),%xmm2 # 6eb0 <_sk_callback_sse41+0x1004>
+ .byte 102,15,219,29,53,51,0,0 // pand 0x3335(%rip),%xmm3 # 6ec0 <_sk_callback_sse41+0x1014>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,121,50,0,0 // mulps 0x3279(%rip),%xmm3 # 6c50 <_sk_callback_sse41+0xf62>
+ .byte 15,89,29,59,51,0,0 // mulps 0x333b(%rip),%xmm3 # 6ed0 <_sk_callback_sse41+0x1024>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -31860,7 +32464,7 @@ _sk_store_4444_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,102,50,0,0 // movaps 0x3266(%rip),%xmm8 # 6c60 <_sk_callback_sse41+0xf72>
+ .byte 68,15,40,5,40,51,0,0 // movaps 0x3328(%rip),%xmm8 # 6ee0 <_sk_callback_sse41+0x1034>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -31880,7 +32484,7 @@ _sk_store_4444_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3a60 <_sk_store_4444_sse41+0x84>
+ .byte 117,10 // jne 3c1e <_sk_store_4444_sse41+0x84>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -31888,17 +32492,17 @@ _sk_store_4444_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 3a96 <_sk_store_4444_sse41+0xba>
+ .byte 116,35 // je 3c54 <_sk_store_4444_sse41+0xba>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 3a88 <_sk_store_4444_sse41+0xac>
+ .byte 116,15 // je 3c46 <_sk_store_4444_sse41+0xac>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 3a5c <_sk_store_4444_sse41+0x80>
+ .byte 117,221 // jne 3c1a <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 3a5c <_sk_store_4444_sse41+0x80>
+ .byte 235,198 // jmp 3c1a <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 3a5c <_sk_store_4444_sse41+0x80>
+ .byte 235,188 // jmp 3c1a <_sk_store_4444_sse41+0x80>
HIDDEN _sk_load_8888_sse41
.globl _sk_load_8888_sse41
@@ -31912,19 +32516,19 @@ _sk_load_8888_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 3b15 <_sk_load_8888_sse41+0x75>
+ .byte 117,89 // jne 3cd3 <_sk_load_8888_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,166,49,0,0 // movdqa 0x31a6(%rip),%xmm0 # 6c70 <_sk_callback_sse41+0xf82>
+ .byte 102,15,111,5,104,50,0,0 // movdqa 0x3268(%rip),%xmm0 # 6ef0 <_sk_callback_sse41+0x1044>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,167,49,0,0 // movaps 0x31a7(%rip),%xmm8 # 6c80 <_sk_callback_sse41+0xf92>
+ .byte 68,15,40,5,105,50,0,0 // movaps 0x3269(%rip),%xmm8 # 6f00 <_sk_callback_sse41+0x1054>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,166,49,0,0 // pshufb 0x31a6(%rip),%xmm1 # 6c90 <_sk_callback_sse41+0xfa2>
+ .byte 102,15,56,0,13,104,50,0,0 // pshufb 0x3268(%rip),%xmm1 # 6f10 <_sk_callback_sse41+0x1064>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,162,49,0,0 // pshufb 0x31a2(%rip),%xmm2 # 6ca0 <_sk_callback_sse41+0xfb2>
+ .byte 102,15,56,0,21,100,50,0,0 // pshufb 0x3264(%rip),%xmm2 # 6f20 <_sk_callback_sse41+0x1074>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31935,19 +32539,19 @@ _sk_load_8888_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 3b4f <_sk_load_8888_sse41+0xaf>
+ .byte 116,45 // je 3d0d <_sk_load_8888_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3b3e <_sk_load_8888_sse41+0x9e>
+ .byte 116,18 // je 3cfc <_sk_load_8888_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 3ac2 <_sk_load_8888_sse41+0x22>
+ .byte 117,144 // jne 3c80 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 3ac2 <_sk_load_8888_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 3c80 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 3ac2 <_sk_load_8888_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 3c80 <_sk_load_8888_sse41+0x22>
HIDDEN _sk_load_8888_dst_sse41
.globl _sk_load_8888_dst_sse41
@@ -31961,19 +32565,19 @@ _sk_load_8888_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 3bcf <_sk_load_8888_dst_sse41+0x75>
+ .byte 117,89 // jne 3d8d <_sk_load_8888_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,44,49,0,0 // movdqa 0x312c(%rip),%xmm4 # 6cb0 <_sk_callback_sse41+0xfc2>
+ .byte 102,15,111,37,238,49,0,0 // movdqa 0x31ee(%rip),%xmm4 # 6f30 <_sk_callback_sse41+0x1084>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,45,49,0,0 // movaps 0x312d(%rip),%xmm8 # 6cc0 <_sk_callback_sse41+0xfd2>
+ .byte 68,15,40,5,239,49,0,0 // movaps 0x31ef(%rip),%xmm8 # 6f40 <_sk_callback_sse41+0x1094>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,44,49,0,0 // pshufb 0x312c(%rip),%xmm5 # 6cd0 <_sk_callback_sse41+0xfe2>
+ .byte 102,15,56,0,45,238,49,0,0 // pshufb 0x31ee(%rip),%xmm5 # 6f50 <_sk_callback_sse41+0x10a4>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,40,49,0,0 // pshufb 0x3128(%rip),%xmm6 # 6ce0 <_sk_callback_sse41+0xff2>
+ .byte 102,15,56,0,53,234,49,0,0 // pshufb 0x31ea(%rip),%xmm6 # 6f60 <_sk_callback_sse41+0x10b4>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -31984,19 +32588,19 @@ _sk_load_8888_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 3c09 <_sk_load_8888_dst_sse41+0xaf>
+ .byte 116,45 // je 3dc7 <_sk_load_8888_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3bf8 <_sk_load_8888_dst_sse41+0x9e>
+ .byte 116,18 // je 3db6 <_sk_load_8888_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 3b7c <_sk_load_8888_dst_sse41+0x22>
+ .byte 117,144 // jne 3d3a <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 3b7c <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 3d3a <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 3b7c <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 3d3a <_sk_load_8888_dst_sse41+0x22>
HIDDEN _sk_gather_8888_sse41
.globl _sk_gather_8888_sse41
@@ -32021,17 +32625,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,123,48,0,0 // movdqa 0x307b(%rip),%xmm0 # 6cf0 <_sk_callback_sse41+0x1002>
+ .byte 102,15,111,5,61,49,0,0 // movdqa 0x313d(%rip),%xmm0 # 6f70 <_sk_callback_sse41+0x10c4>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,124,48,0,0 // movaps 0x307c(%rip),%xmm8 # 6d00 <_sk_callback_sse41+0x1012>
+ .byte 68,15,40,5,62,49,0,0 // movaps 0x313e(%rip),%xmm8 # 6f80 <_sk_callback_sse41+0x10d4>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,123,48,0,0 // pshufb 0x307b(%rip),%xmm1 # 6d10 <_sk_callback_sse41+0x1022>
+ .byte 102,15,56,0,13,61,49,0,0 // pshufb 0x313d(%rip),%xmm1 # 6f90 <_sk_callback_sse41+0x10e4>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,119,48,0,0 // pshufb 0x3077(%rip),%xmm2 # 6d20 <_sk_callback_sse41+0x1032>
+ .byte 102,15,56,0,21,57,49,0,0 // pshufb 0x3139(%rip),%xmm2 # 6fa0 <_sk_callback_sse41+0x10f4>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32052,7 +32656,7 @@ _sk_store_8888_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,80,48,0,0 // movaps 0x3050(%rip),%xmm8 # 6d30 <_sk_callback_sse41+0x1042>
+ .byte 68,15,40,5,18,49,0,0 // movaps 0x3112(%rip),%xmm8 # 6fb0 <_sk_callback_sse41+0x1104>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -32071,23 +32675,23 @@ _sk_store_8888_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3d40 <_sk_store_8888_sse41+0x7f>
+ .byte 117,10 // jne 3efe <_sk_store_8888_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 3d6a <_sk_store_8888_sse41+0xa9>
+ .byte 116,29 // je 3f28 <_sk_store_8888_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 3d62 <_sk_store_8888_sse41+0xa1>
+ .byte 116,15 // je 3f20 <_sk_store_8888_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 3d3c <_sk_store_8888_sse41+0x7b>
+ .byte 117,227 // jne 3efa <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 3d3c <_sk_store_8888_sse41+0x7b>
+ .byte 235,210 // jmp 3efa <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 3d3c <_sk_store_8888_sse41+0x7b>
+ .byte 235,202 // jmp 3efa <_sk_store_8888_sse41+0x7b>
HIDDEN _sk_load_bgra_sse41
.globl _sk_load_bgra_sse41
@@ -32101,19 +32705,19 @@ _sk_load_bgra_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 3de7 <_sk_load_bgra_sse41+0x75>
+ .byte 117,89 // jne 3fa5 <_sk_load_bgra_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,164,47,0,0 // movdqa 0x2fa4(%rip),%xmm0 # 6d40 <_sk_callback_sse41+0x1052>
+ .byte 102,15,111,5,102,48,0,0 // movdqa 0x3066(%rip),%xmm0 # 6fc0 <_sk_callback_sse41+0x1114>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,165,47,0,0 // movaps 0x2fa5(%rip),%xmm8 # 6d50 <_sk_callback_sse41+0x1062>
+ .byte 68,15,40,5,103,48,0,0 // movaps 0x3067(%rip),%xmm8 # 6fd0 <_sk_callback_sse41+0x1124>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,164,47,0,0 // pshufb 0x2fa4(%rip),%xmm0 # 6d60 <_sk_callback_sse41+0x1072>
+ .byte 102,15,56,0,5,102,48,0,0 // pshufb 0x3066(%rip),%xmm0 # 6fe0 <_sk_callback_sse41+0x1134>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,160,47,0,0 // pshufb 0x2fa0(%rip),%xmm0 # 6d70 <_sk_callback_sse41+0x1082>
+ .byte 102,15,56,0,5,98,48,0,0 // pshufb 0x3062(%rip),%xmm0 # 6ff0 <_sk_callback_sse41+0x1144>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32124,19 +32728,19 @@ _sk_load_bgra_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 3e21 <_sk_load_bgra_sse41+0xaf>
+ .byte 116,45 // je 3fdf <_sk_load_bgra_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3e10 <_sk_load_bgra_sse41+0x9e>
+ .byte 116,18 // je 3fce <_sk_load_bgra_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 3d94 <_sk_load_bgra_sse41+0x22>
+ .byte 117,144 // jne 3f52 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 3d94 <_sk_load_bgra_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 3f52 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 3d94 <_sk_load_bgra_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 3f52 <_sk_load_bgra_sse41+0x22>
HIDDEN _sk_load_bgra_dst_sse41
.globl _sk_load_bgra_dst_sse41
@@ -32150,19 +32754,19 @@ _sk_load_bgra_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 3ea1 <_sk_load_bgra_dst_sse41+0x75>
+ .byte 117,89 // jne 405f <_sk_load_bgra_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,42,47,0,0 // movdqa 0x2f2a(%rip),%xmm4 # 6d80 <_sk_callback_sse41+0x1092>
+ .byte 102,15,111,37,236,47,0,0 // movdqa 0x2fec(%rip),%xmm4 # 7000 <_sk_callback_sse41+0x1154>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,244 // cvtdq2ps %xmm4,%xmm6
- .byte 68,15,40,5,43,47,0,0 // movaps 0x2f2b(%rip),%xmm8 # 6d90 <_sk_callback_sse41+0x10a2>
+ .byte 68,15,40,5,237,47,0,0 // movaps 0x2fed(%rip),%xmm8 # 7010 <_sk_callback_sse41+0x1164>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,42,47,0,0 // pshufb 0x2f2a(%rip),%xmm4 # 6da0 <_sk_callback_sse41+0x10b2>
+ .byte 102,15,56,0,37,236,47,0,0 // pshufb 0x2fec(%rip),%xmm4 # 7020 <_sk_callback_sse41+0x1174>
.byte 15,91,236 // cvtdq2ps %xmm4,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,38,47,0,0 // pshufb 0x2f26(%rip),%xmm4 # 6db0 <_sk_callback_sse41+0x10c2>
+ .byte 102,15,56,0,37,232,47,0,0 // pshufb 0x2fe8(%rip),%xmm4 # 7030 <_sk_callback_sse41+0x1184>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -32173,19 +32777,19 @@ _sk_load_bgra_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 3edb <_sk_load_bgra_dst_sse41+0xaf>
+ .byte 116,45 // je 4099 <_sk_load_bgra_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3eca <_sk_load_bgra_dst_sse41+0x9e>
+ .byte 116,18 // je 4088 <_sk_load_bgra_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 3e4e <_sk_load_bgra_dst_sse41+0x22>
+ .byte 117,144 // jne 400c <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 3e4e <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 400c <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 3e4e <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 400c <_sk_load_bgra_dst_sse41+0x22>
HIDDEN _sk_gather_bgra_sse41
.globl _sk_gather_bgra_sse41
@@ -32210,17 +32814,17 @@ _sk_gather_bgra_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,121,46,0,0 // movdqa 0x2e79(%rip),%xmm0 # 6dc0 <_sk_callback_sse41+0x10d2>
+ .byte 102,15,111,5,59,47,0,0 // movdqa 0x2f3b(%rip),%xmm0 # 7040 <_sk_callback_sse41+0x1194>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,122,46,0,0 // movaps 0x2e7a(%rip),%xmm8 # 6dd0 <_sk_callback_sse41+0x10e2>
+ .byte 68,15,40,5,60,47,0,0 // movaps 0x2f3c(%rip),%xmm8 # 7050 <_sk_callback_sse41+0x11a4>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,121,46,0,0 // pshufb 0x2e79(%rip),%xmm0 # 6de0 <_sk_callback_sse41+0x10f2>
+ .byte 102,15,56,0,5,59,47,0,0 // pshufb 0x2f3b(%rip),%xmm0 # 7060 <_sk_callback_sse41+0x11b4>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,117,46,0,0 // pshufb 0x2e75(%rip),%xmm0 # 6df0 <_sk_callback_sse41+0x1102>
+ .byte 102,15,56,0,5,55,47,0,0 // pshufb 0x2f37(%rip),%xmm0 # 7070 <_sk_callback_sse41+0x11c4>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -32241,7 +32845,7 @@ _sk_store_bgra_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,78,46,0,0 // movaps 0x2e4e(%rip),%xmm8 # 6e00 <_sk_callback_sse41+0x1112>
+ .byte 68,15,40,5,16,47,0,0 // movaps 0x2f10(%rip),%xmm8 # 7080 <_sk_callback_sse41+0x11d4>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -32260,23 +32864,23 @@ _sk_store_bgra_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 4012 <_sk_store_bgra_sse41+0x7f>
+ .byte 117,10 // jne 41d0 <_sk_store_bgra_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 403c <_sk_store_bgra_sse41+0xa9>
+ .byte 116,29 // je 41fa <_sk_store_bgra_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 4034 <_sk_store_bgra_sse41+0xa1>
+ .byte 116,15 // je 41f2 <_sk_store_bgra_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 400e <_sk_store_bgra_sse41+0x7b>
+ .byte 117,227 // jne 41cc <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 400e <_sk_store_bgra_sse41+0x7b>
+ .byte 235,210 // jmp 41cc <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 400e <_sk_store_bgra_sse41+0x7b>
+ .byte 235,202 // jmp 41cc <_sk_store_bgra_sse41+0x7b>
HIDDEN _sk_load_f16_sse41
.globl _sk_load_f16_sse41
@@ -32290,7 +32894,7 @@ _sk_load_f16_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 41a2 <_sk_load_f16_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 4360 <_sk_load_f16_sse41+0x15e>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 243,65,15,111,76,193,16 // movdqu 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,200 // movapd %xmm0,%xmm9
@@ -32300,18 +32904,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,115,45,0,0 // movdqa 0x2d73(%rip),%xmm8 # 6e10 <_sk_callback_sse41+0x1122>
+ .byte 102,68,15,111,5,53,46,0,0 // movdqa 0x2e35(%rip),%xmm8 # 7090 <_sk_callback_sse41+0x11e4>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,110,45,0,0 // movdqa 0x2d6e(%rip),%xmm3 # 6e20 <_sk_callback_sse41+0x1132>
+ .byte 102,15,111,29,48,46,0,0 // movdqa 0x2e30(%rip),%xmm3 # 70a0 <_sk_callback_sse41+0x11f4>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,90,45,0,0 // movdqa 0x2d5a(%rip),%xmm10 # 6e30 <_sk_callback_sse41+0x1142>
+ .byte 102,68,15,111,21,28,46,0,0 // movdqa 0x2e1c(%rip),%xmm10 # 70b0 <_sk_callback_sse41+0x1204>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -32354,16 +32958,16 @@ _sk_load_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 41bb <_sk_load_f16_sse41+0x177>
+ .byte 117,13 // jne 4379 <_sk_load_f16_sse41+0x177>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,182,254,255,255 // jmpq 4071 <_sk_load_f16_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 422f <_sk_load_f16_sse41+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 4071 <_sk_load_f16_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 422f <_sk_load_f16_sse41+0x2d>
.byte 243,65,15,126,76,193,16 // movq 0x10(%r9,%rax,8),%xmm1
- .byte 233,149,254,255,255 // jmpq 4071 <_sk_load_f16_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 422f <_sk_load_f16_sse41+0x2d>
HIDDEN _sk_load_f16_dst_sse41
.globl _sk_load_f16_dst_sse41
@@ -32377,7 +32981,7 @@ _sk_load_f16_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 433a <_sk_load_f16_dst_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 44f8 <_sk_load_f16_dst_sse41+0x15e>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 243,65,15,111,108,193,16 // movdqu 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,204 // movapd %xmm4,%xmm9
@@ -32387,18 +32991,18 @@ _sk_load_f16_dst_sse41:
.byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11
.byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9
.byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5
- .byte 102,68,15,111,5,11,44,0,0 // movdqa 0x2c0b(%rip),%xmm8 # 6e40 <_sk_callback_sse41+0x1152>
+ .byte 102,68,15,111,5,205,44,0,0 // movdqa 0x2ccd(%rip),%xmm8 # 70c0 <_sk_callback_sse41+0x1214>
.byte 102,15,111,245 // movdqa %xmm5,%xmm6
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,239,238 // pxor %xmm6,%xmm5
- .byte 102,15,111,61,6,44,0,0 // movdqa 0x2c06(%rip),%xmm7 # 6e50 <_sk_callback_sse41+0x1162>
+ .byte 102,15,111,61,200,44,0,0 // movdqa 0x2cc8(%rip),%xmm7 # 70d0 <_sk_callback_sse41+0x1224>
.byte 102,15,114,246,16 // pslld $0x10,%xmm6
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4
.byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4
.byte 102,15,114,245,13 // pslld $0xd,%xmm5
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,68,15,111,21,242,43,0,0 // movdqa 0x2bf2(%rip),%xmm10 # 6e60 <_sk_callback_sse41+0x1172>
+ .byte 102,68,15,111,21,180,44,0,0 // movdqa 0x2cb4(%rip),%xmm10 # 70e0 <_sk_callback_sse41+0x1234>
.byte 102,65,15,254,234 // paddd %xmm10,%xmm5
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -32441,16 +33045,16 @@ _sk_load_f16_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 4353 <_sk_load_f16_dst_sse41+0x177>
+ .byte 117,13 // jne 4511 <_sk_load_f16_dst_sse41+0x177>
.byte 243,15,126,228 // movq %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
- .byte 233,182,254,255,255 // jmpq 4209 <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 43c7 <_sk_load_f16_dst_sse41+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 4209 <_sk_load_f16_dst_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 43c7 <_sk_load_f16_dst_sse41+0x2d>
.byte 243,65,15,126,108,193,16 // movq 0x10(%r9,%rax,8),%xmm5
- .byte 233,149,254,255,255 // jmpq 4209 <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 43c7 <_sk_load_f16_dst_sse41+0x2d>
HIDDEN _sk_gather_f16_sse41
.globl _sk_gather_f16_sse41
@@ -32484,18 +33088,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,117,42,0,0 // movdqa 0x2a75(%rip),%xmm8 # 6e70 <_sk_callback_sse41+0x1182>
+ .byte 102,68,15,111,5,55,43,0,0 // movdqa 0x2b37(%rip),%xmm8 # 70f0 <_sk_callback_sse41+0x1244>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,112,42,0,0 // movdqa 0x2a70(%rip),%xmm3 # 6e80 <_sk_callback_sse41+0x1192>
+ .byte 102,15,111,29,50,43,0,0 // movdqa 0x2b32(%rip),%xmm3 # 7100 <_sk_callback_sse41+0x1254>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,92,42,0,0 // movdqa 0x2a5c(%rip),%xmm10 # 6e90 <_sk_callback_sse41+0x11a2>
+ .byte 102,68,15,111,21,30,43,0,0 // movdqa 0x2b1e(%rip),%xmm10 # 7110 <_sk_callback_sse41+0x1264>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -32549,17 +33153,17 @@ _sk_store_f16_sse41:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,127,41,0,0 // movdqa 0x297f(%rip),%xmm10 # 6ea0 <_sk_callback_sse41+0x11b2>
+ .byte 102,68,15,111,21,65,42,0,0 // movdqa 0x2a41(%rip),%xmm10 # 7120 <_sk_callback_sse41+0x1274>
.byte 102,68,15,111,216 // movdqa %xmm0,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,235 // pxor %xmm11,%xmm13
- .byte 102,68,15,111,13,114,41,0,0 // movdqa 0x2972(%rip),%xmm9 # 6eb0 <_sk_callback_sse41+0x11c2>
+ .byte 102,68,15,111,13,52,42,0,0 // movdqa 0x2a34(%rip),%xmm9 # 7130 <_sk_callback_sse41+0x1284>
.byte 102,65,15,114,211,16 // psrld $0x10,%xmm11
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,37,99,41,0,0 // movdqa 0x2963(%rip),%xmm12 # 6ec0 <_sk_callback_sse41+0x11d2>
+ .byte 102,68,15,111,37,37,42,0,0 // movdqa 0x2a25(%rip),%xmm12 # 7140 <_sk_callback_sse41+0x1294>
.byte 102,69,15,235,220 // por %xmm12,%xmm11
.byte 102,69,15,254,221 // paddd %xmm13,%xmm11
.byte 102,69,15,223,195 // pandn %xmm11,%xmm8
@@ -32603,7 +33207,7 @@ _sk_store_f16_sse41:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,203 // punpckldq %xmm11,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 4653 <_sk_store_f16_sse41+0x152>
+ .byte 117,21 // jne 4811 <_sk_store_f16_sse41+0x152>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -32611,13 +33215,13 @@ _sk_store_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 464f <_sk_store_f16_sse41+0x14e>
+ .byte 116,240 // je 480d <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 464f <_sk_store_f16_sse41+0x14e>
+ .byte 114,227 // jb 480d <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 464f <_sk_store_f16_sse41+0x14e>
+ .byte 235,213 // jmp 480d <_sk_store_f16_sse41+0x14e>
HIDDEN _sk_load_u16_be_sse41
.globl _sk_load_u16_be_sse41
@@ -32632,7 +33236,7 @@ _sk_load_u16_be_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,185,0,0,0 // jne 475a <_sk_load_u16_be_sse41+0xe0>
+ .byte 15,133,185,0,0,0 // jne 4918 <_sk_load_u16_be_sse41+0xe0>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 243,65,15,111,76,65,16 // movdqu 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -32648,7 +33252,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,227,39,0,0 // movaps 0x27e3(%rip),%xmm8 # 6ed0 <_sk_callback_sse41+0x11e2>
+ .byte 68,15,40,5,165,40,0,0 // movaps 0x28a5(%rip),%xmm8 # 7150 <_sk_callback_sse41+0x12a4>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -32676,16 +33280,16 @@ _sk_load_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 4773 <_sk_load_u16_be_sse41+0xf9>
+ .byte 117,13 // jne 4931 <_sk_load_u16_be_sse41+0xf9>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,59,255,255,255 // jmpq 46ae <_sk_load_u16_be_sse41+0x34>
+ .byte 233,59,255,255,255 // jmpq 486c <_sk_load_u16_be_sse41+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,38,255,255,255 // jb 46ae <_sk_load_u16_be_sse41+0x34>
+ .byte 15,130,38,255,255,255 // jb 486c <_sk_load_u16_be_sse41+0x34>
.byte 243,65,15,126,76,65,16 // movq 0x10(%r9,%rax,2),%xmm1
- .byte 233,26,255,255,255 // jmpq 46ae <_sk_load_u16_be_sse41+0x34>
+ .byte 233,26,255,255,255 // jmpq 486c <_sk_load_u16_be_sse41+0x34>
HIDDEN _sk_load_rgb_u16_be_sse41
.globl _sk_load_rgb_u16_be_sse41
@@ -32702,7 +33306,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,170,0,0,0 // jne 4869 <_sk_load_rgb_u16_be_sse41+0xd5>
+ .byte 15,133,170,0,0,0 // jne 4a27 <_sk_load_rgb_u16_be_sse41+0xd5>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -32722,7 +33326,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,194,38,0,0 // movaps 0x26c2(%rip),%xmm8 # 6ee0 <_sk_callback_sse41+0x11f2>
+ .byte 68,15,40,5,132,39,0,0 // movaps 0x2784(%rip),%xmm8 # 7160 <_sk_callback_sse41+0x12b4>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -32739,27 +33343,27 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,137,38,0,0 // movaps 0x2689(%rip),%xmm3 # 6ef0 <_sk_callback_sse41+0x1202>
+ .byte 15,40,29,75,39,0,0 // movaps 0x274b(%rip),%xmm3 # 7170 <_sk_callback_sse41+0x12c4>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 488e <_sk_load_rgb_u16_be_sse41+0xfa>
+ .byte 117,13 // jne 4a4c <_sk_load_rgb_u16_be_sse41+0xfa>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,85,255,255,255 // jmpq 47e3 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,85,255,255,255 // jmpq 49a1 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 48bf <_sk_load_rgb_u16_be_sse41+0x12b>
+ .byte 114,24 // jb 4a7d <_sk_load_rgb_u16_be_sse41+0x12b>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,36,255,255,255 // jmpq 47e3 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,36,255,255,255 // jmpq 49a1 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,27,255,255,255 // jmpq 47e3 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,27,255,255,255 // jmpq 49a1 <_sk_load_rgb_u16_be_sse41+0x4f>
HIDDEN _sk_store_u16_be_sse41
.globl _sk_store_u16_be_sse41
@@ -32773,7 +33377,7 @@ _sk_store_u16_be_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,18,38,0,0 // movaps 0x2612(%rip),%xmm10 # 6f00 <_sk_callback_sse41+0x1212>
+ .byte 68,15,40,21,212,38,0,0 // movaps 0x26d4(%rip),%xmm10 # 7180 <_sk_callback_sse41+0x12d4>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -32810,7 +33414,7 @@ _sk_store_u16_be_sse41:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 49bc <_sk_store_u16_be_sse41+0xf4>
+ .byte 117,21 // jne 4b7a <_sk_store_u16_be_sse41+0xf4>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -32818,13 +33422,13 @@ _sk_store_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 49b8 <_sk_store_u16_be_sse41+0xf0>
+ .byte 116,240 // je 4b76 <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 49b8 <_sk_store_u16_be_sse41+0xf0>
+ .byte 114,227 // jb 4b76 <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 49b8 <_sk_store_u16_be_sse41+0xf0>
+ .byte 235,213 // jmp 4b76 <_sk_store_u16_be_sse41+0xf0>
HIDDEN _sk_load_f32_sse41
.globl _sk_load_f32_sse41
@@ -32840,7 +33444,7 @@ _sk_load_f32_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 4a4e <_sk_load_f32_sse41+0x6b>
+ .byte 117,66 // jne 4c0c <_sk_load_f32_sse41+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -32860,17 +33464,17 @@ _sk_load_f32_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 4a60 <_sk_load_f32_sse41+0x7d>
+ .byte 117,8 // jne 4c1e <_sk_load_f32_sse41+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 4a1e <_sk_load_f32_sse41+0x3b>
+ .byte 235,190 // jmp 4bdc <_sk_load_f32_sse41+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 4a74 <_sk_load_f32_sse41+0x91>
+ .byte 114,8 // jb 4c32 <_sk_load_f32_sse41+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 4a1e <_sk_load_f32_sse41+0x3b>
+ .byte 235,170 // jmp 4bdc <_sk_load_f32_sse41+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 4a1e <_sk_load_f32_sse41+0x3b>
+ .byte 235,165 // jmp 4bdc <_sk_load_f32_sse41+0x3b>
HIDDEN _sk_load_f32_dst_sse41
.globl _sk_load_f32_dst_sse41
@@ -32886,7 +33490,7 @@ _sk_load_f32_dst_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 4ae4 <_sk_load_f32_dst_sse41+0x6b>
+ .byte 117,66 // jne 4ca2 <_sk_load_f32_dst_sse41+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -32906,17 +33510,17 @@ _sk_load_f32_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 4af6 <_sk_load_f32_dst_sse41+0x7d>
+ .byte 117,8 // jne 4cb4 <_sk_load_f32_dst_sse41+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 4ab4 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,190 // jmp 4c72 <_sk_load_f32_dst_sse41+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 4b0a <_sk_load_f32_dst_sse41+0x91>
+ .byte 114,8 // jb 4cc8 <_sk_load_f32_dst_sse41+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 4ab4 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,170 // jmp 4c72 <_sk_load_f32_dst_sse41+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 4ab4 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,165 // jmp 4c72 <_sk_load_f32_dst_sse41+0x3b>
HIDDEN _sk_store_f32_sse41
.globl _sk_store_f32_sse41
@@ -32945,7 +33549,7 @@ _sk_store_f32_sse41:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 4b8c <_sk_store_f32_sse41+0x7d>
+ .byte 117,29 // jne 4d4a <_sk_store_f32_sse41+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -32953,12 +33557,12 @@ _sk_store_f32_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 4b88 <_sk_store_f32_sse41+0x79>
+ .byte 116,246 // je 4d46 <_sk_store_f32_sse41+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 4b88 <_sk_store_f32_sse41+0x79>
+ .byte 114,234 // jb 4d46 <_sk_store_f32_sse41+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 4b88 <_sk_store_f32_sse41+0x79>
+ .byte 235,225 // jmp 4d46 <_sk_store_f32_sse41+0x79>
HIDDEN _sk_clamp_x_sse41
.globl _sk_clamp_x_sse41
@@ -33048,7 +33652,7 @@ _sk_mirror_x_sse41:
.byte 65,15,92,194 // subps %xmm10,%xmm0
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,188,38,0,0 // mulss 0x26bc(%rip),%xmm9 # 7370 <_sk_callback_sse41+0x1682>
+ .byte 243,68,15,89,13,126,39,0,0 // mulss 0x277e(%rip),%xmm9 # 75f0 <_sk_callback_sse41+0x1744>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -33079,7 +33683,7 @@ _sk_mirror_y_sse41:
.byte 65,15,92,202 // subps %xmm10,%xmm1
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,78,38,0,0 // mulss 0x264e(%rip),%xmm9 # 7374 <_sk_callback_sse41+0x1686>
+ .byte 243,68,15,89,13,16,39,0,0 // mulss 0x2710(%rip),%xmm9 # 75f4 <_sk_callback_sse41+0x1748>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,201 // mulps %xmm1,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -33104,7 +33708,7 @@ FUNCTION(_sk_clamp_x_1_sse41)
_sk_clamp_x_1_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,149,33,0,0 // minps 0x2195(%rip),%xmm8 # 6f10 <_sk_callback_sse41+0x1222>
+ .byte 68,15,93,5,87,34,0,0 // minps 0x2257(%rip),%xmm8 # 7190 <_sk_callback_sse41+0x12e4>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -33122,9 +33726,9 @@ HIDDEN _sk_mirror_x_1_sse41
.globl _sk_mirror_x_1_sse41
FUNCTION(_sk_mirror_x_1_sse41)
_sk_mirror_x_1_sse41:
- .byte 68,15,40,5,134,33,0,0 // movaps 0x2186(%rip),%xmm8 # 6f20 <_sk_callback_sse41+0x1232>
+ .byte 68,15,40,5,72,34,0,0 // movaps 0x2248(%rip),%xmm8 # 71a0 <_sk_callback_sse41+0x12f4>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,138,33,0,0 // movaps 0x218a(%rip),%xmm9 # 6f30 <_sk_callback_sse41+0x1242>
+ .byte 68,15,40,13,76,34,0,0 // movaps 0x224c(%rip),%xmm9 # 71b0 <_sk_callback_sse41+0x1304>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
.byte 69,15,88,201 // addps %xmm9,%xmm9
@@ -33141,10 +33745,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,105,33,0,0 // mulps 0x2169(%rip),%xmm0 # 6f40 <_sk_callback_sse41+0x1252>
- .byte 15,89,13,114,33,0,0 // mulps 0x2172(%rip),%xmm1 # 6f50 <_sk_callback_sse41+0x1262>
+ .byte 15,89,5,43,34,0,0 // mulps 0x222b(%rip),%xmm0 # 71c0 <_sk_callback_sse41+0x1314>
+ .byte 15,89,13,52,34,0,0 // mulps 0x2234(%rip),%xmm1 # 71d0 <_sk_callback_sse41+0x1324>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,120,33,0,0 // mulps 0x2178(%rip),%xmm3 # 6f60 <_sk_callback_sse41+0x1272>
+ .byte 15,89,29,58,34,0,0 // mulps 0x223a(%rip),%xmm3 # 71e0 <_sk_callback_sse41+0x1334>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -33457,9 +34061,9 @@ _sk_evenly_spaced_gradient_sse41:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 528a <_sk_evenly_spaced_gradient_sse41+0x1a>
+ .byte 120,7 // js 5448 <_sk_evenly_spaced_gradient_sse41+0x1a>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 529f <_sk_evenly_spaced_gradient_sse41+0x2f>
+ .byte 235,21 // jmp 545d <_sk_evenly_spaced_gradient_sse41+0x2f>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -33549,15 +34153,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41
.globl _sk_gauss_a_to_rgba_sse41
FUNCTION(_sk_gauss_a_to_rgba_sse41)
_sk_gauss_a_to_rgba_sse41:
- .byte 15,40,5,35,27,0,0 // movaps 0x1b23(%rip),%xmm0 # 6f70 <_sk_callback_sse41+0x1282>
+ .byte 15,40,5,229,27,0,0 // movaps 0x1be5(%rip),%xmm0 # 71f0 <_sk_callback_sse41+0x1344>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,41,27,0,0 // addps 0x1b29(%rip),%xmm0 # 6f80 <_sk_callback_sse41+0x1292>
+ .byte 15,88,5,235,27,0,0 // addps 0x1beb(%rip),%xmm0 # 7200 <_sk_callback_sse41+0x1354>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,47,27,0,0 // addps 0x1b2f(%rip),%xmm0 # 6f90 <_sk_callback_sse41+0x12a2>
+ .byte 15,88,5,241,27,0,0 // addps 0x1bf1(%rip),%xmm0 # 7210 <_sk_callback_sse41+0x1364>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,53,27,0,0 // addps 0x1b35(%rip),%xmm0 # 6fa0 <_sk_callback_sse41+0x12b2>
+ .byte 15,88,5,247,27,0,0 // addps 0x1bf7(%rip),%xmm0 # 7220 <_sk_callback_sse41+0x1374>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,59,27,0,0 // addps 0x1b3b(%rip),%xmm0 # 6fb0 <_sk_callback_sse41+0x12c2>
+ .byte 15,88,5,253,27,0,0 // addps 0x1bfd(%rip),%xmm0 # 7230 <_sk_callback_sse41+0x1384>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -33575,12 +34179,12 @@ _sk_gradient_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 54c8 <_sk_gradient_sse41+0x46>
+ .byte 114,50 // jb 5686 <_sk_gradient_sse41+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,20,27,0,0 // movaps 0x1b14(%rip),%xmm2 # 6fc0 <_sk_callback_sse41+0x12d2>
+ .byte 15,40,21,214,27,0,0 // movaps 0x1bd6(%rip),%xmm2 # 7240 <_sk_callback_sse41+0x1394>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -33588,7 +34192,7 @@ _sk_gradient_sse41:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 54ac <_sk_gradient_sse41+0x2a>
+ .byte 117,228 // jne 566a <_sk_gradient_sse41+0x2a>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -33718,26 +34322,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,181,24,0,0 // movaps 0x18b5(%rip),%xmm10 # 6fd0 <_sk_callback_sse41+0x12e2>
+ .byte 68,15,40,21,119,25,0,0 // movaps 0x1977(%rip),%xmm10 # 7250 <_sk_callback_sse41+0x13a4>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,185,24,0,0 // addps 0x18b9(%rip),%xmm10 # 6fe0 <_sk_callback_sse41+0x12f2>
+ .byte 68,15,88,21,123,25,0,0 // addps 0x197b(%rip),%xmm10 # 7260 <_sk_callback_sse41+0x13b4>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,189,24,0,0 // addps 0x18bd(%rip),%xmm10 # 6ff0 <_sk_callback_sse41+0x1302>
+ .byte 68,15,88,21,127,25,0,0 // addps 0x197f(%rip),%xmm10 # 7270 <_sk_callback_sse41+0x13c4>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,193,24,0,0 // addps 0x18c1(%rip),%xmm10 # 7000 <_sk_callback_sse41+0x1312>
+ .byte 68,15,88,21,131,25,0,0 // addps 0x1983(%rip),%xmm10 # 7280 <_sk_callback_sse41+0x13d4>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,192,24,0,0 // movaps 0x18c0(%rip),%xmm11 # 7010 <_sk_callback_sse41+0x1322>
+ .byte 68,15,40,29,130,25,0,0 // movaps 0x1982(%rip),%xmm11 # 7290 <_sk_callback_sse41+0x13e4>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,185,24,0,0 // movaps 0x18b9(%rip),%xmm11 # 7020 <_sk_callback_sse41+0x1332>
+ .byte 68,15,40,29,123,25,0,0 // movaps 0x197b(%rip),%xmm11 # 72a0 <_sk_callback_sse41+0x13f4>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,171,24,0,0 // movaps 0x18ab(%rip),%xmm9 # 7030 <_sk_callback_sse41+0x1342>
+ .byte 68,15,40,13,109,25,0,0 // movaps 0x196d(%rip),%xmm9 # 72b0 <_sk_callback_sse41+0x1404>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -33771,7 +34375,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,84,24,0,0 // mulps 0x1854(%rip),%xmm9 # 7040 <_sk_callback_sse41+0x1352>
+ .byte 68,15,89,13,22,25,0,0 // mulps 0x1916(%rip),%xmm9 # 72c0 <_sk_callback_sse41+0x1414>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -33779,7 +34383,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,63,24,0,0 // mulps 0x183f(%rip),%xmm10 # 7050 <_sk_callback_sse41+0x1362>
+ .byte 68,15,89,21,1,25,0,0 // mulps 0x1901(%rip),%xmm10 # 72d0 <_sk_callback_sse41+0x1424>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -33788,8 +34392,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,39,24,0,0 // xorps 0x1827(%rip),%xmm9 # 7060 <_sk_callback_sse41+0x1372>
- .byte 68,15,89,5,47,24,0,0 // mulps 0x182f(%rip),%xmm8 # 7070 <_sk_callback_sse41+0x1382>
+ .byte 68,15,87,13,233,24,0,0 // xorps 0x18e9(%rip),%xmm9 # 72e0 <_sk_callback_sse41+0x1434>
+ .byte 68,15,89,5,241,24,0,0 // mulps 0x18f1(%rip),%xmm8 # 72f0 <_sk_callback_sse41+0x1444>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -33810,7 +34414,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,246,23,0,0 // mulps 0x17f6(%rip),%xmm9 # 7080 <_sk_callback_sse41+0x1392>
+ .byte 68,15,89,13,184,24,0,0 // mulps 0x18b8(%rip),%xmm9 # 7300 <_sk_callback_sse41+0x1454>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -33818,7 +34422,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,225,23,0,0 // mulps 0x17e1(%rip),%xmm10 # 7090 <_sk_callback_sse41+0x13a2>
+ .byte 68,15,89,21,163,24,0,0 // mulps 0x18a3(%rip),%xmm10 # 7310 <_sk_callback_sse41+0x1464>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -33827,8 +34431,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,201,23,0,0 // xorps 0x17c9(%rip),%xmm9 # 70a0 <_sk_callback_sse41+0x13b2>
- .byte 68,15,89,5,209,23,0,0 // mulps 0x17d1(%rip),%xmm8 # 70b0 <_sk_callback_sse41+0x13c2>
+ .byte 68,15,87,13,139,24,0,0 // xorps 0x188b(%rip),%xmm9 # 7320 <_sk_callback_sse41+0x1474>
+ .byte 68,15,89,5,147,24,0,0 // mulps 0x1893(%rip),%xmm8 # 7330 <_sk_callback_sse41+0x1484>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -33846,7 +34450,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,169,23,0,0 // mulps 0x17a9(%rip),%xmm9 # 70c0 <_sk_callback_sse41+0x13d2>
+ .byte 68,15,89,13,107,24,0,0 // mulps 0x186b(%rip),%xmm9 # 7340 <_sk_callback_sse41+0x1494>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -33854,7 +34458,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,149,23,0,0 // xorps 0x1795(%rip),%xmm0 # 70d0 <_sk_callback_sse41+0x13e2>
+ .byte 15,87,5,87,24,0,0 // xorps 0x1857(%rip),%xmm0 # 7350 <_sk_callback_sse41+0x14a4>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33897,7 +34501,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,59,23,0,0 // movaps 0x173b(%rip),%xmm8 # 70e0 <_sk_callback_sse41+0x13f2>
+ .byte 68,15,40,5,253,23,0,0 // movaps 0x17fd(%rip),%xmm8 # 7360 <_sk_callback_sse41+0x14b4>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -33941,8 +34545,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,189,22,0,0 // addps 0x16bd(%rip),%xmm0 # 70f0 <_sk_callback_sse41+0x1402>
- .byte 68,15,40,13,197,22,0,0 // movaps 0x16c5(%rip),%xmm9 # 7100 <_sk_callback_sse41+0x1412>
+ .byte 15,88,5,127,23,0,0 // addps 0x177f(%rip),%xmm0 # 7370 <_sk_callback_sse41+0x14c4>
+ .byte 68,15,40,13,135,23,0,0 // movaps 0x1787(%rip),%xmm9 # 7380 <_sk_callback_sse41+0x14d4>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33955,7 +34559,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,180,22,0,0 // addps 0x16b4(%rip),%xmm0 # 7110 <_sk_callback_sse41+0x1422>
+ .byte 15,88,5,118,23,0,0 // addps 0x1776(%rip),%xmm0 # 7390 <_sk_callback_sse41+0x14e4>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33967,8 +34571,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,166,22,0,0 // addps 0x16a6(%rip),%xmm1 # 7120 <_sk_callback_sse41+0x1432>
- .byte 68,15,40,13,174,22,0,0 // movaps 0x16ae(%rip),%xmm9 # 7130 <_sk_callback_sse41+0x1442>
+ .byte 15,88,13,104,23,0,0 // addps 0x1768(%rip),%xmm1 # 73a0 <_sk_callback_sse41+0x14f4>
+ .byte 68,15,40,13,112,23,0,0 // movaps 0x1770(%rip),%xmm9 # 73b0 <_sk_callback_sse41+0x1504>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33981,7 +34585,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,156,22,0,0 // addps 0x169c(%rip),%xmm1 # 7140 <_sk_callback_sse41+0x1452>
+ .byte 15,88,13,94,23,0,0 // addps 0x175e(%rip),%xmm1 # 73c0 <_sk_callback_sse41+0x1514>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33993,13 +34597,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,143,22,0,0 // addps 0x168f(%rip),%xmm0 # 7150 <_sk_callback_sse41+0x1462>
- .byte 68,15,40,13,151,22,0,0 // movaps 0x1697(%rip),%xmm9 # 7160 <_sk_callback_sse41+0x1472>
+ .byte 15,88,5,81,23,0,0 // addps 0x1751(%rip),%xmm0 # 73d0 <_sk_callback_sse41+0x1524>
+ .byte 68,15,40,13,89,23,0,0 // movaps 0x1759(%rip),%xmm9 # 73e0 <_sk_callback_sse41+0x1534>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,147,22,0,0 // mulps 0x1693(%rip),%xmm9 # 7170 <_sk_callback_sse41+0x1482>
- .byte 68,15,88,13,155,22,0,0 // addps 0x169b(%rip),%xmm9 # 7180 <_sk_callback_sse41+0x1492>
+ .byte 68,15,89,13,85,23,0,0 // mulps 0x1755(%rip),%xmm9 # 73f0 <_sk_callback_sse41+0x1544>
+ .byte 68,15,88,13,93,23,0,0 // addps 0x175d(%rip),%xmm9 # 7400 <_sk_callback_sse41+0x1554>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34012,16 +34616,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,138,22,0,0 // addps 0x168a(%rip),%xmm0 # 7190 <_sk_callback_sse41+0x14a2>
- .byte 68,15,40,13,146,22,0,0 // movaps 0x1692(%rip),%xmm9 # 71a0 <_sk_callback_sse41+0x14b2>
+ .byte 15,88,5,76,23,0,0 // addps 0x174c(%rip),%xmm0 # 7410 <_sk_callback_sse41+0x1564>
+ .byte 68,15,40,13,84,23,0,0 // movaps 0x1754(%rip),%xmm9 # 7420 <_sk_callback_sse41+0x1574>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,150,22,0,0 // movaps 0x1696(%rip),%xmm8 # 71b0 <_sk_callback_sse41+0x14c2>
+ .byte 68,15,40,5,88,23,0,0 // movaps 0x1758(%rip),%xmm8 # 7430 <_sk_callback_sse41+0x1584>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,154,22,0,0 // addps 0x169a(%rip),%xmm8 # 71c0 <_sk_callback_sse41+0x14d2>
+ .byte 68,15,88,5,92,23,0,0 // addps 0x175c(%rip),%xmm8 # 7440 <_sk_callback_sse41+0x1594>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,158,22,0,0 // addps 0x169e(%rip),%xmm8 # 71d0 <_sk_callback_sse41+0x14e2>
+ .byte 68,15,88,5,96,23,0,0 // addps 0x1760(%rip),%xmm8 # 7450 <_sk_callback_sse41+0x15a4>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,162,22,0,0 // addps 0x16a2(%rip),%xmm8 # 71e0 <_sk_callback_sse41+0x14f2>
+ .byte 68,15,88,5,100,23,0,0 // addps 0x1764(%rip),%xmm8 # 7460 <_sk_callback_sse41+0x15b4>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34031,17 +34635,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,156,22,0,0 // movaps 0x169c(%rip),%xmm8 # 71f0 <_sk_callback_sse41+0x1502>
+ .byte 68,15,40,5,94,23,0,0 // movaps 0x175e(%rip),%xmm8 # 7470 <_sk_callback_sse41+0x15c4>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,152,22,0,0 // movaps 0x1698(%rip),%xmm10 # 7200 <_sk_callback_sse41+0x1512>
+ .byte 68,15,40,21,90,23,0,0 // movaps 0x175a(%rip),%xmm10 # 7480 <_sk_callback_sse41+0x15d4>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,156,22,0,0 // addps 0x169c(%rip),%xmm10 # 7210 <_sk_callback_sse41+0x1522>
+ .byte 68,15,88,21,94,23,0,0 // addps 0x175e(%rip),%xmm10 # 7490 <_sk_callback_sse41+0x15e4>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,152,22,0,0 // addps 0x1698(%rip),%xmm10 # 7220 <_sk_callback_sse41+0x1532>
+ .byte 68,15,88,21,90,23,0,0 // addps 0x175a(%rip),%xmm10 # 74a0 <_sk_callback_sse41+0x15f4>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34053,11 +34657,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,139,22,0,0 // addps 0x168b(%rip),%xmm0 # 7230 <_sk_callback_sse41+0x1542>
+ .byte 15,88,5,77,23,0,0 // addps 0x174d(%rip),%xmm0 # 74b0 <_sk_callback_sse41+0x1604>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,139,22,0,0 // mulps 0x168b(%rip),%xmm8 # 7240 <_sk_callback_sse41+0x1552>
- .byte 68,15,88,5,147,22,0,0 // addps 0x1693(%rip),%xmm8 # 7250 <_sk_callback_sse41+0x1562>
+ .byte 68,15,89,5,77,23,0,0 // mulps 0x174d(%rip),%xmm8 # 74c0 <_sk_callback_sse41+0x1614>
+ .byte 68,15,88,5,85,23,0,0 // addps 0x1755(%rip),%xmm8 # 74d0 <_sk_callback_sse41+0x1624>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34070,13 +34674,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,129,22,0,0 // addps 0x1681(%rip),%xmm1 # 7260 <_sk_callback_sse41+0x1572>
- .byte 68,15,40,13,137,22,0,0 // movaps 0x1689(%rip),%xmm9 # 7270 <_sk_callback_sse41+0x1582>
+ .byte 15,88,13,67,23,0,0 // addps 0x1743(%rip),%xmm1 # 74e0 <_sk_callback_sse41+0x1634>
+ .byte 68,15,40,13,75,23,0,0 // movaps 0x174b(%rip),%xmm9 # 74f0 <_sk_callback_sse41+0x1644>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,133,22,0,0 // mulps 0x1685(%rip),%xmm9 # 7280 <_sk_callback_sse41+0x1592>
- .byte 68,15,88,13,141,22,0,0 // addps 0x168d(%rip),%xmm9 # 7290 <_sk_callback_sse41+0x15a2>
+ .byte 68,15,89,13,71,23,0,0 // mulps 0x1747(%rip),%xmm9 # 7500 <_sk_callback_sse41+0x1654>
+ .byte 68,15,88,13,79,23,0,0 // addps 0x174f(%rip),%xmm9 # 7510 <_sk_callback_sse41+0x1664>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34089,16 +34693,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,123,22,0,0 // addps 0x167b(%rip),%xmm1 # 72a0 <_sk_callback_sse41+0x15b2>
- .byte 68,15,40,13,131,22,0,0 // movaps 0x1683(%rip),%xmm9 # 72b0 <_sk_callback_sse41+0x15c2>
+ .byte 15,88,13,61,23,0,0 // addps 0x173d(%rip),%xmm1 # 7520 <_sk_callback_sse41+0x1674>
+ .byte 68,15,40,13,69,23,0,0 // movaps 0x1745(%rip),%xmm9 # 7530 <_sk_callback_sse41+0x1684>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,135,22,0,0 // movaps 0x1687(%rip),%xmm8 # 72c0 <_sk_callback_sse41+0x15d2>
+ .byte 68,15,40,5,73,23,0,0 // movaps 0x1749(%rip),%xmm8 # 7540 <_sk_callback_sse41+0x1694>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,139,22,0,0 // addps 0x168b(%rip),%xmm8 # 72d0 <_sk_callback_sse41+0x15e2>
+ .byte 68,15,88,5,77,23,0,0 // addps 0x174d(%rip),%xmm8 # 7550 <_sk_callback_sse41+0x16a4>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,143,22,0,0 // addps 0x168f(%rip),%xmm8 # 72e0 <_sk_callback_sse41+0x15f2>
+ .byte 68,15,88,5,81,23,0,0 // addps 0x1751(%rip),%xmm8 # 7560 <_sk_callback_sse41+0x16b4>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,147,22,0,0 // addps 0x1693(%rip),%xmm8 # 72f0 <_sk_callback_sse41+0x1602>
+ .byte 68,15,88,5,85,23,0,0 // addps 0x1755(%rip),%xmm8 # 7570 <_sk_callback_sse41+0x16c4>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34108,17 +34712,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,141,22,0,0 // movaps 0x168d(%rip),%xmm8 # 7300 <_sk_callback_sse41+0x1612>
+ .byte 68,15,40,5,79,23,0,0 // movaps 0x174f(%rip),%xmm8 # 7580 <_sk_callback_sse41+0x16d4>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,136,22,0,0 // movaps 0x1688(%rip),%xmm10 # 7310 <_sk_callback_sse41+0x1622>
+ .byte 68,15,40,21,74,23,0,0 // movaps 0x174a(%rip),%xmm10 # 7590 <_sk_callback_sse41+0x16e4>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,140,22,0,0 // addps 0x168c(%rip),%xmm10 # 7320 <_sk_callback_sse41+0x1632>
+ .byte 68,15,88,21,78,23,0,0 // addps 0x174e(%rip),%xmm10 # 75a0 <_sk_callback_sse41+0x16f4>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,136,22,0,0 // addps 0x1688(%rip),%xmm10 # 7330 <_sk_callback_sse41+0x1642>
+ .byte 68,15,88,21,74,23,0,0 // addps 0x174a(%rip),%xmm10 # 75b0 <_sk_callback_sse41+0x1704>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -34130,11 +34734,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,122,22,0,0 // addps 0x167a(%rip),%xmm1 # 7340 <_sk_callback_sse41+0x1652>
+ .byte 15,88,13,60,23,0,0 // addps 0x173c(%rip),%xmm1 # 75c0 <_sk_callback_sse41+0x1714>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,122,22,0,0 // mulps 0x167a(%rip),%xmm8 # 7350 <_sk_callback_sse41+0x1662>
- .byte 68,15,88,5,130,22,0,0 // addps 0x1682(%rip),%xmm8 # 7360 <_sk_callback_sse41+0x1672>
+ .byte 68,15,89,5,60,23,0,0 // mulps 0x173c(%rip),%xmm8 # 75d0 <_sk_callback_sse41+0x1724>
+ .byte 68,15,88,5,68,23,0,0 // addps 0x1744(%rip),%xmm8 # 75e0 <_sk_callback_sse41+0x1734>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34376,9 +34980,9 @@ BALIGN16
.byte 128,191,0,0,224,64,0 // cmpb $0x0,0x40e00000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 5fdc <.literal16+0x1fc>
+ .byte 224,64 // loopne 619c <.literal16+0x1fc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 5fe0 <.literal16+0x200>
+ .byte 224,64 // loopne 61a0 <.literal16+0x200>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -34398,13 +35002,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6001 <.literal16+0x221>
+ .byte 71,225,61 // rex.RXB loope 61c1 <.literal16+0x221>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6005 <.literal16+0x225>
+ .byte 71,225,61 // rex.RXB loope 61c5 <.literal16+0x225>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6009 <.literal16+0x229>
+ .byte 71,225,61 // rex.RXB loope 61c9 <.literal16+0x229>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 600d <.literal16+0x22d>
+ .byte 71,225,61 // rex.RXB loope 61cd <.literal16+0x22d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34429,13 +35033,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6041 <.literal16+0x261>
+ .byte 71,225,61 // rex.RXB loope 6201 <.literal16+0x261>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6045 <.literal16+0x265>
+ .byte 71,225,61 // rex.RXB loope 6205 <.literal16+0x265>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6049 <.literal16+0x269>
+ .byte 71,225,61 // rex.RXB loope 6209 <.literal16+0x269>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 604d <.literal16+0x26d>
+ .byte 71,225,61 // rex.RXB loope 620d <.literal16+0x26d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34460,13 +35064,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6081 <.literal16+0x2a1>
+ .byte 71,225,61 // rex.RXB loope 6241 <.literal16+0x2a1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6085 <.literal16+0x2a5>
+ .byte 71,225,61 // rex.RXB loope 6245 <.literal16+0x2a5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6089 <.literal16+0x2a9>
+ .byte 71,225,61 // rex.RXB loope 6249 <.literal16+0x2a9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 608d <.literal16+0x2ad>
+ .byte 71,225,61 // rex.RXB loope 624d <.literal16+0x2ad>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34491,13 +35095,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 60c1 <.literal16+0x2e1>
+ .byte 71,225,61 // rex.RXB loope 6281 <.literal16+0x2e1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 60c5 <.literal16+0x2e5>
+ .byte 71,225,61 // rex.RXB loope 6285 <.literal16+0x2e5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 60c9 <.literal16+0x2e9>
+ .byte 71,225,61 // rex.RXB loope 6289 <.literal16+0x2e9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 60cd <.literal16+0x2ed>
+ .byte 71,225,61 // rex.RXB loope 628d <.literal16+0x2ed>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34514,10 +35118,10 @@ BALIGN16
.byte 0,1 // add %al,(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0060b8 <_sk_callback_sse41+0xa0003ca>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006278 <_sk_callback_sse41+0xa0003cc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30060c0 <_sk_callback_sse41+0x30003d2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006280 <_sk_callback_sse41+0x30003d4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -34536,11 +35140,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
.byte 67,0,0 // rex.XB add %al,(%r8)
- .byte 127,67 // jg 612b <.literal16+0x34b>
+ .byte 127,67 // jg 62eb <.literal16+0x34b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 612f <.literal16+0x34f>
+ .byte 127,67 // jg 62ef <.literal16+0x34f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6133 <.literal16+0x353>
+ .byte 127,67 // jg 62f3 <.literal16+0x353>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -34827,13 +35431,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6379 <.literal16+0x599>
+ .byte 224,7 // loopne 6539 <.literal16+0x599>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 637d <.literal16+0x59d>
+ .byte 224,7 // loopne 653d <.literal16+0x59d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6381 <.literal16+0x5a1>
+ .byte 224,7 // loopne 6541 <.literal16+0x5a1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6385 <.literal16+0x5a5>
+ .byte 224,7 // loopne 6545 <.literal16+0x5a5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -34867,10 +35471,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0063c8 <_sk_callback_sse41+0xa0006da>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a006588 <_sk_callback_sse41+0xa0006dc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30063d0 <_sk_callback_sse41+0x30006e2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006590 <_sk_callback_sse41+0x30006e4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -34925,11 +35529,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 649b <.literal16+0x6bb>
+ .byte 127,67 // jg 665b <.literal16+0x6bb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 649f <.literal16+0x6bf>
+ .byte 127,67 // jg 665f <.literal16+0x6bf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 64a3 <.literal16+0x6c3>
+ .byte 127,67 // jg 6663 <.literal16+0x6c3>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -34944,16 +35548,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6494 <.literal16+0x6b4>
+ .byte 127,0 // jg 6654 <.literal16+0x6b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6498 <.literal16+0x6b8>
+ .byte 127,0 // jg 6658 <.literal16+0x6b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 649c <.literal16+0x6bc>
+ .byte 127,0 // jg 665c <.literal16+0x6bc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 64a0 <.literal16+0x6c0>
+ .byte 127,0 // jg 6660 <.literal16+0x6c0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -34962,7 +35566,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6525 <.literal16+0x745>
+ .byte 119,115 // ja 66e5 <.literal16+0x745>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -34973,7 +35577,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6489 <.literal16+0x6a9>
+ .byte 117,191 // jne 6649 <.literal16+0x6a9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -34985,7 +35589,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a4ca <_sk_callback_sse41+0xffffffffe9a347dc>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a68a <_sk_callback_sse41+0xffffffffe9a347de>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35040,16 +35644,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6564 <.literal16+0x784>
+ .byte 127,0 // jg 6724 <.literal16+0x784>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6568 <.literal16+0x788>
+ .byte 127,0 // jg 6728 <.literal16+0x788>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 656c <.literal16+0x78c>
+ .byte 127,0 // jg 672c <.literal16+0x78c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6570 <.literal16+0x790>
+ .byte 127,0 // jg 6730 <.literal16+0x790>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35058,7 +35662,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 65f5 <.literal16+0x815>
+ .byte 119,115 // ja 67b5 <.literal16+0x815>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35069,7 +35673,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6559 <.literal16+0x779>
+ .byte 117,191 // jne 6719 <.literal16+0x779>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35081,7 +35685,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a59a <_sk_callback_sse41+0xffffffffe9a348ac>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a75a <_sk_callback_sse41+0xffffffffe9a348ae>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35136,16 +35740,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6634 <.literal16+0x854>
+ .byte 127,0 // jg 67f4 <.literal16+0x854>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6638 <.literal16+0x858>
+ .byte 127,0 // jg 67f8 <.literal16+0x858>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 663c <.literal16+0x85c>
+ .byte 127,0 // jg 67fc <.literal16+0x85c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6640 <.literal16+0x860>
+ .byte 127,0 // jg 6800 <.literal16+0x860>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35154,7 +35758,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 66c5 <.literal16+0x8e5>
+ .byte 119,115 // ja 6885 <.literal16+0x8e5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35165,7 +35769,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6629 <.literal16+0x849>
+ .byte 117,191 // jne 67e9 <.literal16+0x849>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35177,7 +35781,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a66a <_sk_callback_sse41+0xffffffffe9a3497c>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a82a <_sk_callback_sse41+0xffffffffe9a3497e>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35232,16 +35836,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6704 <.literal16+0x924>
+ .byte 127,0 // jg 68c4 <.literal16+0x924>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6708 <.literal16+0x928>
+ .byte 127,0 // jg 68c8 <.literal16+0x928>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 670c <.literal16+0x92c>
+ .byte 127,0 // jg 68cc <.literal16+0x92c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6710 <.literal16+0x930>
+ .byte 127,0 // jg 68d0 <.literal16+0x930>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35250,7 +35854,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6795 <.literal16+0x9b5>
+ .byte 119,115 // ja 6955 <.literal16+0x9b5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35261,7 +35865,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 66f9 <.literal16+0x919>
+ .byte 117,191 // jne 68b9 <.literal16+0x919>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -35273,7 +35877,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a73a <_sk_callback_sse41+0xffffffffe9a34a4c>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a8fa <_sk_callback_sse41+0xffffffffe9a34a4e>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -35319,18 +35923,108 @@ BALIGN16
.byte 63 // (bad)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
- .byte 0,200 // add %cl,%al
- .byte 66,0,0 // rex.X add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6994 <.literal16+0x9f4>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6998 <.literal16+0x9f8>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 699c <.literal16+0x9fc>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 69a0 <.literal16+0xa00>
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 119,115 // ja 6a25 <.literal16+0xa85>
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,117,191 // retq $0xbf75
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // (bad)
+ .byte 117,191 // jne 6989 <.literal16+0x9e9>
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // (bad)
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3a9ca <_sk_callback_sse41+0xffffffffe9a34b1e>
+ .byte 220,63 // fdivrl (%rdi)
+ .byte 81 // push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,141,188,190,63,141,188,190 // lea -0x414372c1(%rsi,%r15,4),%edi
+ .byte 63 // (bad)
+ .byte 141,188,190,63,141,188,190 // lea -0x414372c1(%rsi,%rdi,4),%edi
+ .byte 63 // (bad)
+ .byte 248 // clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,254 // rex (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 75,0,0 // rex.WXB add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 75,0,0 // rex.WXB add %al,(%r8)
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 6817 <.literal16+0xa37>
+ .byte 200,66,0,0 // enterq $0x42,$0x0
+ .byte 127,67 // jg 6a97 <.literal16+0xaf7>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 681b <.literal16+0xa3b>
+ .byte 127,67 // jg 6a9b <.literal16+0xafb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 681f <.literal16+0xa3f>
+ .byte 127,67 // jg 6a9f <.literal16+0xaff>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6823 <.literal16+0xa43>
+ .byte 127,67 // jg 6aa3 <.literal16+0xb03>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -35377,16 +36071,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 68a3 <.literal16+0xac3>
+ .byte 118,63 // jbe 6b23 <.literal16+0xb83>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 68a7 <.literal16+0xac7>
+ .byte 118,63 // jbe 6b27 <.literal16+0xb87>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 68ab <.literal16+0xacb>
+ .byte 118,63 // jbe 6b2b <.literal16+0xb8b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 68af <.literal16+0xacf>
+ .byte 118,63 // jbe 6b2f <.literal16+0xb8f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -35415,11 +36109,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 691b <.literal16+0xb3b>
+ .byte 127,67 // jg 6b9b <.literal16+0xbfb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 691f <.literal16+0xb3f>
+ .byte 127,67 // jg 6b9f <.literal16+0xbff>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6923 <.literal16+0xb43>
+ .byte 127,67 // jg 6ba3 <.literal16+0xc03>
.byte 0,4,0 // add %al,(%rax,%rax,1)
.byte 0,0 // add %al,(%rax)
.byte 0,0 // add %al,(%rax)
@@ -35479,13 +36173,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6999 <.literal16+0xbb9>
+ .byte 224,7 // loopne 6c19 <.literal16+0xc79>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 699d <.literal16+0xbbd>
+ .byte 224,7 // loopne 6c1d <.literal16+0xc7d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 69a1 <.literal16+0xbc1>
+ .byte 224,7 // loopne 6c21 <.literal16+0xc81>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 69a5 <.literal16+0xbc5>
+ .byte 224,7 // loopne 6c25 <.literal16+0xc85>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -35531,13 +36225,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6a09 <.literal16+0xc29>
+ .byte 224,7 // loopne 6c89 <.literal16+0xce9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a0d <.literal16+0xc2d>
+ .byte 224,7 // loopne 6c8d <.literal16+0xced>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a11 <.literal16+0xc31>
+ .byte 224,7 // loopne 6c91 <.literal16+0xcf1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a15 <.literal16+0xc35>
+ .byte 224,7 // loopne 6c95 <.literal16+0xcf5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -35583,13 +36277,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6a79 <.literal16+0xc99>
+ .byte 224,7 // loopne 6cf9 <.literal16+0xd59>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a7d <.literal16+0xc9d>
+ .byte 224,7 // loopne 6cfd <.literal16+0xd5d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a81 <.literal16+0xca1>
+ .byte 224,7 // loopne 6d01 <.literal16+0xd61>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6a85 <.literal16+0xca5>
+ .byte 224,7 // loopne 6d05 <.literal16+0xd65>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -35627,13 +36321,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 6b16 <.literal16+0xd36>
+ .byte 124,66 // jl 6d96 <.literal16+0xdf6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6b1a <.literal16+0xd3a>
+ .byte 124,66 // jl 6d9a <.literal16+0xdfa>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6b1e <.literal16+0xd3e>
+ .byte 124,66 // jl 6d9e <.literal16+0xdfe>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6b22 <.literal16+0xd42>
+ .byte 124,66 // jl 6da2 <.literal16+0xe02>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -35767,13 +36461,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6ca5 <.literal16+0xec5>
+ .byte 112,65 // jo 6f25 <.literal16+0xf85>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6ca9 <.literal16+0xec9>
+ .byte 112,65 // jo 6f29 <.literal16+0xf89>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6cad <.literal16+0xecd>
+ .byte 112,65 // jo 6f2d <.literal16+0xf8d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6cb1 <.literal16+0xed1>
+ .byte 112,65 // jo 6f31 <.literal16+0xf91>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -35788,7 +36482,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006ca0 <_sk_callback_sse41+0x3000fb2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006f20 <_sk_callback_sse41+0x3001074>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35815,7 +36509,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006ce0 <_sk_callback_sse41+0x3000ff2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006f60 <_sk_callback_sse41+0x30010b4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35842,7 +36536,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006d20 <_sk_callback_sse41+0x3001032>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006fa0 <_sk_callback_sse41+0x30010f4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35857,11 +36551,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6d7b <.literal16+0xf9b>
+ .byte 127,67 // jg 6ffb <.literal16+0x105b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6d7f <.literal16+0xf9f>
+ .byte 127,67 // jg 6fff <.literal16+0x105f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6d83 <.literal16+0xfa3>
+ .byte 127,67 // jg 7003 <.literal16+0x1063>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -35876,7 +36570,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006d70 <_sk_callback_sse41+0x3001082>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006ff0 <_sk_callback_sse41+0x3001144>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35903,7 +36597,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006db0 <_sk_callback_sse41+0x30010c2>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3007030 <_sk_callback_sse41+0x3001184>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35930,7 +36624,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3006df0 <_sk_callback_sse41+0x3001102>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3007070 <_sk_callback_sse41+0x30011c4>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -35945,11 +36639,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6e4b <.literal16+0x106b>
+ .byte 127,67 // jg 70cb <.literal16+0x112b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6e4f <.literal16+0x106f>
+ .byte 127,67 // jg 70cf <.literal16+0x112f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6e53 <.literal16+0x1073>
+ .byte 127,67 // jg 70d3 <.literal16+0x1133>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -36044,13 +36738,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 6f4b <.literal16+0x116b>
+ .byte 127,71 // jg 71cb <.literal16+0x122b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 6f4f <.literal16+0x116f>
+ .byte 127,71 // jg 71cf <.literal16+0x122f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 6f53 <.literal16+0x1173>
+ .byte 127,71 // jg 71d3 <.literal16+0x1233>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 6f57 <.literal16+0x1177>
+ .byte 127,71 // jg 71d7 <.literal16+0x1237>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -36096,10 +36790,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0808a <_sk_callback_sse41+0x2dc0239c>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0830a <_sk_callback_sse41+0x2dc0245e>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 6fbc <.literal16+0x11dc>
+ .byte 120,57 // js 723c <.literal16+0x129c>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -36280,11 +36974,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 7192 <.literal16+0x13b2>
+ .byte 62,114,28 // jb,pt 7412 <.literal16+0x1472>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7196 <.literal16+0x13b6>
+ .byte 62,114,28 // jb,pt 7416 <.literal16+0x1476>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 719a <.literal16+0x13ba>
+ .byte 62,114,28 // jb,pt 741a <.literal16+0x147a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -36328,7 +37022,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640025 <_sk_callback_sse41+0x3d63a337>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6402a5 <_sk_callback_sse41+0x3d63a3f9>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -36354,7 +37048,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640065 <_sk_callback_sse41+0x3d63a377>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6402e5 <_sk_callback_sse41+0x3d63a439>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -36363,13 +37057,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 725e <.literal16+0x147e>
+ .byte 114,28 // jb 74de <.literal16+0x153e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7262 <.literal16+0x1482>
+ .byte 62,114,28 // jb,pt 74e2 <.literal16+0x1542>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7266 <.literal16+0x1486>
+ .byte 62,114,28 // jb,pt 74e6 <.literal16+0x1546>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 726a <.literal16+0x148a>
+ .byte 62,114,28 // jb,pt 74ea <.literal16+0x154a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -36390,11 +37084,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 72a2 <.literal16+0x14c2>
+ .byte 62,114,28 // jb,pt 7522 <.literal16+0x1582>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 72a6 <.literal16+0x14c6>
+ .byte 62,114,28 // jb,pt 7526 <.literal16+0x1586>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 72aa <.literal16+0x14ca>
+ .byte 62,114,28 // jb,pt 752a <.literal16+0x158a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -36438,7 +37132,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640135 <_sk_callback_sse41+0x3d63a447>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6403b5 <_sk_callback_sse41+0x3d63a509>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -36464,7 +37158,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640175 <_sk_callback_sse41+0x3d63a487>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6403f5 <_sk_callback_sse41+0x3d63a549>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -36473,13 +37167,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 736e <.literal16+0x158e>
+ .byte 114,28 // jb 75ee <.literal16+0x164e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7372 <_sk_callback_sse41+0x1684>
+ .byte 62,114,28 // jb,pt 75f2 <_sk_callback_sse41+0x1746>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7376 <_sk_callback_sse41+0x1688>
+ .byte 62,114,28 // jb,pt 75f6 <_sk_callback_sse41+0x174a>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 737a <_sk_callback_sse41+0x168c>
+ .byte 62,114,28 // jb,pt 75fa <_sk_callback_sse41+0x174e>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -36576,7 +37270,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,252,97,0,0 // movaps 0x61fc(%rip),%xmm2 # 62c0 <_sk_callback_sse2+0xf7>
+ .byte 15,40,21,236,99,0,0 // movaps 0x63ec(%rip),%xmm2 # 64b0 <_sk_callback_sse2+0xf3>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -36585,7 +37279,7 @@ _sk_seed_shader_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,235,97,0,0 // movaps 0x61eb(%rip),%xmm2 # 62d0 <_sk_callback_sse2+0x107>
+ .byte 15,40,21,219,99,0,0 // movaps 0x63db(%rip),%xmm2 # 64c0 <_sk_callback_sse2+0x103>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -36605,14 +37299,14 @@ _sk_dither_sse2:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,185,97,0,0 // movdqa 0x61b9(%rip),%xmm10 # 62e0 <_sk_callback_sse2+0x117>
+ .byte 102,68,15,111,21,169,99,0,0 // movdqa 0x63a9(%rip),%xmm10 # 64d0 <_sk_callback_sse2+0x113>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,165,97,0,0 // movdqa 0x61a5(%rip),%xmm12 # 62f0 <_sk_callback_sse2+0x127>
- .byte 102,68,15,111,45,172,97,0,0 // movdqa 0x61ac(%rip),%xmm13 # 6300 <_sk_callback_sse2+0x137>
+ .byte 102,68,15,111,37,149,99,0,0 // movdqa 0x6395(%rip),%xmm12 # 64e0 <_sk_callback_sse2+0x123>
+ .byte 102,68,15,111,45,156,99,0,0 // movdqa 0x639c(%rip),%xmm13 # 64f0 <_sk_callback_sse2+0x133>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -36628,8 +37322,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,103,97,0,0 // mulps 0x6167(%rip),%xmm8 # 6310 <_sk_callback_sse2+0x147>
- .byte 68,15,88,5,111,97,0,0 // addps 0x616f(%rip),%xmm8 # 6320 <_sk_callback_sse2+0x157>
+ .byte 68,15,89,5,87,99,0,0 // mulps 0x6357(%rip),%xmm8 # 6500 <_sk_callback_sse2+0x143>
+ .byte 68,15,88,5,95,99,0,0 // addps 0x635f(%rip),%xmm8 # 6510 <_sk_callback_sse2+0x153>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -36671,7 +37365,7 @@ HIDDEN _sk_black_color_sse2
FUNCTION(_sk_black_color_sse2)
_sk_black_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,5,97,0,0 // movaps 0x6105(%rip),%xmm3 # 6330 <_sk_callback_sse2+0x167>
+ .byte 15,40,29,245,98,0,0 // movaps 0x62f5(%rip),%xmm3 # 6520 <_sk_callback_sse2+0x163>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -36682,7 +37376,7 @@ HIDDEN _sk_white_color_sse2
FUNCTION(_sk_white_color_sse2)
_sk_white_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,1,97,0,0 // movaps 0x6101(%rip),%xmm0 # 6340 <_sk_callback_sse2+0x177>
+ .byte 15,40,5,241,98,0,0 // movaps 0x62f1(%rip),%xmm0 # 6530 <_sk_callback_sse2+0x173>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -36728,7 +37422,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,193,96,0,0 // movaps 0x60c1(%rip),%xmm8 # 6350 <_sk_callback_sse2+0x187>
+ .byte 68,15,40,5,177,98,0,0 // movaps 0x62b1(%rip),%xmm8 # 6540 <_sk_callback_sse2+0x183>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -36753,7 +37447,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,132,96,0,0 // movaps 0x6084(%rip),%xmm9 # 6360 <_sk_callback_sse2+0x197>
+ .byte 68,15,40,13,116,98,0,0 // movaps 0x6274(%rip),%xmm9 # 6550 <_sk_callback_sse2+0x193>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -36800,7 +37494,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,40,96,0,0 // movaps 0x6028(%rip),%xmm8 # 6370 <_sk_callback_sse2+0x1a7>
+ .byte 68,15,40,5,24,98,0,0 // movaps 0x6218(%rip),%xmm8 # 6560 <_sk_callback_sse2+0x1a3>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -36813,7 +37507,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,24,96,0,0 // movaps 0x6018(%rip),%xmm8 # 6380 <_sk_callback_sse2+0x1b7>
+ .byte 68,15,40,5,8,98,0,0 // movaps 0x6208(%rip),%xmm8 # 6570 <_sk_callback_sse2+0x1b3>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -36830,7 +37524,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,251,95,0,0 // movaps 0x5ffb(%rip),%xmm8 # 6390 <_sk_callback_sse2+0x1c7>
+ .byte 68,15,40,5,235,97,0,0 // movaps 0x61eb(%rip),%xmm8 # 6580 <_sk_callback_sse2+0x1c3>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -36850,7 +37544,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,207,95,0,0 // movaps 0x5fcf(%rip),%xmm8 # 63a0 <_sk_callback_sse2+0x1d7>
+ .byte 68,15,40,5,191,97,0,0 // movaps 0x61bf(%rip),%xmm8 # 6590 <_sk_callback_sse2+0x1d3>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -36878,7 +37572,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,163,95,0,0 // movaps 0x5fa3(%rip),%xmm8 # 63b0 <_sk_callback_sse2+0x1e7>
+ .byte 68,15,40,5,147,97,0,0 // movaps 0x6193(%rip),%xmm8 # 65a0 <_sk_callback_sse2+0x1e3>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -36953,7 +37647,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,216,94,0,0 // movaps 0x5ed8(%rip),%xmm3 # 63c0 <_sk_callback_sse2+0x1f7>
+ .byte 15,40,29,200,96,0,0 // movaps 0x60c8(%rip),%xmm3 # 65b0 <_sk_callback_sse2+0x1f3>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -37001,7 +37695,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,67,94,0,0 // movaps 0x5e43(%rip),%xmm2 # 63d0 <_sk_callback_sse2+0x207>
+ .byte 15,40,21,51,96,0,0 // movaps 0x6033(%rip),%xmm2 # 65c0 <_sk_callback_sse2+0x203>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37035,7 +37729,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,232,93,0,0 // movaps 0x5de8(%rip),%xmm2 # 63e0 <_sk_callback_sse2+0x217>
+ .byte 15,40,21,216,95,0,0 // movaps 0x5fd8(%rip),%xmm2 # 65d0 <_sk_callback_sse2+0x213>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37072,7 +37766,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,130,93,0,0 // movaps 0x5d82(%rip),%xmm2 # 63f0 <_sk_callback_sse2+0x227>
+ .byte 15,40,21,114,95,0,0 // movaps 0x5f72(%rip),%xmm2 # 65e0 <_sk_callback_sse2+0x223>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37100,7 +37794,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,66,93,0,0 // movaps 0x5d42(%rip),%xmm2 # 6400 <_sk_callback_sse2+0x237>
+ .byte 15,40,21,50,95,0,0 // movaps 0x5f32(%rip),%xmm2 # 65f0 <_sk_callback_sse2+0x233>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -37113,7 +37807,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,53,93,0,0 // movaps 0x5d35(%rip),%xmm10 # 6410 <_sk_callback_sse2+0x247>
+ .byte 68,15,40,21,37,95,0,0 // movaps 0x5f25(%rip),%xmm10 # 6600 <_sk_callback_sse2+0x243>
.byte 69,15,40,202 // movaps %xmm10,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,217 // movaps %xmm9,%xmm11
@@ -37207,7 +37901,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,235,91,0,0 // movaps 0x5beb(%rip),%xmm10 # 6420 <_sk_callback_sse2+0x257>
+ .byte 68,15,40,21,219,93,0,0 // movaps 0x5ddb(%rip),%xmm10 # 6610 <_sk_callback_sse2+0x253>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -37301,7 +37995,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,160,90,0,0 // movaps 0x5aa0(%rip),%xmm11 # 6430 <_sk_callback_sse2+0x267>
+ .byte 68,15,40,29,144,92,0,0 // movaps 0x5c90(%rip),%xmm11 # 6620 <_sk_callback_sse2+0x263>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -37389,7 +38083,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,110,89,0,0 // movaps 0x596e(%rip),%xmm9 # 6440 <_sk_callback_sse2+0x277>
+ .byte 68,15,40,13,94,91,0,0 // movaps 0x5b5e(%rip),%xmm9 # 6630 <_sk_callback_sse2+0x273>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -37480,7 +38174,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,43,88,0,0 // movaps 0x582b(%rip),%xmm9 # 6450 <_sk_callback_sse2+0x287>
+ .byte 68,15,40,13,27,90,0,0 // movaps 0x5a1b(%rip),%xmm9 # 6640 <_sk_callback_sse2+0x283>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -37493,10 +38187,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,5,88,0,0 // movaps 0x5805(%rip),%xmm14 # 6460 <_sk_callback_sse2+0x297>
+ .byte 68,15,40,53,245,89,0,0 // movaps 0x59f5(%rip),%xmm14 # 6650 <_sk_callback_sse2+0x293>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,5,88,0,0 // movaps 0x5805(%rip),%xmm10 # 6470 <_sk_callback_sse2+0x2a7>
+ .byte 68,15,40,21,245,89,0,0 // movaps 0x59f5(%rip),%xmm10 # 6660 <_sk_callback_sse2+0x2a3>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -37641,7 +38335,7 @@ _sk_hue_sse2:
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,40,5,72,86,0,0 // movaps 0x5648(%rip),%xmm8 # 64b0 <_sk_callback_sse2+0x2e7>
+ .byte 68,15,40,5,56,88,0,0 // movaps 0x5838(%rip),%xmm8 # 66a0 <_sk_callback_sse2+0x2e3>
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 15,40,207 // movaps %xmm7,%xmm1
.byte 68,15,92,217 // subps %xmm1,%xmm11
@@ -37689,12 +38383,12 @@ _sk_hue_sse2:
.byte 69,15,84,206 // andps %xmm14,%xmm9
.byte 69,15,84,214 // andps %xmm14,%xmm10
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,61,85,85,0,0 // movaps 0x5555(%rip),%xmm15 # 6480 <_sk_callback_sse2+0x2b7>
+ .byte 68,15,40,61,69,87,0,0 // movaps 0x5745(%rip),%xmm15 # 6670 <_sk_callback_sse2+0x2b3>
.byte 65,15,89,231 // mulps %xmm15,%xmm4
- .byte 15,40,5,90,85,0,0 // movaps 0x555a(%rip),%xmm0 # 6490 <_sk_callback_sse2+0x2c7>
+ .byte 15,40,5,74,87,0,0 // movaps 0x574a(%rip),%xmm0 # 6680 <_sk_callback_sse2+0x2c3>
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
- .byte 68,15,40,53,92,85,0,0 // movaps 0x555c(%rip),%xmm14 # 64a0 <_sk_callback_sse2+0x2d7>
+ .byte 68,15,40,53,76,87,0,0 // movaps 0x574c(%rip),%xmm14 # 6690 <_sk_callback_sse2+0x2d3>
.byte 68,15,40,239 // movaps %xmm7,%xmm13
.byte 69,15,89,238 // mulps %xmm14,%xmm13
.byte 68,15,88,238 // addps %xmm6,%xmm13
@@ -37872,14 +38566,14 @@ _sk_saturation_sse2:
.byte 68,15,84,211 // andps %xmm3,%xmm10
.byte 68,15,84,203 // andps %xmm3,%xmm9
.byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,40,5,238,82,0,0 // movaps 0x52ee(%rip),%xmm8 # 64c0 <_sk_callback_sse2+0x2f7>
+ .byte 68,15,40,5,222,84,0,0 // movaps 0x54de(%rip),%xmm8 # 66b0 <_sk_callback_sse2+0x2f3>
.byte 15,40,214 // movaps %xmm6,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,40,13,240,82,0,0 // movaps 0x52f0(%rip),%xmm1 # 64d0 <_sk_callback_sse2+0x307>
+ .byte 15,40,13,224,84,0,0 // movaps 0x54e0(%rip),%xmm1 # 66c0 <_sk_callback_sse2+0x303>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,217 // mulps %xmm1,%xmm3
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,37,239,82,0,0 // movaps 0x52ef(%rip),%xmm12 # 64e0 <_sk_callback_sse2+0x317>
+ .byte 68,15,40,37,223,84,0,0 // movaps 0x54df(%rip),%xmm12 # 66d0 <_sk_callback_sse2+0x313>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
.byte 65,15,40,210 // movaps %xmm10,%xmm2
@@ -37924,7 +38618,7 @@ _sk_saturation_sse2:
.byte 15,40,223 // movaps %xmm7,%xmm3
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 68,15,40,5,84,82,0,0 // movaps 0x5254(%rip),%xmm8 # 64f0 <_sk_callback_sse2+0x327>
+ .byte 68,15,40,5,68,84,0,0 // movaps 0x5444(%rip),%xmm8 # 66e0 <_sk_callback_sse2+0x323>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 15,88,253 // addps %xmm5,%xmm7
@@ -38025,14 +38719,14 @@ _sk_color_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 68,15,40,45,242,80,0,0 // movaps 0x50f2(%rip),%xmm13 # 6500 <_sk_callback_sse2+0x337>
+ .byte 68,15,40,45,226,82,0,0 // movaps 0x52e2(%rip),%xmm13 # 66f0 <_sk_callback_sse2+0x333>
.byte 68,15,40,198 // movaps %xmm6,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,242,80,0,0 // movaps 0x50f2(%rip),%xmm14 # 6510 <_sk_callback_sse2+0x347>
+ .byte 68,15,40,53,226,82,0,0 // movaps 0x52e2(%rip),%xmm14 # 6700 <_sk_callback_sse2+0x343>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,29,238,80,0,0 // movaps 0x50ee(%rip),%xmm11 # 6520 <_sk_callback_sse2+0x357>
+ .byte 68,15,40,29,222,82,0,0 // movaps 0x52de(%rip),%xmm11 # 6710 <_sk_callback_sse2+0x353>
.byte 69,15,89,227 // mulps %xmm11,%xmm12
.byte 68,15,88,224 // addps %xmm0,%xmm12
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -38040,7 +38734,7 @@ _sk_color_sse2:
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 68,15,40,5,218,80,0,0 // movaps 0x50da(%rip),%xmm8 # 6530 <_sk_callback_sse2+0x367>
+ .byte 68,15,40,5,202,82,0,0 // movaps 0x52ca(%rip),%xmm8 # 6720 <_sk_callback_sse2+0x363>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,89,252 // mulps %xmm4,%xmm7
@@ -38176,15 +38870,15 @@ _sk_luminosity_sse2:
.byte 68,15,40,205 // movaps %xmm5,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 68,15,40,37,241,78,0,0 // movaps 0x4ef1(%rip),%xmm12 # 6540 <_sk_callback_sse2+0x377>
+ .byte 68,15,40,37,225,80,0,0 // movaps 0x50e1(%rip),%xmm12 # 6730 <_sk_callback_sse2+0x373>
.byte 68,15,40,199 // movaps %xmm7,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,241,78,0,0 // movaps 0x4ef1(%rip),%xmm13 # 6550 <_sk_callback_sse2+0x387>
+ .byte 68,15,40,45,225,80,0,0 // movaps 0x50e1(%rip),%xmm13 # 6740 <_sk_callback_sse2+0x383>
.byte 68,15,40,241 // movaps %xmm1,%xmm14
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 69,15,88,240 // addps %xmm8,%xmm14
- .byte 68,15,40,29,237,78,0,0 // movaps 0x4eed(%rip),%xmm11 # 6560 <_sk_callback_sse2+0x397>
- .byte 68,15,40,5,245,78,0,0 // movaps 0x4ef5(%rip),%xmm8 # 6570 <_sk_callback_sse2+0x3a7>
+ .byte 68,15,40,29,221,80,0,0 // movaps 0x50dd(%rip),%xmm11 # 6750 <_sk_callback_sse2+0x393>
+ .byte 68,15,40,5,229,80,0,0 // movaps 0x50e5(%rip),%xmm8 # 6760 <_sk_callback_sse2+0x3a3>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 68,15,92,248 // subps %xmm0,%xmm15
@@ -38328,7 +39022,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,133,228,0,0,0 // jne 1966 <_sk_srcover_rgba_8888_sse2+0x104>
.byte 243,69,15,111,4,129 // movdqu (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,53,237,76,0,0 // movdqa 0x4ced(%rip),%xmm6 # 6580 <_sk_callback_sse2+0x3b7>
+ .byte 102,15,111,53,221,78,0,0 // movdqa 0x4edd(%rip),%xmm6 # 6770 <_sk_callback_sse2+0x3b3>
.byte 102,65,15,111,224 // movdqa %xmm8,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
@@ -38342,9 +39036,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,91,247 // cvtdq2ps %xmm7,%xmm6
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7
- .byte 68,15,40,5,189,76,0,0 // movaps 0x4cbd(%rip),%xmm8 # 6590 <_sk_callback_sse2+0x3c7>
+ .byte 68,15,40,5,173,78,0,0 // movaps 0x4ead(%rip),%xmm8 # 6780 <_sk_callback_sse2+0x3c3>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,193,76,0,0 // movaps 0x4cc1(%rip),%xmm12 # 65a0 <_sk_callback_sse2+0x3d7>
+ .byte 68,15,40,37,177,78,0,0 // movaps 0x4eb1(%rip),%xmm12 # 6790 <_sk_callback_sse2+0x3d3>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -38424,7 +39118,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,173,75,0,0 // movaps 0x4bad(%rip),%xmm8 # 65b0 <_sk_callback_sse2+0x3e7>
+ .byte 68,15,40,5,157,77,0,0 // movaps 0x4d9d(%rip),%xmm8 # 67a0 <_sk_callback_sse2+0x3e3>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -38436,7 +39130,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,162,75,0,0 // minps 0x4ba2(%rip),%xmm3 # 65c0 <_sk_callback_sse2+0x3f7>
+ .byte 15,93,29,146,77,0,0 // minps 0x4d92(%rip),%xmm3 # 67b0 <_sk_callback_sse2+0x3f3>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -38447,7 +39141,7 @@ HIDDEN _sk_clamp_a_dst_sse2
.globl _sk_clamp_a_dst_sse2
FUNCTION(_sk_clamp_a_dst_sse2)
_sk_clamp_a_dst_sse2:
- .byte 15,93,61,158,75,0,0 // minps 0x4b9e(%rip),%xmm7 # 65d0 <_sk_callback_sse2+0x407>
+ .byte 15,93,61,142,77,0,0 // minps 0x4d8e(%rip),%xmm7 # 67c0 <_sk_callback_sse2+0x403>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -38482,7 +39176,7 @@ HIDDEN _sk_invert_sse2
.globl _sk_invert_sse2
FUNCTION(_sk_invert_sse2)
_sk_invert_sse2:
- .byte 68,15,40,5,106,75,0,0 // movaps 0x4b6a(%rip),%xmm8 # 65e0 <_sk_callback_sse2+0x417>
+ .byte 68,15,40,5,90,77,0,0 // movaps 0x4d5a(%rip),%xmm8 # 67d0 <_sk_callback_sse2+0x413>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -38544,7 +39238,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,4,75,0,0 // movaps 0x4b04(%rip),%xmm9 # 65f0 <_sk_callback_sse2+0x427>
+ .byte 68,15,40,13,244,76,0,0 // movaps 0x4cf4(%rip),%xmm9 # 67e0 <_sk_callback_sse2+0x423>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -38558,20 +39252,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,239,74,0,0 // movaps 0x4aef(%rip),%xmm8 # 6600 <_sk_callback_sse2+0x437>
+ .byte 68,15,40,5,223,76,0,0 // movaps 0x4cdf(%rip),%xmm8 # 67f0 <_sk_callback_sse2+0x433>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,231,74,0,0 // movaps 0x4ae7(%rip),%xmm9 # 6610 <_sk_callback_sse2+0x447>
+ .byte 68,15,40,13,215,76,0,0 // movaps 0x4cd7(%rip),%xmm9 # 6800 <_sk_callback_sse2+0x443>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,231,74,0,0 // movaps 0x4ae7(%rip),%xmm10 # 6620 <_sk_callback_sse2+0x457>
+ .byte 68,15,40,21,215,76,0,0 // movaps 0x4cd7(%rip),%xmm10 # 6810 <_sk_callback_sse2+0x453>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,231,74,0,0 // movaps 0x4ae7(%rip),%xmm11 # 6630 <_sk_callback_sse2+0x467>
+ .byte 68,15,40,29,215,76,0,0 // movaps 0x4cd7(%rip),%xmm11 # 6820 <_sk_callback_sse2+0x463>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,235,74,0,0 // movaps 0x4aeb(%rip),%xmm12 # 6640 <_sk_callback_sse2+0x477>
+ .byte 68,15,40,37,219,76,0,0 // movaps 0x4cdb(%rip),%xmm12 # 6830 <_sk_callback_sse2+0x473>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -38607,20 +39301,20 @@ HIDDEN _sk_from_srgb_dst_sse2
.globl _sk_from_srgb_dst_sse2
FUNCTION(_sk_from_srgb_dst_sse2)
_sk_from_srgb_dst_sse2:
- .byte 68,15,40,5,124,74,0,0 // movaps 0x4a7c(%rip),%xmm8 # 6650 <_sk_callback_sse2+0x487>
+ .byte 68,15,40,5,108,76,0,0 // movaps 0x4c6c(%rip),%xmm8 # 6840 <_sk_callback_sse2+0x483>
.byte 68,15,40,236 // movaps %xmm4,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,220 // movaps %xmm4,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,116,74,0,0 // movaps 0x4a74(%rip),%xmm9 # 6660 <_sk_callback_sse2+0x497>
+ .byte 68,15,40,13,100,76,0,0 // movaps 0x4c64(%rip),%xmm9 # 6850 <_sk_callback_sse2+0x493>
.byte 68,15,40,244 // movaps %xmm4,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,116,74,0,0 // movaps 0x4a74(%rip),%xmm10 # 6670 <_sk_callback_sse2+0x4a7>
+ .byte 68,15,40,21,100,76,0,0 // movaps 0x4c64(%rip),%xmm10 # 6860 <_sk_callback_sse2+0x4a3>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,116,74,0,0 // movaps 0x4a74(%rip),%xmm11 # 6680 <_sk_callback_sse2+0x4b7>
+ .byte 68,15,40,29,100,76,0,0 // movaps 0x4c64(%rip),%xmm11 # 6870 <_sk_callback_sse2+0x4b3>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,120,74,0,0 // movaps 0x4a78(%rip),%xmm12 # 6690 <_sk_callback_sse2+0x4c7>
+ .byte 68,15,40,37,104,76,0,0 // movaps 0x4c68(%rip),%xmm12 # 6880 <_sk_callback_sse2+0x4c3>
.byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4
.byte 68,15,84,236 // andps %xmm4,%xmm13
.byte 65,15,85,230 // andnps %xmm14,%xmm4
@@ -38657,22 +39351,22 @@ HIDDEN _sk_to_srgb_sse2
FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 68,15,82,232 // rsqrtps %xmm0,%xmm13
- .byte 68,15,40,5,5,74,0,0 // movaps 0x4a05(%rip),%xmm8 # 66a0 <_sk_callback_sse2+0x4d7>
+ .byte 68,15,40,5,245,75,0,0 // movaps 0x4bf5(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x4d3>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,13,5,74,0,0 // movaps 0x4a05(%rip),%xmm9 # 66b0 <_sk_callback_sse2+0x4e7>
+ .byte 68,15,40,13,245,75,0,0 // movaps 0x4bf5(%rip),%xmm9 # 68a0 <_sk_callback_sse2+0x4e3>
.byte 69,15,40,253 // movaps %xmm13,%xmm15
.byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,40,21,5,74,0,0 // movaps 0x4a05(%rip),%xmm10 # 66c0 <_sk_callback_sse2+0x4f7>
+ .byte 68,15,40,21,245,75,0,0 // movaps 0x4bf5(%rip),%xmm10 # 68b0 <_sk_callback_sse2+0x4f3>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,40,29,5,74,0,0 // movaps 0x4a05(%rip),%xmm11 # 66d0 <_sk_callback_sse2+0x507>
+ .byte 68,15,40,29,245,75,0,0 // movaps 0x4bf5(%rip),%xmm11 # 68c0 <_sk_callback_sse2+0x503>
.byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 68,15,40,37,9,74,0,0 // movaps 0x4a09(%rip),%xmm12 # 66e0 <_sk_callback_sse2+0x517>
+ .byte 68,15,40,37,249,75,0,0 // movaps 0x4bf9(%rip),%xmm12 # 68d0 <_sk_callback_sse2+0x513>
.byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 69,15,83,237 // rcpps %xmm13,%xmm13
.byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,61,5,74,0,0 // movaps 0x4a05(%rip),%xmm15 # 66f0 <_sk_callback_sse2+0x527>
+ .byte 68,15,40,61,245,75,0,0 // movaps 0x4bf5(%rip),%xmm15 # 68e0 <_sk_callback_sse2+0x523>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,197 // andnps %xmm13,%xmm0
@@ -38722,7 +39416,7 @@ _sk_rgb_to_hsl_sse2:
.byte 68,15,93,218 // minps %xmm2,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,94,73,0,0 // movaps 0x495e(%rip),%xmm13 # 6700 <_sk_callback_sse2+0x537>
+ .byte 68,15,40,45,78,75,0,0 // movaps 0x4b4e(%rip),%xmm13 # 68f0 <_sk_callback_sse2+0x533>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -38731,30 +39425,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,68,73,0,0 // andps 0x4944(%rip),%xmm14 # 6710 <_sk_callback_sse2+0x547>
+ .byte 68,15,84,53,52,75,0,0 // andps 0x4b34(%rip),%xmm14 # 6900 <_sk_callback_sse2+0x543>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,55,73,0,0 // movaps 0x4937(%rip),%xmm12 # 6720 <_sk_callback_sse2+0x557>
+ .byte 68,15,40,37,39,75,0,0 // movaps 0x4b27(%rip),%xmm12 # 6910 <_sk_callback_sse2+0x553>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,51,73,0,0 // addps 0x4933(%rip),%xmm8 # 6730 <_sk_callback_sse2+0x567>
+ .byte 68,15,88,5,35,75,0,0 // addps 0x4b23(%rip),%xmm8 # 6920 <_sk_callback_sse2+0x563>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,36,73,0,0 // mulps 0x4924(%rip),%xmm0 # 6740 <_sk_callback_sse2+0x577>
+ .byte 15,89,5,20,75,0,0 // mulps 0x4b14(%rip),%xmm0 # 6930 <_sk_callback_sse2+0x573>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,23,73,0,0 // movaps 0x4917(%rip),%xmm9 # 6750 <_sk_callback_sse2+0x587>
+ .byte 68,15,40,13,7,75,0,0 // movaps 0x4b07(%rip),%xmm9 # 6940 <_sk_callback_sse2+0x583>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -38778,7 +39472,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,214,72,0,0 // movaps 0x48d6(%rip),%xmm9 # 6760 <_sk_callback_sse2+0x597>
+ .byte 68,15,40,13,198,74,0,0 // movaps 0x4ac6(%rip),%xmm9 # 6950 <_sk_callback_sse2+0x593>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -38795,28 +39489,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,159,72,0,0 // movaps 0x489f(%rip),%xmm0 # 6770 <_sk_callback_sse2+0x5a7>
+ .byte 15,40,5,143,74,0,0 // movaps 0x4a8f(%rip),%xmm0 # 6960 <_sk_callback_sse2+0x5a3>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,151,72,0,0 // andps 0x4897(%rip),%xmm3 # 6780 <_sk_callback_sse2+0x5b7>
+ .byte 15,84,29,135,74,0,0 // andps 0x4a87(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x5b3>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,153,72,0,0 // movaps 0x4899(%rip),%xmm13 # 6790 <_sk_callback_sse2+0x5c7>
+ .byte 68,15,40,45,137,74,0,0 // movaps 0x4a89(%rip),%xmm13 # 6980 <_sk_callback_sse2+0x5c3>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,169,72,0,0 // movaps 0x48a9(%rip),%xmm2 # 67c0 <_sk_callback_sse2+0x5f7>
+ .byte 15,40,21,153,74,0,0 // movaps 0x4a99(%rip),%xmm2 # 69b0 <_sk_callback_sse2+0x5f3>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,121,72,0,0 // movaps 0x4879(%rip),%xmm1 # 67a0 <_sk_callback_sse2+0x5d7>
+ .byte 15,40,13,105,74,0,0 // movaps 0x4a69(%rip),%xmm1 # 6990 <_sk_callback_sse2+0x5d3>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,127,72,0,0 // movaps 0x487f(%rip),%xmm5 # 67b0 <_sk_callback_sse2+0x5e7>
+ .byte 15,40,45,111,74,0,0 // movaps 0x4a6f(%rip),%xmm5 # 69a0 <_sk_callback_sse2+0x5e3>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -38839,7 +39533,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,244,71,0,0 // andps 0x47f4(%rip),%xmm3 # 6780 <_sk_callback_sse2+0x5b7>
+ .byte 15,84,29,228,73,0,0 // andps 0x49e4(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x5b3>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -38869,12 +39563,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,204,71,0,0 // addps 0x47cc(%rip),%xmm6 # 67d0 <_sk_callback_sse2+0x607>
+ .byte 15,88,53,188,73,0,0 // addps 0x49bc(%rip),%xmm6 # 69c0 <_sk_callback_sse2+0x603>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,103,71,0,0 // andps 0x4767(%rip),%xmm3 # 6780 <_sk_callback_sse2+0x5b7>
+ .byte 15,84,29,87,73,0,0 // andps 0x4957(%rip),%xmm3 # 6970 <_sk_callback_sse2+0x5b3>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -38942,9 +39636,9 @@ _sk_scale_u8_sse2:
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,234,70,0,0 // pand 0x46ea(%rip),%xmm8 # 67e0 <_sk_callback_sse2+0x617>
+ .byte 102,68,15,219,5,218,72,0,0 // pand 0x48da(%rip),%xmm8 # 69d0 <_sk_callback_sse2+0x613>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,238,70,0,0 // mulps 0x46ee(%rip),%xmm8 # 67f0 <_sk_callback_sse2+0x627>
+ .byte 68,15,89,5,222,72,0,0 // mulps 0x48de(%rip),%xmm8 # 69e0 <_sk_callback_sse2+0x623>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -39011,9 +39705,9 @@ _sk_lerp_u8_sse2:
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,36,70,0,0 // pand 0x4624(%rip),%xmm8 # 6800 <_sk_callback_sse2+0x637>
+ .byte 102,68,15,219,5,20,72,0,0 // pand 0x4814(%rip),%xmm8 # 69f0 <_sk_callback_sse2+0x633>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,40,70,0,0 // mulps 0x4628(%rip),%xmm8 # 6810 <_sk_callback_sse2+0x647>
+ .byte 68,15,89,5,24,72,0,0 // mulps 0x4818(%rip),%xmm8 # 6a00 <_sk_callback_sse2+0x643>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -39065,17 +39759,17 @@ _sk_lerp_565_sse2:
.byte 15,133,156,0,0,0 // jne 232b <_sk_lerp_565_sse2+0xbb>
.byte 243,71,15,126,12,89 // movq (%r9,%r11,2),%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
- .byte 102,68,15,111,5,125,69,0,0 // movdqa 0x457d(%rip),%xmm8 # 6820 <_sk_callback_sse2+0x657>
+ .byte 102,68,15,111,5,109,71,0,0 // movdqa 0x476d(%rip),%xmm8 # 6a10 <_sk_callback_sse2+0x653>
.byte 102,69,15,219,193 // pand %xmm9,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,124,69,0,0 // mulps 0x457c(%rip),%xmm8 # 6830 <_sk_callback_sse2+0x667>
- .byte 102,68,15,111,21,131,69,0,0 // movdqa 0x4583(%rip),%xmm10 # 6840 <_sk_callback_sse2+0x677>
+ .byte 68,15,89,5,108,71,0,0 // mulps 0x476c(%rip),%xmm8 # 6a20 <_sk_callback_sse2+0x663>
+ .byte 102,68,15,111,21,115,71,0,0 // movdqa 0x4773(%rip),%xmm10 # 6a30 <_sk_callback_sse2+0x673>
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,130,69,0,0 // mulps 0x4582(%rip),%xmm10 # 6850 <_sk_callback_sse2+0x687>
- .byte 102,68,15,219,13,137,69,0,0 // pand 0x4589(%rip),%xmm9 # 6860 <_sk_callback_sse2+0x697>
+ .byte 68,15,89,21,114,71,0,0 // mulps 0x4772(%rip),%xmm10 # 6a40 <_sk_callback_sse2+0x683>
+ .byte 102,68,15,219,13,121,71,0,0 // pand 0x4779(%rip),%xmm9 # 6a50 <_sk_callback_sse2+0x693>
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,141,69,0,0 // mulps 0x458d(%rip),%xmm9 # 6870 <_sk_callback_sse2+0x6a7>
+ .byte 68,15,89,13,125,71,0,0 // mulps 0x477d(%rip),%xmm9 # 6a60 <_sk_callback_sse2+0x6a3>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -39129,7 +39823,7 @@ _sk_load_tables_sse2:
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,68,15,111,5,220,68,0,0 // movdqa 0x44dc(%rip),%xmm8 # 6880 <_sk_callback_sse2+0x6b7>
+ .byte 102,68,15,111,5,204,70,0,0 // movdqa 0x46cc(%rip),%xmm8 # 6a70 <_sk_callback_sse2+0x6b3>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -39185,7 +39879,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,229,67,0,0 // mulps 0x43e5(%rip),%xmm3 # 6890 <_sk_callback_sse2+0x6c7>
+ .byte 15,89,29,213,69,0,0 // mulps 0x45d5(%rip),%xmm3 # 6a80 <_sk_callback_sse2+0x6c3>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -39227,7 +39921,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,90,67,0,0 // movdqa 0x435a(%rip),%xmm10 # 68a0 <_sk_callback_sse2+0x6d7>
+ .byte 102,68,15,111,21,74,69,0,0 // movdqa 0x454a(%rip),%xmm10 # 6a90 <_sk_callback_sse2+0x6d3>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -39289,7 +39983,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,69,66,0,0 // mulps 0x4245(%rip),%xmm3 # 68b0 <_sk_callback_sse2+0x6e7>
+ .byte 15,89,29,53,68,0,0 // mulps 0x4435(%rip),%xmm3 # 6aa0 <_sk_callback_sse2+0x6e3>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -39332,7 +40026,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,180,65,0,0 // movdqa 0x41b4(%rip),%xmm8 # 68c0 <_sk_callback_sse2+0x6f7>
+ .byte 102,68,15,111,5,164,67,0,0 // movdqa 0x43a4(%rip),%xmm8 # 6ab0 <_sk_callback_sse2+0x6f3>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -39388,7 +40082,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,191,64,0,0 // movaps 0x40bf(%rip),%xmm3 # 68d0 <_sk_callback_sse2+0x707>
+ .byte 15,40,29,175,66,0,0 // movaps 0x42af(%rip),%xmm3 # 6ac0 <_sk_callback_sse2+0x703>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -39422,7 +40116,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,88,64,0,0 // movaps 0x4058(%rip),%xmm8 # 68e0 <_sk_callback_sse2+0x717>
+ .byte 68,15,40,5,72,66,0,0 // movaps 0x4248(%rip),%xmm8 # 6ad0 <_sk_callback_sse2+0x713>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -39450,7 +40144,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,242,63,0,0 // movaps 0x3ff2(%rip),%xmm10 # 68f0 <_sk_callback_sse2+0x727>
+ .byte 68,15,40,21,226,65,0,0 // movaps 0x41e2(%rip),%xmm10 # 6ae0 <_sk_callback_sse2+0x723>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -39571,7 +40265,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,58,62,0,0 // movaps 0x3e3a(%rip),%xmm10 # 6900 <_sk_callback_sse2+0x737>
+ .byte 68,15,40,21,42,64,0,0 // movaps 0x402a(%rip),%xmm10 # 6af0 <_sk_callback_sse2+0x733>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -39778,15 +40472,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,110,59,0,0 // mulps 0x3b6e(%rip),%xmm9 # 6910 <_sk_callback_sse2+0x747>
- .byte 68,15,84,21,118,59,0,0 // andps 0x3b76(%rip),%xmm10 # 6920 <_sk_callback_sse2+0x757>
- .byte 68,15,86,21,126,59,0,0 // orps 0x3b7e(%rip),%xmm10 # 6930 <_sk_callback_sse2+0x767>
- .byte 68,15,88,13,134,59,0,0 // addps 0x3b86(%rip),%xmm9 # 6940 <_sk_callback_sse2+0x777>
- .byte 68,15,40,37,142,59,0,0 // movaps 0x3b8e(%rip),%xmm12 # 6950 <_sk_callback_sse2+0x787>
+ .byte 68,15,89,13,94,61,0,0 // mulps 0x3d5e(%rip),%xmm9 # 6b00 <_sk_callback_sse2+0x743>
+ .byte 68,15,84,21,102,61,0,0 // andps 0x3d66(%rip),%xmm10 # 6b10 <_sk_callback_sse2+0x753>
+ .byte 68,15,86,21,110,61,0,0 // orps 0x3d6e(%rip),%xmm10 # 6b20 <_sk_callback_sse2+0x763>
+ .byte 68,15,88,13,118,61,0,0 // addps 0x3d76(%rip),%xmm9 # 6b30 <_sk_callback_sse2+0x773>
+ .byte 68,15,40,37,126,61,0,0 // movaps 0x3d7e(%rip),%xmm12 # 6b40 <_sk_callback_sse2+0x783>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,142,59,0,0 // addps 0x3b8e(%rip),%xmm10 # 6960 <_sk_callback_sse2+0x797>
- .byte 68,15,40,37,150,59,0,0 // movaps 0x3b96(%rip),%xmm12 # 6970 <_sk_callback_sse2+0x7a7>
+ .byte 68,15,88,21,126,61,0,0 // addps 0x3d7e(%rip),%xmm10 # 6b50 <_sk_callback_sse2+0x793>
+ .byte 68,15,40,37,134,61,0,0 // movaps 0x3d86(%rip),%xmm12 # 6b60 <_sk_callback_sse2+0x7a3>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -39794,22 +40488,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,128,59,0,0 // movaps 0x3b80(%rip),%xmm10 # 6980 <_sk_callback_sse2+0x7b7>
+ .byte 68,15,40,21,112,61,0,0 // movaps 0x3d70(%rip),%xmm10 # 6b70 <_sk_callback_sse2+0x7b3>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,116,59,0,0 // addps 0x3b74(%rip),%xmm9 # 6990 <_sk_callback_sse2+0x7c7>
- .byte 68,15,40,37,124,59,0,0 // movaps 0x3b7c(%rip),%xmm12 # 69a0 <_sk_callback_sse2+0x7d7>
+ .byte 68,15,88,13,100,61,0,0 // addps 0x3d64(%rip),%xmm9 # 6b80 <_sk_callback_sse2+0x7c3>
+ .byte 68,15,40,37,108,61,0,0 // movaps 0x3d6c(%rip),%xmm12 # 6b90 <_sk_callback_sse2+0x7d3>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,124,59,0,0 // movaps 0x3b7c(%rip),%xmm12 # 69b0 <_sk_callback_sse2+0x7e7>
+ .byte 68,15,40,37,108,61,0,0 // movaps 0x3d6c(%rip),%xmm12 # 6ba0 <_sk_callback_sse2+0x7e3>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,128,59,0,0 // movaps 0x3b80(%rip),%xmm13 # 69c0 <_sk_callback_sse2+0x7f7>
+ .byte 68,15,40,45,112,61,0,0 // movaps 0x3d70(%rip),%xmm13 # 6bb0 <_sk_callback_sse2+0x7f3>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,128,59,0,0 // mulps 0x3b80(%rip),%xmm13 # 69d0 <_sk_callback_sse2+0x807>
+ .byte 68,15,89,45,112,61,0,0 // mulps 0x3d70(%rip),%xmm13 # 6bc0 <_sk_callback_sse2+0x803>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -39845,15 +40539,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,0,59,0,0 // mulps 0x3b00(%rip),%xmm9 # 69e0 <_sk_callback_sse2+0x817>
- .byte 68,15,84,21,8,59,0,0 // andps 0x3b08(%rip),%xmm10 # 69f0 <_sk_callback_sse2+0x827>
- .byte 68,15,86,21,16,59,0,0 // orps 0x3b10(%rip),%xmm10 # 6a00 <_sk_callback_sse2+0x837>
- .byte 68,15,88,13,24,59,0,0 // addps 0x3b18(%rip),%xmm9 # 6a10 <_sk_callback_sse2+0x847>
- .byte 68,15,40,37,32,59,0,0 // movaps 0x3b20(%rip),%xmm12 # 6a20 <_sk_callback_sse2+0x857>
+ .byte 68,15,89,13,240,60,0,0 // mulps 0x3cf0(%rip),%xmm9 # 6bd0 <_sk_callback_sse2+0x813>
+ .byte 68,15,84,21,248,60,0,0 // andps 0x3cf8(%rip),%xmm10 # 6be0 <_sk_callback_sse2+0x823>
+ .byte 68,15,86,21,0,61,0,0 // orps 0x3d00(%rip),%xmm10 # 6bf0 <_sk_callback_sse2+0x833>
+ .byte 68,15,88,13,8,61,0,0 // addps 0x3d08(%rip),%xmm9 # 6c00 <_sk_callback_sse2+0x843>
+ .byte 68,15,40,37,16,61,0,0 // movaps 0x3d10(%rip),%xmm12 # 6c10 <_sk_callback_sse2+0x853>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,32,59,0,0 // addps 0x3b20(%rip),%xmm10 # 6a30 <_sk_callback_sse2+0x867>
- .byte 68,15,40,37,40,59,0,0 // movaps 0x3b28(%rip),%xmm12 # 6a40 <_sk_callback_sse2+0x877>
+ .byte 68,15,88,21,16,61,0,0 // addps 0x3d10(%rip),%xmm10 # 6c20 <_sk_callback_sse2+0x863>
+ .byte 68,15,40,37,24,61,0,0 // movaps 0x3d18(%rip),%xmm12 # 6c30 <_sk_callback_sse2+0x873>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -39861,22 +40555,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,18,59,0,0 // movaps 0x3b12(%rip),%xmm10 # 6a50 <_sk_callback_sse2+0x887>
+ .byte 68,15,40,21,2,61,0,0 // movaps 0x3d02(%rip),%xmm10 # 6c40 <_sk_callback_sse2+0x883>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,6,59,0,0 // addps 0x3b06(%rip),%xmm9 # 6a60 <_sk_callback_sse2+0x897>
- .byte 68,15,40,37,14,59,0,0 // movaps 0x3b0e(%rip),%xmm12 # 6a70 <_sk_callback_sse2+0x8a7>
+ .byte 68,15,88,13,246,60,0,0 // addps 0x3cf6(%rip),%xmm9 # 6c50 <_sk_callback_sse2+0x893>
+ .byte 68,15,40,37,254,60,0,0 // movaps 0x3cfe(%rip),%xmm12 # 6c60 <_sk_callback_sse2+0x8a3>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,14,59,0,0 // movaps 0x3b0e(%rip),%xmm12 # 6a80 <_sk_callback_sse2+0x8b7>
+ .byte 68,15,40,37,254,60,0,0 // movaps 0x3cfe(%rip),%xmm12 # 6c70 <_sk_callback_sse2+0x8b3>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,18,59,0,0 // movaps 0x3b12(%rip),%xmm13 # 6a90 <_sk_callback_sse2+0x8c7>
+ .byte 68,15,40,45,2,61,0,0 // movaps 0x3d02(%rip),%xmm13 # 6c80 <_sk_callback_sse2+0x8c3>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,18,59,0,0 // mulps 0x3b12(%rip),%xmm13 # 6aa0 <_sk_callback_sse2+0x8d7>
+ .byte 68,15,89,45,2,61,0,0 // mulps 0x3d02(%rip),%xmm13 # 6c90 <_sk_callback_sse2+0x8d3>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -39912,15 +40606,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,146,58,0,0 // mulps 0x3a92(%rip),%xmm9 # 6ab0 <_sk_callback_sse2+0x8e7>
- .byte 68,15,84,21,154,58,0,0 // andps 0x3a9a(%rip),%xmm10 # 6ac0 <_sk_callback_sse2+0x8f7>
- .byte 68,15,86,21,162,58,0,0 // orps 0x3aa2(%rip),%xmm10 # 6ad0 <_sk_callback_sse2+0x907>
- .byte 68,15,88,13,170,58,0,0 // addps 0x3aaa(%rip),%xmm9 # 6ae0 <_sk_callback_sse2+0x917>
- .byte 68,15,40,37,178,58,0,0 // movaps 0x3ab2(%rip),%xmm12 # 6af0 <_sk_callback_sse2+0x927>
+ .byte 68,15,89,13,130,60,0,0 // mulps 0x3c82(%rip),%xmm9 # 6ca0 <_sk_callback_sse2+0x8e3>
+ .byte 68,15,84,21,138,60,0,0 // andps 0x3c8a(%rip),%xmm10 # 6cb0 <_sk_callback_sse2+0x8f3>
+ .byte 68,15,86,21,146,60,0,0 // orps 0x3c92(%rip),%xmm10 # 6cc0 <_sk_callback_sse2+0x903>
+ .byte 68,15,88,13,154,60,0,0 // addps 0x3c9a(%rip),%xmm9 # 6cd0 <_sk_callback_sse2+0x913>
+ .byte 68,15,40,37,162,60,0,0 // movaps 0x3ca2(%rip),%xmm12 # 6ce0 <_sk_callback_sse2+0x923>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,178,58,0,0 // addps 0x3ab2(%rip),%xmm10 # 6b00 <_sk_callback_sse2+0x937>
- .byte 68,15,40,37,186,58,0,0 // movaps 0x3aba(%rip),%xmm12 # 6b10 <_sk_callback_sse2+0x947>
+ .byte 68,15,88,21,162,60,0,0 // addps 0x3ca2(%rip),%xmm10 # 6cf0 <_sk_callback_sse2+0x933>
+ .byte 68,15,40,37,170,60,0,0 // movaps 0x3caa(%rip),%xmm12 # 6d00 <_sk_callback_sse2+0x943>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -39928,22 +40622,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,164,58,0,0 // movaps 0x3aa4(%rip),%xmm10 # 6b20 <_sk_callback_sse2+0x957>
+ .byte 68,15,40,21,148,60,0,0 // movaps 0x3c94(%rip),%xmm10 # 6d10 <_sk_callback_sse2+0x953>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,152,58,0,0 // addps 0x3a98(%rip),%xmm9 # 6b30 <_sk_callback_sse2+0x967>
- .byte 68,15,40,37,160,58,0,0 // movaps 0x3aa0(%rip),%xmm12 # 6b40 <_sk_callback_sse2+0x977>
+ .byte 68,15,88,13,136,60,0,0 // addps 0x3c88(%rip),%xmm9 # 6d20 <_sk_callback_sse2+0x963>
+ .byte 68,15,40,37,144,60,0,0 // movaps 0x3c90(%rip),%xmm12 # 6d30 <_sk_callback_sse2+0x973>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,160,58,0,0 // movaps 0x3aa0(%rip),%xmm12 # 6b50 <_sk_callback_sse2+0x987>
+ .byte 68,15,40,37,144,60,0,0 // movaps 0x3c90(%rip),%xmm12 # 6d40 <_sk_callback_sse2+0x983>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,164,58,0,0 // movaps 0x3aa4(%rip),%xmm13 # 6b60 <_sk_callback_sse2+0x997>
+ .byte 68,15,40,45,148,60,0,0 // movaps 0x3c94(%rip),%xmm13 # 6d50 <_sk_callback_sse2+0x993>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,164,58,0,0 // mulps 0x3aa4(%rip),%xmm13 # 6b70 <_sk_callback_sse2+0x9a7>
+ .byte 68,15,89,45,148,60,0,0 // mulps 0x3c94(%rip),%xmm13 # 6d60 <_sk_callback_sse2+0x9a3>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -39979,15 +40673,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,36,58,0,0 // mulps 0x3a24(%rip),%xmm9 # 6b80 <_sk_callback_sse2+0x9b7>
- .byte 68,15,84,21,44,58,0,0 // andps 0x3a2c(%rip),%xmm10 # 6b90 <_sk_callback_sse2+0x9c7>
- .byte 68,15,86,21,52,58,0,0 // orps 0x3a34(%rip),%xmm10 # 6ba0 <_sk_callback_sse2+0x9d7>
- .byte 68,15,88,13,60,58,0,0 // addps 0x3a3c(%rip),%xmm9 # 6bb0 <_sk_callback_sse2+0x9e7>
- .byte 68,15,40,37,68,58,0,0 // movaps 0x3a44(%rip),%xmm12 # 6bc0 <_sk_callback_sse2+0x9f7>
+ .byte 68,15,89,13,20,60,0,0 // mulps 0x3c14(%rip),%xmm9 # 6d70 <_sk_callback_sse2+0x9b3>
+ .byte 68,15,84,21,28,60,0,0 // andps 0x3c1c(%rip),%xmm10 # 6d80 <_sk_callback_sse2+0x9c3>
+ .byte 68,15,86,21,36,60,0,0 // orps 0x3c24(%rip),%xmm10 # 6d90 <_sk_callback_sse2+0x9d3>
+ .byte 68,15,88,13,44,60,0,0 // addps 0x3c2c(%rip),%xmm9 # 6da0 <_sk_callback_sse2+0x9e3>
+ .byte 68,15,40,37,52,60,0,0 // movaps 0x3c34(%rip),%xmm12 # 6db0 <_sk_callback_sse2+0x9f3>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,68,58,0,0 // addps 0x3a44(%rip),%xmm10 # 6bd0 <_sk_callback_sse2+0xa07>
- .byte 68,15,40,37,76,58,0,0 // movaps 0x3a4c(%rip),%xmm12 # 6be0 <_sk_callback_sse2+0xa17>
+ .byte 68,15,88,21,52,60,0,0 // addps 0x3c34(%rip),%xmm10 # 6dc0 <_sk_callback_sse2+0xa03>
+ .byte 68,15,40,37,60,60,0,0 // movaps 0x3c3c(%rip),%xmm12 # 6dd0 <_sk_callback_sse2+0xa13>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -39995,22 +40689,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,54,58,0,0 // movaps 0x3a36(%rip),%xmm10 # 6bf0 <_sk_callback_sse2+0xa27>
+ .byte 68,15,40,21,38,60,0,0 // movaps 0x3c26(%rip),%xmm10 # 6de0 <_sk_callback_sse2+0xa23>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,42,58,0,0 // addps 0x3a2a(%rip),%xmm9 # 6c00 <_sk_callback_sse2+0xa37>
- .byte 68,15,40,37,50,58,0,0 // movaps 0x3a32(%rip),%xmm12 # 6c10 <_sk_callback_sse2+0xa47>
+ .byte 68,15,88,13,26,60,0,0 // addps 0x3c1a(%rip),%xmm9 # 6df0 <_sk_callback_sse2+0xa33>
+ .byte 68,15,40,37,34,60,0,0 // movaps 0x3c22(%rip),%xmm12 # 6e00 <_sk_callback_sse2+0xa43>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,50,58,0,0 // movaps 0x3a32(%rip),%xmm12 # 6c20 <_sk_callback_sse2+0xa57>
+ .byte 68,15,40,37,34,60,0,0 // movaps 0x3c22(%rip),%xmm12 # 6e10 <_sk_callback_sse2+0xa53>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,54,58,0,0 // movaps 0x3a36(%rip),%xmm13 # 6c30 <_sk_callback_sse2+0xa67>
+ .byte 68,15,40,45,38,60,0,0 // movaps 0x3c26(%rip),%xmm13 # 6e20 <_sk_callback_sse2+0xa63>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,54,58,0,0 // mulps 0x3a36(%rip),%xmm13 # 6c40 <_sk_callback_sse2+0xa77>
+ .byte 68,15,89,45,38,60,0,0 // mulps 0x3c26(%rip),%xmm13 # 6e30 <_sk_callback_sse2+0xa73>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -40023,33 +40717,158 @@ _sk_parametric_a_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
+HIDDEN _sk_gamma_sse2
+.globl _sk_gamma_sse2
+FUNCTION(_sk_gamma_sse2)
+_sk_gamma_sse2:
+ .byte 15,41,124,36,232 // movaps %xmm7,-0x18(%rsp)
+ .byte 15,41,116,36,216 // movaps %xmm6,-0x28(%rsp)
+ .byte 15,41,108,36,200 // movaps %xmm5,-0x38(%rsp)
+ .byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
+ .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
+ .byte 15,40,218 // movaps %xmm2,%xmm3
+ .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
+ .byte 15,89,5,225,59,0,0 // mulps 0x3be1(%rip),%xmm0 # 6e40 <_sk_callback_sse2+0xa83>
+ .byte 15,84,21,234,59,0,0 // andps 0x3bea(%rip),%xmm2 # 6e50 <_sk_callback_sse2+0xa93>
+ .byte 68,15,40,53,242,59,0,0 // movaps 0x3bf2(%rip),%xmm14 # 6e60 <_sk_callback_sse2+0xaa3>
+ .byte 65,15,86,214 // orps %xmm14,%xmm2
+ .byte 68,15,40,37,246,59,0,0 // movaps 0x3bf6(%rip),%xmm12 # 6e70 <_sk_callback_sse2+0xab3>
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 68,15,40,29,250,59,0,0 // movaps 0x3bfa(%rip),%xmm11 # 6e80 <_sk_callback_sse2+0xac3>
+ .byte 15,40,226 // movaps %xmm2,%xmm4
+ .byte 65,15,89,227 // mulps %xmm11,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 68,15,40,21,248,59,0,0 // movaps 0x3bf8(%rip),%xmm10 # 6e90 <_sk_callback_sse2+0xad3>
+ .byte 65,15,88,210 // addps %xmm10,%xmm2
+ .byte 68,15,40,45,252,59,0,0 // movaps 0x3bfc(%rip),%xmm13 # 6ea0 <_sk_callback_sse2+0xae3>
+ .byte 65,15,40,229 // movaps %xmm13,%xmm4
+ .byte 15,94,226 // divps %xmm2,%xmm4
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 243,68,15,16,0 // movss (%rax),%xmm8
+ .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 243,15,91,208 // cvttps2dq %xmm0,%xmm2
+ .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,194,226,1 // cmpltps %xmm2,%xmm4
+ .byte 68,15,40,13,220,59,0,0 // movaps 0x3bdc(%rip),%xmm9 # 6eb0 <_sk_callback_sse2+0xaf3>
+ .byte 65,15,84,225 // andps %xmm9,%xmm4
+ .byte 15,92,212 // subps %xmm4,%xmm2
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,92,226 // subps %xmm2,%xmm4
+ .byte 15,40,53,216,59,0,0 // movaps 0x3bd8(%rip),%xmm6 # 6ec0 <_sk_callback_sse2+0xb03>
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 15,40,61,238,59,0,0 // movaps 0x3bee(%rip),%xmm7 # 6ee0 <_sk_callback_sse2+0xb23>
+ .byte 15,40,239 // movaps %xmm7,%xmm5
+ .byte 15,92,236 // subps %xmm4,%xmm5
+ .byte 15,40,212 // movaps %xmm4,%xmm2
+ .byte 15,40,37,206,59,0,0 // movaps 0x3bce(%rip),%xmm4 # 6ed0 <_sk_callback_sse2+0xb13>
+ .byte 15,89,212 // mulps %xmm4,%xmm2
+ .byte 15,92,194 // subps %xmm2,%xmm0
+ .byte 68,15,40,61,224,59,0,0 // movaps 0x3be0(%rip),%xmm15 # 6ef0 <_sk_callback_sse2+0xb33>
+ .byte 65,15,40,215 // movaps %xmm15,%xmm2
+ .byte 15,94,213 // divps %xmm5,%xmm2
+ .byte 15,88,208 // addps %xmm0,%xmm2
+ .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
+ .byte 15,89,5,28,59,0,0 // mulps 0x3b1c(%rip),%xmm0 # 6e40 <_sk_callback_sse2+0xa83>
+ .byte 15,84,13,37,59,0,0 // andps 0x3b25(%rip),%xmm1 # 6e50 <_sk_callback_sse2+0xa93>
+ .byte 65,15,86,206 // orps %xmm14,%xmm1
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 15,40,233 // movaps %xmm1,%xmm5
+ .byte 65,15,89,235 // mulps %xmm11,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,88,202 // addps %xmm10,%xmm1
+ .byte 69,15,40,242 // movaps %xmm10,%xmm14
+ .byte 65,15,40,237 // movaps %xmm13,%xmm5
+ .byte 15,94,233 // divps %xmm1,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
+ .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,194,233,1 // cmpltps %xmm1,%xmm5
+ .byte 65,15,84,233 // andps %xmm9,%xmm5
+ .byte 15,92,205 // subps %xmm5,%xmm1
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,92,233 // subps %xmm1,%xmm5
+ .byte 15,88,198 // addps %xmm6,%xmm0
+ .byte 68,15,40,214 // movaps %xmm6,%xmm10
+ .byte 15,40,247 // movaps %xmm7,%xmm6
+ .byte 15,92,245 // subps %xmm5,%xmm6
+ .byte 15,89,236 // mulps %xmm4,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 65,15,40,207 // movaps %xmm15,%xmm1
+ .byte 15,94,206 // divps %xmm6,%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
+ .byte 15,89,5,171,58,0,0 // mulps 0x3aab(%rip),%xmm0 # 6e40 <_sk_callback_sse2+0xa83>
+ .byte 15,84,29,180,58,0,0 // andps 0x3ab4(%rip),%xmm3 # 6e50 <_sk_callback_sse2+0xa93>
+ .byte 15,86,29,189,58,0,0 // orps 0x3abd(%rip),%xmm3 # 6e60 <_sk_callback_sse2+0xaa3>
+ .byte 65,15,88,196 // addps %xmm12,%xmm0
+ .byte 68,15,89,219 // mulps %xmm3,%xmm11
+ .byte 65,15,92,195 // subps %xmm11,%xmm0
+ .byte 65,15,88,222 // addps %xmm14,%xmm3
+ .byte 68,15,94,235 // divps %xmm3,%xmm13
+ .byte 65,15,92,197 // subps %xmm13,%xmm0
+ .byte 65,15,89,192 // mulps %xmm8,%xmm0
+ .byte 243,15,91,216 // cvttps2dq %xmm0,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,194,235,1 // cmpltps %xmm3,%xmm5
+ .byte 65,15,84,233 // andps %xmm9,%xmm5
+ .byte 15,92,221 // subps %xmm5,%xmm3
+ .byte 15,40,232 // movaps %xmm0,%xmm5
+ .byte 15,92,235 // subps %xmm3,%xmm5
+ .byte 65,15,88,194 // addps %xmm10,%xmm0
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,92,253 // subps %xmm5,%xmm7
+ .byte 68,15,94,255 // divps %xmm7,%xmm15
+ .byte 68,15,88,248 // addps %xmm0,%xmm15
+ .byte 15,40,5,10,59,0,0 // movaps 0x3b0a(%rip),%xmm0 # 6f00 <_sk_callback_sse2+0xb43>
+ .byte 15,89,208 // mulps %xmm0,%xmm2
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 68,15,89,248 // mulps %xmm0,%xmm15
+ .byte 102,15,91,194 // cvtps2dq %xmm2,%xmm0
+ .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
+ .byte 102,65,15,91,215 // cvtps2dq %xmm15,%xmm2
+ .byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 15,40,92,36,168 // movaps -0x58(%rsp),%xmm3
+ .byte 15,40,100,36,184 // movaps -0x48(%rsp),%xmm4
+ .byte 15,40,108,36,200 // movaps -0x38(%rsp),%xmm5
+ .byte 15,40,116,36,216 // movaps -0x28(%rsp),%xmm6
+ .byte 15,40,124,36,232 // movaps -0x18(%rsp),%xmm7
+ .byte 255,224 // jmpq *%rax
+
HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,19,58,0,0 // mulps 0x3a13(%rip),%xmm0 # 6c50 <_sk_callback_sse2+0xa87>
- .byte 68,15,40,5,27,58,0,0 // movaps 0x3a1b(%rip),%xmm8 # 6c60 <_sk_callback_sse2+0xa97>
+ .byte 15,89,5,223,58,0,0 // mulps 0x3adf(%rip),%xmm0 # 6f10 <_sk_callback_sse2+0xb53>
+ .byte 68,15,40,5,231,58,0,0 // movaps 0x3ae7(%rip),%xmm8 # 6f20 <_sk_callback_sse2+0xb63>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,31,58,0,0 // movaps 0x3a1f(%rip),%xmm9 # 6c70 <_sk_callback_sse2+0xaa7>
+ .byte 68,15,40,13,235,58,0,0 // movaps 0x3aeb(%rip),%xmm9 # 6f30 <_sk_callback_sse2+0xb73>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,28,58,0,0 // addps 0x3a1c(%rip),%xmm0 # 6c80 <_sk_callback_sse2+0xab7>
- .byte 15,89,5,37,58,0,0 // mulps 0x3a25(%rip),%xmm0 # 6c90 <_sk_callback_sse2+0xac7>
- .byte 15,89,13,46,58,0,0 // mulps 0x3a2e(%rip),%xmm1 # 6ca0 <_sk_callback_sse2+0xad7>
+ .byte 15,88,5,232,58,0,0 // addps 0x3ae8(%rip),%xmm0 # 6f40 <_sk_callback_sse2+0xb83>
+ .byte 15,89,5,241,58,0,0 // mulps 0x3af1(%rip),%xmm0 # 6f50 <_sk_callback_sse2+0xb93>
+ .byte 15,89,13,250,58,0,0 // mulps 0x3afa(%rip),%xmm1 # 6f60 <_sk_callback_sse2+0xba3>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,52,58,0,0 // mulps 0x3a34(%rip),%xmm2 # 6cb0 <_sk_callback_sse2+0xae7>
+ .byte 15,89,21,0,59,0,0 // mulps 0x3b00(%rip),%xmm2 # 6f70 <_sk_callback_sse2+0xbb3>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,41,58,0,0 // movaps 0x3a29(%rip),%xmm2 # 6cc0 <_sk_callback_sse2+0xaf7>
+ .byte 15,40,21,245,58,0,0 // movaps 0x3af5(%rip),%xmm2 # 6f80 <_sk_callback_sse2+0xbc3>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,40,58,0,0 // movaps 0x3a28(%rip),%xmm10 # 6cd0 <_sk_callback_sse2+0xb07>
+ .byte 68,15,40,21,244,58,0,0 // movaps 0x3af4(%rip),%xmm10 # 6f90 <_sk_callback_sse2+0xbd3>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,44,58,0,0 // movaps 0x3a2c(%rip),%xmm11 # 6ce0 <_sk_callback_sse2+0xb17>
+ .byte 68,15,40,29,248,58,0,0 // movaps 0x3af8(%rip),%xmm11 # 6fa0 <_sk_callback_sse2+0xbe3>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -40073,8 +40892,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,220,57,0,0 // mulps 0x39dc(%rip),%xmm8 # 6cf0 <_sk_callback_sse2+0xb27>
- .byte 15,89,21,229,57,0,0 // mulps 0x39e5(%rip),%xmm2 # 6d00 <_sk_callback_sse2+0xb37>
+ .byte 68,15,89,5,168,58,0,0 // mulps 0x3aa8(%rip),%xmm8 # 6fb0 <_sk_callback_sse2+0xbf3>
+ .byte 15,89,21,177,58,0,0 // mulps 0x3ab1(%rip),%xmm2 # 6fc0 <_sk_callback_sse2+0xc03>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -40090,13 +40909,13 @@ _sk_load_a8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 3369 <_sk_load_a8_sse2+0x46>
+ .byte 117,46 // jne 355d <_sk_load_a8_sse2+0x46>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,191,57,0,0 // pand 0x39bf(%rip),%xmm0 # 6d10 <_sk_callback_sse2+0xb47>
+ .byte 102,15,219,5,139,58,0,0 // pand 0x3a8b(%rip),%xmm0 # 6fd0 <_sk_callback_sse2+0xc13>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,197,57,0,0 // mulps 0x39c5(%rip),%xmm3 # 6d20 <_sk_callback_sse2+0xb57>
+ .byte 15,89,29,145,58,0,0 // mulps 0x3a91(%rip),%xmm3 # 6fe0 <_sk_callback_sse2+0xc23>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
@@ -40105,12 +40924,12 @@ _sk_load_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 33ac <_sk_load_a8_sse2+0x89>
+ .byte 116,54 // je 35a0 <_sk_load_a8_sse2+0x89>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3395 <_sk_load_a8_sse2+0x72>
+ .byte 116,21 // je 3589 <_sk_load_a8_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 3349 <_sk_load_a8_sse2+0x26>
+ .byte 117,195 // jne 353d <_sk_load_a8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -40119,10 +40938,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,157 // jmp 3349 <_sk_load_a8_sse2+0x26>
+ .byte 235,157 // jmp 353d <_sk_load_a8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,146 // jmp 3349 <_sk_load_a8_sse2+0x26>
+ .byte 235,146 // jmp 353d <_sk_load_a8_sse2+0x26>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -40135,13 +40954,13 @@ _sk_load_a8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 33fd <_sk_load_a8_dst_sse2+0x46>
+ .byte 117,46 // jne 35f1 <_sk_load_a8_dst_sse2+0x46>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,75,57,0,0 // pand 0x394b(%rip),%xmm4 # 6d30 <_sk_callback_sse2+0xb67>
+ .byte 102,15,219,37,23,58,0,0 // pand 0x3a17(%rip),%xmm4 # 6ff0 <_sk_callback_sse2+0xc33>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,81,57,0,0 // mulps 0x3951(%rip),%xmm7 # 6d40 <_sk_callback_sse2+0xb77>
+ .byte 15,89,61,29,58,0,0 // mulps 0x3a1d(%rip),%xmm7 # 7000 <_sk_callback_sse2+0xc43>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
@@ -40150,12 +40969,12 @@ _sk_load_a8_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 3440 <_sk_load_a8_dst_sse2+0x89>
+ .byte 116,54 // je 3634 <_sk_load_a8_dst_sse2+0x89>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3429 <_sk_load_a8_dst_sse2+0x72>
+ .byte 116,21 // je 361d <_sk_load_a8_dst_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 33dd <_sk_load_a8_dst_sse2+0x26>
+ .byte 117,195 // jne 35d1 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -40164,10 +40983,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,157 // jmp 33dd <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,157 // jmp 35d1 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,146 // jmp 33dd <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,146 // jmp 35d1 <_sk_load_a8_dst_sse2+0x26>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -40209,7 +41028,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,114,56,0,0 // mulps 0x3872(%rip),%xmm3 # 6d50 <_sk_callback_sse2+0xb87>
+ .byte 15,89,29,62,57,0,0 // mulps 0x393e(%rip),%xmm3 # 7010 <_sk_callback_sse2+0xc53>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -40228,7 +41047,7 @@ _sk_store_a8_sse2:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,86,56,0,0 // movaps 0x3856(%rip),%xmm8 # 6d60 <_sk_callback_sse2+0xb97>
+ .byte 68,15,40,5,34,57,0,0 // movaps 0x3922(%rip),%xmm8 # 7020 <_sk_callback_sse2+0xc63>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -40236,7 +41055,7 @@ _sk_store_a8_sse2:
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 353b <_sk_store_a8_sse2+0x4c>
+ .byte 117,13 // jne 372f <_sk_store_a8_sse2+0x4c>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -40246,24 +41065,24 @@ _sk_store_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 358d <_sk_store_a8_sse2+0x9e>
+ .byte 116,59 // je 3781 <_sk_store_a8_sse2+0x9e>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,22 // je 356e <_sk_store_a8_sse2+0x7f>
+ .byte 116,22 // je 3762 <_sk_store_a8_sse2+0x7f>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,217 // jne 3537 <_sk_store_a8_sse2+0x48>
+ .byte 117,217 // jne 372b <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 67,136,68,25,2 // mov %al,0x2(%r9,%r11,1)
- .byte 102,68,15,219,5,249,55,0,0 // pand 0x37f9(%rip),%xmm8 # 6d70 <_sk_callback_sse2+0xba7>
+ .byte 102,68,15,219,5,197,56,0,0 // pand 0x38c5(%rip),%xmm8 # 7030 <_sk_callback_sse2+0xc73>
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,25 // mov %ax,(%r9,%r11,1)
- .byte 235,170 // jmp 3537 <_sk_store_a8_sse2+0x48>
+ .byte 235,170 // jmp 372b <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp)
.byte 138,68,36,216 // mov -0x28(%rsp),%al
.byte 67,136,4,25 // mov %al,(%r9,%r11,1)
- .byte 235,153 // jmp 3537 <_sk_store_a8_sse2+0x48>
+ .byte 235,153 // jmp 372b <_sk_store_a8_sse2+0x48>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -40276,27 +41095,27 @@ _sk_load_g8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 35e7 <_sk_load_g8_sse2+0x49>
+ .byte 117,49 // jne 37db <_sk_load_g8_sse2+0x49>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,180,55,0,0 // pand 0x37b4(%rip),%xmm0 # 6d80 <_sk_callback_sse2+0xbb7>
+ .byte 102,15,219,5,128,56,0,0 // pand 0x3880(%rip),%xmm0 # 7040 <_sk_callback_sse2+0xc83>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,186,55,0,0 // mulps 0x37ba(%rip),%xmm0 # 6d90 <_sk_callback_sse2+0xbc7>
+ .byte 15,89,5,134,56,0,0 // mulps 0x3886(%rip),%xmm0 # 7050 <_sk_callback_sse2+0xc93>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,193,55,0,0 // movaps 0x37c1(%rip),%xmm3 # 6da0 <_sk_callback_sse2+0xbd7>
+ .byte 15,40,29,141,56,0,0 // movaps 0x388d(%rip),%xmm3 # 7060 <_sk_callback_sse2+0xca3>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 362a <_sk_load_g8_sse2+0x8c>
+ .byte 116,54 // je 381e <_sk_load_g8_sse2+0x8c>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3613 <_sk_load_g8_sse2+0x75>
+ .byte 116,21 // je 3807 <_sk_load_g8_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 35c4 <_sk_load_g8_sse2+0x26>
+ .byte 117,192 // jne 37b8 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -40305,10 +41124,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,154 // jmp 35c4 <_sk_load_g8_sse2+0x26>
+ .byte 235,154 // jmp 37b8 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,143 // jmp 35c4 <_sk_load_g8_sse2+0x26>
+ .byte 235,143 // jmp 37b8 <_sk_load_g8_sse2+0x26>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -40321,27 +41140,27 @@ _sk_load_g8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 367e <_sk_load_g8_dst_sse2+0x49>
+ .byte 117,49 // jne 3872 <_sk_load_g8_dst_sse2+0x49>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,77,55,0,0 // pand 0x374d(%rip),%xmm4 # 6db0 <_sk_callback_sse2+0xbe7>
+ .byte 102,15,219,37,25,56,0,0 // pand 0x3819(%rip),%xmm4 # 7070 <_sk_callback_sse2+0xcb3>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,83,55,0,0 // mulps 0x3753(%rip),%xmm4 # 6dc0 <_sk_callback_sse2+0xbf7>
+ .byte 15,89,37,31,56,0,0 // mulps 0x381f(%rip),%xmm4 # 7080 <_sk_callback_sse2+0xcc3>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,90,55,0,0 // movaps 0x375a(%rip),%xmm7 # 6dd0 <_sk_callback_sse2+0xc07>
+ .byte 15,40,61,38,56,0,0 // movaps 0x3826(%rip),%xmm7 # 7090 <_sk_callback_sse2+0xcd3>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 36c1 <_sk_load_g8_dst_sse2+0x8c>
+ .byte 116,54 // je 38b5 <_sk_load_g8_dst_sse2+0x8c>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 36aa <_sk_load_g8_dst_sse2+0x75>
+ .byte 116,21 // je 389e <_sk_load_g8_dst_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 365b <_sk_load_g8_dst_sse2+0x26>
+ .byte 117,192 // jne 384f <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -40350,10 +41169,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,154 // jmp 365b <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,154 // jmp 384f <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,143 // jmp 365b <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,143 // jmp 384f <_sk_load_g8_dst_sse2+0x26>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -40395,9 +41214,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,129,54,0,0 // mulps 0x3681(%rip),%xmm0 # 6de0 <_sk_callback_sse2+0xc17>
+ .byte 15,89,5,77,55,0,0 // mulps 0x374d(%rip),%xmm0 # 70a0 <_sk_callback_sse2+0xce3>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,136,54,0,0 // movaps 0x3688(%rip),%xmm3 # 6df0 <_sk_callback_sse2+0xc27>
+ .byte 15,40,29,84,55,0,0 // movaps 0x3754(%rip),%xmm3 # 70b0 <_sk_callback_sse2+0xcf3>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -40416,42 +41235,42 @@ _sk_load_565_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 37e0 <_sk_load_565_sse2+0x6e>
+ .byte 117,83 // jne 39d4 <_sk_load_565_sse2+0x6e>
.byte 243,67,15,126,20,89 // movq (%r9,%r11,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,97,54,0,0 // movdqa 0x3661(%rip),%xmm0 # 6e00 <_sk_callback_sse2+0xc37>
+ .byte 102,15,111,5,45,55,0,0 // movdqa 0x372d(%rip),%xmm0 # 70c0 <_sk_callback_sse2+0xd03>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,99,54,0,0 // mulps 0x3663(%rip),%xmm0 # 6e10 <_sk_callback_sse2+0xc47>
- .byte 102,15,111,13,107,54,0,0 // movdqa 0x366b(%rip),%xmm1 # 6e20 <_sk_callback_sse2+0xc57>
+ .byte 15,89,5,47,55,0,0 // mulps 0x372f(%rip),%xmm0 # 70d0 <_sk_callback_sse2+0xd13>
+ .byte 102,15,111,13,55,55,0,0 // movdqa 0x3737(%rip),%xmm1 # 70e0 <_sk_callback_sse2+0xd23>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,109,54,0,0 // mulps 0x366d(%rip),%xmm1 # 6e30 <_sk_callback_sse2+0xc67>
- .byte 102,15,219,21,117,54,0,0 // pand 0x3675(%rip),%xmm2 # 6e40 <_sk_callback_sse2+0xc77>
+ .byte 15,89,13,57,55,0,0 // mulps 0x3739(%rip),%xmm1 # 70f0 <_sk_callback_sse2+0xd33>
+ .byte 102,15,219,21,65,55,0,0 // pand 0x3741(%rip),%xmm2 # 7100 <_sk_callback_sse2+0xd43>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,123,54,0,0 // mulps 0x367b(%rip),%xmm2 # 6e50 <_sk_callback_sse2+0xc87>
+ .byte 15,89,21,71,55,0,0 // mulps 0x3747(%rip),%xmm2 # 7110 <_sk_callback_sse2+0xd53>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,130,54,0,0 // movaps 0x3682(%rip),%xmm3 # 6e60 <_sk_callback_sse2+0xc97>
+ .byte 15,40,29,78,55,0,0 // movaps 0x374e(%rip),%xmm3 # 7120 <_sk_callback_sse2+0xd63>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 381f <_sk_load_565_sse2+0xad>
+ .byte 116,50 // je 3a13 <_sk_load_565_sse2+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 380c <_sk_load_565_sse2+0x9a>
+ .byte 116,21 // je 3a00 <_sk_load_565_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 3797 <_sk_load_565_sse2+0x25>
+ .byte 117,154 // jne 398b <_sk_load_565_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,120,255,255,255 // jmpq 3797 <_sk_load_565_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 398b <_sk_load_565_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,106,255,255,255 // jmpq 3797 <_sk_load_565_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 398b <_sk_load_565_sse2+0x25>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -40465,42 +41284,42 @@ _sk_load_565_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 389b <_sk_load_565_dst_sse2+0x6e>
+ .byte 117,83 // jne 3a8f <_sk_load_565_dst_sse2+0x6e>
.byte 243,67,15,126,52,89 // movq (%r9,%r11,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,37,22,54,0,0 // movdqa 0x3616(%rip),%xmm4 # 6e70 <_sk_callback_sse2+0xca7>
+ .byte 102,15,111,37,226,54,0,0 // movdqa 0x36e2(%rip),%xmm4 # 7130 <_sk_callback_sse2+0xd73>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,24,54,0,0 // mulps 0x3618(%rip),%xmm4 # 6e80 <_sk_callback_sse2+0xcb7>
- .byte 102,15,111,45,32,54,0,0 // movdqa 0x3620(%rip),%xmm5 # 6e90 <_sk_callback_sse2+0xcc7>
+ .byte 15,89,37,228,54,0,0 // mulps 0x36e4(%rip),%xmm4 # 7140 <_sk_callback_sse2+0xd83>
+ .byte 102,15,111,45,236,54,0,0 // movdqa 0x36ec(%rip),%xmm5 # 7150 <_sk_callback_sse2+0xd93>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,34,54,0,0 // mulps 0x3622(%rip),%xmm5 # 6ea0 <_sk_callback_sse2+0xcd7>
- .byte 102,15,219,53,42,54,0,0 // pand 0x362a(%rip),%xmm6 # 6eb0 <_sk_callback_sse2+0xce7>
+ .byte 15,89,45,238,54,0,0 // mulps 0x36ee(%rip),%xmm5 # 7160 <_sk_callback_sse2+0xda3>
+ .byte 102,15,219,53,246,54,0,0 // pand 0x36f6(%rip),%xmm6 # 7170 <_sk_callback_sse2+0xdb3>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,48,54,0,0 // mulps 0x3630(%rip),%xmm6 # 6ec0 <_sk_callback_sse2+0xcf7>
+ .byte 15,89,53,252,54,0,0 // mulps 0x36fc(%rip),%xmm6 # 7180 <_sk_callback_sse2+0xdc3>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,55,54,0,0 // movaps 0x3637(%rip),%xmm7 # 6ed0 <_sk_callback_sse2+0xd07>
+ .byte 15,40,61,3,55,0,0 // movaps 0x3703(%rip),%xmm7 # 7190 <_sk_callback_sse2+0xdd3>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 38da <_sk_load_565_dst_sse2+0xad>
+ .byte 116,50 // je 3ace <_sk_load_565_dst_sse2+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 38c7 <_sk_load_565_dst_sse2+0x9a>
+ .byte 116,21 // je 3abb <_sk_load_565_dst_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 3852 <_sk_load_565_dst_sse2+0x25>
+ .byte 117,154 // jne 3a46 <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,120,255,255,255 // jmpq 3852 <_sk_load_565_dst_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 3a46 <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,106,255,255,255 // jmpq 3852 <_sk_load_565_dst_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 3a46 <_sk_load_565_dst_sse2+0x25>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -40535,19 +41354,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,114,53,0,0 // movdqa 0x3572(%rip),%xmm0 # 6ee0 <_sk_callback_sse2+0xd17>
+ .byte 102,15,111,5,62,54,0,0 // movdqa 0x363e(%rip),%xmm0 # 71a0 <_sk_callback_sse2+0xde3>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,116,53,0,0 // mulps 0x3574(%rip),%xmm0 # 6ef0 <_sk_callback_sse2+0xd27>
- .byte 102,15,111,13,124,53,0,0 // movdqa 0x357c(%rip),%xmm1 # 6f00 <_sk_callback_sse2+0xd37>
+ .byte 15,89,5,64,54,0,0 // mulps 0x3640(%rip),%xmm0 # 71b0 <_sk_callback_sse2+0xdf3>
+ .byte 102,15,111,13,72,54,0,0 // movdqa 0x3648(%rip),%xmm1 # 71c0 <_sk_callback_sse2+0xe03>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,126,53,0,0 // mulps 0x357e(%rip),%xmm1 # 6f10 <_sk_callback_sse2+0xd47>
- .byte 102,15,219,21,134,53,0,0 // pand 0x3586(%rip),%xmm2 # 6f20 <_sk_callback_sse2+0xd57>
+ .byte 15,89,13,74,54,0,0 // mulps 0x364a(%rip),%xmm1 # 71d0 <_sk_callback_sse2+0xe13>
+ .byte 102,15,219,21,82,54,0,0 // pand 0x3652(%rip),%xmm2 # 71e0 <_sk_callback_sse2+0xe23>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,140,53,0,0 // mulps 0x358c(%rip),%xmm2 # 6f30 <_sk_callback_sse2+0xd67>
+ .byte 15,89,21,88,54,0,0 // mulps 0x3658(%rip),%xmm2 # 71f0 <_sk_callback_sse2+0xe33>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,147,53,0,0 // movaps 0x3593(%rip),%xmm3 # 6f40 <_sk_callback_sse2+0xd77>
+ .byte 15,40,29,95,54,0,0 // movaps 0x365f(%rip),%xmm3 # 7200 <_sk_callback_sse2+0xe43>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -40562,12 +41381,12 @@ _sk_store_565_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,130,53,0,0 // movaps 0x3582(%rip),%xmm8 # 6f50 <_sk_callback_sse2+0xd87>
+ .byte 68,15,40,5,78,54,0,0 // movaps 0x364e(%rip),%xmm8 # 7210 <_sk_callback_sse2+0xe53>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,119,53,0,0 // movaps 0x3577(%rip),%xmm10 # 6f60 <_sk_callback_sse2+0xd97>
+ .byte 68,15,40,21,67,54,0,0 // movaps 0x3643(%rip),%xmm10 # 7220 <_sk_callback_sse2+0xe63>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -40579,7 +41398,7 @@ _sk_store_565_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3a2b <_sk_store_565_sse2+0x7b>
+ .byte 117,10 // jne 3c1f <_sk_store_565_sse2+0x7b>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -40587,19 +41406,19 @@ _sk_store_565_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 3a63 <_sk_store_565_sse2+0xb3>
+ .byte 116,38 // je 3c57 <_sk_store_565_sse2+0xb3>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3a55 <_sk_store_565_sse2+0xa5>
+ .byte 116,18 // je 3c49 <_sk_store_565_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 3a27 <_sk_store_565_sse2+0x77>
+ .byte 117,222 // jne 3c1b <_sk_store_565_sse2+0x77>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 3a27 <_sk_store_565_sse2+0x77>
+ .byte 235,196 // jmp 3c1b <_sk_store_565_sse2+0x77>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 3a27 <_sk_store_565_sse2+0x77>
+ .byte 235,184 // jmp 3c1b <_sk_store_565_sse2+0x77>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -40613,45 +41432,45 @@ _sk_load_4444_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 3aec <_sk_load_4444_sse2+0x7d>
+ .byte 117,98 // jne 3ce0 <_sk_load_4444_sse2+0x7d>
.byte 243,67,15,126,28,89 // movq (%r9,%r11,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,212,52,0,0 // movdqa 0x34d4(%rip),%xmm0 # 6f70 <_sk_callback_sse2+0xda7>
+ .byte 102,15,111,5,160,53,0,0 // movdqa 0x35a0(%rip),%xmm0 # 7230 <_sk_callback_sse2+0xe73>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,214,52,0,0 // mulps 0x34d6(%rip),%xmm0 # 6f80 <_sk_callback_sse2+0xdb7>
- .byte 102,15,111,13,222,52,0,0 // movdqa 0x34de(%rip),%xmm1 # 6f90 <_sk_callback_sse2+0xdc7>
+ .byte 15,89,5,162,53,0,0 // mulps 0x35a2(%rip),%xmm0 # 7240 <_sk_callback_sse2+0xe83>
+ .byte 102,15,111,13,170,53,0,0 // movdqa 0x35aa(%rip),%xmm1 # 7250 <_sk_callback_sse2+0xe93>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,224,52,0,0 // mulps 0x34e0(%rip),%xmm1 # 6fa0 <_sk_callback_sse2+0xdd7>
- .byte 102,15,111,21,232,52,0,0 // movdqa 0x34e8(%rip),%xmm2 # 6fb0 <_sk_callback_sse2+0xde7>
+ .byte 15,89,13,172,53,0,0 // mulps 0x35ac(%rip),%xmm1 # 7260 <_sk_callback_sse2+0xea3>
+ .byte 102,15,111,21,180,53,0,0 // movdqa 0x35b4(%rip),%xmm2 # 7270 <_sk_callback_sse2+0xeb3>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,234,52,0,0 // mulps 0x34ea(%rip),%xmm2 # 6fc0 <_sk_callback_sse2+0xdf7>
- .byte 102,15,219,29,242,52,0,0 // pand 0x34f2(%rip),%xmm3 # 6fd0 <_sk_callback_sse2+0xe07>
+ .byte 15,89,21,182,53,0,0 // mulps 0x35b6(%rip),%xmm2 # 7280 <_sk_callback_sse2+0xec3>
+ .byte 102,15,219,29,190,53,0,0 // pand 0x35be(%rip),%xmm3 # 7290 <_sk_callback_sse2+0xed3>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,248,52,0,0 // mulps 0x34f8(%rip),%xmm3 # 6fe0 <_sk_callback_sse2+0xe17>
+ .byte 15,89,29,196,53,0,0 // mulps 0x35c4(%rip),%xmm3 # 72a0 <_sk_callback_sse2+0xee3>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 3b2b <_sk_load_4444_sse2+0xbc>
+ .byte 116,50 // je 3d1f <_sk_load_4444_sse2+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3b18 <_sk_load_4444_sse2+0xa9>
+ .byte 116,21 // je 3d0c <_sk_load_4444_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 3a94 <_sk_load_4444_sse2+0x25>
+ .byte 117,139 // jne 3c88 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,105,255,255,255 // jmpq 3a94 <_sk_load_4444_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 3c88 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,91,255,255,255 // jmpq 3a94 <_sk_load_4444_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 3c88 <_sk_load_4444_sse2+0x25>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -40665,45 +41484,45 @@ _sk_load_4444_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 3bb6 <_sk_load_4444_dst_sse2+0x7d>
+ .byte 117,98 // jne 3daa <_sk_load_4444_dst_sse2+0x7d>
.byte 243,67,15,126,60,89 // movq (%r9,%r11,2),%xmm7
.byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
- .byte 102,15,111,37,138,52,0,0 // movdqa 0x348a(%rip),%xmm4 # 6ff0 <_sk_callback_sse2+0xe27>
+ .byte 102,15,111,37,86,53,0,0 // movdqa 0x3556(%rip),%xmm4 # 72b0 <_sk_callback_sse2+0xef3>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,140,52,0,0 // mulps 0x348c(%rip),%xmm4 # 7000 <_sk_callback_sse2+0xe37>
- .byte 102,15,111,45,148,52,0,0 // movdqa 0x3494(%rip),%xmm5 # 7010 <_sk_callback_sse2+0xe47>
+ .byte 15,89,37,88,53,0,0 // mulps 0x3558(%rip),%xmm4 # 72c0 <_sk_callback_sse2+0xf03>
+ .byte 102,15,111,45,96,53,0,0 // movdqa 0x3560(%rip),%xmm5 # 72d0 <_sk_callback_sse2+0xf13>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,150,52,0,0 // mulps 0x3496(%rip),%xmm5 # 7020 <_sk_callback_sse2+0xe57>
- .byte 102,15,111,53,158,52,0,0 // movdqa 0x349e(%rip),%xmm6 # 7030 <_sk_callback_sse2+0xe67>
+ .byte 15,89,45,98,53,0,0 // mulps 0x3562(%rip),%xmm5 # 72e0 <_sk_callback_sse2+0xf23>
+ .byte 102,15,111,53,106,53,0,0 // movdqa 0x356a(%rip),%xmm6 # 72f0 <_sk_callback_sse2+0xf33>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,160,52,0,0 // mulps 0x34a0(%rip),%xmm6 # 7040 <_sk_callback_sse2+0xe77>
- .byte 102,15,219,61,168,52,0,0 // pand 0x34a8(%rip),%xmm7 # 7050 <_sk_callback_sse2+0xe87>
+ .byte 15,89,53,108,53,0,0 // mulps 0x356c(%rip),%xmm6 # 7300 <_sk_callback_sse2+0xf43>
+ .byte 102,15,219,61,116,53,0,0 // pand 0x3574(%rip),%xmm7 # 7310 <_sk_callback_sse2+0xf53>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,174,52,0,0 // mulps 0x34ae(%rip),%xmm7 # 7060 <_sk_callback_sse2+0xe97>
+ .byte 15,89,61,122,53,0,0 // mulps 0x357a(%rip),%xmm7 # 7320 <_sk_callback_sse2+0xf63>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 3bf5 <_sk_load_4444_dst_sse2+0xbc>
+ .byte 116,50 // je 3de9 <_sk_load_4444_dst_sse2+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 3be2 <_sk_load_4444_dst_sse2+0xa9>
+ .byte 116,21 // je 3dd6 <_sk_load_4444_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 3b5e <_sk_load_4444_dst_sse2+0x25>
+ .byte 117,139 // jne 3d52 <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,252 // movsd %xmm4,%xmm7
- .byte 233,105,255,255,255 // jmpq 3b5e <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 3d52 <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,91,255,255,255 // jmpq 3b5e <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 3d52 <_sk_load_4444_dst_sse2+0x25>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -40738,21 +41557,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,231,51,0,0 // movdqa 0x33e7(%rip),%xmm0 # 7070 <_sk_callback_sse2+0xea7>
+ .byte 102,15,111,5,179,52,0,0 // movdqa 0x34b3(%rip),%xmm0 # 7330 <_sk_callback_sse2+0xf73>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,233,51,0,0 // mulps 0x33e9(%rip),%xmm0 # 7080 <_sk_callback_sse2+0xeb7>
- .byte 102,15,111,13,241,51,0,0 // movdqa 0x33f1(%rip),%xmm1 # 7090 <_sk_callback_sse2+0xec7>
+ .byte 15,89,5,181,52,0,0 // mulps 0x34b5(%rip),%xmm0 # 7340 <_sk_callback_sse2+0xf83>
+ .byte 102,15,111,13,189,52,0,0 // movdqa 0x34bd(%rip),%xmm1 # 7350 <_sk_callback_sse2+0xf93>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,243,51,0,0 // mulps 0x33f3(%rip),%xmm1 # 70a0 <_sk_callback_sse2+0xed7>
- .byte 102,15,111,21,251,51,0,0 // movdqa 0x33fb(%rip),%xmm2 # 70b0 <_sk_callback_sse2+0xee7>
+ .byte 15,89,13,191,52,0,0 // mulps 0x34bf(%rip),%xmm1 # 7360 <_sk_callback_sse2+0xfa3>
+ .byte 102,15,111,21,199,52,0,0 // movdqa 0x34c7(%rip),%xmm2 # 7370 <_sk_callback_sse2+0xfb3>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,253,51,0,0 // mulps 0x33fd(%rip),%xmm2 # 70c0 <_sk_callback_sse2+0xef7>
- .byte 102,15,219,29,5,52,0,0 // pand 0x3405(%rip),%xmm3 # 70d0 <_sk_callback_sse2+0xf07>
+ .byte 15,89,21,201,52,0,0 // mulps 0x34c9(%rip),%xmm2 # 7380 <_sk_callback_sse2+0xfc3>
+ .byte 102,15,219,29,209,52,0,0 // pand 0x34d1(%rip),%xmm3 # 7390 <_sk_callback_sse2+0xfd3>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,11,52,0,0 // mulps 0x340b(%rip),%xmm3 # 70e0 <_sk_callback_sse2+0xf17>
+ .byte 15,89,29,215,52,0,0 // mulps 0x34d7(%rip),%xmm3 # 73a0 <_sk_callback_sse2+0xfe3>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -40768,7 +41587,7 @@ _sk_store_4444_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,248,51,0,0 // movaps 0x33f8(%rip),%xmm8 # 70f0 <_sk_callback_sse2+0xf27>
+ .byte 68,15,40,5,196,52,0,0 // movaps 0x34c4(%rip),%xmm8 # 73b0 <_sk_callback_sse2+0xff3>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -40790,7 +41609,7 @@ _sk_store_4444_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3d69 <_sk_store_4444_sse2+0x8f>
+ .byte 117,10 // jne 3f5d <_sk_store_4444_sse2+0x8f>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -40798,19 +41617,19 @@ _sk_store_4444_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 3da1 <_sk_store_4444_sse2+0xc7>
+ .byte 116,38 // je 3f95 <_sk_store_4444_sse2+0xc7>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 3d93 <_sk_store_4444_sse2+0xb9>
+ .byte 116,18 // je 3f87 <_sk_store_4444_sse2+0xb9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 3d65 <_sk_store_4444_sse2+0x8b>
+ .byte 117,222 // jne 3f59 <_sk_store_4444_sse2+0x8b>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 3d65 <_sk_store_4444_sse2+0x8b>
+ .byte 235,196 // jmp 3f59 <_sk_store_4444_sse2+0x8b>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 3d65 <_sk_store_4444_sse2+0x8b>
+ .byte 235,184 // jmp 3f59 <_sk_store_4444_sse2+0x8b>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -40824,13 +41643,13 @@ _sk_load_8888_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 3e2b <_sk_load_8888_sse2+0x7e>
+ .byte 117,98 // jne 401f <_sk_load_8888_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,21,41,51,0,0 // movdqa 0x3329(%rip),%xmm2 # 7100 <_sk_callback_sse2+0xf37>
+ .byte 102,15,111,21,245,51,0,0 // movdqa 0x33f5(%rip),%xmm2 # 73c0 <_sk_callback_sse2+0x1003>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,37,51,0,0 // movaps 0x3325(%rip),%xmm8 # 7110 <_sk_callback_sse2+0xf47>
+ .byte 68,15,40,5,241,51,0,0 // movaps 0x33f1(%rip),%xmm8 # 73d0 <_sk_callback_sse2+0x1013>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -40850,18 +41669,18 @@ _sk_load_8888_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 3e61 <_sk_load_8888_sse2+0xb4>
+ .byte 116,41 // je 4055 <_sk_load_8888_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 3e56 <_sk_load_8888_sse2+0xa9>
+ .byte 116,19 // je 404a <_sk_load_8888_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 3dcf <_sk_load_8888_sse2+0x22>
+ .byte 117,134 // jne 3fc3 <_sk_load_8888_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 3dcf <_sk_load_8888_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 3fc3 <_sk_load_8888_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 3dcf <_sk_load_8888_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 3fc3 <_sk_load_8888_sse2+0x22>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -40875,13 +41694,13 @@ _sk_load_8888_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 3eea <_sk_load_8888_dst_sse2+0x7e>
+ .byte 117,98 // jne 40de <_sk_load_8888_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,53,138,50,0,0 // movdqa 0x328a(%rip),%xmm6 # 7120 <_sk_callback_sse2+0xf57>
+ .byte 102,15,111,53,86,51,0,0 // movdqa 0x3356(%rip),%xmm6 # 73e0 <_sk_callback_sse2+0x1023>
.byte 102,65,15,111,225 // movdqa %xmm9,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,134,50,0,0 // movaps 0x3286(%rip),%xmm8 # 7130 <_sk_callback_sse2+0xf67>
+ .byte 68,15,40,5,82,51,0,0 // movaps 0x3352(%rip),%xmm8 # 73f0 <_sk_callback_sse2+0x1033>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -40901,18 +41720,18 @@ _sk_load_8888_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 3f20 <_sk_load_8888_dst_sse2+0xb4>
+ .byte 116,41 // je 4114 <_sk_load_8888_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 3f15 <_sk_load_8888_dst_sse2+0xa9>
+ .byte 116,19 // je 4109 <_sk_load_8888_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 3e8e <_sk_load_8888_dst_sse2+0x22>
+ .byte 117,134 // jne 4082 <_sk_load_8888_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 3e8e <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 4082 <_sk_load_8888_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 3e8e <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 4082 <_sk_load_8888_dst_sse2+0x22>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -40946,11 +41765,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,147,49,0,0 // movdqa 0x3193(%rip),%xmm2 # 7140 <_sk_callback_sse2+0xf77>
+ .byte 102,15,111,21,95,50,0,0 // movdqa 0x325f(%rip),%xmm2 # 7400 <_sk_callback_sse2+0x1043>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,143,49,0,0 // movaps 0x318f(%rip),%xmm8 # 7150 <_sk_callback_sse2+0xf87>
+ .byte 68,15,40,5,91,50,0,0 // movaps 0x325b(%rip),%xmm8 # 7410 <_sk_callback_sse2+0x1053>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -40980,7 +41799,7 @@ _sk_store_8888_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,63,49,0,0 // movaps 0x313f(%rip),%xmm8 # 7160 <_sk_callback_sse2+0xf97>
+ .byte 68,15,40,5,11,50,0,0 // movaps 0x320b(%rip),%xmm8 # 7420 <_sk_callback_sse2+0x1063>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -40999,24 +41818,24 @@ _sk_store_8888_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 4081 <_sk_store_8888_sse2+0x7f>
+ .byte 117,10 // jne 4275 <_sk_store_8888_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 40af <_sk_store_8888_sse2+0xad>
+ .byte 116,33 // je 42a3 <_sk_store_8888_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 40a7 <_sk_store_8888_sse2+0xa5>
+ .byte 116,19 // je 429b <_sk_store_8888_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 407d <_sk_store_8888_sse2+0x7b>
+ .byte 117,227 // jne 4271 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 407d <_sk_store_8888_sse2+0x7b>
+ .byte 235,206 // jmp 4271 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 407d <_sk_store_8888_sse2+0x7b>
+ .byte 235,198 // jmp 4271 <_sk_store_8888_sse2+0x7b>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -41030,13 +41849,13 @@ _sk_load_bgra_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 4135 <_sk_load_bgra_sse2+0x7e>
+ .byte 117,98 // jne 4329 <_sk_load_bgra_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,5,143,48,0,0 // movdqa 0x308f(%rip),%xmm0 # 7170 <_sk_callback_sse2+0xfa7>
+ .byte 102,15,111,5,91,49,0,0 // movdqa 0x315b(%rip),%xmm0 # 7430 <_sk_callback_sse2+0x1073>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,139,48,0,0 // movaps 0x308b(%rip),%xmm8 # 7180 <_sk_callback_sse2+0xfb7>
+ .byte 68,15,40,5,87,49,0,0 // movaps 0x3157(%rip),%xmm8 # 7440 <_sk_callback_sse2+0x1083>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -41056,18 +41875,18 @@ _sk_load_bgra_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 416b <_sk_load_bgra_sse2+0xb4>
+ .byte 116,41 // je 435f <_sk_load_bgra_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 4160 <_sk_load_bgra_sse2+0xa9>
+ .byte 116,19 // je 4354 <_sk_load_bgra_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 40d9 <_sk_load_bgra_sse2+0x22>
+ .byte 117,134 // jne 42cd <_sk_load_bgra_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 40d9 <_sk_load_bgra_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 42cd <_sk_load_bgra_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 40d9 <_sk_load_bgra_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 42cd <_sk_load_bgra_sse2+0x22>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -41081,13 +41900,13 @@ _sk_load_bgra_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 41f4 <_sk_load_bgra_dst_sse2+0x7e>
+ .byte 117,98 // jne 43e8 <_sk_load_bgra_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,37,240,47,0,0 // movdqa 0x2ff0(%rip),%xmm4 # 7190 <_sk_callback_sse2+0xfc7>
+ .byte 102,15,111,37,188,48,0,0 // movdqa 0x30bc(%rip),%xmm4 # 7450 <_sk_callback_sse2+0x1093>
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 68,15,40,5,236,47,0,0 // movaps 0x2fec(%rip),%xmm8 # 71a0 <_sk_callback_sse2+0xfd7>
+ .byte 68,15,40,5,184,48,0,0 // movaps 0x30b8(%rip),%xmm8 # 7460 <_sk_callback_sse2+0x10a3>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -41107,18 +41926,18 @@ _sk_load_bgra_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 422a <_sk_load_bgra_dst_sse2+0xb4>
+ .byte 116,41 // je 441e <_sk_load_bgra_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 421f <_sk_load_bgra_dst_sse2+0xa9>
+ .byte 116,19 // je 4413 <_sk_load_bgra_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 4198 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 117,134 // jne 438c <_sk_load_bgra_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 4198 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 438c <_sk_load_bgra_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 4198 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 438c <_sk_load_bgra_dst_sse2+0x22>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -41152,11 +41971,11 @@ _sk_gather_bgra_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,5,249,46,0,0 // movdqa 0x2ef9(%rip),%xmm0 # 71b0 <_sk_callback_sse2+0xfe7>
+ .byte 102,15,111,5,197,47,0,0 // movdqa 0x2fc5(%rip),%xmm0 # 7470 <_sk_callback_sse2+0x10b3>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,245,46,0,0 // movaps 0x2ef5(%rip),%xmm8 # 71c0 <_sk_callback_sse2+0xff7>
+ .byte 68,15,40,5,193,47,0,0 // movaps 0x2fc1(%rip),%xmm8 # 7480 <_sk_callback_sse2+0x10c3>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -41186,7 +42005,7 @@ _sk_store_bgra_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,165,46,0,0 // movaps 0x2ea5(%rip),%xmm8 # 71d0 <_sk_callback_sse2+0x1007>
+ .byte 68,15,40,5,113,47,0,0 // movaps 0x2f71(%rip),%xmm8 # 7490 <_sk_callback_sse2+0x10d3>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -41205,24 +42024,24 @@ _sk_store_bgra_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 438b <_sk_store_bgra_sse2+0x7f>
+ .byte 117,10 // jne 457f <_sk_store_bgra_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 43b9 <_sk_store_bgra_sse2+0xad>
+ .byte 116,33 // je 45ad <_sk_store_bgra_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 43b1 <_sk_store_bgra_sse2+0xa5>
+ .byte 116,19 // je 45a5 <_sk_store_bgra_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 4387 <_sk_store_bgra_sse2+0x7b>
+ .byte 117,227 // jne 457b <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 4387 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,206 // jmp 457b <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 4387 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,198 // jmp 457b <_sk_store_bgra_sse2+0x7b>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -41236,7 +42055,7 @@ _sk_load_f16_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 4543 <_sk_load_f16_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 4737 <_sk_load_f16_sse2+0x182>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 102,65,15,16,76,193,16 // movupd 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,192 // movapd %xmm0,%xmm8
@@ -41248,7 +42067,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,189,45,0,0 // movdqa 0x2dbd(%rip),%xmm9 # 71e0 <_sk_callback_sse2+0x1017>
+ .byte 102,68,15,111,13,137,46,0,0 // movdqa 0x2e89(%rip),%xmm9 # 74a0 <_sk_callback_sse2+0x10e3>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -41256,11 +42075,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,162,45,0,0 // movdqa 0x2da2(%rip),%xmm11 # 71f0 <_sk_callback_sse2+0x1027>
+ .byte 102,68,15,111,29,110,46,0,0 // movdqa 0x2e6e(%rip),%xmm11 # 74b0 <_sk_callback_sse2+0x10f3>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,164,45,0,0 // movdqa 0x2da4(%rip),%xmm12 # 7200 <_sk_callback_sse2+0x1037>
+ .byte 102,68,15,111,37,112,46,0,0 // movdqa 0x2e70(%rip),%xmm12 # 74c0 <_sk_callback_sse2+0x1103>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,167,45,0,0 // movdqa 0x2da7(%rip),%xmm3 # 7210 <_sk_callback_sse2+0x1047>
+ .byte 102,15,111,29,115,46,0,0 // movdqa 0x2e73(%rip),%xmm3 # 74d0 <_sk_callback_sse2+0x1113>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -41308,17 +42127,17 @@ _sk_load_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 4560 <_sk_load_f16_sse2+0x19f>
+ .byte 117,17 // jne 4754 <_sk_load_f16_sse2+0x19f>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,142,254,255,255 // jmpq 43ee <_sk_load_f16_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 45e2 <_sk_load_f16_sse2+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 43ee <_sk_load_f16_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 45e2 <_sk_load_f16_sse2+0x2d>
.byte 242,65,15,16,76,193,16 // movsd 0x10(%r9,%rax,8),%xmm1
- .byte 233,109,254,255,255 // jmpq 43ee <_sk_load_f16_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 45e2 <_sk_load_f16_sse2+0x2d>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -41332,7 +42151,7 @@ _sk_load_f16_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 4703 <_sk_load_f16_dst_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 48f7 <_sk_load_f16_dst_sse2+0x182>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 102,65,15,16,108,193,16 // movupd 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,196 // movapd %xmm4,%xmm8
@@ -41344,7 +42163,7 @@ _sk_load_f16_dst_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,238 // movdqa %xmm14,%xmm5
.byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5
- .byte 102,68,15,111,13,61,44,0,0 // movdqa 0x2c3d(%rip),%xmm9 # 7220 <_sk_callback_sse2+0x1057>
+ .byte 102,68,15,111,13,9,45,0,0 // movdqa 0x2d09(%rip),%xmm9 # 74e0 <_sk_callback_sse2+0x1123>
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,219,225 // pand %xmm9,%xmm4
.byte 102,15,239,236 // pxor %xmm4,%xmm5
@@ -41352,11 +42171,11 @@ _sk_load_f16_dst_sse2:
.byte 102,68,15,111,237 // movdqa %xmm5,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,236 // por %xmm4,%xmm13
- .byte 102,68,15,111,29,34,44,0,0 // movdqa 0x2c22(%rip),%xmm11 # 7230 <_sk_callback_sse2+0x1067>
+ .byte 102,68,15,111,29,238,44,0,0 // movdqa 0x2cee(%rip),%xmm11 # 74f0 <_sk_callback_sse2+0x1133>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,36,44,0,0 // movdqa 0x2c24(%rip),%xmm12 # 7240 <_sk_callback_sse2+0x1077>
+ .byte 102,68,15,111,37,240,44,0,0 // movdqa 0x2cf0(%rip),%xmm12 # 7500 <_sk_callback_sse2+0x1143>
.byte 102,65,15,239,236 // pxor %xmm12,%xmm5
- .byte 102,15,111,61,39,44,0,0 // movdqa 0x2c27(%rip),%xmm7 # 7250 <_sk_callback_sse2+0x1087>
+ .byte 102,15,111,61,243,44,0,0 // movdqa 0x2cf3(%rip),%xmm7 # 7510 <_sk_callback_sse2+0x1153>
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4
.byte 102,65,15,223,229 // pandn %xmm13,%xmm4
@@ -41404,17 +42223,17 @@ _sk_load_f16_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 4720 <_sk_load_f16_dst_sse2+0x19f>
+ .byte 117,17 // jne 4914 <_sk_load_f16_dst_sse2+0x19f>
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 102,15,20,229 // unpcklpd %xmm5,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
- .byte 233,142,254,255,255 // jmpq 45ae <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 47a2 <_sk_load_f16_dst_sse2+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 45ae <_sk_load_f16_dst_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 47a2 <_sk_load_f16_dst_sse2+0x2d>
.byte 242,65,15,16,108,193,16 // movsd 0x10(%r9,%rax,8),%xmm5
- .byte 233,109,254,255,255 // jmpq 45ae <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 47a2 <_sk_load_f16_dst_sse2+0x2d>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -41456,7 +42275,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,118,42,0,0 // movdqa 0x2a76(%rip),%xmm9 # 7260 <_sk_callback_sse2+0x1097>
+ .byte 102,68,15,111,13,66,43,0,0 // movdqa 0x2b42(%rip),%xmm9 # 7520 <_sk_callback_sse2+0x1163>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -41464,11 +42283,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,91,42,0,0 // movdqa 0x2a5b(%rip),%xmm11 # 7270 <_sk_callback_sse2+0x10a7>
+ .byte 102,68,15,111,29,39,43,0,0 // movdqa 0x2b27(%rip),%xmm11 # 7530 <_sk_callback_sse2+0x1173>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,93,42,0,0 // movdqa 0x2a5d(%rip),%xmm12 # 7280 <_sk_callback_sse2+0x10b7>
+ .byte 102,68,15,111,37,41,43,0,0 // movdqa 0x2b29(%rip),%xmm12 # 7540 <_sk_callback_sse2+0x1183>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,96,42,0,0 // movdqa 0x2a60(%rip),%xmm3 # 7290 <_sk_callback_sse2+0x10c7>
+ .byte 102,15,111,29,44,43,0,0 // movdqa 0x2b2c(%rip),%xmm3 # 7550 <_sk_callback_sse2+0x1193>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -41527,17 +42346,17 @@ _sk_store_f16_sse2:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,117,41,0,0 // movdqa 0x2975(%rip),%xmm10 # 72a0 <_sk_callback_sse2+0x10d7>
+ .byte 102,68,15,111,21,65,42,0,0 // movdqa 0x2a41(%rip),%xmm10 # 7560 <_sk_callback_sse2+0x11a3>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,69,15,219,226 // pand %xmm10,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,236 // pxor %xmm12,%xmm13
- .byte 102,68,15,111,13,104,41,0,0 // movdqa 0x2968(%rip),%xmm9 # 72b0 <_sk_callback_sse2+0x10e7>
+ .byte 102,68,15,111,13,52,42,0,0 // movdqa 0x2a34(%rip),%xmm9 # 7570 <_sk_callback_sse2+0x11b3>
.byte 102,65,15,114,212,16 // psrld $0x10,%xmm12
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,29,89,41,0,0 // movdqa 0x2959(%rip),%xmm11 # 72c0 <_sk_callback_sse2+0x10f7>
+ .byte 102,68,15,111,29,37,42,0,0 // movdqa 0x2a25(%rip),%xmm11 # 7580 <_sk_callback_sse2+0x11c3>
.byte 102,69,15,235,227 // por %xmm11,%xmm12
.byte 102,69,15,254,229 // paddd %xmm13,%xmm12
.byte 102,65,15,114,244,16 // pslld $0x10,%xmm12
@@ -41589,7 +42408,7 @@ _sk_store_f16_sse2:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,204 // punpckldq %xmm12,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 4a89 <_sk_store_f16_sse2+0x17e>
+ .byte 117,21 // jne 4c7d <_sk_store_f16_sse2+0x17e>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -41597,13 +42416,13 @@ _sk_store_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4a85 <_sk_store_f16_sse2+0x17a>
+ .byte 116,240 // je 4c79 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4a85 <_sk_store_f16_sse2+0x17a>
+ .byte 114,227 // jb 4c79 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 4a85 <_sk_store_f16_sse2+0x17a>
+ .byte 235,213 // jmp 4c79 <_sk_store_f16_sse2+0x17a>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -41618,7 +42437,7 @@ _sk_load_u16_be_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,190,0,0,0 // jne 4b95 <_sk_load_u16_be_sse2+0xe5>
+ .byte 15,133,190,0,0,0 // jne 4d89 <_sk_load_u16_be_sse2+0xe5>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 102,65,15,16,76,65,16 // movupd 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -41635,7 +42454,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,168,39,0,0 // movaps 0x27a8(%rip),%xmm8 # 72d0 <_sk_callback_sse2+0x1107>
+ .byte 68,15,40,5,116,40,0,0 // movaps 0x2874(%rip),%xmm8 # 7590 <_sk_callback_sse2+0x11d3>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -41663,17 +42482,17 @@ _sk_load_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 4bb2 <_sk_load_u16_be_sse2+0x102>
+ .byte 117,17 // jne 4da6 <_sk_load_u16_be_sse2+0x102>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,50,255,255,255 // jmpq 4ae4 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,50,255,255,255 // jmpq 4cd8 <_sk_load_u16_be_sse2+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,29,255,255,255 // jb 4ae4 <_sk_load_u16_be_sse2+0x34>
+ .byte 15,130,29,255,255,255 // jb 4cd8 <_sk_load_u16_be_sse2+0x34>
.byte 242,65,15,16,76,65,16 // movsd 0x10(%r9,%rax,2),%xmm1
- .byte 233,17,255,255,255 // jmpq 4ae4 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,17,255,255,255 // jmpq 4cd8 <_sk_load_u16_be_sse2+0x34>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -41690,7 +42509,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,175,0,0,0 // jne 4cad <_sk_load_rgb_u16_be_sse2+0xda>
+ .byte 15,133,175,0,0,0 // jne 4ea1 <_sk_load_rgb_u16_be_sse2+0xda>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -41711,7 +42530,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,13,126,38,0,0 // movaps 0x267e(%rip),%xmm9 # 72e0 <_sk_callback_sse2+0x1117>
+ .byte 68,15,40,13,74,39,0,0 // movaps 0x274a(%rip),%xmm9 # 75a0 <_sk_callback_sse2+0x11e3>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -41728,27 +42547,27 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,69,38,0,0 // movaps 0x2645(%rip),%xmm3 # 72f0 <_sk_callback_sse2+0x1127>
+ .byte 15,40,29,17,39,0,0 // movaps 0x2711(%rip),%xmm3 # 75b0 <_sk_callback_sse2+0x11f3>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 4cd2 <_sk_load_rgb_u16_be_sse2+0xff>
+ .byte 117,13 // jne 4ec6 <_sk_load_rgb_u16_be_sse2+0xff>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,80,255,255,255 // jmpq 4c22 <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,80,255,255,255 // jmpq 4e16 <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 4d03 <_sk_load_rgb_u16_be_sse2+0x130>
+ .byte 114,24 // jb 4ef7 <_sk_load_rgb_u16_be_sse2+0x130>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,31,255,255,255 // jmpq 4c22 <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,31,255,255,255 // jmpq 4e16 <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,22,255,255,255 // jmpq 4c22 <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,22,255,255,255 // jmpq 4e16 <_sk_load_rgb_u16_be_sse2+0x4f>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -41762,7 +42581,7 @@ _sk_store_u16_be_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,206,37,0,0 // movaps 0x25ce(%rip),%xmm10 # 7300 <_sk_callback_sse2+0x1137>
+ .byte 68,15,40,21,154,38,0,0 // movaps 0x269a(%rip),%xmm10 # 75c0 <_sk_callback_sse2+0x1203>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -41807,7 +42626,7 @@ _sk_store_u16_be_sse2:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 4e2c <_sk_store_u16_be_sse2+0x120>
+ .byte 117,21 // jne 5020 <_sk_store_u16_be_sse2+0x120>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -41815,13 +42634,13 @@ _sk_store_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4e28 <_sk_store_u16_be_sse2+0x11c>
+ .byte 116,240 // je 501c <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4e28 <_sk_store_u16_be_sse2+0x11c>
+ .byte 114,227 // jb 501c <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 4e28 <_sk_store_u16_be_sse2+0x11c>
+ .byte 235,213 // jmp 501c <_sk_store_u16_be_sse2+0x11c>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -41837,7 +42656,7 @@ _sk_load_f32_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 4ebe <_sk_load_f32_sse2+0x6b>
+ .byte 117,66 // jne 50b2 <_sk_load_f32_sse2+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -41857,17 +42676,17 @@ _sk_load_f32_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 4ed0 <_sk_load_f32_sse2+0x7d>
+ .byte 117,8 // jne 50c4 <_sk_load_f32_sse2+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 4e8e <_sk_load_f32_sse2+0x3b>
+ .byte 235,190 // jmp 5082 <_sk_load_f32_sse2+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 4ee4 <_sk_load_f32_sse2+0x91>
+ .byte 114,8 // jb 50d8 <_sk_load_f32_sse2+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 4e8e <_sk_load_f32_sse2+0x3b>
+ .byte 235,170 // jmp 5082 <_sk_load_f32_sse2+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 4e8e <_sk_load_f32_sse2+0x3b>
+ .byte 235,165 // jmp 5082 <_sk_load_f32_sse2+0x3b>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -41883,7 +42702,7 @@ _sk_load_f32_dst_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 4f54 <_sk_load_f32_dst_sse2+0x6b>
+ .byte 117,66 // jne 5148 <_sk_load_f32_dst_sse2+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -41903,17 +42722,17 @@ _sk_load_f32_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 4f66 <_sk_load_f32_dst_sse2+0x7d>
+ .byte 117,8 // jne 515a <_sk_load_f32_dst_sse2+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 4f24 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,190 // jmp 5118 <_sk_load_f32_dst_sse2+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 4f7a <_sk_load_f32_dst_sse2+0x91>
+ .byte 114,8 // jb 516e <_sk_load_f32_dst_sse2+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 4f24 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,170 // jmp 5118 <_sk_load_f32_dst_sse2+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 4f24 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,165 // jmp 5118 <_sk_load_f32_dst_sse2+0x3b>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -41942,7 +42761,7 @@ _sk_store_f32_sse2:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 4ffc <_sk_store_f32_sse2+0x7d>
+ .byte 117,29 // jne 51f0 <_sk_store_f32_sse2+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -41950,12 +42769,12 @@ _sk_store_f32_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 4ff8 <_sk_store_f32_sse2+0x79>
+ .byte 116,246 // je 51ec <_sk_store_f32_sse2+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 4ff8 <_sk_store_f32_sse2+0x79>
+ .byte 114,234 // jb 51ec <_sk_store_f32_sse2+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 4ff8 <_sk_store_f32_sse2+0x79>
+ .byte 235,225 // jmp 51ec <_sk_store_f32_sse2+0x79>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -42001,7 +42820,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,123,34,0,0 // andps 0x227b(%rip),%xmm10 # 7310 <_sk_callback_sse2+0x1147>
+ .byte 68,15,84,21,71,35,0,0 // andps 0x2347(%rip),%xmm10 # 75d0 <_sk_callback_sse2+0x1213>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -42027,7 +42846,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,49,34,0,0 // andps 0x2231(%rip),%xmm10 # 7320 <_sk_callback_sse2+0x1157>
+ .byte 68,15,84,21,253,34,0,0 // andps 0x22fd(%rip),%xmm10 # 75e0 <_sk_callback_sse2+0x1223>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -42053,13 +42872,13 @@ _sk_mirror_x_sse2:
.byte 65,15,92,193 // subps %xmm9,%xmm0
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,150,38,0,0 // mulss 0x2696(%rip),%xmm11 # 77e0 <_sk_callback_sse2+0x1617>
+ .byte 243,68,15,89,29,98,39,0,0 // mulss 0x2762(%rip),%xmm11 # 7aa0 <_sk_callback_sse2+0x16e3>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,199,33,0,0 // andps 0x21c7(%rip),%xmm11 # 7330 <_sk_callback_sse2+0x1167>
+ .byte 68,15,84,29,147,34,0,0 // andps 0x2293(%rip),%xmm11 # 75f0 <_sk_callback_sse2+0x1233>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -42088,13 +42907,13 @@ _sk_mirror_y_sse2:
.byte 65,15,92,201 // subps %xmm9,%xmm1
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,21,38,0,0 // mulss 0x2615(%rip),%xmm11 # 77e4 <_sk_callback_sse2+0x161b>
+ .byte 243,68,15,89,29,225,38,0,0 // mulss 0x26e1(%rip),%xmm11 # 7aa4 <_sk_callback_sse2+0x16e7>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,82,33,0,0 // andps 0x2152(%rip),%xmm11 # 7340 <_sk_callback_sse2+0x1177>
+ .byte 68,15,84,29,30,34,0,0 // andps 0x221e(%rip),%xmm11 # 7600 <_sk_callback_sse2+0x1243>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -42117,7 +42936,7 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,25,33,0,0 // minps 0x2119(%rip),%xmm8 # 7350 <_sk_callback_sse2+0x1187>
+ .byte 68,15,93,5,229,33,0,0 // minps 0x21e5(%rip),%xmm8 # 7610 <_sk_callback_sse2+0x1253>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -42130,7 +42949,7 @@ _sk_repeat_x_1_sse2:
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,84,13,7,33,0,0 // andps 0x2107(%rip),%xmm9 # 7360 <_sk_callback_sse2+0x1197>
+ .byte 68,15,84,13,211,33,0,0 // andps 0x21d3(%rip),%xmm9 # 7620 <_sk_callback_sse2+0x1263>
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -42140,14 +42959,14 @@ HIDDEN _sk_mirror_x_1_sse2
.globl _sk_mirror_x_1_sse2
FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
- .byte 68,15,40,5,3,33,0,0 // movaps 0x2103(%rip),%xmm8 # 7370 <_sk_callback_sse2+0x11a7>
+ .byte 68,15,40,5,207,33,0,0 // movaps 0x21cf(%rip),%xmm8 # 7630 <_sk_callback_sse2+0x1273>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,7,33,0,0 // movaps 0x2107(%rip),%xmm9 # 7380 <_sk_callback_sse2+0x11b7>
+ .byte 68,15,40,13,211,33,0,0 // movaps 0x21d3(%rip),%xmm9 # 7640 <_sk_callback_sse2+0x1283>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,253,32,0,0 // andps 0x20fd(%rip),%xmm9 # 7390 <_sk_callback_sse2+0x11c7>
+ .byte 68,15,84,13,201,33,0,0 // andps 0x21c9(%rip),%xmm9 # 7650 <_sk_callback_sse2+0x1293>
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,88,210 // addps %xmm10,%xmm10
@@ -42163,10 +42982,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,227,32,0,0 // mulps 0x20e3(%rip),%xmm0 # 73a0 <_sk_callback_sse2+0x11d7>
- .byte 15,89,13,236,32,0,0 // mulps 0x20ec(%rip),%xmm1 # 73b0 <_sk_callback_sse2+0x11e7>
+ .byte 15,89,5,175,33,0,0 // mulps 0x21af(%rip),%xmm0 # 7660 <_sk_callback_sse2+0x12a3>
+ .byte 15,89,13,184,33,0,0 // mulps 0x21b8(%rip),%xmm1 # 7670 <_sk_callback_sse2+0x12b3>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,242,32,0,0 // mulps 0x20f2(%rip),%xmm3 # 73c0 <_sk_callback_sse2+0x11f7>
+ .byte 15,89,29,190,33,0,0 // mulps 0x21be(%rip),%xmm3 # 7680 <_sk_callback_sse2+0x12c3>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -42478,9 +43297,9 @@ _sk_evenly_spaced_gradient_sse2:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 576e <_sk_evenly_spaced_gradient_sse2+0x18>
+ .byte 120,7 // js 5962 <_sk_evenly_spaced_gradient_sse2+0x18>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 5783 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ .byte 235,21 // jmp 5977 <_sk_evenly_spaced_gradient_sse2+0x2d>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -42578,15 +43397,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2
.globl _sk_gauss_a_to_rgba_sse2
FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
- .byte 15,40,5,193,26,0,0 // movaps 0x1ac1(%rip),%xmm0 # 73d0 <_sk_callback_sse2+0x1207>
+ .byte 15,40,5,141,27,0,0 // movaps 0x1b8d(%rip),%xmm0 # 7690 <_sk_callback_sse2+0x12d3>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,199,26,0,0 // addps 0x1ac7(%rip),%xmm0 # 73e0 <_sk_callback_sse2+0x1217>
+ .byte 15,88,5,147,27,0,0 // addps 0x1b93(%rip),%xmm0 # 76a0 <_sk_callback_sse2+0x12e3>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,205,26,0,0 // addps 0x1acd(%rip),%xmm0 # 73f0 <_sk_callback_sse2+0x1227>
+ .byte 15,88,5,153,27,0,0 // addps 0x1b99(%rip),%xmm0 # 76b0 <_sk_callback_sse2+0x12f3>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,211,26,0,0 // addps 0x1ad3(%rip),%xmm0 # 7400 <_sk_callback_sse2+0x1237>
+ .byte 15,88,5,159,27,0,0 // addps 0x1b9f(%rip),%xmm0 # 76c0 <_sk_callback_sse2+0x1303>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,217,26,0,0 // addps 0x1ad9(%rip),%xmm0 # 7410 <_sk_callback_sse2+0x1247>
+ .byte 15,88,5,165,27,0,0 // addps 0x1ba5(%rip),%xmm0 # 76d0 <_sk_callback_sse2+0x1313>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -42604,12 +43423,12 @@ _sk_gradient_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 598a <_sk_gradient_sse2+0x46>
+ .byte 114,50 // jb 5b7e <_sk_gradient_sse2+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,178,26,0,0 // movaps 0x1ab2(%rip),%xmm2 # 7420 <_sk_callback_sse2+0x1257>
+ .byte 15,40,21,126,27,0,0 // movaps 0x1b7e(%rip),%xmm2 # 76e0 <_sk_callback_sse2+0x1323>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -42617,7 +43436,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 596e <_sk_gradient_sse2+0x2a>
+ .byte 117,228 // jne 5b62 <_sk_gradient_sse2+0x2a>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,211 // movq %xmm2,%r11
.byte 69,137,217 // mov %r11d,%r9d
@@ -42756,29 +43575,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,115,24,0,0 // movaps 0x1873(%rip),%xmm13 # 7430 <_sk_callback_sse2+0x1267>
+ .byte 68,15,40,45,63,25,0,0 // movaps 0x193f(%rip),%xmm13 # 76f0 <_sk_callback_sse2+0x1333>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,119,24,0,0 // addps 0x1877(%rip),%xmm13 # 7440 <_sk_callback_sse2+0x1277>
+ .byte 68,15,88,45,67,25,0,0 // addps 0x1943(%rip),%xmm13 # 7700 <_sk_callback_sse2+0x1343>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,123,24,0,0 // addps 0x187b(%rip),%xmm13 # 7450 <_sk_callback_sse2+0x1287>
+ .byte 68,15,88,45,71,25,0,0 // addps 0x1947(%rip),%xmm13 # 7710 <_sk_callback_sse2+0x1353>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,127,24,0,0 // addps 0x187f(%rip),%xmm13 # 7460 <_sk_callback_sse2+0x1297>
+ .byte 68,15,88,45,75,25,0,0 // addps 0x194b(%rip),%xmm13 # 7720 <_sk_callback_sse2+0x1363>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,126,24,0,0 // movaps 0x187e(%rip),%xmm10 # 7470 <_sk_callback_sse2+0x12a7>
+ .byte 68,15,40,21,74,25,0,0 // movaps 0x194a(%rip),%xmm10 # 7730 <_sk_callback_sse2+0x1373>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,113,24,0,0 // movaps 0x1871(%rip),%xmm10 # 7480 <_sk_callback_sse2+0x12b7>
+ .byte 68,15,40,21,61,25,0,0 // movaps 0x193d(%rip),%xmm10 # 7740 <_sk_callback_sse2+0x1383>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,96,24,0,0 // movaps 0x1860(%rip),%xmm10 # 7490 <_sk_callback_sse2+0x12c7>
+ .byte 68,15,40,21,44,25,0,0 // movaps 0x192c(%rip),%xmm10 # 7750 <_sk_callback_sse2+0x1393>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -42813,7 +43632,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,7,24,0,0 // mulps 0x1807(%rip),%xmm9 # 74a0 <_sk_callback_sse2+0x12d7>
+ .byte 68,15,89,13,211,24,0,0 // mulps 0x18d3(%rip),%xmm9 # 7760 <_sk_callback_sse2+0x13a3>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -42821,7 +43640,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,242,23,0,0 // mulps 0x17f2(%rip),%xmm10 # 74b0 <_sk_callback_sse2+0x12e7>
+ .byte 68,15,89,21,190,24,0,0 // mulps 0x18be(%rip),%xmm10 # 7770 <_sk_callback_sse2+0x13b3>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -42830,8 +43649,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,218,23,0,0 // xorps 0x17da(%rip),%xmm9 # 74c0 <_sk_callback_sse2+0x12f7>
- .byte 68,15,89,5,226,23,0,0 // mulps 0x17e2(%rip),%xmm8 # 74d0 <_sk_callback_sse2+0x1307>
+ .byte 68,15,87,13,166,24,0,0 // xorps 0x18a6(%rip),%xmm9 # 7780 <_sk_callback_sse2+0x13c3>
+ .byte 68,15,89,5,174,24,0,0 // mulps 0x18ae(%rip),%xmm8 # 7790 <_sk_callback_sse2+0x13d3>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -42852,7 +43671,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,169,23,0,0 // mulps 0x17a9(%rip),%xmm9 # 74e0 <_sk_callback_sse2+0x1317>
+ .byte 68,15,89,13,117,24,0,0 // mulps 0x1875(%rip),%xmm9 # 77a0 <_sk_callback_sse2+0x13e3>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -42860,7 +43679,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,148,23,0,0 // mulps 0x1794(%rip),%xmm10 # 74f0 <_sk_callback_sse2+0x1327>
+ .byte 68,15,89,21,96,24,0,0 // mulps 0x1860(%rip),%xmm10 # 77b0 <_sk_callback_sse2+0x13f3>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -42869,8 +43688,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,124,23,0,0 // xorps 0x177c(%rip),%xmm9 # 7500 <_sk_callback_sse2+0x1337>
- .byte 68,15,89,5,132,23,0,0 // mulps 0x1784(%rip),%xmm8 # 7510 <_sk_callback_sse2+0x1347>
+ .byte 68,15,87,13,72,24,0,0 // xorps 0x1848(%rip),%xmm9 # 77c0 <_sk_callback_sse2+0x1403>
+ .byte 68,15,89,5,80,24,0,0 // mulps 0x1850(%rip),%xmm8 # 77d0 <_sk_callback_sse2+0x1413>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -42888,7 +43707,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,92,23,0,0 // mulps 0x175c(%rip),%xmm9 # 7520 <_sk_callback_sse2+0x1357>
+ .byte 68,15,89,13,40,24,0,0 // mulps 0x1828(%rip),%xmm9 # 77e0 <_sk_callback_sse2+0x1423>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -42896,7 +43715,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,72,23,0,0 // xorps 0x1748(%rip),%xmm0 # 7530 <_sk_callback_sse2+0x1367>
+ .byte 15,87,5,20,24,0,0 // xorps 0x1814(%rip),%xmm0 # 77f0 <_sk_callback_sse2+0x1433>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -42939,7 +43758,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,238,22,0,0 // movaps 0x16ee(%rip),%xmm8 # 7540 <_sk_callback_sse2+0x1377>
+ .byte 68,15,40,5,186,23,0,0 // movaps 0x17ba(%rip),%xmm8 # 7800 <_sk_callback_sse2+0x1443>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -42947,7 +43766,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,217,22,0,0 // movaps 0x16d9(%rip),%xmm12 # 7550 <_sk_callback_sse2+0x1387>
+ .byte 68,15,40,37,165,23,0,0 // movaps 0x17a5(%rip),%xmm12 # 7810 <_sk_callback_sse2+0x1453>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -42994,8 +43813,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,82,22,0,0 // addps 0x1652(%rip),%xmm0 # 7560 <_sk_callback_sse2+0x1397>
- .byte 68,15,40,13,90,22,0,0 // movaps 0x165a(%rip),%xmm9 # 7570 <_sk_callback_sse2+0x13a7>
+ .byte 15,88,5,30,23,0,0 // addps 0x171e(%rip),%xmm0 # 7820 <_sk_callback_sse2+0x1463>
+ .byte 68,15,40,13,38,23,0,0 // movaps 0x1726(%rip),%xmm9 # 7830 <_sk_callback_sse2+0x1473>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43008,7 +43827,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,73,22,0,0 // addps 0x1649(%rip),%xmm0 # 7580 <_sk_callback_sse2+0x13b7>
+ .byte 15,88,5,21,23,0,0 // addps 0x1715(%rip),%xmm0 # 7840 <_sk_callback_sse2+0x1483>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43020,8 +43839,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,59,22,0,0 // addps 0x163b(%rip),%xmm1 # 7590 <_sk_callback_sse2+0x13c7>
- .byte 68,15,40,13,67,22,0,0 // movaps 0x1643(%rip),%xmm9 # 75a0 <_sk_callback_sse2+0x13d7>
+ .byte 15,88,13,7,23,0,0 // addps 0x1707(%rip),%xmm1 # 7850 <_sk_callback_sse2+0x1493>
+ .byte 68,15,40,13,15,23,0,0 // movaps 0x170f(%rip),%xmm9 # 7860 <_sk_callback_sse2+0x14a3>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43034,7 +43853,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,49,22,0,0 // addps 0x1631(%rip),%xmm1 # 75b0 <_sk_callback_sse2+0x13e7>
+ .byte 15,88,13,253,22,0,0 // addps 0x16fd(%rip),%xmm1 # 7870 <_sk_callback_sse2+0x14b3>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43046,13 +43865,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,36,22,0,0 // addps 0x1624(%rip),%xmm0 # 75c0 <_sk_callback_sse2+0x13f7>
- .byte 68,15,40,13,44,22,0,0 // movaps 0x162c(%rip),%xmm9 # 75d0 <_sk_callback_sse2+0x1407>
+ .byte 15,88,5,240,22,0,0 // addps 0x16f0(%rip),%xmm0 # 7880 <_sk_callback_sse2+0x14c3>
+ .byte 68,15,40,13,248,22,0,0 // movaps 0x16f8(%rip),%xmm9 # 7890 <_sk_callback_sse2+0x14d3>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,40,22,0,0 // mulps 0x1628(%rip),%xmm9 # 75e0 <_sk_callback_sse2+0x1417>
- .byte 68,15,88,13,48,22,0,0 // addps 0x1630(%rip),%xmm9 # 75f0 <_sk_callback_sse2+0x1427>
+ .byte 68,15,89,13,244,22,0,0 // mulps 0x16f4(%rip),%xmm9 # 78a0 <_sk_callback_sse2+0x14e3>
+ .byte 68,15,88,13,252,22,0,0 // addps 0x16fc(%rip),%xmm9 # 78b0 <_sk_callback_sse2+0x14f3>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43065,16 +43884,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,31,22,0,0 // addps 0x161f(%rip),%xmm0 # 7600 <_sk_callback_sse2+0x1437>
- .byte 68,15,40,13,39,22,0,0 // movaps 0x1627(%rip),%xmm9 # 7610 <_sk_callback_sse2+0x1447>
+ .byte 15,88,5,235,22,0,0 // addps 0x16eb(%rip),%xmm0 # 78c0 <_sk_callback_sse2+0x1503>
+ .byte 68,15,40,13,243,22,0,0 // movaps 0x16f3(%rip),%xmm9 # 78d0 <_sk_callback_sse2+0x1513>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,43,22,0,0 // movaps 0x162b(%rip),%xmm8 # 7620 <_sk_callback_sse2+0x1457>
+ .byte 68,15,40,5,247,22,0,0 // movaps 0x16f7(%rip),%xmm8 # 78e0 <_sk_callback_sse2+0x1523>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,47,22,0,0 // addps 0x162f(%rip),%xmm8 # 7630 <_sk_callback_sse2+0x1467>
+ .byte 68,15,88,5,251,22,0,0 // addps 0x16fb(%rip),%xmm8 # 78f0 <_sk_callback_sse2+0x1533>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,51,22,0,0 // addps 0x1633(%rip),%xmm8 # 7640 <_sk_callback_sse2+0x1477>
+ .byte 68,15,88,5,255,22,0,0 // addps 0x16ff(%rip),%xmm8 # 7900 <_sk_callback_sse2+0x1543>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,55,22,0,0 // addps 0x1637(%rip),%xmm8 # 7650 <_sk_callback_sse2+0x1487>
+ .byte 68,15,88,5,3,23,0,0 // addps 0x1703(%rip),%xmm8 # 7910 <_sk_callback_sse2+0x1553>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43084,17 +43903,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,49,22,0,0 // movaps 0x1631(%rip),%xmm8 # 7660 <_sk_callback_sse2+0x1497>
+ .byte 68,15,40,5,253,22,0,0 // movaps 0x16fd(%rip),%xmm8 # 7920 <_sk_callback_sse2+0x1563>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,45,22,0,0 // movaps 0x162d(%rip),%xmm10 # 7670 <_sk_callback_sse2+0x14a7>
+ .byte 68,15,40,21,249,22,0,0 // movaps 0x16f9(%rip),%xmm10 # 7930 <_sk_callback_sse2+0x1573>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,49,22,0,0 // addps 0x1631(%rip),%xmm10 # 7680 <_sk_callback_sse2+0x14b7>
+ .byte 68,15,88,21,253,22,0,0 // addps 0x16fd(%rip),%xmm10 # 7940 <_sk_callback_sse2+0x1583>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,45,22,0,0 // addps 0x162d(%rip),%xmm10 # 7690 <_sk_callback_sse2+0x14c7>
+ .byte 68,15,88,21,249,22,0,0 // addps 0x16f9(%rip),%xmm10 # 7950 <_sk_callback_sse2+0x1593>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43106,11 +43925,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,32,22,0,0 // addps 0x1620(%rip),%xmm0 # 76a0 <_sk_callback_sse2+0x14d7>
+ .byte 15,88,5,236,22,0,0 // addps 0x16ec(%rip),%xmm0 # 7960 <_sk_callback_sse2+0x15a3>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,32,22,0,0 // mulps 0x1620(%rip),%xmm8 # 76b0 <_sk_callback_sse2+0x14e7>
- .byte 68,15,88,5,40,22,0,0 // addps 0x1628(%rip),%xmm8 # 76c0 <_sk_callback_sse2+0x14f7>
+ .byte 68,15,89,5,236,22,0,0 // mulps 0x16ec(%rip),%xmm8 # 7970 <_sk_callback_sse2+0x15b3>
+ .byte 68,15,88,5,244,22,0,0 // addps 0x16f4(%rip),%xmm8 # 7980 <_sk_callback_sse2+0x15c3>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43123,13 +43942,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,22,22,0,0 // addps 0x1616(%rip),%xmm1 # 76d0 <_sk_callback_sse2+0x1507>
- .byte 68,15,40,13,30,22,0,0 // movaps 0x161e(%rip),%xmm9 # 76e0 <_sk_callback_sse2+0x1517>
+ .byte 15,88,13,226,22,0,0 // addps 0x16e2(%rip),%xmm1 # 7990 <_sk_callback_sse2+0x15d3>
+ .byte 68,15,40,13,234,22,0,0 // movaps 0x16ea(%rip),%xmm9 # 79a0 <_sk_callback_sse2+0x15e3>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,26,22,0,0 // mulps 0x161a(%rip),%xmm9 # 76f0 <_sk_callback_sse2+0x1527>
- .byte 68,15,88,13,34,22,0,0 // addps 0x1622(%rip),%xmm9 # 7700 <_sk_callback_sse2+0x1537>
+ .byte 68,15,89,13,230,22,0,0 // mulps 0x16e6(%rip),%xmm9 # 79b0 <_sk_callback_sse2+0x15f3>
+ .byte 68,15,88,13,238,22,0,0 // addps 0x16ee(%rip),%xmm9 # 79c0 <_sk_callback_sse2+0x1603>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43142,16 +43961,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,16,22,0,0 // addps 0x1610(%rip),%xmm1 # 7710 <_sk_callback_sse2+0x1547>
- .byte 68,15,40,13,24,22,0,0 // movaps 0x1618(%rip),%xmm9 # 7720 <_sk_callback_sse2+0x1557>
+ .byte 15,88,13,220,22,0,0 // addps 0x16dc(%rip),%xmm1 # 79d0 <_sk_callback_sse2+0x1613>
+ .byte 68,15,40,13,228,22,0,0 // movaps 0x16e4(%rip),%xmm9 # 79e0 <_sk_callback_sse2+0x1623>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,28,22,0,0 // movaps 0x161c(%rip),%xmm8 # 7730 <_sk_callback_sse2+0x1567>
+ .byte 68,15,40,5,232,22,0,0 // movaps 0x16e8(%rip),%xmm8 # 79f0 <_sk_callback_sse2+0x1633>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,32,22,0,0 // addps 0x1620(%rip),%xmm8 # 7740 <_sk_callback_sse2+0x1577>
+ .byte 68,15,88,5,236,22,0,0 // addps 0x16ec(%rip),%xmm8 # 7a00 <_sk_callback_sse2+0x1643>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,36,22,0,0 // addps 0x1624(%rip),%xmm8 # 7750 <_sk_callback_sse2+0x1587>
+ .byte 68,15,88,5,240,22,0,0 // addps 0x16f0(%rip),%xmm8 # 7a10 <_sk_callback_sse2+0x1653>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,40,22,0,0 // addps 0x1628(%rip),%xmm8 # 7760 <_sk_callback_sse2+0x1597>
+ .byte 68,15,88,5,244,22,0,0 // addps 0x16f4(%rip),%xmm8 # 7a20 <_sk_callback_sse2+0x1663>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43161,17 +43980,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,34,22,0,0 // movaps 0x1622(%rip),%xmm8 # 7770 <_sk_callback_sse2+0x15a7>
+ .byte 68,15,40,5,238,22,0,0 // movaps 0x16ee(%rip),%xmm8 # 7a30 <_sk_callback_sse2+0x1673>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,29,22,0,0 // movaps 0x161d(%rip),%xmm10 # 7780 <_sk_callback_sse2+0x15b7>
+ .byte 68,15,40,21,233,22,0,0 // movaps 0x16e9(%rip),%xmm10 # 7a40 <_sk_callback_sse2+0x1683>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,33,22,0,0 // addps 0x1621(%rip),%xmm10 # 7790 <_sk_callback_sse2+0x15c7>
+ .byte 68,15,88,21,237,22,0,0 // addps 0x16ed(%rip),%xmm10 # 7a50 <_sk_callback_sse2+0x1693>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,29,22,0,0 // addps 0x161d(%rip),%xmm10 # 77a0 <_sk_callback_sse2+0x15d7>
+ .byte 68,15,88,21,233,22,0,0 // addps 0x16e9(%rip),%xmm10 # 7a60 <_sk_callback_sse2+0x16a3>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -43183,11 +44002,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,15,22,0,0 // addps 0x160f(%rip),%xmm1 # 77b0 <_sk_callback_sse2+0x15e7>
+ .byte 15,88,13,219,22,0,0 // addps 0x16db(%rip),%xmm1 # 7a70 <_sk_callback_sse2+0x16b3>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,15,22,0,0 // mulps 0x160f(%rip),%xmm8 # 77c0 <_sk_callback_sse2+0x15f7>
- .byte 68,15,88,5,23,22,0,0 // addps 0x1617(%rip),%xmm8 # 77d0 <_sk_callback_sse2+0x1607>
+ .byte 68,15,89,5,219,22,0,0 // mulps 0x16db(%rip),%xmm8 # 7a80 <_sk_callback_sse2+0x16c3>
+ .byte 68,15,88,5,227,22,0,0 // addps 0x16e3(%rip),%xmm8 # 7a90 <_sk_callback_sse2+0x16d3>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43429,9 +44248,9 @@ BALIGN16
.byte 128,191,0,0,224,64,0 // cmpb $0x0,0x40e00000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 64bc <.literal16+0x1fc>
+ .byte 224,64 // loopne 66ac <.literal16+0x1fc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 64c0 <.literal16+0x200>
+ .byte 224,64 // loopne 66b0 <.literal16+0x200>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -43451,13 +44270,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 64e1 <.literal16+0x221>
+ .byte 71,225,61 // rex.RXB loope 66d1 <.literal16+0x221>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 64e5 <.literal16+0x225>
+ .byte 71,225,61 // rex.RXB loope 66d5 <.literal16+0x225>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 64e9 <.literal16+0x229>
+ .byte 71,225,61 // rex.RXB loope 66d9 <.literal16+0x229>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 64ed <.literal16+0x22d>
+ .byte 71,225,61 // rex.RXB loope 66dd <.literal16+0x22d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43482,13 +44301,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6521 <.literal16+0x261>
+ .byte 71,225,61 // rex.RXB loope 6711 <.literal16+0x261>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6525 <.literal16+0x265>
+ .byte 71,225,61 // rex.RXB loope 6715 <.literal16+0x265>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6529 <.literal16+0x269>
+ .byte 71,225,61 // rex.RXB loope 6719 <.literal16+0x269>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 652d <.literal16+0x26d>
+ .byte 71,225,61 // rex.RXB loope 671d <.literal16+0x26d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43513,13 +44332,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6561 <.literal16+0x2a1>
+ .byte 71,225,61 // rex.RXB loope 6751 <.literal16+0x2a1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6565 <.literal16+0x2a5>
+ .byte 71,225,61 // rex.RXB loope 6755 <.literal16+0x2a5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 6569 <.literal16+0x2a9>
+ .byte 71,225,61 // rex.RXB loope 6759 <.literal16+0x2a9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 656d <.literal16+0x2ad>
+ .byte 71,225,61 // rex.RXB loope 675d <.literal16+0x2ad>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43544,13 +44363,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 65a1 <.literal16+0x2e1>
+ .byte 71,225,61 // rex.RXB loope 6791 <.literal16+0x2e1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 65a5 <.literal16+0x2e5>
+ .byte 71,225,61 // rex.RXB loope 6795 <.literal16+0x2e5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 65a9 <.literal16+0x2e9>
+ .byte 71,225,61 // rex.RXB loope 6799 <.literal16+0x2e9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 65ad <.literal16+0x2ed>
+ .byte 71,225,61 // rex.RXB loope 679d <.literal16+0x2ed>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43571,11 +44390,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
.byte 67,0,0 // rex.XB add %al,(%r8)
- .byte 127,67 // jg 65eb <.literal16+0x32b>
+ .byte 127,67 // jg 67db <.literal16+0x32b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 65ef <.literal16+0x32f>
+ .byte 127,67 // jg 67df <.literal16+0x32f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 65f3 <.literal16+0x333>
+ .byte 127,67 // jg 67e3 <.literal16+0x333>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -43867,13 +44686,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6849 <.literal16+0x589>
+ .byte 224,7 // loopne 6a39 <.literal16+0x589>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 684d <.literal16+0x58d>
+ .byte 224,7 // loopne 6a3d <.literal16+0x58d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6851 <.literal16+0x591>
+ .byte 224,7 // loopne 6a41 <.literal16+0x591>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6855 <.literal16+0x595>
+ .byte 224,7 // loopne 6a45 <.literal16+0x595>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -43938,11 +44757,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 692b <.literal16+0x66b>
+ .byte 127,67 // jg 6b1b <.literal16+0x66b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 692f <.literal16+0x66f>
+ .byte 127,67 // jg 6b1f <.literal16+0x66f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6933 <.literal16+0x673>
+ .byte 127,67 // jg 6b23 <.literal16+0x673>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -43957,16 +44776,111 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6924 <.literal16+0x664>
+ .byte 127,0 // jg 6b14 <.literal16+0x664>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6b18 <.literal16+0x668>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6b1c <.literal16+0x66c>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6b20 <.literal16+0x670>
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,63 // add %bh,(%rdi)
+ .byte 119,115 // ja 6ba5 <.literal16+0x6f5>
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // retq $0x7377
+ .byte 248 // clc
+ .byte 194,117,191 // retq $0xbf75
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // (bad)
+ .byte 117,191 // jne 6b09 <.literal16+0x659>
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // (bad)
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 249 // stc
+ .byte 68,180,62 // rex.R mov $0x3e,%spl
+ .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3ab4a <_sk_callback_sse2+0xffffffffe9a3478d>
+ .byte 220,63 // fdivrl (%rdi)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,0 // cmpb $0x0,(%rdi)
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
+ .byte 63 // (bad)
+ .byte 0,0 // add %al,(%rax)
+ .byte 128,63,81 // cmpb $0x51,(%rdi)
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,81 // rex.X push %rcx
+ .byte 140,242 // mov %?,%edx
+ .byte 66,141,188,190,63,141,188,190 // lea -0x414372c1(%rsi,%r15,4),%edi
+ .byte 63 // (bad)
+ .byte 141,188,190,63,141,188,190 // lea -0x414372c1(%rsi,%rdi,4),%edi
+ .byte 63 // (bad)
+ .byte 248 // clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,248 // rex clc
+ .byte 245 // cmc
+ .byte 154 // (bad)
+ .byte 64,254 // rex (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,254 // rex.B (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65,0,0 // add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 75,0,0 // rex.WXB add %al,(%r8)
+ .byte 0,75,0 // add %cl,0x0(%rbx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 75,0,0 // rex.WXB add %al,(%r8)
+ .byte 0,52,0 // add %dh,(%rax,%rax,1)
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 6be4 <.literal16+0x734>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6928 <.literal16+0x668>
+ .byte 127,0 // jg 6be8 <.literal16+0x738>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 692c <.literal16+0x66c>
+ .byte 127,0 // jg 6bec <.literal16+0x73c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6930 <.literal16+0x670>
+ .byte 127,0 // jg 6bf0 <.literal16+0x740>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -43975,7 +44889,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 69b5 <.literal16+0x6f5>
+ .byte 119,115 // ja 6c75 <.literal16+0x7c5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -43986,7 +44900,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6919 <.literal16+0x659>
+ .byte 117,191 // jne 6bd9 <.literal16+0x729>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -43998,7 +44912,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3a95a <_sk_callback_sse2+0xffffffffe9a34791>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3ac1a <_sk_callback_sse2+0xffffffffe9a3485d>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44052,16 +44966,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 69f4 <.literal16+0x734>
+ .byte 127,0 // jg 6cb4 <.literal16+0x804>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 69f8 <.literal16+0x738>
+ .byte 127,0 // jg 6cb8 <.literal16+0x808>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 69fc <.literal16+0x73c>
+ .byte 127,0 // jg 6cbc <.literal16+0x80c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6a00 <.literal16+0x740>
+ .byte 127,0 // jg 6cc0 <.literal16+0x810>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -44070,7 +44984,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6a85 <.literal16+0x7c5>
+ .byte 119,115 // ja 6d45 <.literal16+0x895>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -44081,7 +44995,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 69e9 <.literal16+0x729>
+ .byte 117,191 // jne 6ca9 <.literal16+0x7f9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -44093,7 +45007,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3aa2a <_sk_callback_sse2+0xffffffffe9a34861>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3acea <_sk_callback_sse2+0xffffffffe9a3492d>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44147,16 +45061,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6ac4 <.literal16+0x804>
+ .byte 127,0 // jg 6d84 <.literal16+0x8d4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6ac8 <.literal16+0x808>
+ .byte 127,0 // jg 6d88 <.literal16+0x8d8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6acc <.literal16+0x80c>
+ .byte 127,0 // jg 6d8c <.literal16+0x8dc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6ad0 <.literal16+0x810>
+ .byte 127,0 // jg 6d90 <.literal16+0x8e0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -44165,7 +45079,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6b55 <.literal16+0x895>
+ .byte 119,115 // ja 6e15 <.literal16+0x965>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -44176,7 +45090,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6ab9 <.literal16+0x7f9>
+ .byte 117,191 // jne 6d79 <.literal16+0x8c9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -44188,7 +45102,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3aafa <_sk_callback_sse2+0xffffffffe9a34931>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3adba <_sk_callback_sse2+0xffffffffe9a349fd>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44242,16 +45156,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 6b94 <.literal16+0x8d4>
+ .byte 127,0 // jg 6e54 <.literal16+0x9a4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6b98 <.literal16+0x8d8>
+ .byte 127,0 // jg 6e58 <.literal16+0x9a8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6b9c <.literal16+0x8dc>
+ .byte 127,0 // jg 6e5c <.literal16+0x9ac>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 6ba0 <.literal16+0x8e0>
+ .byte 127,0 // jg 6e60 <.literal16+0x9b0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -44260,7 +45174,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6c25 <.literal16+0x965>
+ .byte 119,115 // ja 6ee5 <.literal16+0xa35>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -44271,7 +45185,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 6b89 <.literal16+0x8c9>
+ .byte 117,191 // jne 6e49 <.literal16+0x999>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -44283,7 +45197,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3abca <_sk_callback_sse2+0xffffffffe9a34a01>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3ae8a <_sk_callback_sse2+0xffffffffe9a34acd>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -44333,13 +45247,13 @@ BALIGN16
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 6ca7 <.literal16+0x9e7>
+ .byte 127,67 // jg 6f67 <.literal16+0xab7>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6cab <.literal16+0x9eb>
+ .byte 127,67 // jg 6f6b <.literal16+0xabb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6caf <.literal16+0x9ef>
+ .byte 127,67 // jg 6f6f <.literal16+0xabf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6cb3 <.literal16+0x9f3>
+ .byte 127,67 // jg 6f73 <.literal16+0xac3>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -44386,16 +45300,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6d33 <.literal16+0xa73>
+ .byte 118,63 // jbe 6ff3 <.literal16+0xb43>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6d37 <.literal16+0xa77>
+ .byte 118,63 // jbe 6ff7 <.literal16+0xb47>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6d3b <.literal16+0xa7b>
+ .byte 118,63 // jbe 6ffb <.literal16+0xb4b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6d3f <.literal16+0xa7f>
+ .byte 118,63 // jbe 6fff <.literal16+0xb4f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -44424,11 +45338,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6dab <.literal16+0xaeb>
+ .byte 127,67 // jg 706b <.literal16+0xbbb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6daf <.literal16+0xaef>
+ .byte 127,67 // jg 706f <.literal16+0xbbf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6db3 <.literal16+0xaf3>
+ .byte 127,67 // jg 7073 <.literal16+0xbc3>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -44490,13 +45404,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6e29 <.literal16+0xb69>
+ .byte 224,7 // loopne 70e9 <.literal16+0xc39>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6e2d <.literal16+0xb6d>
+ .byte 224,7 // loopne 70ed <.literal16+0xc3d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6e31 <.literal16+0xb71>
+ .byte 224,7 // loopne 70f1 <.literal16+0xc41>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6e35 <.literal16+0xb75>
+ .byte 224,7 // loopne 70f5 <.literal16+0xc45>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -44542,13 +45456,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6e99 <.literal16+0xbd9>
+ .byte 224,7 // loopne 7159 <.literal16+0xca9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6e9d <.literal16+0xbdd>
+ .byte 224,7 // loopne 715d <.literal16+0xcad>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6ea1 <.literal16+0xbe1>
+ .byte 224,7 // loopne 7161 <.literal16+0xcb1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6ea5 <.literal16+0xbe5>
+ .byte 224,7 // loopne 7165 <.literal16+0xcb5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -44594,13 +45508,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6f09 <.literal16+0xc49>
+ .byte 224,7 // loopne 71c9 <.literal16+0xd19>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6f0d <.literal16+0xc4d>
+ .byte 224,7 // loopne 71cd <.literal16+0xd1d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6f11 <.literal16+0xc51>
+ .byte 224,7 // loopne 71d1 <.literal16+0xd21>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6f15 <.literal16+0xc55>
+ .byte 224,7 // loopne 71d5 <.literal16+0xd25>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -44638,13 +45552,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 6fa6 <.literal16+0xce6>
+ .byte 124,66 // jl 7266 <.literal16+0xdb6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6faa <.literal16+0xcea>
+ .byte 124,66 // jl 726a <.literal16+0xdba>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6fae <.literal16+0xcee>
+ .byte 124,66 // jl 726e <.literal16+0xdbe>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6fb2 <.literal16+0xcf2>
+ .byte 124,66 // jl 7272 <.literal16+0xdc2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -44778,13 +45692,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 7135 <.literal16+0xe75>
+ .byte 112,65 // jo 73f5 <.literal16+0xf45>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 7139 <.literal16+0xe79>
+ .byte 112,65 // jo 73f9 <.literal16+0xf49>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 713d <.literal16+0xe7d>
+ .byte 112,65 // jo 73fd <.literal16+0xf4d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 7141 <.literal16+0xe81>
+ .byte 112,65 // jo 7401 <.literal16+0xf51>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -44815,11 +45729,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 71ab <.literal16+0xeeb>
+ .byte 127,67 // jg 746b <.literal16+0xfbb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 71af <.literal16+0xeef>
+ .byte 127,67 // jg 746f <.literal16+0xfbf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 71b3 <.literal16+0xef3>
+ .byte 127,67 // jg 7473 <.literal16+0xfc3>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -44850,11 +45764,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 721b <.literal16+0xf5b>
+ .byte 127,67 // jg 74db <.literal16+0x102b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 721f <.literal16+0xf5f>
+ .byte 127,67 // jg 74df <.literal16+0x102f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 7223 <.literal16+0xf63>
+ .byte 127,67 // jg 74e3 <.literal16+0x1033>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -44950,13 +45864,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 734b <.literal16+0x108b>
+ .byte 127,71 // jg 760b <.literal16+0x115b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 734f <.literal16+0x108f>
+ .byte 127,71 // jg 760f <.literal16+0x115f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7353 <.literal16+0x1093>
+ .byte 127,71 // jg 7613 <.literal16+0x1163>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7357 <.literal16+0x1097>
+ .byte 127,71 // jg 7617 <.literal16+0x1167>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -45033,10 +45947,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc084ea <_sk_callback_sse2+0x2dc02321>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc087aa <_sk_callback_sse2+0x2dc023ed>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 741c <.literal16+0x115c>
+ .byte 120,57 // js 76dc <.literal16+0x122c>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -45223,11 +46137,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 7602 <.literal16+0x1342>
+ .byte 62,114,28 // jb,pt 78c2 <.literal16+0x1412>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7606 <.literal16+0x1346>
+ .byte 62,114,28 // jb,pt 78c6 <.literal16+0x1416>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 760a <.literal16+0x134a>
+ .byte 62,114,28 // jb,pt 78ca <.literal16+0x141a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -45271,7 +46185,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640495 <_sk_callback_sse2+0x3d63a2cc>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640755 <_sk_callback_sse2+0x3d63a398>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -45297,7 +46211,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6404d5 <_sk_callback_sse2+0x3d63a30c>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640795 <_sk_callback_sse2+0x3d63a3d8>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -45306,13 +46220,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 76ce <.literal16+0x140e>
+ .byte 114,28 // jb 798e <.literal16+0x14de>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 76d2 <.literal16+0x1412>
+ .byte 62,114,28 // jb,pt 7992 <.literal16+0x14e2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 76d6 <.literal16+0x1416>
+ .byte 62,114,28 // jb,pt 7996 <.literal16+0x14e6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 76da <.literal16+0x141a>
+ .byte 62,114,28 // jb,pt 799a <.literal16+0x14ea>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -45333,11 +46247,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 7712 <.literal16+0x1452>
+ .byte 62,114,28 // jb,pt 79d2 <.literal16+0x1522>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 7716 <.literal16+0x1456>
+ .byte 62,114,28 // jb,pt 79d6 <.literal16+0x1526>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 771a <.literal16+0x145a>
+ .byte 62,114,28 // jb,pt 79da <.literal16+0x152a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -45381,7 +46295,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6405a5 <_sk_callback_sse2+0x3d63a3dc>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d640865 <_sk_callback_sse2+0x3d63a4a8>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -45407,7 +46321,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6405e5 <_sk_callback_sse2+0x3d63a41c>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6408a5 <_sk_callback_sse2+0x3d63a4e8>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -45416,13 +46330,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 77de <.literal16+0x151e>
+ .byte 114,28 // jb 7a9e <.literal16+0x15ee>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 77e2 <_sk_callback_sse2+0x1619>
+ .byte 62,114,28 // jb,pt 7aa2 <_sk_callback_sse2+0x16e5>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 77e6 <_sk_callback_sse2+0x161d>
+ .byte 62,114,28 // jb,pt 7aa6 <_sk_callback_sse2+0x16e9>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 77ea <_sk_callback_sse2+0x1621>
+ .byte 62,114,28 // jb,pt 7aaa <_sk_callback_sse2+0x16ed>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -50362,7 +51276,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,2 // movd (%edx),%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,144,70,110,0,0 // movaps 0x6e46(%eax),%xmm2
+ .byte 15,40,144,38,112,0,0 // movaps 0x7026(%eax),%xmm2
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -50377,7 +51291,7 @@ _sk_seed_shader_sse2:
.byte 15,41,82,32 // movaps %xmm2,0x20(%edx)
.byte 15,41,82,16 // movaps %xmm2,0x10(%edx)
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,144,86,110,0,0 // movaps 0x6e56(%eax),%xmm2
+ .byte 15,40,144,54,112,0,0 // movaps 0x7036(%eax),%xmm2
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 86 // push %esi
.byte 82 // push %edx
@@ -50410,16 +51324,16 @@ _sk_dither_sse2:
.byte 102,15,110,96,4 // movd 0x4(%eax),%xmm4
.byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7
.byte 102,15,239,253 // pxor %xmm5,%xmm7
- .byte 102,15,111,177,233,109,0,0 // movdqa 0x6de9(%ecx),%xmm6
+ .byte 102,15,111,177,201,111,0,0 // movdqa 0x6fc9(%ecx),%xmm6
.byte 102,15,111,207 // movdqa %xmm7,%xmm1
.byte 102,15,219,206 // pand %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
- .byte 102,15,111,129,9,110,0,0 // movdqa 0x6e09(%ecx),%xmm0
+ .byte 102,15,111,129,233,111,0,0 // movdqa 0x6fe9(%ecx),%xmm0
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,219,224 // pand %xmm0,%xmm4
.byte 102,15,219,197 // pand %xmm5,%xmm0
- .byte 102,15,219,185,249,109,0,0 // pand 0x6df9(%ecx),%xmm7
- .byte 102,15,219,169,249,109,0,0 // pand 0x6df9(%ecx),%xmm5
+ .byte 102,15,219,185,217,111,0,0 // pand 0x6fd9(%ecx),%xmm7
+ .byte 102,15,219,169,217,111,0,0 // pand 0x6fd9(%ecx),%xmm5
.byte 102,15,114,246,4 // pslld $0x4,%xmm6
.byte 102,15,254,192 // paddd %xmm0,%xmm0
.byte 102,15,235,198 // por %xmm6,%xmm0
@@ -50434,8 +51348,8 @@ _sk_dither_sse2:
.byte 102,15,114,215,1 // psrld $0x1,%xmm7
.byte 102,15,235,231 // por %xmm7,%xmm4
.byte 15,91,196 // cvtdq2ps %xmm4,%xmm0
- .byte 15,89,129,25,110,0,0 // mulps 0x6e19(%ecx),%xmm0
- .byte 15,88,129,41,110,0,0 // addps 0x6e29(%ecx),%xmm0
+ .byte 15,89,129,249,111,0,0 // mulps 0x6ff9(%ecx),%xmm0
+ .byte 15,88,129,9,112,0,0 // addps 0x7009(%ecx),%xmm0
.byte 243,15,16,14 // movss (%esi),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -50503,7 +51417,7 @@ _sk_black_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,152,249,108,0,0 // movaps 0x6cf9(%eax),%xmm3
+ .byte 15,40,152,217,110,0,0 // movaps 0x6ed9(%eax),%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -50526,7 +51440,7 @@ _sk_white_color_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,128,217,108,0,0 // movaps 0x6cd9(%eax),%xmm0
+ .byte 15,40,128,185,110,0,0 // movaps 0x6eb9(%eax),%xmm0
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -50616,7 +51530,7 @@ _sk_srcatop_sse2:
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,97,64 // movaps 0x40(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,170,58,108,0,0 // movaps 0x6c3a(%edx),%xmm5
+ .byte 15,40,170,26,110,0,0 // movaps 0x6e1a(%edx),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
@@ -50655,7 +51569,7 @@ _sk_dstatop_sse2:
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
.byte 15,40,113,16 // movaps 0x10(%ecx),%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
- .byte 15,40,162,235,107,0,0 // movaps 0x6beb(%edx),%xmm4
+ .byte 15,40,162,203,109,0,0 // movaps 0x6dcb(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,198 // addps %xmm6,%xmm0
@@ -50739,7 +51653,7 @@ _sk_srcout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,58,107,0,0 // movaps 0x6b3a(%eax),%xmm4
+ .byte 15,40,160,26,109,0,0 // movaps 0x6d1a(%eax),%xmm4
.byte 15,92,98,64 // subps 0x40(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
@@ -50765,7 +51679,7 @@ _sk_dstout_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,18,107,0,0 // movaps 0x6b12(%eax),%xmm4
+ .byte 15,40,160,242,108,0,0 // movaps 0x6cf2(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,66,16 // movaps 0x10(%edx),%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -50795,7 +51709,7 @@ _sk_srcover_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
- .byte 15,40,160,219,106,0,0 // movaps 0x6adb(%eax),%xmm4
+ .byte 15,40,160,187,108,0,0 // movaps 0x6cbb(%eax),%xmm4
.byte 15,92,227 // subps %xmm3,%xmm4
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -50829,7 +51743,7 @@ _sk_dstover_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,106,64 // movaps 0x40(%edx),%xmm5
- .byte 15,40,160,155,106,0,0 // movaps 0x6a9b(%eax),%xmm4
+ .byte 15,40,160,123,108,0,0 // movaps 0x6c7b(%eax),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,88,66,16 // addps 0x10(%edx),%xmm0
@@ -50885,7 +51799,7 @@ _sk_multiply_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp)
- .byte 15,40,129,44,106,0,0 // movaps 0x6a2c(%ecx),%xmm0
+ .byte 15,40,129,12,108,0,0 // movaps 0x6c0c(%ecx),%xmm0
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
@@ -51010,7 +51924,7 @@ _sk_xor__sse2:
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 15,40,105,64 // movaps 0x40(%ecx),%xmm5
- .byte 15,40,154,1,105,0,0 // movaps 0x6901(%edx),%xmm3
+ .byte 15,40,154,225,106,0,0 // movaps 0x6ae1(%edx),%xmm3
.byte 15,40,243 // movaps %xmm3,%xmm6
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,89,198 // mulps %xmm6,%xmm0
@@ -51072,7 +51986,7 @@ _sk_darken_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,95,209 // maxps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,169,104,0,0 // movaps 0x68a9(%edx),%xmm1
+ .byte 15,40,138,137,106,0,0 // movaps 0x6a89(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -51121,7 +52035,7 @@ _sk_lighten_sse2:
.byte 15,89,203 // mulps %xmm3,%xmm1
.byte 15,93,209 // minps %xmm1,%xmm2
.byte 15,92,234 // subps %xmm2,%xmm5
- .byte 15,40,138,57,104,0,0 // movaps 0x6839(%edx),%xmm1
+ .byte 15,40,138,25,106,0,0 // movaps 0x6a19(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -51174,7 +52088,7 @@ _sk_difference_sse2:
.byte 15,93,214 // minps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,146,198,103,0,0 // movaps 0x67c6(%edx),%xmm2
+ .byte 15,40,146,166,105,0,0 // movaps 0x69a6(%edx),%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -51218,7 +52132,7 @@ _sk_exclusion_sse2:
.byte 15,89,202 // mulps %xmm2,%xmm1
.byte 15,88,201 // addps %xmm1,%xmm1
.byte 15,92,233 // subps %xmm1,%xmm5
- .byte 15,40,138,80,103,0,0 // movaps 0x6750(%edx),%xmm1
+ .byte 15,40,138,48,105,0,0 // movaps 0x6930(%edx),%xmm1
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,89,73,64 // mulps 0x40(%ecx),%xmm1
.byte 15,88,217 // addps %xmm1,%xmm3
@@ -51259,7 +52173,7 @@ _sk_colorburn_sse2:
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,92,238 // subps %xmm6,%xmm5
- .byte 15,40,177,221,102,0,0 // movaps 0x66dd(%ecx),%xmm6
+ .byte 15,40,177,189,104,0,0 // movaps 0x68bd(%ecx),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
@@ -51381,7 +52295,7 @@ _sk_colordodge_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
- .byte 15,40,177,87,101,0,0 // movaps 0x6557(%ecx),%xmm6
+ .byte 15,40,177,55,103,0,0 // movaps 0x6737(%ecx),%xmm6
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp)
@@ -51500,7 +52414,7 @@ _sk_hardlight_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
- .byte 15,40,145,251,99,0,0 // movaps 0x63fb(%ecx),%xmm2
+ .byte 15,40,145,219,101,0,0 // movaps 0x65db(%ecx),%xmm2
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,40,225 // movaps %xmm1,%xmm4
@@ -51610,7 +52524,7 @@ _sk_overlay_sse2:
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
- .byte 15,40,161,192,98,0,0 // movaps 0x62c0(%ecx),%xmm4
+ .byte 15,40,161,160,100,0,0 // movaps 0x64a0(%ecx),%xmm4
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,92,242 // subps %xmm2,%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
@@ -51738,17 +52652,17 @@ _sk_softlight_sse2:
.byte 232,0,0,0,0 // call f30 <_sk_softlight_sse2+0x52>
.byte 89 // pop %ecx
.byte 15,40,194 // movaps %xmm2,%xmm0
- .byte 15,40,137,80,97,0,0 // movaps 0x6150(%ecx),%xmm1
+ .byte 15,40,137,48,99,0,0 // movaps 0x6330(%ecx),%xmm1
.byte 15,41,141,104,255,255,255 // movaps %xmm1,-0x98(%ebp)
.byte 15,88,193 // addps %xmm1,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,185,64,97,0,0 // movaps 0x6140(%ecx),%xmm7
+ .byte 15,40,185,32,99,0,0 // movaps 0x6320(%ecx),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,82,242 // rsqrtps %xmm2,%xmm6
.byte 15,83,206 // rcpps %xmm6,%xmm1
.byte 15,92,202 // subps %xmm2,%xmm1
- .byte 15,40,161,96,97,0,0 // movaps 0x6160(%ecx),%xmm4
+ .byte 15,40,161,64,99,0,0 // movaps 0x6340(%ecx),%xmm4
.byte 15,41,101,152 // movaps %xmm4,-0x68(%ebp)
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
@@ -51954,7 +52868,7 @@ _sk_hue_sse2:
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 15,40,72,64 // movaps 0x40(%eax),%xmm1
.byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp)
- .byte 15,40,169,223,94,0,0 // movaps 0x5edf(%ecx),%xmm5
+ .byte 15,40,169,191,96,0,0 // movaps 0x60bf(%ecx),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
@@ -51987,17 +52901,17 @@ _sk_hue_sse2:
.byte 15,89,233 // mulps %xmm1,%xmm5
.byte 15,41,173,120,255,255,255 // movaps %xmm5,-0x88(%ebp)
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,153,175,94,0,0 // movaps 0x5eaf(%ecx),%xmm3
+ .byte 15,40,153,143,96,0,0 // movaps 0x608f(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,117,152 // movaps -0x68(%ebp),%xmm6
.byte 15,40,206 // movaps %xmm6,%xmm1
.byte 15,89,203 // mulps %xmm3,%xmm1
- .byte 15,40,153,191,94,0,0 // movaps 0x5ebf(%ecx),%xmm3
+ .byte 15,40,153,159,96,0,0 // movaps 0x609f(%ecx),%xmm3
.byte 15,40,109,136 // movaps -0x78(%ebp),%xmm5
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,89,251 // mulps %xmm3,%xmm7
.byte 15,88,249 // addps %xmm1,%xmm7
- .byte 15,40,137,223,94,0,0 // movaps 0x5edf(%ecx),%xmm1
+ .byte 15,40,137,191,96,0,0 // movaps 0x60bf(%ecx),%xmm1
.byte 15,92,77,184 // subps -0x48(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,152 // movaps %xmm6,-0x68(%ebp)
@@ -52007,7 +52921,7 @@ _sk_hue_sse2:
.byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 15,41,117,168 // movaps %xmm6,-0x58(%ebp)
- .byte 15,40,169,207,94,0,0 // movaps 0x5ecf(%ecx),%xmm5
+ .byte 15,40,169,175,96,0,0 // movaps 0x60af(%ecx),%xmm5
.byte 15,89,205 // mulps %xmm5,%xmm1
.byte 15,88,207 // addps %xmm7,%xmm1
.byte 15,94,212 // divps %xmm4,%xmm2
@@ -52200,17 +53114,17 @@ _sk_saturation_sse2:
.byte 15,89,253 // mulps %xmm5,%xmm7
.byte 232,0,0,0,0 // call 1545 <_sk_saturation_sse2+0xb0>
.byte 89 // pop %ecx
- .byte 15,40,153,155,91,0,0 // movaps 0x5b9b(%ecx),%xmm3
+ .byte 15,40,153,123,93,0,0 // movaps 0x5d7b(%ecx),%xmm3
.byte 15,41,157,88,255,255,255 // movaps %xmm3,-0xa8(%ebp)
.byte 15,40,77,184 // movaps -0x48(%ebp),%xmm1
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,40,153,171,91,0,0 // movaps 0x5bab(%ecx),%xmm3
+ .byte 15,40,153,139,93,0,0 // movaps 0x5d8b(%ecx),%xmm3
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,129,203,91,0,0 // movaps 0x5bcb(%ecx),%xmm0
+ .byte 15,40,129,171,93,0,0 // movaps 0x5dab(%ecx),%xmm0
.byte 15,41,133,104,255,255,255 // movaps %xmm0,-0x98(%ebp)
.byte 15,92,69,216 // subps -0x28(%ebp),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
@@ -52222,7 +53136,7 @@ _sk_saturation_sse2:
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,41,141,120,255,255,255 // movaps %xmm1,-0x88(%ebp)
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 15,40,129,187,91,0,0 // movaps 0x5bbb(%ecx),%xmm0
+ .byte 15,40,129,155,93,0,0 // movaps 0x5d9b(%ecx),%xmm0
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,40,109,168 // movaps -0x58(%ebp),%xmm5
@@ -52381,16 +53295,16 @@ _sk_color_sse2:
.byte 139,69,8 // mov 0x8(%ebp),%eax
.byte 15,40,80,16 // movaps 0x10(%eax),%xmm2
.byte 15,40,72,32 // movaps 0x20(%eax),%xmm1
- .byte 15,40,177,128,89,0,0 // movaps 0x5980(%ecx),%xmm6
+ .byte 15,40,177,96,91,0,0 // movaps 0x5b60(%ecx),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
- .byte 15,40,153,144,89,0,0 // movaps 0x5990(%ecx),%xmm3
+ .byte 15,40,153,112,91,0,0 // movaps 0x5b70(%ecx),%xmm3
.byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp)
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,243 // mulps %xmm3,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 15,40,129,176,89,0,0 // movaps 0x59b0(%ecx),%xmm0
+ .byte 15,40,129,144,91,0,0 // movaps 0x5b90(%ecx),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,69,200 // subps -0x38(%ebp),%xmm0
.byte 15,89,208 // mulps %xmm0,%xmm2
@@ -52400,7 +53314,7 @@ _sk_color_sse2:
.byte 15,40,80,48 // movaps 0x30(%eax),%xmm2
.byte 15,89,194 // mulps %xmm2,%xmm0
.byte 15,41,133,72,255,255,255 // movaps %xmm0,-0xb8(%ebp)
- .byte 15,40,137,160,89,0,0 // movaps 0x59a0(%ecx),%xmm1
+ .byte 15,40,137,128,91,0,0 // movaps 0x5b80(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,40,88,64 // movaps 0x40(%eax),%xmm3
@@ -52559,18 +53473,18 @@ _sk_luminosity_sse2:
.byte 232,0,0,0,0 // call 1a03 <_sk_luminosity_sse2+0x11>
.byte 89 // pop %ecx
.byte 139,69,8 // mov 0x8(%ebp),%eax
- .byte 15,40,161,93,87,0,0 // movaps 0x575d(%ecx),%xmm4
+ .byte 15,40,161,61,89,0,0 // movaps 0x593d(%ecx),%xmm4
.byte 15,41,101,232 // movaps %xmm4,-0x18(%ebp)
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,212 // mulps %xmm4,%xmm2
- .byte 15,40,161,109,87,0,0 // movaps 0x576d(%ecx),%xmm4
+ .byte 15,40,161,77,89,0,0 // movaps 0x594d(%ecx),%xmm4
.byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp)
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
.byte 15,40,80,64 // movaps 0x40(%eax),%xmm2
.byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp)
- .byte 15,40,161,141,87,0,0 // movaps 0x578d(%ecx),%xmm4
+ .byte 15,40,161,109,89,0,0 // movaps 0x596d(%ecx),%xmm4
.byte 15,40,252 // movaps %xmm4,%xmm7
.byte 15,92,250 // subps %xmm2,%xmm7
.byte 15,89,199 // mulps %xmm7,%xmm0
@@ -52580,7 +53494,7 @@ _sk_luminosity_sse2:
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,41,189,104,255,255,255 // movaps %xmm7,-0x98(%ebp)
.byte 15,40,214 // movaps %xmm6,%xmm2
- .byte 15,40,137,125,87,0,0 // movaps 0x577d(%ecx),%xmm1
+ .byte 15,40,137,93,89,0,0 // movaps 0x595d(%ecx),%xmm1
.byte 15,89,209 // mulps %xmm1,%xmm2
.byte 15,88,213 // addps %xmm5,%xmm2
.byte 15,40,104,16 // movaps 0x10(%eax),%xmm5
@@ -52756,7 +53670,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 139,49 // mov (%ecx),%esi
.byte 15,133,224,0,0,0 // jne 1d70 <_sk_srcover_rgba_8888_sse2+0x119>
.byte 243,15,111,20,178 // movdqu (%edx,%esi,4),%xmm2
- .byte 102,15,111,167,50,85,0,0 // movdqa 0x5532(%edi),%xmm4
+ .byte 102,15,111,167,18,87,0,0 // movdqa 0x5712(%edi),%xmm4
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,242 // movdqa %xmm2,%xmm6
@@ -52767,9 +53681,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,219,252 // pand %xmm4,%xmm7
.byte 15,91,229 // cvtdq2ps %xmm5,%xmm4
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,175,66,85,0,0 // movaps 0x5542(%edi),%xmm5
+ .byte 15,40,175,34,87,0,0 // movaps 0x5722(%edi),%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
- .byte 15,40,143,82,85,0,0 // movaps 0x5552(%edi),%xmm1
+ .byte 15,40,143,50,87,0,0 // movaps 0x5732(%edi),%xmm1
.byte 15,89,193 // mulps %xmm1,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,88,224 // addps %xmm0,%xmm4
@@ -52883,7 +53797,7 @@ _sk_clamp_1_sse2:
.byte 232,0,0,0,0 // call 1e1a <_sk_clamp_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,182,83,0,0 // movaps 0x53b6(%eax),%xmm4
+ .byte 15,40,160,150,85,0,0 // movaps 0x5596(%eax),%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
.byte 15,93,204 // minps %xmm4,%xmm1
.byte 15,93,212 // minps %xmm4,%xmm2
@@ -52907,7 +53821,7 @@ _sk_clamp_a_sse2:
.byte 232,0,0,0,0 // call 1e4d <_sk_clamp_a_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,93,152,147,83,0,0 // minps 0x5393(%eax),%xmm3
+ .byte 15,93,152,115,85,0,0 // minps 0x5573(%eax),%xmm3
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -52932,7 +53846,7 @@ _sk_clamp_a_dst_sse2:
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 139,85,8 // mov 0x8(%ebp),%edx
.byte 15,40,98,64 // movaps 0x40(%edx),%xmm4
- .byte 15,93,160,115,83,0,0 // minps 0x5373(%eax),%xmm4
+ .byte 15,93,160,83,85,0,0 // minps 0x5553(%eax),%xmm4
.byte 15,41,98,64 // movaps %xmm4,0x40(%edx)
.byte 15,40,106,16 // movaps 0x10(%edx),%xmm5
.byte 15,93,236 // minps %xmm4,%xmm5
@@ -53006,7 +53920,7 @@ _sk_invert_sse2:
.byte 232,0,0,0,0 // call 1f28 <_sk_invert_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,160,216,82,0,0 // movaps 0x52d8(%eax),%xmm4
+ .byte 15,40,160,184,84,0,0 // movaps 0x54b8(%eax),%xmm4
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,92,232 // subps %xmm0,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
@@ -53129,7 +54043,7 @@ _sk_unpremul_sse2:
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 15,40,168,234,81,0,0 // movaps 0x51ea(%eax),%xmm5
+ .byte 15,40,168,202,83,0,0 // movaps 0x53ca(%eax),%xmm5
.byte 15,94,235 // divps %xmm3,%xmm5
.byte 15,194,227,4 // cmpneqps %xmm3,%xmm4
.byte 15,84,229 // andps %xmm5,%xmm4
@@ -53160,19 +54074,19 @@ _sk_from_srgb_sse2:
.byte 88 // pop %eax
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,201 // mulps %xmm1,%xmm1
- .byte 15,40,160,192,81,0,0 // movaps 0x51c0(%eax),%xmm4
+ .byte 15,40,160,160,83,0,0 // movaps 0x53a0(%eax),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,176,208,81,0,0 // movaps 0x51d0(%eax),%xmm6
+ .byte 15,40,176,176,83,0,0 // movaps 0x53b0(%eax),%xmm6
.byte 15,41,117,216 // movaps %xmm6,-0x28(%ebp)
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,176,176,81,0,0 // movaps 0x51b0(%eax),%xmm6
+ .byte 15,40,176,144,83,0,0 // movaps 0x5390(%eax),%xmm6
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,184,224,81,0,0 // movaps 0x51e0(%eax),%xmm7
+ .byte 15,40,184,192,83,0,0 // movaps 0x53c0(%eax),%xmm7
.byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,184,240,81,0,0 // movaps 0x51f0(%eax),%xmm7
+ .byte 15,40,184,208,83,0,0 // movaps 0x53d0(%eax),%xmm7
.byte 15,194,215,1 // cmpltps %xmm7,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -53232,18 +54146,18 @@ _sk_from_srgb_dst_sse2:
.byte 15,40,72,16 // movaps 0x10(%eax),%xmm1
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,40,161,53,81,0,0 // movaps 0x5135(%ecx),%xmm4
+ .byte 15,40,161,21,83,0,0 // movaps 0x5315(%ecx),%xmm4
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
- .byte 15,40,177,69,81,0,0 // movaps 0x5145(%ecx),%xmm6
+ .byte 15,40,177,37,83,0,0 // movaps 0x5325(%ecx),%xmm6
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,169,37,81,0,0 // movaps 0x5125(%ecx),%xmm5
+ .byte 15,40,169,5,83,0,0 // movaps 0x5305(%ecx),%xmm5
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
- .byte 15,40,185,85,81,0,0 // movaps 0x5155(%ecx),%xmm7
+ .byte 15,40,185,53,83,0,0 // movaps 0x5335(%ecx),%xmm7
.byte 15,88,199 // addps %xmm7,%xmm0
- .byte 15,40,153,101,81,0,0 // movaps 0x5165(%ecx),%xmm3
+ .byte 15,40,153,69,83,0,0 // movaps 0x5345(%ecx),%xmm3
.byte 15,194,203,1 // cmpltps %xmm3,%xmm1
.byte 15,84,209 // andps %xmm1,%xmm2
.byte 15,85,200 // andnps %xmm0,%xmm1
@@ -53305,25 +54219,25 @@ _sk_to_srgb_sse2:
.byte 232,0,0,0,0 // call 2236 <_sk_to_srgb_sse2+0x18>
.byte 88 // pop %eax
.byte 15,82,218 // rsqrtps %xmm2,%xmm3
- .byte 15,40,160,154,80,0,0 // movaps 0x509a(%eax),%xmm4
+ .byte 15,40,160,122,82,0,0 // movaps 0x527a(%eax),%xmm4
.byte 15,40,235 // movaps %xmm3,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
- .byte 15,40,128,170,80,0,0 // movaps 0x50aa(%eax),%xmm0
+ .byte 15,40,128,138,82,0,0 // movaps 0x528a(%eax),%xmm0
.byte 15,41,69,232 // movaps %xmm0,-0x18(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,89,235 // mulps %xmm3,%xmm5
- .byte 15,40,128,186,80,0,0 // movaps 0x50ba(%eax),%xmm0
+ .byte 15,40,128,154,82,0,0 // movaps 0x529a(%eax),%xmm0
.byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp)
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,40,128,202,80,0,0 // movaps 0x50ca(%eax),%xmm0
+ .byte 15,40,128,170,82,0,0 // movaps 0x52aa(%eax),%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
.byte 15,88,216 // addps %xmm0,%xmm3
.byte 15,83,195 // rcpps %xmm3,%xmm0
.byte 15,89,197 // mulps %xmm5,%xmm0
- .byte 15,40,168,138,80,0,0 // movaps 0x508a(%eax),%xmm5
+ .byte 15,40,168,106,82,0,0 // movaps 0x526a(%eax),%xmm5
.byte 15,40,202 // movaps %xmm2,%xmm1
.byte 15,89,205 // mulps %xmm5,%xmm1
- .byte 15,40,152,218,80,0,0 // movaps 0x50da(%eax),%xmm3
+ .byte 15,40,152,186,82,0,0 // movaps 0x52ba(%eax),%xmm3
.byte 15,194,211,1 // cmpltps %xmm3,%xmm2
.byte 15,84,202 // andps %xmm2,%xmm1
.byte 15,85,208 // andnps %xmm0,%xmm2
@@ -53392,14 +54306,14 @@ _sk_rgb_to_hsl_sse2:
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp)
- .byte 15,40,152,243,79,0,0 // movaps 0x4ff3(%eax),%xmm3
+ .byte 15,40,152,211,81,0,0 // movaps 0x51d3(%eax),%xmm3
.byte 15,94,216 // divps %xmm0,%xmm3
.byte 15,40,199 // movaps %xmm7,%xmm0
.byte 15,92,194 // subps %xmm2,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,194,234,1 // cmpltps %xmm2,%xmm5
- .byte 15,84,168,3,80,0,0 // andps 0x5003(%eax),%xmm5
+ .byte 15,84,168,227,81,0,0 // andps 0x51e3(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,194,196,0 // cmpeqps %xmm4,%xmm0
@@ -53409,9 +54323,9 @@ _sk_rgb_to_hsl_sse2:
.byte 15,92,231 // subps %xmm7,%xmm4
.byte 15,89,211 // mulps %xmm3,%xmm2
.byte 15,89,227 // mulps %xmm3,%xmm4
- .byte 15,40,152,19,80,0,0 // movaps 0x5013(%eax),%xmm3
+ .byte 15,40,152,243,81,0,0 // movaps 0x51f3(%eax),%xmm3
.byte 15,88,211 // addps %xmm3,%xmm2
- .byte 15,88,160,35,80,0,0 // addps 0x5023(%eax),%xmm4
+ .byte 15,88,160,3,82,0,0 // addps 0x5203(%eax),%xmm4
.byte 15,84,214 // andps %xmm6,%xmm2
.byte 15,85,244 // andnps %xmm4,%xmm6
.byte 15,86,242 // orps %xmm2,%xmm6
@@ -53423,7 +54337,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,194,226,4 // cmpneqps %xmm2,%xmm4
.byte 15,92,217 // subps %xmm1,%xmm3
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,40,168,67,80,0,0 // movaps 0x5043(%eax),%xmm5
+ .byte 15,40,168,35,82,0,0 // movaps 0x5223(%eax),%xmm5
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,89,213 // mulps %xmm5,%xmm2
@@ -53433,7 +54347,7 @@ _sk_rgb_to_hsl_sse2:
.byte 15,86,235 // orps %xmm3,%xmm5
.byte 15,40,77,216 // movaps -0x28(%ebp),%xmm1
.byte 15,94,205 // divps %xmm5,%xmm1
- .byte 15,89,128,51,80,0,0 // mulps 0x5033(%eax),%xmm0
+ .byte 15,89,128,19,82,0,0 // mulps 0x5213(%eax),%xmm0
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,84,204 // andps %xmm4,%xmm1
.byte 139,69,12 // mov 0xc(%ebp),%eax
@@ -53458,7 +54372,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
.byte 232,0,0,0,0 // call 2422 <_sk_hsl_to_rgb_sse2+0x19>
.byte 88 // pop %eax
- .byte 15,40,160,94,79,0,0 // movaps 0x4f5e(%eax),%xmm4
+ .byte 15,40,160,62,81,0,0 // movaps 0x513e(%eax),%xmm4
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 15,41,165,104,255,255,255 // movaps %xmm4,-0x98(%ebp)
.byte 15,194,218,2 // cmpleps %xmm2,%xmm3
@@ -53471,13 +54385,13 @@ _sk_hsl_to_rgb_sse2:
.byte 15,84,243 // andps %xmm3,%xmm6
.byte 15,85,217 // andnps %xmm1,%xmm3
.byte 15,86,222 // orps %xmm6,%xmm3
- .byte 15,40,168,110,79,0,0 // movaps 0x4f6e(%eax),%xmm5
+ .byte 15,40,168,78,81,0,0 // movaps 0x514e(%eax),%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
.byte 243,15,91,205 // cvttps2dq %xmm5,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,193,1 // cmpltps %xmm1,%xmm0
- .byte 15,40,176,126,79,0,0 // movaps 0x4f7e(%eax),%xmm6
+ .byte 15,40,176,94,81,0,0 // movaps 0x515e(%eax),%xmm6
.byte 15,41,117,136 // movaps %xmm6,-0x78(%ebp)
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,200 // subps %xmm0,%xmm1
@@ -53487,19 +54401,19 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 15,92,211 // subps %xmm3,%xmm2
- .byte 15,40,184,142,79,0,0 // movaps 0x4f8e(%eax),%xmm7
+ .byte 15,40,184,110,81,0,0 // movaps 0x516e(%eax),%xmm7
.byte 15,41,189,88,255,255,255 // movaps %xmm7,-0xa8(%ebp)
.byte 15,194,253,2 // cmpleps %xmm5,%xmm7
.byte 15,92,218 // subps %xmm2,%xmm3
.byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp)
.byte 15,40,204 // movaps %xmm4,%xmm1
.byte 15,194,205,2 // cmpleps %xmm5,%xmm1
- .byte 15,40,160,190,79,0,0 // movaps 0x4fbe(%eax),%xmm4
+ .byte 15,40,160,158,81,0,0 // movaps 0x519e(%eax),%xmm4
.byte 15,41,165,120,255,255,255 // movaps %xmm4,-0x88(%ebp)
.byte 15,194,229,2 // cmpleps %xmm5,%xmm4
- .byte 15,40,176,158,79,0,0 // movaps 0x4f9e(%eax),%xmm6
+ .byte 15,40,176,126,81,0,0 // movaps 0x517e(%eax),%xmm6
.byte 15,89,238 // mulps %xmm6,%xmm5
- .byte 15,40,128,174,79,0,0 // movaps 0x4fae(%eax),%xmm0
+ .byte 15,40,128,142,81,0,0 // movaps 0x518e(%eax),%xmm0
.byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp)
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
@@ -53525,18 +54439,18 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,194,200,1 // cmpltps %xmm0,%xmm1
- .byte 15,84,136,126,79,0,0 // andps 0x4f7e(%eax),%xmm1
+ .byte 15,84,136,94,81,0,0 // andps 0x515e(%eax),%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
.byte 15,92,200 // subps %xmm0,%xmm1
- .byte 15,40,128,142,79,0,0 // movaps 0x4f8e(%eax),%xmm0
+ .byte 15,40,128,110,81,0,0 // movaps 0x516e(%eax),%xmm0
.byte 15,194,193,2 // cmpleps %xmm1,%xmm0
- .byte 15,40,152,94,79,0,0 // movaps 0x4f5e(%eax),%xmm3
+ .byte 15,40,152,62,81,0,0 // movaps 0x513e(%eax),%xmm3
.byte 15,194,217,2 // cmpleps %xmm1,%xmm3
- .byte 15,40,160,190,79,0,0 // movaps 0x4fbe(%eax),%xmm4
+ .byte 15,40,160,158,81,0,0 // movaps 0x519e(%eax),%xmm4
.byte 15,194,225,2 // cmpleps %xmm1,%xmm4
.byte 15,89,206 // mulps %xmm6,%xmm1
- .byte 15,40,168,174,79,0,0 // movaps 0x4fae(%eax),%xmm5
+ .byte 15,40,168,142,81,0,0 // movaps 0x518e(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,89,239 // mulps %xmm7,%xmm5
.byte 15,88,234 // addps %xmm2,%xmm5
@@ -53556,7 +54470,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,125,232 // movaps -0x18(%ebp),%xmm7
.byte 15,85,252 // andnps %xmm4,%xmm7
.byte 15,40,93,184 // movaps -0x48(%ebp),%xmm3
- .byte 15,88,152,206,79,0,0 // addps 0x4fce(%eax),%xmm3
+ .byte 15,88,152,174,81,0,0 // addps 0x51ae(%eax),%xmm3
.byte 243,15,91,195 // cvttps2dq %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,203 // movaps %xmm3,%xmm1
@@ -53658,9 +54572,9 @@ _sk_scale_u8_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,100,77,0,0 // pand 0x4d64(%edx),%xmm4
+ .byte 102,15,219,162,68,79,0,0 // pand 0x4f44(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,116,77,0,0 // mulps 0x4d74(%edx),%xmm4
+ .byte 15,89,162,84,79,0,0 // mulps 0x4f54(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 15,89,212 // mulps %xmm4,%xmm2
@@ -53760,9 +54674,9 @@ _sk_lerp_u8_sse2:
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,124,76,0,0 // pand 0x4c7c(%edx),%xmm4
+ .byte 102,15,219,162,92,78,0,0 // pand 0x4e5c(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,140,76,0,0 // mulps 0x4c8c(%edx),%xmm4
+ .byte 15,89,162,108,78,0,0 // mulps 0x4e6c(%edx),%xmm4
.byte 15,40,105,16 // movaps 0x10(%ecx),%xmm5
.byte 15,40,113,32 // movaps 0x20(%ecx),%xmm6
.byte 15,92,197 // subps %xmm5,%xmm0
@@ -53836,17 +54750,17 @@ _sk_lerp_565_sse2:
.byte 15,133,163,0,0,0 // jne 2941 <_sk_lerp_565_sse2+0xd2>
.byte 243,15,126,52,126 // movq (%esi,%edi,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,162,195,75,0,0 // movdqa 0x4bc3(%edx),%xmm4
+ .byte 102,15,111,162,163,77,0,0 // movdqa 0x4da3(%edx),%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,211,75,0,0 // mulps 0x4bd3(%edx),%xmm4
- .byte 102,15,111,170,227,75,0,0 // movdqa 0x4be3(%edx),%xmm5
+ .byte 15,89,162,179,77,0,0 // mulps 0x4db3(%edx),%xmm4
+ .byte 102,15,111,170,195,77,0,0 // movdqa 0x4dc3(%edx),%xmm5
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,243,75,0,0 // mulps 0x4bf3(%edx),%xmm5
- .byte 102,15,219,178,3,76,0,0 // pand 0x4c03(%edx),%xmm6
+ .byte 15,89,170,211,77,0,0 // mulps 0x4dd3(%edx),%xmm5
+ .byte 102,15,219,178,227,77,0,0 // pand 0x4de3(%edx),%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,178,19,76,0,0 // mulps 0x4c13(%edx),%xmm6
+ .byte 15,89,178,243,77,0,0 // mulps 0x4df3(%edx),%xmm6
.byte 15,40,121,16 // movaps 0x10(%ecx),%xmm7
.byte 15,92,199 // subps %xmm7,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -53921,7 +54835,7 @@ _sk_load_tables_sse2:
.byte 139,30 // mov (%esi),%ebx
.byte 15,133,19,1,0,0 // jne 2ac1 <_sk_load_tables_sse2+0x139>
.byte 243,15,111,28,187 // movdqu (%ebx,%edi,4),%xmm3
- .byte 102,15,111,146,10,75,0,0 // movdqa 0x4b0a(%edx),%xmm2
+ .byte 102,15,111,146,234,76,0,0 // movdqa 0x4cea(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
@@ -53977,7 +54891,7 @@ _sk_load_tables_sse2:
.byte 15,20,215 // unpcklps %xmm7,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,26,75,0,0 // mulps 0x4b1a(%edx),%xmm3
+ .byte 15,89,154,250,76,0,0 // mulps 0x4cfa(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,194 // mov %eax,%edx
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -54124,7 +55038,7 @@ _sk_load_tables_u16_be_sse2:
.byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3
.byte 102,15,97,223 // punpcklwd %xmm7,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,188,73,0,0 // mulps 0x49bc(%edx),%xmm3
+ .byte 15,89,154,156,75,0,0 // mulps 0x4b9c(%edx),%xmm3
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 137,193 // mov %eax,%ecx
.byte 141,65,8 // lea 0x8(%ecx),%eax
@@ -54263,7 +55177,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 141,65,8 // lea 0x8(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 139,85,240 // mov -0x10(%ebp),%edx
- .byte 15,40,162,204,71,0,0 // movaps 0x47cc(%edx),%xmm4
+ .byte 15,40,162,172,73,0,0 // movaps 0x49ac(%edx),%xmm4
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,40,220 // movaps %xmm4,%xmm3
.byte 80 // push %eax
@@ -54308,7 +55222,7 @@ _sk_byte_tables_sse2:
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,8 // mov (%eax),%ecx
- .byte 15,40,162,205,69,0,0 // movaps 0x45cd(%edx),%xmm4
+ .byte 15,40,162,173,71,0,0 // movaps 0x47ad(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
@@ -54330,7 +55244,7 @@ _sk_byte_tables_sse2:
.byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0
.byte 139,65,4 // mov 0x4(%ecx),%eax
.byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0
- .byte 15,40,170,221,69,0,0 // movaps 0x45dd(%edx),%xmm5
+ .byte 15,40,170,189,71,0,0 // movaps 0x47bd(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -54460,7 +55374,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0
.byte 139,121,4 // mov 0x4(%ecx),%edi
.byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0
- .byte 15,40,170,237,67,0,0 // movaps 0x43ed(%edx),%xmm5
+ .byte 15,40,170,205,69,0,0 // movaps 0x45cd(%edx),%xmm5
.byte 15,89,204 // mulps %xmm4,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
.byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6
@@ -54716,15 +55630,15 @@ _sk_parametric_r_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,46,65,0,0 // mulps 0x412e(%edx),%xmm5
- .byte 15,84,178,62,65,0,0 // andps 0x413e(%edx),%xmm6
- .byte 15,86,178,78,65,0,0 // orps 0x414e(%edx),%xmm6
- .byte 15,88,170,94,65,0,0 // addps 0x415e(%edx),%xmm5
- .byte 15,40,186,110,65,0,0 // movaps 0x416e(%edx),%xmm7
+ .byte 15,89,170,14,67,0,0 // mulps 0x430e(%edx),%xmm5
+ .byte 15,84,178,30,67,0,0 // andps 0x431e(%edx),%xmm6
+ .byte 15,86,178,46,67,0,0 // orps 0x432e(%edx),%xmm6
+ .byte 15,88,170,62,67,0,0 // addps 0x433e(%edx),%xmm5
+ .byte 15,40,186,78,67,0,0 // movaps 0x434e(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,126,65,0,0 // addps 0x417e(%edx),%xmm6
- .byte 15,40,186,142,65,0,0 // movaps 0x418e(%edx),%xmm7
+ .byte 15,88,178,94,67,0,0 // addps 0x435e(%edx),%xmm6
+ .byte 15,40,186,110,67,0,0 // movaps 0x436e(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -54734,21 +55648,21 @@ _sk_parametric_r_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,158,65,0,0 // movaps 0x419e(%edx),%xmm6
+ .byte 15,40,178,126,67,0,0 // movaps 0x437e(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,174,65,0,0 // addps 0x41ae(%edx),%xmm5
- .byte 15,40,186,190,65,0,0 // movaps 0x41be(%edx),%xmm7
+ .byte 15,88,170,142,67,0,0 // addps 0x438e(%edx),%xmm5
+ .byte 15,40,186,158,67,0,0 // movaps 0x439e(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,206,65,0,0 // movaps 0x41ce(%edx),%xmm7
+ .byte 15,40,186,174,67,0,0 // movaps 0x43ae(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,222,65,0,0 // movaps 0x41de(%edx),%xmm0
+ .byte 15,40,130,190,67,0,0 // movaps 0x43be(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,238,65,0,0 // mulps 0x41ee(%edx),%xmm0
+ .byte 15,89,130,206,67,0,0 // mulps 0x43ce(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -54802,15 +55716,15 @@ _sk_parametric_g_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,199,64,0,0 // mulps 0x40c7(%edx),%xmm5
- .byte 15,84,178,215,64,0,0 // andps 0x40d7(%edx),%xmm6
- .byte 15,86,178,231,64,0,0 // orps 0x40e7(%edx),%xmm6
- .byte 15,88,170,247,64,0,0 // addps 0x40f7(%edx),%xmm5
- .byte 15,40,186,7,65,0,0 // movaps 0x4107(%edx),%xmm7
+ .byte 15,89,170,167,66,0,0 // mulps 0x42a7(%edx),%xmm5
+ .byte 15,84,178,183,66,0,0 // andps 0x42b7(%edx),%xmm6
+ .byte 15,86,178,199,66,0,0 // orps 0x42c7(%edx),%xmm6
+ .byte 15,88,170,215,66,0,0 // addps 0x42d7(%edx),%xmm5
+ .byte 15,40,186,231,66,0,0 // movaps 0x42e7(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,23,65,0,0 // addps 0x4117(%edx),%xmm6
- .byte 15,40,186,39,65,0,0 // movaps 0x4127(%edx),%xmm7
+ .byte 15,88,178,247,66,0,0 // addps 0x42f7(%edx),%xmm6
+ .byte 15,40,186,7,67,0,0 // movaps 0x4307(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -54820,21 +55734,21 @@ _sk_parametric_g_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,55,65,0,0 // movaps 0x4137(%edx),%xmm6
+ .byte 15,40,178,23,67,0,0 // movaps 0x4317(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,71,65,0,0 // addps 0x4147(%edx),%xmm5
- .byte 15,40,186,87,65,0,0 // movaps 0x4157(%edx),%xmm7
+ .byte 15,88,170,39,67,0,0 // addps 0x4327(%edx),%xmm5
+ .byte 15,40,186,55,67,0,0 // movaps 0x4337(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,103,65,0,0 // movaps 0x4167(%edx),%xmm7
+ .byte 15,40,186,71,67,0,0 // movaps 0x4347(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,119,65,0,0 // movaps 0x4177(%edx),%xmm0
+ .byte 15,40,130,87,67,0,0 // movaps 0x4357(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,135,65,0,0 // mulps 0x4187(%edx),%xmm0
+ .byte 15,89,130,103,67,0,0 // mulps 0x4367(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -54887,15 +55801,15 @@ _sk_parametric_b_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,99,64,0,0 // mulps 0x4063(%edx),%xmm5
- .byte 15,84,178,115,64,0,0 // andps 0x4073(%edx),%xmm6
- .byte 15,86,178,131,64,0,0 // orps 0x4083(%edx),%xmm6
- .byte 15,88,170,147,64,0,0 // addps 0x4093(%edx),%xmm5
- .byte 15,40,186,163,64,0,0 // movaps 0x40a3(%edx),%xmm7
+ .byte 15,89,170,67,66,0,0 // mulps 0x4243(%edx),%xmm5
+ .byte 15,84,178,83,66,0,0 // andps 0x4253(%edx),%xmm6
+ .byte 15,86,178,99,66,0,0 // orps 0x4263(%edx),%xmm6
+ .byte 15,88,170,115,66,0,0 // addps 0x4273(%edx),%xmm5
+ .byte 15,40,186,131,66,0,0 // movaps 0x4283(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,179,64,0,0 // addps 0x40b3(%edx),%xmm6
- .byte 15,40,186,195,64,0,0 // movaps 0x40c3(%edx),%xmm7
+ .byte 15,88,178,147,66,0,0 // addps 0x4293(%edx),%xmm6
+ .byte 15,40,186,163,66,0,0 // movaps 0x42a3(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -54905,21 +55819,21 @@ _sk_parametric_b_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,211,64,0,0 // movaps 0x40d3(%edx),%xmm6
+ .byte 15,40,178,179,66,0,0 // movaps 0x42b3(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,227,64,0,0 // addps 0x40e3(%edx),%xmm5
- .byte 15,40,186,243,64,0,0 // movaps 0x40f3(%edx),%xmm7
+ .byte 15,88,170,195,66,0,0 // addps 0x42c3(%edx),%xmm5
+ .byte 15,40,186,211,66,0,0 // movaps 0x42d3(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,3,65,0,0 // movaps 0x4103(%edx),%xmm7
+ .byte 15,40,186,227,66,0,0 // movaps 0x42e3(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,19,65,0,0 // movaps 0x4113(%edx),%xmm0
+ .byte 15,40,130,243,66,0,0 // movaps 0x42f3(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,35,65,0,0 // mulps 0x4123(%edx),%xmm0
+ .byte 15,89,130,3,67,0,0 // mulps 0x4303(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -54972,15 +55886,15 @@ _sk_parametric_a_sse2:
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,245 // addps %xmm5,%xmm6
.byte 15,91,238 // cvtdq2ps %xmm6,%xmm5
- .byte 15,89,170,255,63,0,0 // mulps 0x3fff(%edx),%xmm5
- .byte 15,84,178,15,64,0,0 // andps 0x400f(%edx),%xmm6
- .byte 15,86,178,31,64,0,0 // orps 0x401f(%edx),%xmm6
- .byte 15,88,170,47,64,0,0 // addps 0x402f(%edx),%xmm5
- .byte 15,40,186,63,64,0,0 // movaps 0x403f(%edx),%xmm7
+ .byte 15,89,170,223,65,0,0 // mulps 0x41df(%edx),%xmm5
+ .byte 15,84,178,239,65,0,0 // andps 0x41ef(%edx),%xmm6
+ .byte 15,86,178,255,65,0,0 // orps 0x41ff(%edx),%xmm6
+ .byte 15,88,170,15,66,0,0 // addps 0x420f(%edx),%xmm5
+ .byte 15,40,186,31,66,0,0 // movaps 0x421f(%edx),%xmm7
.byte 15,89,254 // mulps %xmm6,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,88,178,79,64,0,0 // addps 0x404f(%edx),%xmm6
- .byte 15,40,186,95,64,0,0 // movaps 0x405f(%edx),%xmm7
+ .byte 15,88,178,47,66,0,0 // addps 0x422f(%edx),%xmm6
+ .byte 15,40,186,63,66,0,0 // movaps 0x423f(%edx),%xmm7
.byte 15,94,254 // divps %xmm6,%xmm7
.byte 243,15,16,49 // movss (%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
@@ -54990,21 +55904,21 @@ _sk_parametric_a_sse2:
.byte 15,91,254 // cvtdq2ps %xmm6,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
- .byte 15,40,178,111,64,0,0 // movaps 0x406f(%edx),%xmm6
+ .byte 15,40,178,79,66,0,0 // movaps 0x424f(%edx),%xmm6
.byte 15,84,198 // andps %xmm6,%xmm0
.byte 15,92,248 // subps %xmm0,%xmm7
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,199 // subps %xmm7,%xmm0
- .byte 15,88,170,127,64,0,0 // addps 0x407f(%edx),%xmm5
- .byte 15,40,186,143,64,0,0 // movaps 0x408f(%edx),%xmm7
+ .byte 15,88,170,95,66,0,0 // addps 0x425f(%edx),%xmm5
+ .byte 15,40,186,111,66,0,0 // movaps 0x426f(%edx),%xmm7
.byte 15,89,248 // mulps %xmm0,%xmm7
.byte 15,92,239 // subps %xmm7,%xmm5
- .byte 15,40,186,159,64,0,0 // movaps 0x409f(%edx),%xmm7
+ .byte 15,40,186,127,66,0,0 // movaps 0x427f(%edx),%xmm7
.byte 15,92,248 // subps %xmm0,%xmm7
- .byte 15,40,130,175,64,0,0 // movaps 0x40af(%edx),%xmm0
+ .byte 15,40,130,143,66,0,0 // movaps 0x428f(%edx),%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 15,88,197 // addps %xmm5,%xmm0
- .byte 15,89,130,191,64,0,0 // mulps 0x40bf(%edx),%xmm0
+ .byte 15,89,130,159,66,0,0 // mulps 0x429f(%edx),%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 243,15,16,105,20 // movss 0x14(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -55027,6 +55941,127 @@ _sk_parametric_a_sse2:
.byte 93 // pop %ebp
.byte 195 // ret
+HIDDEN _sk_gamma_sse2
+.globl _sk_gamma_sse2
+FUNCTION(_sk_gamma_sse2)
+_sk_gamma_sse2:
+ .byte 85 // push %ebp
+ .byte 137,229 // mov %esp,%ebp
+ .byte 131,236,40 // sub $0x28,%esp
+ .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
+ .byte 15,40,216 // movaps %xmm0,%xmm3
+ .byte 232,0,0,0,0 // call 38b2 <_sk_gamma_sse2+0x12>
+ .byte 88 // pop %eax
+ .byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
+ .byte 15,89,128,126,65,0,0 // mulps 0x417e(%eax),%xmm0
+ .byte 15,84,152,142,65,0,0 // andps 0x418e(%eax),%xmm3
+ .byte 15,86,152,158,65,0,0 // orps 0x419e(%eax),%xmm3
+ .byte 15,88,128,174,65,0,0 // addps 0x41ae(%eax),%xmm0
+ .byte 15,40,227 // movaps %xmm3,%xmm4
+ .byte 15,89,160,190,65,0,0 // mulps 0x41be(%eax),%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,88,152,206,65,0,0 // addps 0x41ce(%eax),%xmm3
+ .byte 15,40,160,222,65,0,0 // movaps 0x41de(%eax),%xmm4
+ .byte 15,94,227 // divps %xmm3,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 139,77,12 // mov 0xc(%ebp),%ecx
+ .byte 139,17 // mov (%ecx),%edx
+ .byte 243,15,16,58 // movss (%edx),%xmm7
+ .byte 15,198,255,0 // shufps $0x0,%xmm7,%xmm7
+ .byte 15,89,199 // mulps %xmm7,%xmm0
+ .byte 15,41,125,232 // movaps %xmm7,-0x18(%ebp)
+ .byte 243,15,91,216 // cvttps2dq %xmm0,%xmm3
+ .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,194,227,1 // cmpltps %xmm3,%xmm4
+ .byte 15,84,160,238,65,0,0 // andps 0x41ee(%eax),%xmm4
+ .byte 15,92,220 // subps %xmm4,%xmm3
+ .byte 15,40,224 // movaps %xmm0,%xmm4
+ .byte 15,92,227 // subps %xmm3,%xmm4
+ .byte 15,88,128,254,65,0,0 // addps 0x41fe(%eax),%xmm0
+ .byte 15,40,176,30,66,0,0 // movaps 0x421e(%eax),%xmm6
+ .byte 15,92,244 // subps %xmm4,%xmm6
+ .byte 15,40,168,14,66,0,0 // movaps 0x420e(%eax),%xmm5
+ .byte 15,89,229 // mulps %xmm5,%xmm4
+ .byte 15,92,196 // subps %xmm4,%xmm0
+ .byte 15,40,152,46,66,0,0 // movaps 0x422e(%eax),%xmm3
+ .byte 15,40,227 // movaps %xmm3,%xmm4
+ .byte 15,94,230 // divps %xmm6,%xmm4
+ .byte 15,88,224 // addps %xmm0,%xmm4
+ .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
+ .byte 15,89,128,126,65,0,0 // mulps 0x417e(%eax),%xmm0
+ .byte 15,84,136,142,65,0,0 // andps 0x418e(%eax),%xmm1
+ .byte 15,86,136,158,65,0,0 // orps 0x419e(%eax),%xmm1
+ .byte 15,88,128,174,65,0,0 // addps 0x41ae(%eax),%xmm0
+ .byte 15,40,241 // movaps %xmm1,%xmm6
+ .byte 15,89,176,190,65,0,0 // mulps 0x41be(%eax),%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,88,136,206,65,0,0 // addps 0x41ce(%eax),%xmm1
+ .byte 15,40,176,222,65,0,0 // movaps 0x41de(%eax),%xmm6
+ .byte 15,94,241 // divps %xmm1,%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,89,199 // mulps %xmm7,%xmm0
+ .byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
+ .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,194,241,1 // cmpltps %xmm1,%xmm6
+ .byte 15,84,176,238,65,0,0 // andps 0x41ee(%eax),%xmm6
+ .byte 15,92,206 // subps %xmm6,%xmm1
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,92,241 // subps %xmm1,%xmm6
+ .byte 15,88,128,254,65,0,0 // addps 0x41fe(%eax),%xmm0
+ .byte 15,40,184,30,66,0,0 // movaps 0x421e(%eax),%xmm7
+ .byte 15,92,254 // subps %xmm6,%xmm7
+ .byte 15,89,245 // mulps %xmm5,%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,40,203 // movaps %xmm3,%xmm1
+ .byte 15,94,207 // divps %xmm7,%xmm1
+ .byte 15,88,200 // addps %xmm0,%xmm1
+ .byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
+ .byte 15,89,128,126,65,0,0 // mulps 0x417e(%eax),%xmm0
+ .byte 15,84,144,142,65,0,0 // andps 0x418e(%eax),%xmm2
+ .byte 15,86,144,158,65,0,0 // orps 0x419e(%eax),%xmm2
+ .byte 15,88,128,174,65,0,0 // addps 0x41ae(%eax),%xmm0
+ .byte 15,40,176,190,65,0,0 // movaps 0x41be(%eax),%xmm6
+ .byte 15,89,242 // mulps %xmm2,%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,88,144,206,65,0,0 // addps 0x41ce(%eax),%xmm2
+ .byte 15,40,176,222,65,0,0 // movaps 0x41de(%eax),%xmm6
+ .byte 15,94,242 // divps %xmm2,%xmm6
+ .byte 15,92,198 // subps %xmm6,%xmm0
+ .byte 15,89,69,232 // mulps -0x18(%ebp),%xmm0
+ .byte 243,15,91,208 // cvttps2dq %xmm0,%xmm2
+ .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,194,242,1 // cmpltps %xmm2,%xmm6
+ .byte 15,84,176,238,65,0,0 // andps 0x41ee(%eax),%xmm6
+ .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 15,40,240 // movaps %xmm0,%xmm6
+ .byte 15,92,242 // subps %xmm2,%xmm6
+ .byte 15,88,128,254,65,0,0 // addps 0x41fe(%eax),%xmm0
+ .byte 15,89,238 // mulps %xmm6,%xmm5
+ .byte 15,92,197 // subps %xmm5,%xmm0
+ .byte 15,40,144,30,66,0,0 // movaps 0x421e(%eax),%xmm2
+ .byte 15,92,214 // subps %xmm6,%xmm2
+ .byte 15,94,218 // divps %xmm2,%xmm3
+ .byte 15,88,216 // addps %xmm0,%xmm3
+ .byte 15,40,128,62,66,0,0 // movaps 0x423e(%eax),%xmm0
+ .byte 15,89,224 // mulps %xmm0,%xmm4
+ .byte 15,89,200 // mulps %xmm0,%xmm1
+ .byte 15,89,216 // mulps %xmm0,%xmm3
+ .byte 102,15,91,196 // cvtps2dq %xmm4,%xmm0
+ .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
+ .byte 102,15,91,211 // cvtps2dq %xmm3,%xmm2
+ .byte 141,65,8 // lea 0x8(%ecx),%eax
+ .byte 131,236,8 // sub $0x8,%esp
+ .byte 15,40,93,216 // movaps -0x28(%ebp),%xmm3
+ .byte 80 // push %eax
+ .byte 255,117,8 // pushl 0x8(%ebp)
+ .byte 255,81,4 // call *0x4(%ecx)
+ .byte 131,196,56 // add $0x38,%esp
+ .byte 93 // pop %ebp
+ .byte 195 // ret
+
HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
@@ -55037,31 +56072,31 @@ _sk_lab_to_xyz_sse2:
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
- .byte 232,0,0,0,0 // call 38b5 <_sk_lab_to_xyz_sse2+0x15>
+ .byte 232,0,0,0,0 // call 3a9a <_sk_lab_to_xyz_sse2+0x15>
.byte 88 // pop %eax
- .byte 15,89,144,155,63,0,0 // mulps 0x3f9b(%eax),%xmm2
- .byte 15,40,160,171,63,0,0 // movaps 0x3fab(%eax),%xmm4
+ .byte 15,89,144,102,64,0,0 // mulps 0x4066(%eax),%xmm2
+ .byte 15,40,160,118,64,0,0 // movaps 0x4076(%eax),%xmm4
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 15,40,168,187,63,0,0 // movaps 0x3fbb(%eax),%xmm5
+ .byte 15,40,168,134,64,0,0 // movaps 0x4086(%eax),%xmm5
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,89,220 // mulps %xmm4,%xmm3
.byte 15,88,221 // addps %xmm5,%xmm3
- .byte 15,88,144,203,63,0,0 // addps 0x3fcb(%eax),%xmm2
- .byte 15,89,144,219,63,0,0 // mulps 0x3fdb(%eax),%xmm2
- .byte 15,89,136,235,63,0,0 // mulps 0x3feb(%eax),%xmm1
+ .byte 15,88,144,150,64,0,0 // addps 0x4096(%eax),%xmm2
+ .byte 15,89,144,166,64,0,0 // mulps 0x40a6(%eax),%xmm2
+ .byte 15,89,136,182,64,0,0 // mulps 0x40b6(%eax),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 15,89,152,251,63,0,0 // mulps 0x3ffb(%eax),%xmm3
+ .byte 15,89,152,198,64,0,0 // mulps 0x40c6(%eax),%xmm3
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,92,235 // subps %xmm3,%xmm5
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,152,11,64,0,0 // movaps 0x400b(%eax),%xmm3
+ .byte 15,40,152,214,64,0,0 // movaps 0x40d6(%eax),%xmm3
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 15,194,224,1 // cmpltps %xmm0,%xmm4
- .byte 15,40,176,27,64,0,0 // movaps 0x401b(%eax),%xmm6
+ .byte 15,40,176,230,64,0,0 // movaps 0x40e6(%eax),%xmm6
.byte 15,88,206 // addps %xmm6,%xmm1
- .byte 15,40,184,43,64,0,0 // movaps 0x402b(%eax),%xmm7
+ .byte 15,40,184,246,64,0,0 // movaps 0x40f6(%eax),%xmm7
.byte 15,89,207 // mulps %xmm7,%xmm1
.byte 15,84,196 // andps %xmm4,%xmm0
.byte 15,85,225 // andnps %xmm1,%xmm4
@@ -55086,8 +56121,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,85,221 // andnps %xmm5,%xmm3
.byte 15,86,216 // orps %xmm0,%xmm3
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,160,59,64,0,0 // mulps 0x403b(%eax),%xmm4
- .byte 15,89,152,75,64,0,0 // mulps 0x404b(%eax),%xmm3
+ .byte 15,89,160,6,65,0,0 // mulps 0x4106(%eax),%xmm4
+ .byte 15,89,152,22,65,0,0 // mulps 0x4116(%eax),%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -55110,7 +56145,7 @@ _sk_load_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 39a5 <_sk_load_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3b8a <_sk_load_a8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55121,13 +56156,13 @@ _sk_load_a8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,60 // jne 39fc <_sk_load_a8_sse2+0x65>
+ .byte 117,60 // jne 3be1 <_sk_load_a8_sse2+0x65>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,107,63,0,0 // pand 0x3f6b(%edx),%xmm0
+ .byte 102,15,219,130,54,64,0,0 // pand 0x4036(%edx),%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,154,123,63,0,0 // mulps 0x3f7b(%edx),%xmm3
+ .byte 15,89,154,70,64,0,0 // mulps 0x4046(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -55144,12 +56179,12 @@ _sk_load_a8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3a36 <_sk_load_a8_sse2+0x9f>
+ .byte 116,50 // je 3c1b <_sk_load_a8_sse2+0x9f>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3a20 <_sk_load_a8_sse2+0x89>
+ .byte 116,19 // je 3c05 <_sk_load_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,187 // jne 39cd <_sk_load_a8_sse2+0x36>
+ .byte 117,187 // jne 3bb2 <_sk_load_a8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -55158,10 +56193,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,151 // jmp 39cd <_sk_load_a8_sse2+0x36>
+ .byte 235,151 // jmp 3bb2 <_sk_load_a8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,141 // jmp 39cd <_sk_load_a8_sse2+0x36>
+ .byte 235,141 // jmp 3bb2 <_sk_load_a8_sse2+0x36>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -55186,15 +56221,15 @@ _sk_load_a8_dst_sse2:
.byte 102,15,127,97,32 // movdqa %xmm4,0x20(%ecx)
.byte 102,15,127,97,16 // movdqa %xmm4,0x10(%ecx)
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 3a79 <_sk_load_a8_dst_sse2+0x39>
+ .byte 232,0,0,0,0 // call 3c5e <_sk_load_a8_dst_sse2+0x39>
.byte 90 // pop %edx
- .byte 117,54 // jne 3ab2 <_sk_load_a8_dst_sse2+0x72>
+ .byte 117,54 // jne 3c97 <_sk_load_a8_dst_sse2+0x72>
.byte 102,15,110,36,55 // movd (%edi,%esi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,183,62,0,0 // pand 0x3eb7(%edx),%xmm4
+ .byte 102,15,219,162,130,63,0,0 // pand 0x3f82(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,199,62,0,0 // mulps 0x3ec7(%edx),%xmm4
+ .byte 15,89,162,146,63,0,0 // mulps 0x3f92(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -55209,11 +56244,11 @@ _sk_load_a8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 3ae8 <_sk_load_a8_dst_sse2+0xa8>
+ .byte 116,46 // je 3ccd <_sk_load_a8_dst_sse2+0xa8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3ad2 <_sk_load_a8_dst_sse2+0x92>
+ .byte 116,19 // je 3cb7 <_sk_load_a8_dst_sse2+0x92>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,197 // jne 3a89 <_sk_load_a8_dst_sse2+0x49>
+ .byte 117,197 // jne 3c6e <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,92,55,2 // movzbl 0x2(%edi,%esi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -55222,10 +56257,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,161 // jmp 3a89 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,161 // jmp 3c6e <_sk_load_a8_dst_sse2+0x49>
.byte 15,182,52,55 // movzbl (%edi,%esi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,151 // jmp 3a89 <_sk_load_a8_dst_sse2+0x49>
+ .byte 235,151 // jmp 3c6e <_sk_load_a8_dst_sse2+0x49>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -55266,13 +56301,13 @@ _sk_gather_a8_sse2:
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
- .byte 232,0,0,0,0 // call 3b77 <_sk_gather_a8_sse2+0x85>
+ .byte 232,0,0,0,0 // call 3d5c <_sk_gather_a8_sse2+0x85>
.byte 89 // pop %ecx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,153,217,61,0,0 // mulps 0x3dd9(%ecx),%xmm3
+ .byte 15,89,153,164,62,0,0 // mulps 0x3ea4(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -55297,7 +56332,7 @@ _sk_store_a8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 3bbb <_sk_store_a8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3da0 <_sk_store_a8_sse2+0xe>
.byte 94 // pop %esi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55306,7 +56341,7 @@ _sk_store_a8_sse2:
.byte 15,175,81,4 // imul 0x4(%ecx),%edx
.byte 3,23 // add (%edi),%edx
.byte 139,89,8 // mov 0x8(%ecx),%ebx
- .byte 15,40,166,165,61,0,0 // movaps 0x3da5(%esi),%xmm4
+ .byte 15,40,166,112,62,0,0 // movaps 0x3e70(%esi),%xmm4
.byte 15,89,227 // mulps %xmm3,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
.byte 102,15,114,244,16 // pslld $0x10,%xmm4
@@ -55315,7 +56350,7 @@ _sk_store_a8_sse2:
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,26 // jne 3c10 <_sk_store_a8_sse2+0x63>
+ .byte 117,26 // jne 3df5 <_sk_store_a8_sse2+0x63>
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 137,52,58 // mov %esi,(%edx,%edi,1)
.byte 141,80,8 // lea 0x8(%eax),%edx
@@ -55333,26 +56368,26 @@ _sk_store_a8_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,57 // je 3c59 <_sk_store_a8_sse2+0xac>
+ .byte 116,57 // je 3e3e <_sk_store_a8_sse2+0xac>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,17 // je 3c36 <_sk_store_a8_sse2+0x89>
+ .byte 116,17 // je 3e1b <_sk_store_a8_sse2+0x89>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,211 // jne 3bfd <_sk_store_a8_sse2+0x50>
+ .byte 117,211 // jne 3de2 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,200 // movdqa %xmm4,-0x38(%ebp)
.byte 138,93,208 // mov -0x30(%ebp),%bl
.byte 136,92,58,2 // mov %bl,0x2(%edx,%edi,1)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
- .byte 102,15,219,166,181,61,0,0 // pand 0x3db5(%esi),%xmm4
+ .byte 102,15,219,166,128,62,0,0 // pand 0x3e80(%esi),%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,230 // movd %xmm4,%esi
.byte 102,137,52,58 // mov %si,(%edx,%edi,1)
- .byte 235,164 // jmp 3bfd <_sk_store_a8_sse2+0x50>
+ .byte 235,164 // jmp 3de2 <_sk_store_a8_sse2+0x50>
.byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp)
.byte 138,93,216 // mov -0x28(%ebp),%bl
.byte 136,28,58 // mov %bl,(%edx,%edi,1)
- .byte 235,151 // jmp 3bfd <_sk_store_a8_sse2+0x50>
+ .byte 235,151 // jmp 3de2 <_sk_store_a8_sse2+0x50>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -55364,7 +56399,7 @@ _sk_load_g8_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3c74 <_sk_load_g8_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3e59 <_sk_load_g8_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55375,16 +56410,16 @@ _sk_load_g8_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,63 // jne 3cce <_sk_load_g8_sse2+0x68>
+ .byte 117,63 // jne 3eb3 <_sk_load_g8_sse2+0x68>
.byte 102,15,110,4,62 // movd (%esi,%edi,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,130,12,61,0,0 // pand 0x3d0c(%edx),%xmm0
+ .byte 102,15,219,130,215,61,0,0 // pand 0x3dd7(%edx),%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,28,61,0,0 // mulps 0x3d1c(%edx),%xmm0
+ .byte 15,89,130,231,61,0,0 // mulps 0x3de7(%edx),%xmm0
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,44,61,0,0 // movaps 0x3d2c(%edx),%xmm3
+ .byte 15,40,154,247,61,0,0 // movaps 0x3df7(%edx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 86 // push %esi
@@ -55398,12 +56433,12 @@ _sk_load_g8_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3d08 <_sk_load_g8_sse2+0xa2>
+ .byte 116,50 // je 3eed <_sk_load_g8_sse2+0xa2>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3cf2 <_sk_load_g8_sse2+0x8c>
+ .byte 116,19 // je 3ed7 <_sk_load_g8_sse2+0x8c>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,184 // jne 3c9c <_sk_load_g8_sse2+0x36>
+ .byte 117,184 // jne 3e81 <_sk_load_g8_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -55412,10 +56447,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,148 // jmp 3c9c <_sk_load_g8_sse2+0x36>
+ .byte 235,148 // jmp 3e81 <_sk_load_g8_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,198 // movd %esi,%xmm0
- .byte 235,138 // jmp 3c9c <_sk_load_g8_sse2+0x36>
+ .byte 235,138 // jmp 3e81 <_sk_load_g8_sse2+0x36>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -55427,7 +56462,7 @@ _sk_load_g8_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3d20 <_sk_load_g8_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 3f05 <_sk_load_g8_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55438,17 +56473,17 @@ _sk_load_g8_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,73 // jne 3d84 <_sk_load_g8_dst_sse2+0x72>
+ .byte 117,73 // jne 3f69 <_sk_load_g8_dst_sse2+0x72>
.byte 102,15,110,36,62 // movd (%esi,%edi,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,162,144,60,0,0 // pand 0x3c90(%edx),%xmm4
+ .byte 102,15,219,162,91,61,0,0 // pand 0x3d5b(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,160,60,0,0 // mulps 0x3ca0(%edx),%xmm4
+ .byte 15,89,162,107,61,0,0 // mulps 0x3d6b(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
.byte 15,41,97,32 // movaps %xmm4,0x20(%ecx)
.byte 15,41,97,16 // movaps %xmm4,0x10(%ecx)
- .byte 15,40,162,176,60,0,0 // movaps 0x3cb0(%edx),%xmm4
+ .byte 15,40,162,123,61,0,0 // movaps 0x3d7b(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -55463,12 +56498,12 @@ _sk_load_g8_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 3dbe <_sk_load_g8_dst_sse2+0xac>
+ .byte 116,50 // je 3fa3 <_sk_load_g8_dst_sse2+0xac>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3da8 <_sk_load_g8_dst_sse2+0x96>
+ .byte 116,19 // je 3f8d <_sk_load_g8_dst_sse2+0x96>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,174 // jne 3d48 <_sk_load_g8_dst_sse2+0x36>
+ .byte 117,174 // jne 3f2d <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,92,62,2 // movzbl 0x2(%esi,%edi,1),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -55477,10 +56512,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,138 // jmp 3d48 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,138 // jmp 3f2d <_sk_load_g8_dst_sse2+0x36>
.byte 15,182,52,62 // movzbl (%esi,%edi,1),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 235,128 // jmp 3d48 <_sk_load_g8_dst_sse2+0x36>
+ .byte 235,128 // jmp 3f2d <_sk_load_g8_dst_sse2+0x36>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -55520,17 +56555,17 @@ _sk_gather_g8_sse2:
.byte 193,226,8 // shl $0x8,%edx
.byte 9,202 // or %ecx,%edx
.byte 102,15,196,194,0 // pinsrw $0x0,%edx,%xmm0
- .byte 232,0,0,0,0 // call 3e48 <_sk_gather_g8_sse2+0x80>
+ .byte 232,0,0,0,0 // call 402d <_sk_gather_g8_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,196,199,1 // pinsrw $0x1,%edi,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,152,59,0,0 // mulps 0x3b98(%ecx),%xmm0
+ .byte 15,89,129,99,60,0,0 // mulps 0x3c63(%ecx),%xmm0
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,153,168,59,0,0 // movaps 0x3ba8(%ecx),%xmm3
+ .byte 15,40,153,115,60,0,0 // movaps 0x3c73(%ecx),%xmm3
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 82 // push %edx
@@ -55552,7 +56587,7 @@ _sk_load_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3e93 <_sk_load_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4078 <_sk_load_565_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55564,23 +56599,23 @@ _sk_load_565_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,97 // jne 3f11 <_sk_load_565_sse2+0x8c>
+ .byte 117,97 // jne 40f6 <_sk_load_565_sse2+0x8c>
.byte 243,15,126,20,126 // movq (%esi,%edi,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,109,59,0,0 // movdqa 0x3b6d(%edx),%xmm0
+ .byte 102,15,111,130,56,60,0,0 // movdqa 0x3c38(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,125,59,0,0 // mulps 0x3b7d(%edx),%xmm0
- .byte 102,15,111,138,141,59,0,0 // movdqa 0x3b8d(%edx),%xmm1
+ .byte 15,89,130,72,60,0,0 // mulps 0x3c48(%edx),%xmm0
+ .byte 102,15,111,138,88,60,0,0 // movdqa 0x3c58(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,157,59,0,0 // mulps 0x3b9d(%edx),%xmm1
- .byte 102,15,219,146,173,59,0,0 // pand 0x3bad(%edx),%xmm2
+ .byte 15,89,138,104,60,0,0 // mulps 0x3c68(%edx),%xmm1
+ .byte 102,15,219,146,120,60,0,0 // pand 0x3c78(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,189,59,0,0 // mulps 0x3bbd(%edx),%xmm2
+ .byte 15,89,146,136,60,0,0 // mulps 0x3c88(%edx),%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,205,59,0,0 // movaps 0x3bcd(%edx),%xmm3
+ .byte 15,40,154,152,60,0,0 // movaps 0x3c98(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -55592,22 +56627,22 @@ _sk_load_565_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 3f47 <_sk_load_565_sse2+0xc2>
+ .byte 116,46 // je 412c <_sk_load_565_sse2+0xc2>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 3f35 <_sk_load_565_sse2+0xb0>
+ .byte 116,19 // je 411a <_sk_load_565_sse2+0xb0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,146 // jne 3eb9 <_sk_load_565_sse2+0x34>
+ .byte 117,146 // jne 409e <_sk_load_565_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,114,255,255,255 // jmp 3eb9 <_sk_load_565_sse2+0x34>
+ .byte 233,114,255,255,255 // jmp 409e <_sk_load_565_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,214 // movd %esi,%xmm2
- .byte 233,101,255,255,255 // jmp 3eb9 <_sk_load_565_sse2+0x34>
+ .byte 233,101,255,255,255 // jmp 409e <_sk_load_565_sse2+0x34>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -55619,7 +56654,7 @@ _sk_load_565_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 3f62 <_sk_load_565_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4147 <_sk_load_565_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55631,24 +56666,24 @@ _sk_load_565_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,113 // jne 3ff0 <_sk_load_565_dst_sse2+0x9c>
+ .byte 117,113 // jne 41d5 <_sk_load_565_dst_sse2+0x9c>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,14,59,0,0 // movdqa 0x3b0e(%edx),%xmm5
+ .byte 102,15,111,170,217,59,0,0 // movdqa 0x3bd9(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,30,59,0,0 // mulps 0x3b1e(%edx),%xmm5
+ .byte 15,89,170,233,59,0,0 // mulps 0x3be9(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,46,59,0,0 // movdqa 0x3b2e(%edx),%xmm5
+ .byte 102,15,111,170,249,59,0,0 // movdqa 0x3bf9(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,62,59,0,0 // mulps 0x3b3e(%edx),%xmm5
+ .byte 15,89,170,9,60,0,0 // mulps 0x3c09(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,219,162,78,59,0,0 // pand 0x3b4e(%edx),%xmm4
+ .byte 102,15,219,162,25,60,0,0 // pand 0x3c19(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,94,59,0,0 // mulps 0x3b5e(%edx),%xmm4
+ .byte 15,89,162,41,60,0,0 // mulps 0x3c29(%edx),%xmm4
.byte 15,41,97,48 // movaps %xmm4,0x30(%ecx)
- .byte 15,40,162,110,59,0,0 // movaps 0x3b6e(%edx),%xmm4
+ .byte 15,40,162,57,60,0,0 // movaps 0x3c39(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -55663,22 +56698,22 @@ _sk_load_565_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 4026 <_sk_load_565_dst_sse2+0xd2>
+ .byte 116,46 // je 420b <_sk_load_565_dst_sse2+0xd2>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 4014 <_sk_load_565_dst_sse2+0xc0>
+ .byte 116,19 // je 41f9 <_sk_load_565_dst_sse2+0xc0>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,130 // jne 3f88 <_sk_load_565_dst_sse2+0x34>
+ .byte 117,130 // jne 416d <_sk_load_565_dst_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,98,255,255,255 // jmp 3f88 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,98,255,255,255 // jmp 416d <_sk_load_565_dst_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,85,255,255,255 // jmp 3f88 <_sk_load_565_dst_sse2+0x34>
+ .byte 233,85,255,255,255 // jmp 416d <_sk_load_565_dst_sse2+0x34>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -55713,25 +56748,25 @@ _sk_gather_565_sse2:
.byte 102,15,196,209,2 // pinsrw $0x2,%ecx,%xmm2
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
- .byte 232,0,0,0,0 // call 40ae <_sk_gather_565_sse2+0x7b>
+ .byte 232,0,0,0,0 // call 4293 <_sk_gather_565_sse2+0x7b>
.byte 90 // pop %edx
.byte 102,15,196,209,3 // pinsrw $0x3,%ecx,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,130,50,58,0,0 // movdqa 0x3a32(%edx),%xmm0
+ .byte 102,15,111,130,253,58,0,0 // movdqa 0x3afd(%edx),%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,66,58,0,0 // mulps 0x3a42(%edx),%xmm0
- .byte 102,15,111,138,82,58,0,0 // movdqa 0x3a52(%edx),%xmm1
+ .byte 15,89,130,13,59,0,0 // mulps 0x3b0d(%edx),%xmm0
+ .byte 102,15,111,138,29,59,0,0 // movdqa 0x3b1d(%edx),%xmm1
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,98,58,0,0 // mulps 0x3a62(%edx),%xmm1
- .byte 102,15,219,146,114,58,0,0 // pand 0x3a72(%edx),%xmm2
+ .byte 15,89,138,45,59,0,0 // mulps 0x3b2d(%edx),%xmm1
+ .byte 102,15,219,146,61,59,0,0 // pand 0x3b3d(%edx),%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,130,58,0,0 // mulps 0x3a82(%edx),%xmm2
+ .byte 15,89,146,77,59,0,0 // mulps 0x3b4d(%edx),%xmm2
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,146,58,0,0 // movaps 0x3a92(%edx),%xmm3
+ .byte 15,40,154,93,59,0,0 // movaps 0x3b5d(%edx),%xmm3
.byte 81 // push %ecx
.byte 255,117,8 // pushl 0x8(%ebp)
.byte 255,80,4 // call *0x4(%eax)
@@ -55749,7 +56784,7 @@ _sk_store_565_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4121 <_sk_store_565_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4306 <_sk_store_565_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55759,8 +56794,8 @@ _sk_store_565_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,47,58,0,0 // movaps 0x3a2f(%edi),%xmm4
- .byte 15,40,175,63,58,0,0 // movaps 0x3a3f(%edi),%xmm5
+ .byte 15,40,167,250,58,0,0 // movaps 0x3afa(%edi),%xmm4
+ .byte 15,40,175,10,59,0,0 // movaps 0x3b0a(%edi),%xmm5
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,240 // movaps %xmm0,%xmm6
.byte 15,89,244 // mulps %xmm4,%xmm6
@@ -55780,7 +56815,7 @@ _sk_store_565_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 41b5 <_sk_store_565_sse2+0xa2>
+ .byte 117,34 // jne 439a <_sk_store_565_sse2+0xa2>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -55800,20 +56835,20 @@ _sk_store_565_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 41eb <_sk_store_565_sse2+0xd8>
+ .byte 116,37 // je 43d0 <_sk_store_565_sse2+0xd8>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 41da <_sk_store_565_sse2+0xc7>
+ .byte 116,15 // je 43bf <_sk_store_565_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 41a2 <_sk_store_565_sse2+0x8f>
+ .byte 117,210 // jne 4387 <_sk_store_565_sse2+0x8f>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 41a2 <_sk_store_565_sse2+0x8f>
+ .byte 235,183 // jmp 4387 <_sk_store_565_sse2+0x8f>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 41a2 <_sk_store_565_sse2+0x8f>
+ .byte 235,173 // jmp 4387 <_sk_store_565_sse2+0x8f>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -55825,7 +56860,7 @@ _sk_load_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4203 <_sk_load_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 43e8 <_sk_load_4444_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55837,24 +56872,24 @@ _sk_load_4444_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,112 // jne 4290 <_sk_load_4444_sse2+0x9b>
+ .byte 117,112 // jne 4475 <_sk_load_4444_sse2+0x9b>
.byte 243,15,126,28,126 // movq (%esi,%edi,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,130,109,57,0,0 // movdqa 0x396d(%edx),%xmm0
+ .byte 102,15,111,130,56,58,0,0 // movdqa 0x3a38(%edx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,130,125,57,0,0 // mulps 0x397d(%edx),%xmm0
- .byte 102,15,111,138,141,57,0,0 // movdqa 0x398d(%edx),%xmm1
+ .byte 15,89,130,72,58,0,0 // mulps 0x3a48(%edx),%xmm0
+ .byte 102,15,111,138,88,58,0,0 // movdqa 0x3a58(%edx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,138,157,57,0,0 // mulps 0x399d(%edx),%xmm1
- .byte 102,15,111,146,173,57,0,0 // movdqa 0x39ad(%edx),%xmm2
+ .byte 15,89,138,104,58,0,0 // mulps 0x3a68(%edx),%xmm1
+ .byte 102,15,111,146,120,58,0,0 // movdqa 0x3a78(%edx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,146,189,57,0,0 // mulps 0x39bd(%edx),%xmm2
- .byte 102,15,219,154,205,57,0,0 // pand 0x39cd(%edx),%xmm3
+ .byte 15,89,146,136,58,0,0 // mulps 0x3a88(%edx),%xmm2
+ .byte 102,15,219,154,152,58,0,0 // pand 0x3a98(%edx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,154,221,57,0,0 // mulps 0x39dd(%edx),%xmm3
+ .byte 15,89,154,168,58,0,0 // mulps 0x3aa8(%edx),%xmm3
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
.byte 82 // push %edx
@@ -55868,22 +56903,22 @@ _sk_load_4444_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,46 // je 42c6 <_sk_load_4444_sse2+0xd1>
+ .byte 116,46 // je 44ab <_sk_load_4444_sse2+0xd1>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,19 // je 42b4 <_sk_load_4444_sse2+0xbf>
+ .byte 116,19 // je 4499 <_sk_load_4444_sse2+0xbf>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,131 // jne 4229 <_sk_load_4444_sse2+0x34>
+ .byte 117,131 // jne 440e <_sk_load_4444_sse2+0x34>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,195 // movd %ebx,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,110,4,126 // movd (%esi,%edi,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,99,255,255,255 // jmp 4229 <_sk_load_4444_sse2+0x34>
+ .byte 233,99,255,255,255 // jmp 440e <_sk_load_4444_sse2+0x34>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,222 // movd %esi,%xmm3
- .byte 233,86,255,255,255 // jmp 4229 <_sk_load_4444_sse2+0x34>
+ .byte 233,86,255,255,255 // jmp 440e <_sk_load_4444_sse2+0x34>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -55895,7 +56930,7 @@ _sk_load_4444_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 42e1 <_sk_load_4444_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 44c6 <_sk_load_4444_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -55907,27 +56942,27 @@ _sk_load_4444_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,128,0,0,0 // jne 4382 <_sk_load_4444_dst_sse2+0xaf>
+ .byte 15,133,128,0,0,0 // jne 4567 <_sk_load_4444_dst_sse2+0xaf>
.byte 243,15,126,36,126 // movq (%esi,%edi,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,111,170,15,57,0,0 // movdqa 0x390f(%edx),%xmm5
+ .byte 102,15,111,170,218,57,0,0 // movdqa 0x39da(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,31,57,0,0 // mulps 0x391f(%edx),%xmm5
+ .byte 15,89,170,234,57,0,0 // mulps 0x39ea(%edx),%xmm5
.byte 15,41,105,16 // movaps %xmm5,0x10(%ecx)
- .byte 102,15,111,170,47,57,0,0 // movdqa 0x392f(%edx),%xmm5
+ .byte 102,15,111,170,250,57,0,0 // movdqa 0x39fa(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,63,57,0,0 // mulps 0x393f(%edx),%xmm5
+ .byte 15,89,170,10,58,0,0 // mulps 0x3a0a(%edx),%xmm5
.byte 15,41,105,32 // movaps %xmm5,0x20(%ecx)
- .byte 102,15,111,170,79,57,0,0 // movdqa 0x394f(%edx),%xmm5
+ .byte 102,15,111,170,26,58,0,0 // movdqa 0x3a1a(%edx),%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,170,95,57,0,0 // mulps 0x395f(%edx),%xmm5
+ .byte 15,89,170,42,58,0,0 // mulps 0x3a2a(%edx),%xmm5
.byte 15,41,105,48 // movaps %xmm5,0x30(%ecx)
- .byte 102,15,219,162,111,57,0,0 // pand 0x396f(%edx),%xmm4
+ .byte 102,15,219,162,58,58,0,0 // pand 0x3a3a(%edx),%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,162,127,57,0,0 // mulps 0x397f(%edx),%xmm4
+ .byte 15,89,162,74,58,0,0 // mulps 0x3a4a(%edx),%xmm4
.byte 15,41,97,64 // movaps %xmm4,0x40(%ecx)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -55942,22 +56977,22 @@ _sk_load_4444_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,50 // je 43bc <_sk_load_4444_dst_sse2+0xe9>
+ .byte 116,50 // je 45a1 <_sk_load_4444_dst_sse2+0xe9>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,23 // je 43aa <_sk_load_4444_dst_sse2+0xd7>
+ .byte 116,23 // je 458f <_sk_load_4444_dst_sse2+0xd7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,111,255,255,255 // jne 430b <_sk_load_4444_dst_sse2+0x38>
+ .byte 15,133,111,255,255,255 // jne 44f0 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,92,126,4 // movzwl 0x4(%esi,%edi,2),%ebx
.byte 102,15,110,227 // movd %ebx,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,110,44,126 // movd (%esi,%edi,2),%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,79,255,255,255 // jmp 430b <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,79,255,255,255 // jmp 44f0 <_sk_load_4444_dst_sse2+0x38>
.byte 15,183,52,126 // movzwl (%esi,%edi,2),%esi
.byte 102,15,110,230 // movd %esi,%xmm4
- .byte 233,66,255,255,255 // jmp 430b <_sk_load_4444_dst_sse2+0x38>
+ .byte 233,66,255,255,255 // jmp 44f0 <_sk_load_4444_dst_sse2+0x38>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -55993,25 +57028,25 @@ _sk_gather_4444_sse2:
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 15,183,12,74 // movzwl (%edx,%ecx,2),%ecx
.byte 102,15,196,217,3 // pinsrw $0x3,%ecx,%xmm3
- .byte 232,0,0,0,0 // call 4449 <_sk_gather_4444_sse2+0x80>
+ .byte 232,0,0,0,0 // call 462e <_sk_gather_4444_sse2+0x80>
.byte 89 // pop %ecx
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,129,39,56,0,0 // movdqa 0x3827(%ecx),%xmm0
+ .byte 102,15,111,129,242,56,0,0 // movdqa 0x38f2(%ecx),%xmm0
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,129,55,56,0,0 // mulps 0x3837(%ecx),%xmm0
- .byte 102,15,111,137,71,56,0,0 // movdqa 0x3847(%ecx),%xmm1
+ .byte 15,89,129,2,57,0,0 // mulps 0x3902(%ecx),%xmm0
+ .byte 102,15,111,137,18,57,0,0 // movdqa 0x3912(%ecx),%xmm1
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,137,87,56,0,0 // mulps 0x3857(%ecx),%xmm1
- .byte 102,15,111,145,103,56,0,0 // movdqa 0x3867(%ecx),%xmm2
+ .byte 15,89,137,34,57,0,0 // mulps 0x3922(%ecx),%xmm1
+ .byte 102,15,111,145,50,57,0,0 // movdqa 0x3932(%ecx),%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,145,119,56,0,0 // mulps 0x3877(%ecx),%xmm2
- .byte 102,15,219,153,135,56,0,0 // pand 0x3887(%ecx),%xmm3
+ .byte 15,89,145,66,57,0,0 // mulps 0x3942(%ecx),%xmm2
+ .byte 102,15,219,153,82,57,0,0 // pand 0x3952(%ecx),%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,153,151,56,0,0 // mulps 0x3897(%ecx),%xmm3
+ .byte 15,89,153,98,57,0,0 // mulps 0x3962(%ecx),%xmm3
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
.byte 81 // push %ecx
@@ -56031,7 +57066,7 @@ _sk_store_4444_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 44c6 <_sk_store_4444_sse2+0xe>
+ .byte 232,0,0,0,0 // call 46ab <_sk_store_4444_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56041,7 +57076,7 @@ _sk_store_4444_sse2:
.byte 1,210 // add %edx,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,42,56,0,0 // movaps 0x382a(%edi),%xmm4
+ .byte 15,40,167,245,56,0,0 // movaps 0x38f5(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -56067,7 +57102,7 @@ _sk_store_4444_sse2:
.byte 102,15,112,236,229 // pshufd $0xe5,%xmm4,%xmm5
.byte 102,15,126,109,236 // movd %xmm5,-0x14(%ebp)
.byte 133,219 // test %ebx,%ebx
- .byte 117,34 // jne 4569 <_sk_store_4444_sse2+0xb1>
+ .byte 117,34 // jne 474e <_sk_store_4444_sse2+0xb1>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,15,126,235 // movd %xmm5,%ebx
.byte 137,60,114 // mov %edi,(%edx,%esi,2)
@@ -56087,20 +57122,20 @@ _sk_store_4444_sse2:
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,37 // je 459f <_sk_store_4444_sse2+0xe7>
+ .byte 116,37 // je 4784 <_sk_store_4444_sse2+0xe7>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,15 // je 458e <_sk_store_4444_sse2+0xd6>
+ .byte 116,15 // je 4773 <_sk_store_4444_sse2+0xd6>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,210 // jne 4556 <_sk_store_4444_sse2+0x9e>
+ .byte 117,210 // jne 473b <_sk_store_4444_sse2+0x9e>
.byte 102,15,197,252,4 // pextrw $0x4,%xmm4,%edi
.byte 102,137,124,114,4 // mov %di,0x4(%edx,%esi,2)
.byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4
.byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4
.byte 102,15,126,36,114 // movd %xmm4,(%edx,%esi,2)
- .byte 235,183 // jmp 4556 <_sk_store_4444_sse2+0x9e>
+ .byte 235,183 // jmp 473b <_sk_store_4444_sse2+0x9e>
.byte 102,15,126,231 // movd %xmm4,%edi
.byte 102,137,60,114 // mov %di,(%edx,%esi,2)
- .byte 235,173 // jmp 4556 <_sk_store_4444_sse2+0x9e>
+ .byte 235,173 // jmp 473b <_sk_store_4444_sse2+0x9e>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -56112,7 +57147,7 @@ _sk_load_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 45b7 <_sk_load_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 479c <_sk_load_8888_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56124,13 +57159,13 @@ _sk_load_8888_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 463b <_sk_load_8888_sse2+0x92>
+ .byte 117,102 // jne 4820 <_sk_load_8888_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,146,73,55,0,0 // movdqa 0x3749(%edx),%xmm2
+ .byte 102,15,111,146,20,56,0,0 // movdqa 0x3814(%edx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,89,55,0,0 // movaps 0x3759(%edx),%xmm4
+ .byte 15,40,162,36,56,0,0 // movaps 0x3824(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -56158,18 +57193,18 @@ _sk_load_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 4666 <_sk_load_8888_sse2+0xbd>
+ .byte 116,35 // je 484b <_sk_load_8888_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 465c <_sk_load_8888_sse2+0xb3>
+ .byte 116,16 // je 4841 <_sk_load_8888_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 45da <_sk_load_8888_sse2+0x31>
+ .byte 117,137 // jne 47bf <_sk_load_8888_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 45da <_sk_load_8888_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 47bf <_sk_load_8888_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 45da <_sk_load_8888_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 47bf <_sk_load_8888_sse2+0x31>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -56181,7 +57216,7 @@ _sk_load_8888_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 467e <_sk_load_8888_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4863 <_sk_load_8888_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56193,13 +57228,13 @@ _sk_load_8888_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 4712 <_sk_load_8888_dst_sse2+0xa2>
+ .byte 117,118 // jne 48f7 <_sk_load_8888_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,162,54,0,0 // movdqa 0x36a2(%edx),%xmm5
+ .byte 102,15,111,170,109,55,0,0 // movdqa 0x376d(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,178,54,0,0 // movaps 0x36b2(%edx),%xmm7
+ .byte 15,40,186,125,55,0,0 // movaps 0x377d(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,16 // movaps %xmm6,0x10(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -56231,18 +57266,18 @@ _sk_load_8888_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 4741 <_sk_load_8888_dst_sse2+0xd1>
+ .byte 116,39 // je 4926 <_sk_load_8888_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4737 <_sk_load_8888_dst_sse2+0xc7>
+ .byte 116,20 // je 491c <_sk_load_8888_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 46a1 <_sk_load_8888_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 4886 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 46a1 <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 4886 <_sk_load_8888_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 46a1 <_sk_load_8888_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 4886 <_sk_load_8888_dst_sse2+0x31>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -56276,16 +57311,16 @@ _sk_gather_8888_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 47c1 <_sk_gather_8888_sse2+0x76>
+ .byte 232,0,0,0,0 // call 49a6 <_sk_gather_8888_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,145,127,53,0,0 // movdqa 0x357f(%ecx),%xmm2
+ .byte 102,15,111,145,74,54,0,0 // movdqa 0x364a(%ecx),%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,161,143,53,0,0 // movaps 0x358f(%ecx),%xmm4
+ .byte 15,40,161,90,54,0,0 // movaps 0x365a(%ecx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -56319,7 +57354,7 @@ _sk_store_8888_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 483c <_sk_store_8888_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4a21 <_sk_store_8888_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56329,7 +57364,7 @@ _sk_store_8888_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,36,53,0,0 // movaps 0x3524(%edi),%xmm4
+ .byte 15,40,167,239,53,0,0 // movaps 0x35ef(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -56349,7 +57384,7 @@ _sk_store_8888_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 48b9 <_sk_store_8888_sse2+0x8b>
+ .byte 117,24 // jne 4a9e <_sk_store_8888_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -56364,17 +57399,17 @@ _sk_store_8888_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 48dd <_sk_store_8888_sse2+0xaf>
+ .byte 116,28 // je 4ac2 <_sk_store_8888_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 48d6 <_sk_store_8888_sse2+0xa8>
+ .byte 116,16 // je 4abb <_sk_store_8888_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 48a6 <_sk_store_8888_sse2+0x78>
+ .byte 117,219 // jne 4a8b <_sk_store_8888_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 48a6 <_sk_store_8888_sse2+0x78>
+ .byte 235,201 // jmp 4a8b <_sk_store_8888_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 48a6 <_sk_store_8888_sse2+0x78>
+ .byte 235,194 // jmp 4a8b <_sk_store_8888_sse2+0x78>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -56386,7 +57421,7 @@ _sk_load_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 48f2 <_sk_load_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4ad7 <_sk_load_bgra_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56398,13 +57433,13 @@ _sk_load_bgra_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,102 // jne 4976 <_sk_load_bgra_sse2+0x92>
+ .byte 117,102 // jne 4b5b <_sk_load_bgra_sse2+0x92>
.byte 243,15,111,28,190 // movdqu (%esi,%edi,4),%xmm3
- .byte 102,15,111,130,126,52,0,0 // movdqa 0x347e(%edx),%xmm0
+ .byte 102,15,111,130,73,53,0,0 // movdqa 0x3549(%edx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,162,142,52,0,0 // movaps 0x348e(%edx),%xmm4
+ .byte 15,40,162,89,53,0,0 // movaps 0x3559(%edx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -56432,18 +57467,18 @@ _sk_load_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,35 // je 49a1 <_sk_load_bgra_sse2+0xbd>
+ .byte 116,35 // je 4b86 <_sk_load_bgra_sse2+0xbd>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4997 <_sk_load_bgra_sse2+0xb3>
+ .byte 116,16 // je 4b7c <_sk_load_bgra_sse2+0xb3>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,137 // jne 4915 <_sk_load_bgra_sse2+0x31>
+ .byte 117,137 // jne 4afa <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,68,190,8 // movd 0x8(%esi,%edi,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,15,18,28,190 // movlpd (%esi,%edi,4),%xmm3
- .byte 233,116,255,255,255 // jmp 4915 <_sk_load_bgra_sse2+0x31>
+ .byte 233,116,255,255,255 // jmp 4afa <_sk_load_bgra_sse2+0x31>
.byte 102,15,110,28,190 // movd (%esi,%edi,4),%xmm3
- .byte 233,106,255,255,255 // jmp 4915 <_sk_load_bgra_sse2+0x31>
+ .byte 233,106,255,255,255 // jmp 4afa <_sk_load_bgra_sse2+0x31>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -56455,7 +57490,7 @@ _sk_load_bgra_dst_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 49b9 <_sk_load_bgra_dst_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4b9e <_sk_load_bgra_dst_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56467,13 +57502,13 @@ _sk_load_bgra_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 117,118 // jne 4a4d <_sk_load_bgra_dst_sse2+0xa2>
+ .byte 117,118 // jne 4c32 <_sk_load_bgra_dst_sse2+0xa2>
.byte 243,15,111,36,190 // movdqu (%esi,%edi,4),%xmm4
- .byte 102,15,111,170,215,51,0,0 // movdqa 0x33d7(%edx),%xmm5
+ .byte 102,15,111,170,162,52,0,0 // movdqa 0x34a2(%edx),%xmm5
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,40,186,231,51,0,0 // movaps 0x33e7(%edx),%xmm7
+ .byte 15,40,186,178,52,0,0 // movaps 0x34b2(%edx),%xmm7
.byte 15,89,247 // mulps %xmm7,%xmm6
.byte 15,41,113,48 // movaps %xmm6,0x30(%ecx)
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
@@ -56505,18 +57540,18 @@ _sk_load_bgra_dst_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,39 // je 4a7c <_sk_load_bgra_dst_sse2+0xd1>
+ .byte 116,39 // je 4c61 <_sk_load_bgra_dst_sse2+0xd1>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,20 // je 4a72 <_sk_load_bgra_dst_sse2+0xc7>
+ .byte 116,20 // je 4c57 <_sk_load_bgra_dst_sse2+0xc7>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 15,133,117,255,255,255 // jne 49dc <_sk_load_bgra_dst_sse2+0x31>
+ .byte 15,133,117,255,255,255 // jne 4bc1 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,100,190,8 // movd 0x8(%esi,%edi,4),%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
.byte 102,15,18,36,190 // movlpd (%esi,%edi,4),%xmm4
- .byte 233,96,255,255,255 // jmp 49dc <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,96,255,255,255 // jmp 4bc1 <_sk_load_bgra_dst_sse2+0x31>
.byte 102,15,110,36,190 // movd (%esi,%edi,4),%xmm4
- .byte 233,86,255,255,255 // jmp 49dc <_sk_load_bgra_dst_sse2+0x31>
+ .byte 233,86,255,255,255 // jmp 4bc1 <_sk_load_bgra_dst_sse2+0x31>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -56550,16 +57585,16 @@ _sk_gather_bgra_sse2:
.byte 102,15,110,28,138 // movd (%edx,%ecx,4),%xmm3
.byte 102,15,126,193 // movd %xmm0,%ecx
.byte 102,15,110,4,138 // movd (%edx,%ecx,4),%xmm0
- .byte 232,0,0,0,0 // call 4afc <_sk_gather_bgra_sse2+0x76>
+ .byte 232,0,0,0,0 // call 4ce1 <_sk_gather_bgra_sse2+0x76>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,216 // punpckldq %xmm0,%xmm3
.byte 102,15,98,217 // punpckldq %xmm1,%xmm3
- .byte 102,15,111,129,180,50,0,0 // movdqa 0x32b4(%ecx),%xmm0
+ .byte 102,15,111,129,127,51,0,0 // movdqa 0x337f(%ecx),%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 15,40,161,196,50,0,0 // movaps 0x32c4(%ecx),%xmm4
+ .byte 15,40,161,143,51,0,0 // movaps 0x338f(%ecx),%xmm4
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -56593,7 +57628,7 @@ _sk_store_bgra_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,12 // sub $0xc,%esp
- .byte 232,0,0,0,0 // call 4b77 <_sk_store_bgra_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4d5c <_sk_store_bgra_sse2+0xe>
.byte 95 // pop %edi
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56603,7 +57638,7 @@ _sk_store_bgra_sse2:
.byte 193,226,2 // shl $0x2,%edx
.byte 3,22 // add (%esi),%edx
.byte 139,49 // mov (%ecx),%esi
- .byte 15,40,167,89,50,0,0 // movaps 0x3259(%edi),%xmm4
+ .byte 15,40,167,36,51,0,0 // movaps 0x3324(%edi),%xmm4
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 15,40,234 // movaps %xmm2,%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
@@ -56623,7 +57658,7 @@ _sk_store_bgra_sse2:
.byte 102,15,235,229 // por %xmm5,%xmm4
.byte 102,15,235,230 // por %xmm6,%xmm4
.byte 133,219 // test %ebx,%ebx
- .byte 117,24 // jne 4bf4 <_sk_store_bgra_sse2+0x8b>
+ .byte 117,24 // jne 4dd9 <_sk_store_bgra_sse2+0x8b>
.byte 243,15,127,36,178 // movdqu %xmm4,(%edx,%esi,4)
.byte 141,80,8 // lea 0x8(%eax),%edx
.byte 131,236,8 // sub $0x8,%esp
@@ -56638,17 +57673,17 @@ _sk_store_bgra_sse2:
.byte 195 // ret
.byte 128,227,3 // and $0x3,%bl
.byte 128,251,1 // cmp $0x1,%bl
- .byte 116,28 // je 4c18 <_sk_store_bgra_sse2+0xaf>
+ .byte 116,28 // je 4dfd <_sk_store_bgra_sse2+0xaf>
.byte 128,251,2 // cmp $0x2,%bl
- .byte 116,16 // je 4c11 <_sk_store_bgra_sse2+0xa8>
+ .byte 116,16 // je 4df6 <_sk_store_bgra_sse2+0xa8>
.byte 128,251,3 // cmp $0x3,%bl
- .byte 117,219 // jne 4be1 <_sk_store_bgra_sse2+0x78>
+ .byte 117,219 // jne 4dc6 <_sk_store_bgra_sse2+0x78>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,15,126,108,178,8 // movd %xmm5,0x8(%edx,%esi,4)
.byte 102,15,214,36,178 // movq %xmm4,(%edx,%esi,4)
- .byte 235,201 // jmp 4be1 <_sk_store_bgra_sse2+0x78>
+ .byte 235,201 // jmp 4dc6 <_sk_store_bgra_sse2+0x78>
.byte 102,15,126,36,178 // movd %xmm4,(%edx,%esi,4)
- .byte 235,194 // jmp 4be1 <_sk_store_bgra_sse2+0x78>
+ .byte 235,194 // jmp 4dc6 <_sk_store_bgra_sse2+0x78>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -56660,7 +57695,7 @@ _sk_load_f16_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,92 // sub $0x5c,%esp
- .byte 232,0,0,0,0 // call 4c2d <_sk_load_f16_sse2+0xe>
+ .byte 232,0,0,0,0 // call 4e12 <_sk_load_f16_sse2+0xe>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56672,7 +57707,7 @@ _sk_load_f16_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,160,1,0,0 // jne 4def <_sk_load_f16_sse2+0x1d0>
+ .byte 15,133,160,1,0,0 // jne 4fd4 <_sk_load_f16_sse2+0x1d0>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,216 // movapd %xmm0,%xmm3
@@ -56700,7 +57735,7 @@ _sk_load_f16_sse2:
.byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,154,179,49,0,0 // movdqa 0x31b3(%edx),%xmm3
+ .byte 102,15,111,154,126,50,0,0 // movdqa 0x327e(%edx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -56733,15 +57768,15 @@ _sk_load_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,154,195,49,0,0 // movdqa 0x31c3(%edx),%xmm3
+ .byte 102,15,111,154,142,50,0,0 // movdqa 0x328e(%edx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,154,211,49,0,0 // movdqa 0x31d3(%edx),%xmm3
+ .byte 102,15,111,154,158,50,0,0 // movdqa 0x329e(%edx),%xmm3
.byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,154,227,49,0,0 // movdqa 0x31e3(%edx),%xmm3
+ .byte 102,15,111,154,174,50,0,0 // movdqa 0x32ae(%edx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -56773,12 +57808,12 @@ _sk_load_f16_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,89,254,255,255 // je 4c5a <_sk_load_f16_sse2+0x3b>
+ .byte 15,132,89,254,255,255 // je 4e3f <_sk_load_f16_sse2+0x3b>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,74,254,255,255 // jb 4c5a <_sk_load_f16_sse2+0x3b>
+ .byte 15,130,74,254,255,255 // jb 4e3f <_sk_load_f16_sse2+0x3b>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,63,254,255,255 // jmp 4c5a <_sk_load_f16_sse2+0x3b>
+ .byte 233,63,254,255,255 // jmp 4e3f <_sk_load_f16_sse2+0x3b>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -56794,7 +57829,7 @@ _sk_load_f16_dst_sse2:
.byte 15,41,149,120,255,255,255 // movaps %xmm2,-0x88(%ebp)
.byte 102,15,127,77,136 // movdqa %xmm1,-0x78(%ebp)
.byte 15,41,69,152 // movaps %xmm0,-0x68(%ebp)
- .byte 232,0,0,0,0 // call 4e43 <_sk_load_f16_dst_sse2+0x28>
+ .byte 232,0,0,0,0 // call 5028 <_sk_load_f16_dst_sse2+0x28>
.byte 90 // pop %edx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
@@ -56806,7 +57841,7 @@ _sk_load_f16_dst_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 133,219 // test %ebx,%ebx
.byte 139,57 // mov (%ecx),%edi
- .byte 15,133,206,1,0,0 // jne 5033 <_sk_load_f16_dst_sse2+0x218>
+ .byte 15,133,206,1,0,0 // jne 5218 <_sk_load_f16_dst_sse2+0x218>
.byte 102,15,16,4,254 // movupd (%esi,%edi,8),%xmm0
.byte 243,15,111,76,254,16 // movdqu 0x10(%esi,%edi,8),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -56834,7 +57869,7 @@ _sk_load_f16_dst_sse2:
.byte 102,15,126,85,232 // movd %xmm2,-0x18(%ebp)
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
- .byte 102,15,111,154,221,47,0,0 // movdqa 0x2fdd(%edx),%xmm3
+ .byte 102,15,111,154,168,48,0,0 // movdqa 0x30a8(%edx),%xmm3
.byte 102,15,111,212 // movdqa %xmm4,%xmm2
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 102,15,239,226 // pxor %xmm2,%xmm4
@@ -56842,13 +57877,13 @@ _sk_load_f16_dst_sse2:
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,15,111,146,253,47,0,0 // movdqa 0x2ffd(%edx),%xmm2
+ .byte 102,15,111,146,200,48,0,0 // movdqa 0x30c8(%edx),%xmm2
.byte 102,15,127,85,168 // movdqa %xmm2,-0x58(%ebp)
.byte 102,15,239,226 // pxor %xmm2,%xmm4
- .byte 102,15,111,178,13,48,0,0 // movdqa 0x300d(%edx),%xmm6
+ .byte 102,15,111,178,216,48,0,0 // movdqa 0x30d8(%edx),%xmm6
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,15,102,252 // pcmpgtd %xmm4,%xmm7
- .byte 102,15,111,146,237,47,0,0 // movdqa 0x2fed(%edx),%xmm2
+ .byte 102,15,111,146,184,48,0,0 // movdqa 0x30b8(%edx),%xmm2
.byte 102,15,127,85,184 // movdqa %xmm2,-0x48(%ebp)
.byte 102,15,254,202 // paddd %xmm2,%xmm1
.byte 102,15,223,249 // pandn %xmm1,%xmm7
@@ -56916,12 +57951,12 @@ _sk_load_f16_dst_sse2:
.byte 242,15,16,4,254 // movsd (%esi,%edi,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,43,254,255,255 // je 4e70 <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,132,43,254,255,255 // je 5055 <_sk_load_f16_dst_sse2+0x55>
.byte 102,15,22,68,254,8 // movhpd 0x8(%esi,%edi,8),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,28,254,255,255 // jb 4e70 <_sk_load_f16_dst_sse2+0x55>
+ .byte 15,130,28,254,255,255 // jb 5055 <_sk_load_f16_dst_sse2+0x55>
.byte 243,15,126,76,254,16 // movq 0x10(%esi,%edi,8),%xmm1
- .byte 233,17,254,255,255 // jmp 4e70 <_sk_load_f16_dst_sse2+0x55>
+ .byte 233,17,254,255,255 // jmp 5055 <_sk_load_f16_dst_sse2+0x55>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -56959,7 +57994,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,194 // movd %xmm0,%edx
.byte 102,15,110,68,209,4 // movd 0x4(%ecx,%edx,8),%xmm0
.byte 102,15,110,60,209 // movd (%ecx,%edx,8),%xmm7
- .byte 232,0,0,0,0 // call 50ed <_sk_gather_f16_sse2+0x8e>
+ .byte 232,0,0,0,0 // call 52d2 <_sk_gather_f16_sse2+0x8e>
.byte 89 // pop %ecx
.byte 102,15,98,202 // punpckldq %xmm2,%xmm1
.byte 102,15,98,227 // punpckldq %xmm3,%xmm4
@@ -56992,7 +58027,7 @@ _sk_gather_f16_sse2:
.byte 102,15,126,69,248 // movd %xmm0,-0x8(%ebp)
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
- .byte 102,15,111,153,115,45,0,0 // movdqa 0x2d73(%ecx),%xmm3
+ .byte 102,15,111,153,62,46,0,0 // movdqa 0x2e3e(%ecx),%xmm3
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,219,227 // pand %xmm3,%xmm4
.byte 102,15,239,204 // pxor %xmm4,%xmm1
@@ -57025,15 +58060,15 @@ _sk_gather_f16_sse2:
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,114,240,13 // pslld $0xd,%xmm0
.byte 102,15,235,195 // por %xmm3,%xmm0
- .byte 102,15,111,153,131,45,0,0 // movdqa 0x2d83(%ecx),%xmm3
+ .byte 102,15,111,153,78,46,0,0 // movdqa 0x2e4e(%ecx),%xmm3
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,254,243 // paddd %xmm3,%xmm6
.byte 102,15,254,235 // paddd %xmm3,%xmm5
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,153,147,45,0,0 // movdqa 0x2d93(%ecx),%xmm3
+ .byte 102,15,111,153,94,46,0,0 // movdqa 0x2e5e(%ecx),%xmm3
.byte 102,15,127,93,200 // movdqa %xmm3,-0x38(%ebp)
.byte 102,15,239,203 // pxor %xmm3,%xmm1
- .byte 102,15,111,153,163,45,0,0 // movdqa 0x2da3(%ecx),%xmm3
+ .byte 102,15,111,153,110,46,0,0 // movdqa 0x2e6e(%ecx),%xmm3
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
.byte 102,15,102,225 // pcmpgtd %xmm1,%xmm4
.byte 102,15,223,226 // pandn %xmm2,%xmm4
@@ -57072,20 +58107,20 @@ _sk_store_f16_sse2:
.byte 131,236,80 // sub $0x50,%esp
.byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp)
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 52b0 <_sk_store_f16_sse2+0x15>
+ .byte 232,0,0,0,0 // call 5495 <_sk_store_f16_sse2+0x15>
.byte 88 // pop %eax
- .byte 102,15,111,176,240,43,0,0 // movdqa 0x2bf0(%eax),%xmm6
+ .byte 102,15,111,176,187,44,0,0 // movdqa 0x2cbb(%eax),%xmm6
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,15,219,214 // pand %xmm6,%xmm2
.byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp)
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 102,15,239,234 // pxor %xmm2,%xmm5
- .byte 102,15,111,160,0,44,0,0 // movdqa 0x2c00(%eax),%xmm4
+ .byte 102,15,111,160,203,44,0,0 // movdqa 0x2ccb(%eax),%xmm4
.byte 102,15,114,210,16 // psrld $0x10,%xmm2
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0
.byte 102,15,114,213,13 // psrld $0xd,%xmm5
- .byte 102,15,111,184,16,44,0,0 // movdqa 0x2c10(%eax),%xmm7
+ .byte 102,15,111,184,219,44,0,0 // movdqa 0x2cdb(%eax),%xmm7
.byte 102,15,254,215 // paddd %xmm7,%xmm2
.byte 102,15,127,125,232 // movdqa %xmm7,-0x18(%ebp)
.byte 102,15,254,213 // paddd %xmm5,%xmm2
@@ -57147,7 +58182,7 @@ _sk_store_f16_sse2:
.byte 3,55 // add (%edi),%esi
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,53 // jne 5422 <_sk_store_f16_sse2+0x187>
+ .byte 117,53 // jne 5607 <_sk_store_f16_sse2+0x187>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,98,197 // punpckldq %xmm5,%xmm0
.byte 243,15,127,4,214 // movdqu %xmm0,(%esi,%edx,8)
@@ -57170,13 +58205,13 @@ _sk_store_f16_sse2:
.byte 102,15,98,213 // punpckldq %xmm5,%xmm2
.byte 102,15,214,20,214 // movq %xmm2,(%esi,%edx,8)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,208 // je 5404 <_sk_store_f16_sse2+0x169>
+ .byte 116,208 // je 55e9 <_sk_store_f16_sse2+0x169>
.byte 102,15,23,84,214,8 // movhpd %xmm2,0x8(%esi,%edx,8)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,197 // jb 5404 <_sk_store_f16_sse2+0x169>
+ .byte 114,197 // jb 55e9 <_sk_store_f16_sse2+0x169>
.byte 102,15,106,205 // punpckhdq %xmm5,%xmm1
.byte 102,15,214,76,214,16 // movq %xmm1,0x10(%esi,%edx,8)
- .byte 235,185 // jmp 5404 <_sk_store_f16_sse2+0x169>
+ .byte 235,185 // jmp 55e9 <_sk_store_f16_sse2+0x169>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -57199,9 +58234,9 @@ _sk_load_u16_be_sse2:
.byte 139,89,8 // mov 0x8(%ecx),%ebx
.byte 193,230,2 // shl $0x2,%esi
.byte 133,219 // test %ebx,%ebx
- .byte 232,0,0,0,0 // call 5476 <_sk_load_u16_be_sse2+0x2b>
+ .byte 232,0,0,0,0 // call 565b <_sk_load_u16_be_sse2+0x2b>
.byte 90 // pop %edx
- .byte 15,133,11,1,0,0 // jne 5588 <_sk_load_u16_be_sse2+0x13d>
+ .byte 15,133,11,1,0,0 // jne 576d <_sk_load_u16_be_sse2+0x13d>
.byte 102,15,16,4,119 // movupd (%edi,%esi,2),%xmm0
.byte 243,15,111,76,119,16 // movdqu 0x10(%edi,%esi,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -57222,7 +58257,7 @@ _sk_load_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,162,90,42,0,0 // movaps 0x2a5a(%edx),%xmm4
+ .byte 15,40,162,37,43,0,0 // movaps 0x2b25(%edx),%xmm4
.byte 15,89,196 // mulps %xmm4,%xmm0
.byte 102,15,111,205 // movdqa %xmm5,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -57272,12 +58307,12 @@ _sk_load_u16_be_sse2:
.byte 242,15,16,4,119 // movsd (%edi,%esi,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,251,1 // cmp $0x1,%ebx
- .byte 15,132,238,254,255,255 // je 5488 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,132,238,254,255,255 // je 566d <_sk_load_u16_be_sse2+0x3d>
.byte 102,15,22,68,119,8 // movhpd 0x8(%edi,%esi,2),%xmm0
.byte 131,251,3 // cmp $0x3,%ebx
- .byte 15,130,223,254,255,255 // jb 5488 <_sk_load_u16_be_sse2+0x3d>
+ .byte 15,130,223,254,255,255 // jb 566d <_sk_load_u16_be_sse2+0x3d>
.byte 243,15,126,76,119,16 // movq 0x10(%edi,%esi,2),%xmm1
- .byte 233,212,254,255,255 // jmp 5488 <_sk_load_u16_be_sse2+0x3d>
+ .byte 233,212,254,255,255 // jmp 566d <_sk_load_u16_be_sse2+0x3d>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -57299,9 +58334,9 @@ _sk_load_rgb_u16_be_sse2:
.byte 3,50 // add (%edx),%esi
.byte 107,25,3 // imul $0x3,(%ecx),%ebx
.byte 133,255 // test %edi,%edi
- .byte 232,0,0,0,0 // call 55dd <_sk_load_rgb_u16_be_sse2+0x29>
+ .byte 232,0,0,0,0 // call 57c2 <_sk_load_rgb_u16_be_sse2+0x29>
.byte 90 // pop %edx
- .byte 15,133,240,0,0,0 // jne 56d4 <_sk_load_rgb_u16_be_sse2+0x120>
+ .byte 15,133,240,0,0,0 // jne 58b9 <_sk_load_rgb_u16_be_sse2+0x120>
.byte 243,15,111,20,94 // movdqu (%esi,%ebx,2),%xmm2
.byte 243,15,111,92,94,8 // movdqu 0x8(%esi,%ebx,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -57326,7 +58361,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,97,195 // punpcklwd %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,40,170,3,41,0,0 // movaps 0x2903(%edx),%xmm5
+ .byte 15,40,170,206,41,0,0 // movaps 0x29ce(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 102,15,111,204 // movdqa %xmm4,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -57352,7 +58387,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,89,213 // mulps %xmm5,%xmm2
.byte 141,112,8 // lea 0x8(%eax),%esi
.byte 131,236,8 // sub $0x8,%esp
- .byte 15,40,154,19,41,0,0 // movaps 0x2913(%edx),%xmm3
+ .byte 15,40,154,222,41,0,0 // movaps 0x29de(%edx),%xmm3
.byte 86 // push %esi
.byte 81 // push %ecx
.byte 255,80,4 // call *0x4(%eax)
@@ -57366,20 +58401,20 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,15,196,84,94,4,2 // pinsrw $0x2,0x4(%esi,%ebx,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,13 // jne 56f6 <_sk_load_rgb_u16_be_sse2+0x142>
+ .byte 117,13 // jne 58db <_sk_load_rgb_u16_be_sse2+0x142>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,16,255,255,255 // jmp 5606 <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,16,255,255,255 // jmp 57eb <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,110,68,94,6 // movd 0x6(%esi,%ebx,2),%xmm0
.byte 102,15,196,68,94,10,2 // pinsrw $0x2,0xa(%esi,%ebx,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,18 // jb 571e <_sk_load_rgb_u16_be_sse2+0x16a>
+ .byte 114,18 // jb 5903 <_sk_load_rgb_u16_be_sse2+0x16a>
.byte 102,15,110,92,94,12 // movd 0xc(%esi,%ebx,2),%xmm3
.byte 102,15,196,92,94,16,2 // pinsrw $0x2,0x10(%esi,%ebx,2),%xmm3
- .byte 233,232,254,255,255 // jmp 5606 <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,232,254,255,255 // jmp 57eb <_sk_load_rgb_u16_be_sse2+0x52>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,223,254,255,255 // jmp 5606 <_sk_load_rgb_u16_be_sse2+0x52>
+ .byte 233,223,254,255,255 // jmp 57eb <_sk_load_rgb_u16_be_sse2+0x52>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -57391,9 +58426,9 @@ _sk_store_u16_be_sse2:
.byte 86 // push %esi
.byte 131,236,16 // sub $0x10,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
- .byte 232,0,0,0,0 // call 5738 <_sk_store_u16_be_sse2+0x11>
+ .byte 232,0,0,0,0 // call 591d <_sk_store_u16_be_sse2+0x11>
.byte 88 // pop %eax
- .byte 15,40,176,200,39,0,0 // movaps 0x27c8(%eax),%xmm6
+ .byte 15,40,176,147,40,0,0 // movaps 0x2893(%eax),%xmm6
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,89,230 // mulps %xmm6,%xmm4
.byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4
@@ -57446,7 +58481,7 @@ _sk_store_u16_be_sse2:
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 193,226,2 // shl $0x2,%edx
.byte 133,255 // test %edi,%edi
- .byte 117,45 // jne 583a <_sk_store_u16_be_sse2+0x113>
+ .byte 117,45 // jne 5a1f <_sk_store_u16_be_sse2+0x113>
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,98,221 // punpckldq %xmm5,%xmm3
.byte 243,15,127,28,86 // movdqu %xmm3,(%esi,%edx,2)
@@ -57467,13 +58502,13 @@ _sk_store_u16_be_sse2:
.byte 102,15,98,245 // punpckldq %xmm5,%xmm6
.byte 102,15,214,52,86 // movq %xmm6,(%esi,%edx,2)
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,216 // je 5824 <_sk_store_u16_be_sse2+0xfd>
+ .byte 116,216 // je 5a09 <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,23,116,86,8 // movhpd %xmm6,0x8(%esi,%edx,2)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,205 // jb 5824 <_sk_store_u16_be_sse2+0xfd>
+ .byte 114,205 // jb 5a09 <_sk_store_u16_be_sse2+0xfd>
.byte 102,15,106,229 // punpckhdq %xmm5,%xmm4
.byte 102,15,214,100,86,16 // movq %xmm4,0x10(%esi,%edx,2)
- .byte 235,193 // jmp 5824 <_sk_store_u16_be_sse2+0xfd>
+ .byte 235,193 // jmp 5a09 <_sk_store_u16_be_sse2+0xfd>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -57496,7 +58531,7 @@ _sk_load_f32_sse2:
.byte 15,16,36,23 // movups (%edi,%edx,1),%xmm4
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,71 // jne 58da <_sk_load_f32_sse2+0x77>
+ .byte 117,71 // jne 5abf <_sk_load_f32_sse2+0x77>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,68,178,48 // movups 0x30(%edx,%esi,4),%xmm0
@@ -57524,17 +58559,17 @@ _sk_load_f32_sse2:
.byte 195 // ret
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 58ea <_sk_load_f32_sse2+0x87>
+ .byte 117,8 // jne 5acf <_sk_load_f32_sse2+0x87>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,210 // xorps %xmm2,%xmm2
- .byte 235,184 // jmp 58a2 <_sk_load_f32_sse2+0x3f>
+ .byte 235,184 // jmp 5a87 <_sk_load_f32_sse2+0x3f>
.byte 15,16,84,178,16 // movups 0x10(%edx,%esi,4),%xmm2
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 58fb <_sk_load_f32_sse2+0x98>
+ .byte 114,7 // jb 5ae0 <_sk_load_f32_sse2+0x98>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,167 // jmp 58a2 <_sk_load_f32_sse2+0x3f>
+ .byte 235,167 // jmp 5a87 <_sk_load_f32_sse2+0x3f>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,162 // jmp 58a2 <_sk_load_f32_sse2+0x3f>
+ .byte 235,162 // jmp 5a87 <_sk_load_f32_sse2+0x3f>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -57560,7 +58595,7 @@ _sk_load_f32_dst_sse2:
.byte 15,16,52,23 // movups (%edi,%edx,1),%xmm6
.byte 139,121,8 // mov 0x8(%ecx),%edi
.byte 133,255 // test %edi,%edi
- .byte 117,97 // jne 599c <_sk_load_f32_dst_sse2+0x9c>
+ .byte 117,97 // jne 5b81 <_sk_load_f32_dst_sse2+0x9c>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
.byte 15,16,84,178,48 // movups 0x30(%edx,%esi,4),%xmm2
@@ -57594,17 +58629,17 @@ _sk_load_f32_dst_sse2:
.byte 195 // ret
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 131,255,1 // cmp $0x1,%edi
- .byte 117,8 // jne 59ac <_sk_load_f32_dst_sse2+0xac>
+ .byte 117,8 // jne 5b91 <_sk_load_f32_dst_sse2+0xac>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,158 // jmp 594a <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,158 // jmp 5b2f <_sk_load_f32_dst_sse2+0x4a>
.byte 15,16,124,178,16 // movups 0x10(%edx,%esi,4),%xmm7
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,7 // jb 59bd <_sk_load_f32_dst_sse2+0xbd>
+ .byte 114,7 // jb 5ba2 <_sk_load_f32_dst_sse2+0xbd>
.byte 15,16,92,178,32 // movups 0x20(%edx,%esi,4),%xmm3
- .byte 235,141 // jmp 594a <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,141 // jmp 5b2f <_sk_load_f32_dst_sse2+0x4a>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,136 // jmp 594a <_sk_load_f32_dst_sse2+0x4a>
+ .byte 235,136 // jmp 5b2f <_sk_load_f32_dst_sse2+0x4a>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -57642,7 +58677,7 @@ _sk_store_f32_sse2:
.byte 15,40,238 // movaps %xmm6,%xmm5
.byte 102,15,20,239 // unpcklpd %xmm7,%xmm5
.byte 133,255 // test %edi,%edi
- .byte 117,40 // jne 5a48 <_sk_store_f32_sse2+0x86>
+ .byte 117,40 // jne 5c2d <_sk_store_f32_sse2+0x86>
.byte 102,15,21,247 // unpckhpd %xmm7,%xmm6
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
@@ -57659,12 +58694,12 @@ _sk_store_f32_sse2:
.byte 93 // pop %ebp
.byte 195 // ret
.byte 131,255,1 // cmp $0x1,%edi
- .byte 116,232 // je 5a35 <_sk_store_f32_sse2+0x73>
+ .byte 116,232 // je 5c1a <_sk_store_f32_sse2+0x73>
.byte 15,17,100,178,16 // movups %xmm4,0x10(%edx,%esi,4)
.byte 131,255,3 // cmp $0x3,%edi
- .byte 114,222 // jb 5a35 <_sk_store_f32_sse2+0x73>
+ .byte 114,222 // jb 5c1a <_sk_store_f32_sse2+0x73>
.byte 102,15,17,108,178,32 // movupd %xmm5,0x20(%edx,%esi,4)
- .byte 235,214 // jmp 5a35 <_sk_store_f32_sse2+0x73>
+ .byte 235,214 // jmp 5c1a <_sk_store_f32_sse2+0x73>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -57725,7 +58760,7 @@ _sk_repeat_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5adc <_sk_repeat_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5cc1 <_sk_repeat_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -57736,7 +58771,7 @@ _sk_repeat_x_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,52,36,0,0 // andps 0x2434(%ecx),%xmm6
+ .byte 15,84,177,255,36,0,0 // andps 0x24ff(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -57763,7 +58798,7 @@ _sk_repeat_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5b42 <_sk_repeat_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5d27 <_sk_repeat_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -57774,7 +58809,7 @@ _sk_repeat_y_sse2:
.byte 243,15,91,230 // cvttps2dq %xmm6,%xmm4
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,222,35,0,0 // andps 0x23de(%ecx),%xmm6
+ .byte 15,84,177,169,36,0,0 // andps 0x24a9(%ecx),%xmm6
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -57801,7 +58836,7 @@ _sk_mirror_x_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5ba8 <_sk_mirror_x_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5d8d <_sk_mirror_x_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -57810,13 +58845,13 @@ _sk_mirror_x_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 243,15,89,177,120,40,0,0 // mulss 0x2878(%ecx),%xmm6
+ .byte 243,15,89,177,67,41,0,0 // mulss 0x2943(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,136,35,0,0 // andps 0x2388(%ecx),%xmm6
+ .byte 15,84,177,83,36,0,0 // andps 0x2453(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -57847,7 +58882,7 @@ _sk_mirror_y_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5c2d <_sk_mirror_y_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e12 <_sk_mirror_y_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -57856,13 +58891,13 @@ _sk_mirror_y_sse2:
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,204 // subps %xmm4,%xmm1
- .byte 243,15,89,177,247,39,0,0 // mulss 0x27f7(%ecx),%xmm6
+ .byte 243,15,89,177,194,40,0,0 // mulss 0x28c2(%ecx),%xmm6
.byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6
.byte 15,89,241 // mulps %xmm1,%xmm6
.byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
.byte 15,194,247,1 // cmpltps %xmm7,%xmm6
- .byte 15,84,177,19,35,0,0 // andps 0x2313(%ecx),%xmm6
+ .byte 15,84,177,222,35,0,0 // andps 0x23de(%ecx),%xmm6
.byte 15,92,254 // subps %xmm6,%xmm7
.byte 243,15,88,237 // addss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
@@ -57893,12 +58928,12 @@ _sk_clamp_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5cb2 <_sk_clamp_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5e97 <_sk_clamp_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,95,224 // maxps %xmm0,%xmm4
- .byte 15,93,160,158,34,0,0 // minps 0x229e(%eax),%xmm4
+ .byte 15,93,160,105,35,0,0 // minps 0x2369(%eax),%xmm4
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,196 // movaps %xmm4,%xmm0
@@ -57916,14 +58951,14 @@ _sk_repeat_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5ce2 <_sk_repeat_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5ec7 <_sk_repeat_x_1_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 243,15,91,224 // cvttps2dq %xmm0,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,84,168,126,34,0,0 // andps 0x227e(%eax),%xmm5
+ .byte 15,84,168,73,35,0,0 // andps 0x2349(%eax),%xmm5
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -57942,17 +58977,17 @@ _sk_mirror_x_1_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 5d1d <_sk_mirror_x_1_sse2+0xb>
+ .byte 232,0,0,0,0 // call 5f02 <_sk_mirror_x_1_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
- .byte 15,40,161,83,34,0,0 // movaps 0x2253(%ecx),%xmm4
+ .byte 15,40,161,30,35,0,0 // movaps 0x231e(%ecx),%xmm4
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,169,99,34,0,0 // movaps 0x2263(%ecx),%xmm5
+ .byte 15,40,169,46,35,0,0 // movaps 0x232e(%ecx),%xmm5
.byte 15,89,232 // mulps %xmm0,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,194,238,1 // cmpltps %xmm6,%xmm5
- .byte 15,84,169,115,34,0,0 // andps 0x2273(%ecx),%xmm5
+ .byte 15,84,169,62,35,0,0 // andps 0x233e(%ecx),%xmm5
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 15,88,246 // addps %xmm6,%xmm6
@@ -57977,13 +59012,13 @@ _sk_luminance_to_alpha_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 5d7b <_sk_luminance_to_alpha_sse2+0xe>
+ .byte 232,0,0,0,0 // call 5f60 <_sk_luminance_to_alpha_sse2+0xe>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,89,128,37,34,0,0 // mulps 0x2225(%eax),%xmm0
- .byte 15,89,136,53,34,0,0 // mulps 0x2235(%eax),%xmm1
+ .byte 15,89,128,240,34,0,0 // mulps 0x22f0(%eax),%xmm0
+ .byte 15,89,136,0,35,0,0 // mulps 0x2300(%eax),%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,152,69,34,0,0 // mulps 0x2245(%eax),%xmm3
+ .byte 15,89,152,16,35,0,0 // mulps 0x2310(%eax),%xmm3
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -58373,7 +59408,7 @@ _sk_evenly_spaced_gradient_sse2:
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
.byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp)
- .byte 232,0,0,0,0 // call 6218 <_sk_evenly_spaced_gradient_sse2+0x12>
+ .byte 232,0,0,0,0 // call 63fd <_sk_evenly_spaced_gradient_sse2+0x12>
.byte 90 // pop %edx
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,65,4 // lea 0x4(%ecx),%eax
@@ -58384,12 +59419,12 @@ _sk_evenly_spaced_gradient_sse2:
.byte 78 // dec %esi
.byte 102,15,110,206 // movd %esi,%xmm1
.byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1
- .byte 102,15,111,146,184,29,0,0 // movdqa 0x1db8(%edx),%xmm2
+ .byte 102,15,111,146,131,30,0,0 // movdqa 0x1e83(%edx),%xmm2
.byte 102,15,219,209 // pand %xmm1,%xmm2
- .byte 102,15,235,146,200,29,0,0 // por 0x1dc8(%edx),%xmm2
+ .byte 102,15,235,146,147,30,0,0 // por 0x1e93(%edx),%xmm2
.byte 102,15,114,209,16 // psrld $0x10,%xmm1
- .byte 102,15,235,138,216,29,0,0 // por 0x1dd8(%edx),%xmm1
- .byte 15,88,138,232,29,0,0 // addps 0x1de8(%edx),%xmm1
+ .byte 102,15,235,138,163,30,0,0 // por 0x1ea3(%edx),%xmm1
+ .byte 15,88,138,179,30,0,0 // addps 0x1eb3(%edx),%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1
@@ -58496,18 +59531,18 @@ _sk_gauss_a_to_rgba_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 63ce <_sk_gauss_a_to_rgba_sse2+0xb>
+ .byte 232,0,0,0,0 // call 65b3 <_sk_gauss_a_to_rgba_sse2+0xb>
.byte 88 // pop %eax
.byte 139,77,12 // mov 0xc(%ebp),%ecx
- .byte 15,40,128,66,28,0,0 // movaps 0x1c42(%eax),%xmm0
+ .byte 15,40,128,13,29,0,0 // movaps 0x1d0d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,82,28,0,0 // addps 0x1c52(%eax),%xmm0
+ .byte 15,88,128,29,29,0,0 // addps 0x1d1d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,98,28,0,0 // addps 0x1c62(%eax),%xmm0
+ .byte 15,88,128,45,29,0,0 // addps 0x1d2d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,114,28,0,0 // addps 0x1c72(%eax),%xmm0
+ .byte 15,88,128,61,29,0,0 // addps 0x1d3d(%eax),%xmm0
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,128,130,28,0,0 // addps 0x1c82(%eax),%xmm0
+ .byte 15,88,128,77,29,0,0 // addps 0x1d4d(%eax),%xmm0
.byte 141,65,4 // lea 0x4(%ecx),%eax
.byte 131,236,8 // sub $0x8,%esp
.byte 15,40,200 // movaps %xmm0,%xmm1
@@ -58530,7 +59565,7 @@ _sk_gradient_sse2:
.byte 87 // push %edi
.byte 86 // push %esi
.byte 131,236,60 // sub $0x3c,%esp
- .byte 232,0,0,0,0 // call 6429 <_sk_gradient_sse2+0xe>
+ .byte 232,0,0,0,0 // call 660e <_sk_gradient_sse2+0xe>
.byte 95 // pop %edi
.byte 139,77,12 // mov 0xc(%ebp),%ecx
.byte 141,81,4 // lea 0x4(%ecx),%edx
@@ -58539,12 +59574,12 @@ _sk_gradient_sse2:
.byte 139,17 // mov (%ecx),%edx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 131,250,2 // cmp $0x2,%edx
- .byte 114,43 // jb 646b <_sk_gradient_sse2+0x50>
+ .byte 114,43 // jb 6650 <_sk_gradient_sse2+0x50>
.byte 139,113,36 // mov 0x24(%ecx),%esi
.byte 74 // dec %edx
.byte 131,198,4 // add $0x4,%esi
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,151,55,28,0,0 // movaps 0x1c37(%edi),%xmm2
+ .byte 15,40,151,2,29,0,0 // movaps 0x1d02(%edi),%xmm2
.byte 243,15,16,30 // movss (%esi),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -58552,7 +59587,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 131,198,4 // add $0x4,%esi
.byte 74 // dec %edx
- .byte 117,231 // jne 6452 <_sk_gradient_sse2+0x37>
+ .byte 117,231 // jne 6637 <_sk_gradient_sse2+0x37>
.byte 102,15,126,202 // movd %xmm1,%edx
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,15,126,214 // movd %xmm2,%esi
@@ -58704,7 +59739,7 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 15,40,200 // movaps %xmm0,%xmm1
- .byte 232,0,0,0,0 // call 6665 <_sk_xy_to_unit_angle_sse2+0x18>
+ .byte 232,0,0,0,0 // call 684a <_sk_xy_to_unit_angle_sse2+0x18>
.byte 88 // pop %eax
.byte 15,87,237 // xorps %xmm5,%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
@@ -58719,30 +59754,30 @@ _sk_xy_to_unit_angle_sse2:
.byte 15,94,247 // divps %xmm7,%xmm6
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,255 // mulps %xmm7,%xmm7
- .byte 15,40,128,11,26,0,0 // movaps 0x1a0b(%eax),%xmm0
+ .byte 15,40,128,214,26,0,0 // movaps 0x1ad6(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,27,26,0,0 // addps 0x1a1b(%eax),%xmm0
+ .byte 15,88,128,230,26,0,0 // addps 0x1ae6(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,43,26,0,0 // addps 0x1a2b(%eax),%xmm0
+ .byte 15,88,128,246,26,0,0 // addps 0x1af6(%eax),%xmm0
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 15,88,128,59,26,0,0 // addps 0x1a3b(%eax),%xmm0
+ .byte 15,88,128,6,27,0,0 // addps 0x1b06(%eax),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,194,236,1 // cmpltps %xmm4,%xmm5
- .byte 15,40,176,75,26,0,0 // movaps 0x1a4b(%eax),%xmm6
+ .byte 15,40,176,22,27,0,0 // movaps 0x1b16(%eax),%xmm6
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,84,245 // andps %xmm5,%xmm6
.byte 15,85,232 // andnps %xmm0,%xmm5
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,86,238 // orps %xmm6,%xmm5
.byte 15,194,204,1 // cmpltps %xmm4,%xmm1
- .byte 15,40,128,91,26,0,0 // movaps 0x1a5b(%eax),%xmm0
+ .byte 15,40,128,38,27,0,0 // movaps 0x1b26(%eax),%xmm0
.byte 15,92,197 // subps %xmm5,%xmm0
.byte 15,84,193 // andps %xmm1,%xmm0
.byte 15,85,205 // andnps %xmm5,%xmm1
.byte 15,86,200 // orps %xmm0,%xmm1
.byte 15,40,194 // movaps %xmm2,%xmm0
.byte 15,194,196,1 // cmpltps %xmm4,%xmm0
- .byte 15,40,168,107,26,0,0 // movaps 0x1a6b(%eax),%xmm5
+ .byte 15,40,168,54,27,0,0 // movaps 0x1b36(%eax),%xmm5
.byte 15,92,233 // subps %xmm1,%xmm5
.byte 15,84,232 // andps %xmm0,%xmm5
.byte 15,85,193 // andnps %xmm1,%xmm0
@@ -58803,15 +59838,15 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 6782 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6967 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,94,25,0,0 // mulps 0x195e(%edx),%xmm4
- .byte 15,89,130,110,25,0,0 // mulps 0x196e(%edx),%xmm0
+ .byte 15,89,162,41,26,0,0 // mulps 0x1a29(%edx),%xmm4
+ .byte 15,89,130,57,26,0,0 // mulps 0x1a39(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -58819,11 +59854,11 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,126,25,0,0 // xorps 0x197e(%edx),%xmm4
+ .byte 15,87,162,73,26,0,0 // xorps 0x1a49(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,142,25,0,0 // mulps 0x198e(%edx),%xmm5
+ .byte 15,89,170,89,26,0,0 // mulps 0x1a59(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,95,196 // maxps %xmm4,%xmm0
@@ -58854,15 +59889,15 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
.byte 15,88,240 // addps %xmm0,%xmm6
- .byte 232,0,0,0,0 // call 6820 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+ .byte 232,0,0,0,0 // call 6a05 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
.byte 90 // pop %edx
.byte 243,15,89,237 // mulss %xmm5,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,92,245 // subps %xmm5,%xmm6
.byte 243,15,16,65,32 // movss 0x20(%ecx),%xmm0
.byte 15,198,192,0 // shufps $0x0,%xmm0,%xmm0
- .byte 15,89,162,0,25,0,0 // mulps 0x1900(%edx),%xmm4
- .byte 15,89,130,16,25,0,0 // mulps 0x1910(%edx),%xmm0
+ .byte 15,89,162,203,25,0,0 // mulps 0x19cb(%edx),%xmm4
+ .byte 15,89,130,219,25,0,0 // mulps 0x19db(%edx),%xmm0
.byte 15,89,198 // mulps %xmm6,%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
@@ -58870,11 +59905,11 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 15,81,237 // sqrtps %xmm5,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,162,32,25,0,0 // xorps 0x1920(%edx),%xmm4
+ .byte 15,87,162,235,25,0,0 // xorps 0x19eb(%edx),%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 243,15,16,105,36 // movss 0x24(%ecx),%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
- .byte 15,89,170,48,25,0,0 // mulps 0x1930(%edx),%xmm5
+ .byte 15,89,170,251,25,0,0 // mulps 0x19fb(%edx),%xmm5
.byte 15,89,197 // mulps %xmm5,%xmm0
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,93,196 // minps %xmm4,%xmm0
@@ -58894,7 +59929,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 85 // push %ebp
.byte 137,229 // mov %esp,%ebp
.byte 131,236,8 // sub $0x8,%esp
- .byte 232,0,0,0,0 // call 6898 <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+ .byte 232,0,0,0,0 // call 6a7d <_sk_xy_to_2pt_conical_linear_sse2+0xb>
.byte 89 // pop %ecx
.byte 139,69,12 // mov 0xc(%ebp),%eax
.byte 139,16 // mov (%eax),%edx
@@ -58903,7 +59938,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 15,89,169,200,24,0,0 // mulps 0x18c8(%ecx),%xmm5
+ .byte 15,89,169,147,25,0,0 // mulps 0x1993(%ecx),%xmm5
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 15,40,241 // movaps %xmm1,%xmm6
.byte 15,89,246 // mulps %xmm6,%xmm6
@@ -58911,7 +59946,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,15,89,228 // mulss %xmm4,%xmm4
.byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 15,87,129,216,24,0,0 // xorps 0x18d8(%ecx),%xmm0
+ .byte 15,87,129,163,25,0,0 // xorps 0x19a3(%ecx),%xmm0
.byte 15,94,197 // divps %xmm5,%xmm0
.byte 141,72,8 // lea 0x8(%eax),%ecx
.byte 131,236,8 // sub $0x8,%esp
@@ -58985,16 +60020,16 @@ _sk_save_xy_sse2:
.byte 131,236,24 // sub $0x18,%esp
.byte 15,41,93,232 // movaps %xmm3,-0x18(%ebp)
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 232,0,0,0,0 // call 6975 <_sk_save_xy_sse2+0x12>
+ .byte 232,0,0,0,0 // call 6b5a <_sk_save_xy_sse2+0x12>
.byte 88 // pop %eax
- .byte 15,40,160,11,24,0,0 // movaps 0x180b(%eax),%xmm4
+ .byte 15,40,160,214,24,0,0 // movaps 0x18d6(%eax),%xmm4
.byte 15,40,232 // movaps %xmm0,%xmm5
.byte 15,88,236 // addps %xmm4,%xmm5
.byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 15,40,253 // movaps %xmm5,%xmm7
.byte 15,194,254,1 // cmpltps %xmm6,%xmm7
- .byte 15,40,144,27,24,0,0 // movaps 0x181b(%eax),%xmm2
+ .byte 15,40,144,230,24,0,0 // movaps 0x18e6(%eax),%xmm2
.byte 15,84,250 // andps %xmm2,%xmm7
.byte 15,92,247 // subps %xmm7,%xmm6
.byte 15,92,238 // subps %xmm6,%xmm5
@@ -59069,15 +60104,15 @@ _sk_bilinear_nx_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6a57 <_sk_bilinear_nx_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6c3c <_sk_bilinear_nx_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,73,23,0,0 // addps 0x1749(%eax),%xmm0
- .byte 15,40,168,89,23,0,0 // movaps 0x1759(%eax),%xmm5
+ .byte 15,88,128,20,24,0,0 // addps 0x1814(%eax),%xmm0
+ .byte 15,40,168,36,24,0,0 // movaps 0x1824(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59098,14 +60133,14 @@ _sk_bilinear_px_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6a9a <_sk_bilinear_px_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6c7f <_sk_bilinear_px_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,38,23,0,0 // addps 0x1726(%eax),%xmm0
+ .byte 15,88,128,241,23,0,0 // addps 0x17f1(%eax),%xmm0
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59125,15 +60160,15 @@ _sk_bilinear_ny_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6ad3 <_sk_bilinear_ny_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6cb8 <_sk_bilinear_ny_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,253,22,0,0 // addps 0x16fd(%eax),%xmm1
- .byte 15,40,168,13,23,0,0 // movaps 0x170d(%eax),%xmm5
+ .byte 15,88,136,200,23,0,0 // addps 0x17c8(%eax),%xmm1
+ .byte 15,40,168,216,23,0,0 // movaps 0x17d8(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59154,14 +60189,14 @@ _sk_bilinear_py_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6b17 <_sk_bilinear_py_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6cfc <_sk_bilinear_py_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,217,22,0,0 // addps 0x16d9(%eax),%xmm1
+ .byte 15,88,136,164,23,0,0 // addps 0x17a4(%eax),%xmm1
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59181,20 +60216,20 @@ _sk_bicubic_n3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6b51 <_sk_bicubic_n3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6d36 <_sk_bicubic_n3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,175,22,0,0 // addps 0x16af(%eax),%xmm0
- .byte 15,40,168,191,22,0,0 // movaps 0x16bf(%eax),%xmm5
+ .byte 15,88,128,122,23,0,0 // addps 0x177a(%eax),%xmm0
+ .byte 15,40,168,138,23,0,0 // movaps 0x178a(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,207,22,0,0 // mulps 0x16cf(%eax),%xmm5
- .byte 15,88,168,223,22,0,0 // addps 0x16df(%eax),%xmm5
+ .byte 15,89,168,154,23,0,0 // mulps 0x179a(%eax),%xmm5
+ .byte 15,88,168,170,23,0,0 // addps 0x17aa(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,128,0,0,0 // movups %xmm5,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59215,23 +60250,23 @@ _sk_bicubic_n1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6bab <_sk_bicubic_n1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6d90 <_sk_bicubic_n1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,149,22,0,0 // addps 0x1695(%eax),%xmm0
- .byte 15,40,168,165,22,0,0 // movaps 0x16a5(%eax),%xmm5
+ .byte 15,88,128,96,23,0,0 // addps 0x1760(%eax),%xmm0
+ .byte 15,40,168,112,23,0,0 // movaps 0x1770(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,181,22,0,0 // movaps 0x16b5(%eax),%xmm4
+ .byte 15,40,160,128,23,0,0 // movaps 0x1780(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,197,22,0,0 // addps 0x16c5(%eax),%xmm4
+ .byte 15,88,160,144,23,0,0 // addps 0x1790(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,213,22,0,0 // addps 0x16d5(%eax),%xmm4
+ .byte 15,88,160,160,23,0,0 // addps 0x17a0(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,229,22,0,0 // addps 0x16e5(%eax),%xmm4
+ .byte 15,88,160,176,23,0,0 // addps 0x17b0(%eax),%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59251,22 +60286,22 @@ _sk_bicubic_p1x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c13 <_sk_bicubic_p1x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6df8 <_sk_bicubic_p1x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,141,22,0,0 // movaps 0x168d(%eax),%xmm4
+ .byte 15,40,160,88,23,0,0 // movaps 0x1758(%eax),%xmm4
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,110,64 // movups 0x40(%esi),%xmm5
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 15,40,176,157,22,0,0 // movaps 0x169d(%eax),%xmm6
+ .byte 15,40,176,104,23,0,0 // movaps 0x1768(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,173,22,0,0 // addps 0x16ad(%eax),%xmm6
+ .byte 15,88,176,120,23,0,0 // addps 0x1778(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,189,22,0,0 // addps 0x16bd(%eax),%xmm6
+ .byte 15,88,176,136,23,0,0 // addps 0x1788(%eax),%xmm6
.byte 15,17,182,128,0,0,0 // movups %xmm6,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59286,18 +60321,18 @@ _sk_bicubic_p3x_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6c70 <_sk_bicubic_p3x_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6e55 <_sk_bicubic_p3x_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,6 // movups (%esi),%xmm0
.byte 15,16,102,64 // movups 0x40(%esi),%xmm4
- .byte 15,88,128,112,22,0,0 // addps 0x1670(%eax),%xmm0
+ .byte 15,88,128,59,23,0,0 // addps 0x173b(%eax),%xmm0
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,128,22,0,0 // mulps 0x1680(%eax),%xmm4
- .byte 15,88,160,144,22,0,0 // addps 0x1690(%eax),%xmm4
+ .byte 15,89,160,75,23,0,0 // mulps 0x174b(%eax),%xmm4
+ .byte 15,88,160,91,23,0,0 // addps 0x175b(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,128,0,0,0 // movups %xmm4,0x80(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59318,20 +60353,20 @@ _sk_bicubic_n3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6cc0 <_sk_bicubic_n3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6ea5 <_sk_bicubic_n3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,80,22,0,0 // addps 0x1650(%eax),%xmm1
- .byte 15,40,168,96,22,0,0 // movaps 0x1660(%eax),%xmm5
+ .byte 15,88,136,27,23,0,0 // addps 0x171b(%eax),%xmm1
+ .byte 15,40,168,43,23,0,0 // movaps 0x172b(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,89,228 // mulps %xmm4,%xmm4
- .byte 15,89,168,112,22,0,0 // mulps 0x1670(%eax),%xmm5
- .byte 15,88,168,128,22,0,0 // addps 0x1680(%eax),%xmm5
+ .byte 15,89,168,59,23,0,0 // mulps 0x173b(%eax),%xmm5
+ .byte 15,88,168,75,23,0,0 // addps 0x174b(%eax),%xmm5
.byte 15,89,236 // mulps %xmm4,%xmm5
.byte 15,17,174,160,0,0,0 // movups %xmm5,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59352,23 +60387,23 @@ _sk_bicubic_n1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6d1b <_sk_bicubic_n1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6f00 <_sk_bicubic_n1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,53,22,0,0 // addps 0x1635(%eax),%xmm1
- .byte 15,40,168,69,22,0,0 // movaps 0x1645(%eax),%xmm5
+ .byte 15,88,136,0,23,0,0 // addps 0x1700(%eax),%xmm1
+ .byte 15,40,168,16,23,0,0 // movaps 0x1710(%eax),%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
- .byte 15,40,160,85,22,0,0 // movaps 0x1655(%eax),%xmm4
+ .byte 15,40,160,32,23,0,0 // movaps 0x1720(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,101,22,0,0 // addps 0x1665(%eax),%xmm4
+ .byte 15,88,160,48,23,0,0 // addps 0x1730(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,117,22,0,0 // addps 0x1675(%eax),%xmm4
+ .byte 15,88,160,64,23,0,0 // addps 0x1740(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
- .byte 15,88,160,133,22,0,0 // addps 0x1685(%eax),%xmm4
+ .byte 15,88,160,80,23,0,0 // addps 0x1750(%eax),%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59388,22 +60423,22 @@ _sk_bicubic_p1y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6d84 <_sk_bicubic_p1y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6f69 <_sk_bicubic_p1y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
- .byte 15,40,160,44,22,0,0 // movaps 0x162c(%eax),%xmm4
+ .byte 15,40,160,247,22,0,0 // movaps 0x16f7(%eax),%xmm4
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,110,96 // movups 0x60(%esi),%xmm5
.byte 15,88,204 // addps %xmm4,%xmm1
- .byte 15,40,176,60,22,0,0 // movaps 0x163c(%eax),%xmm6
+ .byte 15,40,176,7,23,0,0 // movaps 0x1707(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,76,22,0,0 // addps 0x164c(%eax),%xmm6
+ .byte 15,88,176,23,23,0,0 // addps 0x1717(%eax),%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
.byte 15,89,245 // mulps %xmm5,%xmm6
- .byte 15,88,176,92,22,0,0 // addps 0x165c(%eax),%xmm6
+ .byte 15,88,176,39,23,0,0 // addps 0x1727(%eax),%xmm6
.byte 15,17,182,160,0,0,0 // movups %xmm6,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
.byte 131,236,8 // sub $0x8,%esp
@@ -59423,18 +60458,18 @@ _sk_bicubic_p3y_sse2:
.byte 137,229 // mov %esp,%ebp
.byte 86 // push %esi
.byte 80 // push %eax
- .byte 232,0,0,0,0 // call 6de2 <_sk_bicubic_p3y_sse2+0xa>
+ .byte 232,0,0,0,0 // call 6fc7 <_sk_bicubic_p3y_sse2+0xa>
.byte 88 // pop %eax
.byte 139,77,8 // mov 0x8(%ebp),%ecx
.byte 139,85,12 // mov 0xc(%ebp),%edx
.byte 139,50 // mov (%edx),%esi
.byte 15,16,78,32 // movups 0x20(%esi),%xmm1
.byte 15,16,102,96 // movups 0x60(%esi),%xmm4
- .byte 15,88,136,14,22,0,0 // addps 0x160e(%eax),%xmm1
+ .byte 15,88,136,217,22,0,0 // addps 0x16d9(%eax),%xmm1
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,237 // mulps %xmm5,%xmm5
- .byte 15,89,160,30,22,0,0 // mulps 0x161e(%eax),%xmm4
- .byte 15,88,160,46,22,0,0 // addps 0x162e(%eax),%xmm4
+ .byte 15,89,160,233,22,0,0 // mulps 0x16e9(%eax),%xmm4
+ .byte 15,88,160,249,22,0,0 // addps 0x16f9(%eax),%xmm4
.byte 15,89,229 // mulps %xmm5,%xmm4
.byte 15,17,166,160,0,0,0 // movups %xmm4,0xa0(%esi)
.byte 141,66,8 // lea 0x8(%edx),%eax
@@ -59671,9 +60706,9 @@ BALIGN16
.byte 0,224 // add %ah,%al
.byte 64 // inc %eax
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 70dc <.literal16+0x1fc>
+ .byte 224,64 // loopne 72bc <.literal16+0x1fc>
.byte 0,0 // add %al,(%eax)
- .byte 224,64 // loopne 70e0 <.literal16+0x200>
+ .byte 224,64 // loopne 72c0 <.literal16+0x200>
.byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999
.byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999
.byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax
@@ -59684,16 +60719,16 @@ BALIGN16
.byte 63 // aas
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7101 <.literal16+0x221>
+ .byte 225,61 // loope 72e1 <.literal16+0x221>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7105 <.literal16+0x225>
+ .byte 225,61 // loope 72e5 <.literal16+0x225>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7109 <.literal16+0x229>
+ .byte 225,61 // loope 72e9 <.literal16+0x229>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 710d <.literal16+0x22d>
+ .byte 225,61 // loope 72ed <.literal16+0x22d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -59710,16 +60745,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 7141 <.literal16+0x261>
+ .byte 225,61 // loope 7321 <.literal16+0x261>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7145 <.literal16+0x265>
+ .byte 225,61 // loope 7325 <.literal16+0x265>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7149 <.literal16+0x269>
+ .byte 225,61 // loope 7329 <.literal16+0x269>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 714d <.literal16+0x26d>
+ .byte 225,61 // loope 732d <.literal16+0x26d>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -59736,16 +60771,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 7181 <.literal16+0x2a1>
+ .byte 225,61 // loope 7361 <.literal16+0x2a1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7185 <.literal16+0x2a5>
+ .byte 225,61 // loope 7365 <.literal16+0x2a5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 7189 <.literal16+0x2a9>
+ .byte 225,61 // loope 7369 <.literal16+0x2a9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 718d <.literal16+0x2ad>
+ .byte 225,61 // loope 736d <.literal16+0x2ad>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -59762,16 +60797,16 @@ BALIGN16
.byte 63 // aas
.byte 61,10,23,63,174 // cmp $0xae3f170a,%eax
.byte 71 // inc %edi
- .byte 225,61 // loope 71c1 <.literal16+0x2e1>
+ .byte 225,61 // loope 73a1 <.literal16+0x2e1>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 71c5 <.literal16+0x2e5>
+ .byte 225,61 // loope 73a5 <.literal16+0x2e5>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 71c9 <.literal16+0x2e9>
+ .byte 225,61 // loope 73a9 <.literal16+0x2e9>
.byte 174 // scas %es:(%edi),%al
.byte 71 // inc %edi
- .byte 225,61 // loope 71cd <.literal16+0x2ed>
+ .byte 225,61 // loope 73ad <.literal16+0x2ed>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -59793,11 +60828,11 @@ BALIGN16
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%eax)
.byte 67 // inc %ebx
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 720b <.literal16+0x32b>
+ .byte 127,67 // jg 73eb <.literal16+0x32b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 720f <.literal16+0x32f>
+ .byte 127,67 // jg 73ef <.literal16+0x32f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7213 <.literal16+0x333>
+ .byte 127,67 // jg 73f3 <.literal16+0x333>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60071,13 +61106,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7469 <.literal16+0x589>
+ .byte 224,7 // loopne 7649 <.literal16+0x589>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 746d <.literal16+0x58d>
+ .byte 224,7 // loopne 764d <.literal16+0x58d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7471 <.literal16+0x591>
+ .byte 224,7 // loopne 7651 <.literal16+0x591>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7475 <.literal16+0x595>
+ .byte 224,7 // loopne 7655 <.literal16+0x595>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -60126,11 +61161,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 752b <.literal16+0x64b>
+ .byte 127,67 // jg 770b <.literal16+0x64b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 752f <.literal16+0x64f>
+ .byte 127,67 // jg 770f <.literal16+0x64f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7533 <.literal16+0x653>
+ .byte 127,67 // jg 7713 <.literal16+0x653>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax)
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%eax)
@@ -60145,16 +61180,116 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7524 <.literal16+0x644>
+ .byte 127,0 // jg 7704 <.literal16+0x644>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 7708 <.literal16+0x648>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 770c <.literal16+0x64c>
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 127,0 // jg 7710 <.literal16+0x650>
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,63 // add %bh,(%edi)
+ .byte 119,115 // ja 7795 <.literal16+0x6d5>
+ .byte 248 // clc
+ .byte 194,119,115 // ret $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // ret $0x7377
+ .byte 248 // clc
+ .byte 194,119,115 // ret $0x7377
+ .byte 248 // clc
+ .byte 194,117,191 // ret $0xbf75
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // aas
+ .byte 117,191 // jne 76f9 <.literal16+0x639>
+ .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
+ .byte 63 // aas
+ .byte 249 // stc
+ .byte 68 // inc %esp
+ .byte 180,62 // mov $0x3e,%ah
+ .byte 249 // stc
+ .byte 68 // inc %esp
+ .byte 180,62 // mov $0x3e,%ah
+ .byte 249 // stc
+ .byte 68 // inc %esp
+ .byte 180,62 // mov $0x3e,%ah
+ .byte 249 // stc
+ .byte 68 // inc %esp
+ .byte 180,62 // mov $0x3e,%ah
+ .byte 163,233,220,63,163 // mov %eax,0xa33fdce9
+ .byte 233,220,63,163,233 // jmp e9a3b736 <_sk_callback_sse2+0xe9a34728>
+ .byte 220,63 // fdivrl (%edi)
+ .byte 163,233,220,63,0 // mov %eax,0x3fdce9
+ .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
+ .byte 63 // aas
+ .byte 0,0 // add %al,(%eax)
+ .byte 128,63,0 // cmpb $0x0,(%edi)
+ .byte 0,128,63,81,140,242 // add %al,-0xd73aec1(%eax)
+ .byte 66 // inc %edx
+ .byte 81 // push %ecx
+ .byte 140,242 // mov %?,%edx
+ .byte 66 // inc %edx
+ .byte 81 // push %ecx
+ .byte 140,242 // mov %?,%edx
+ .byte 66 // inc %edx
+ .byte 81 // push %ecx
+ .byte 140,242 // mov %?,%edx
+ .byte 66 // inc %edx
+ .byte 141,188,190,63,141,188,190 // lea -0x414372c1(%esi,%edi,4),%edi
+ .byte 63 // aas
+ .byte 141,188,190,63,141,188,190 // lea -0x414372c1(%esi,%edi,4),%edi
+ .byte 63 // aas
+ .byte 248 // clc
+ .byte 245 // cmc
+ .byte 154,64,248,245,154,64,248 // lcall $0xf840,$0x9af5f840
+ .byte 245 // cmc
+ .byte 154,64,248,245,154,64,254 // lcall $0xfe40,$0x9af5f840
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65 // inc %ecx
+ .byte 254 // (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65 // inc %ecx
+ .byte 254 // (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65 // inc %ecx
+ .byte 254 // (bad)
+ .byte 210,221 // rcr %cl,%ch
+ .byte 65 // inc %ecx
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,75,0 // add %cl,0x0(%ebx)
+ .byte 0,0 // add %al,(%eax)
+ .byte 75 // dec %ebx
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,75,0 // add %cl,0x0(%ebx)
+ .byte 0,0 // add %al,(%eax)
+ .byte 75 // dec %ebx
+ .byte 0,0 // add %al,(%eax)
+ .byte 0,52,0 // add %dh,(%eax,%eax,1)
+ .byte 0,0 // add %al,(%eax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 52,0 // xor $0x0,%al
+ .byte 0,0 // add %al,(%eax)
+ .byte 52,255 // xor $0xff,%al
+ .byte 255 // (bad)
+ .byte 127,0 // jg 77d4 <.literal16+0x714>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7528 <.literal16+0x648>
+ .byte 127,0 // jg 77d8 <.literal16+0x718>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 752c <.literal16+0x64c>
+ .byte 127,0 // jg 77dc <.literal16+0x71c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7530 <.literal16+0x650>
+ .byte 127,0 // jg 77e0 <.literal16+0x720>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60163,7 +61298,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 75b5 <.literal16+0x6d5>
+ .byte 119,115 // ja 7865 <.literal16+0x7a5>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -60174,7 +61309,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 7519 <.literal16+0x639>
+ .byte 117,191 // jne 77c9 <.literal16+0x709>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -60190,7 +61325,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b556 <_sk_callback_sse2+0xe9a3472d>
+ .byte 233,220,63,163,233 // jmp e9a3b806 <_sk_callback_sse2+0xe9a347f8>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60245,16 +61380,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 75f4 <.literal16+0x714>
+ .byte 127,0 // jg 78a4 <.literal16+0x7e4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 75f8 <.literal16+0x718>
+ .byte 127,0 // jg 78a8 <.literal16+0x7e8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 75fc <.literal16+0x71c>
+ .byte 127,0 // jg 78ac <.literal16+0x7ec>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7600 <.literal16+0x720>
+ .byte 127,0 // jg 78b0 <.literal16+0x7f0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60263,7 +61398,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7685 <.literal16+0x7a5>
+ .byte 119,115 // ja 7935 <.literal16+0x875>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -60274,7 +61409,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 75e9 <.literal16+0x709>
+ .byte 117,191 // jne 7899 <.literal16+0x7d9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -60290,7 +61425,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b626 <_sk_callback_sse2+0xe9a347fd>
+ .byte 233,220,63,163,233 // jmp e9a3b8d6 <_sk_callback_sse2+0xe9a348c8>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60345,16 +61480,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 76c4 <.literal16+0x7e4>
+ .byte 127,0 // jg 7974 <.literal16+0x8b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 76c8 <.literal16+0x7e8>
+ .byte 127,0 // jg 7978 <.literal16+0x8b8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 76cc <.literal16+0x7ec>
+ .byte 127,0 // jg 797c <.literal16+0x8bc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 76d0 <.literal16+0x7f0>
+ .byte 127,0 // jg 7980 <.literal16+0x8c0>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60363,7 +61498,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7755 <.literal16+0x875>
+ .byte 119,115 // ja 7a05 <.literal16+0x945>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -60374,7 +61509,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 76b9 <.literal16+0x7d9>
+ .byte 117,191 // jne 7969 <.literal16+0x8a9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -60390,7 +61525,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b6f6 <_sk_callback_sse2+0xe9a348cd>
+ .byte 233,220,63,163,233 // jmp e9a3b9a6 <_sk_callback_sse2+0xe9a34998>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60445,16 +61580,16 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 7794 <.literal16+0x8b4>
+ .byte 127,0 // jg 7a44 <.literal16+0x984>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 7798 <.literal16+0x8b8>
+ .byte 127,0 // jg 7a48 <.literal16+0x988>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 779c <.literal16+0x8bc>
+ .byte 127,0 // jg 7a4c <.literal16+0x98c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 77a0 <.literal16+0x8c0>
+ .byte 127,0 // jg 7a50 <.literal16+0x990>
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
@@ -60463,7 +61598,7 @@ BALIGN16
.byte 0,63 // add %bh,(%edi)
.byte 0,0 // add %al,(%eax)
.byte 0,63 // add %bh,(%edi)
- .byte 119,115 // ja 7825 <.literal16+0x945>
+ .byte 119,115 // ja 7ad5 <.literal16+0xa15>
.byte 248 // clc
.byte 194,119,115 // ret $0x7377
.byte 248 // clc
@@ -60474,7 +61609,7 @@ BALIGN16
.byte 194,117,191 // ret $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
- .byte 117,191 // jne 7789 <.literal16+0x8a9>
+ .byte 117,191 // jne 7a39 <.literal16+0x979>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // aas
.byte 249 // stc
@@ -60490,7 +61625,7 @@ BALIGN16
.byte 68 // inc %esp
.byte 180,62 // mov $0x3e,%ah
.byte 163,233,220,63,163 // mov %eax,0xa33fdce9
- .byte 233,220,63,163,233 // jmp e9a3b7c6 <_sk_callback_sse2+0xe9a3499d>
+ .byte 233,220,63,163,233 // jmp e9a3ba76 <_sk_callback_sse2+0xe9a34a68>
.byte 220,63 // fdivrl (%edi)
.byte 163,233,220,63,0 // mov %eax,0x3fdce9
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -60541,13 +61676,13 @@ BALIGN16
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
.byte 200,66,0,0 // enter $0x42,$0x0
- .byte 127,67 // jg 78a7 <.literal16+0x9c7>
+ .byte 127,67 // jg 7b57 <.literal16+0xa97>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 78ab <.literal16+0x9cb>
+ .byte 127,67 // jg 7b5b <.literal16+0xa9b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 78af <.literal16+0x9cf>
+ .byte 127,67 // jg 7b5f <.literal16+0xa9f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 78b3 <.literal16+0x9d3>
+ .byte 127,67 // jg 7b63 <.literal16+0xaa3>
.byte 0,0 // add %al,(%eax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%eax)
@@ -60598,16 +61733,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%ebx)
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 7933 <.literal16+0xa53>
+ .byte 118,63 // jbe 7be3 <.literal16+0xb23>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 7937 <.literal16+0xa57>
+ .byte 118,63 // jbe 7be7 <.literal16+0xb27>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 793b <.literal16+0xa5b>
+ .byte 118,63 // jbe 7beb <.literal16+0xb2b>
.byte 31 // pop %ds
.byte 215 // xlat %ds:(%ebx)
- .byte 118,63 // jbe 793f <.literal16+0xa5f>
+ .byte 118,63 // jbe 7bef <.literal16+0xb2f>
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
.byte 246,64,83,63 // testb $0x3f,0x53(%eax)
@@ -60636,11 +61771,11 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%ebx)
.byte 0,127,67 // add %bh,0x43(%edi)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 79ab <.literal16+0xacb>
+ .byte 127,67 // jg 7c5b <.literal16+0xb9b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 79af <.literal16+0xacf>
+ .byte 127,67 // jg 7c5f <.literal16+0xb9f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 79b3 <.literal16+0xad3>
+ .byte 127,67 // jg 7c63 <.literal16+0xba3>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,0 // add %al,(%eax)
@@ -60702,13 +61837,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7a29 <.literal16+0xb49>
+ .byte 224,7 // loopne 7cd9 <.literal16+0xc19>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7a2d <.literal16+0xb4d>
+ .byte 224,7 // loopne 7cdd <.literal16+0xc1d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7a31 <.literal16+0xb51>
+ .byte 224,7 // loopne 7ce1 <.literal16+0xc21>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7a35 <.literal16+0xb55>
+ .byte 224,7 // loopne 7ce5 <.literal16+0xc25>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -60754,13 +61889,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7a99 <.literal16+0xbb9>
+ .byte 224,7 // loopne 7d49 <.literal16+0xc89>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7a9d <.literal16+0xbbd>
+ .byte 224,7 // loopne 7d4d <.literal16+0xc8d>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7aa1 <.literal16+0xbc1>
+ .byte 224,7 // loopne 7d51 <.literal16+0xc91>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7aa5 <.literal16+0xbc5>
+ .byte 224,7 // loopne 7d55 <.literal16+0xc95>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -60806,13 +61941,13 @@ BALIGN16
.byte 132,55 // test %dh,(%edi)
.byte 8,33 // or %ah,(%ecx)
.byte 132,55 // test %dh,(%edi)
- .byte 224,7 // loopne 7b09 <.literal16+0xc29>
+ .byte 224,7 // loopne 7db9 <.literal16+0xcf9>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7b0d <.literal16+0xc2d>
+ .byte 224,7 // loopne 7dbd <.literal16+0xcfd>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7b11 <.literal16+0xc31>
+ .byte 224,7 // loopne 7dc1 <.literal16+0xd01>
.byte 0,0 // add %al,(%eax)
- .byte 224,7 // loopne 7b15 <.literal16+0xc35>
+ .byte 224,7 // loopne 7dc5 <.literal16+0xd05>
.byte 0,0 // add %al,(%eax)
.byte 33,8 // and %ecx,(%eax)
.byte 2,58 // add (%edx),%bh
@@ -60854,13 +61989,13 @@ BALIGN16
.byte 248 // clc
.byte 65 // inc %ecx
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7ba6 <.literal16+0xcc6>
+ .byte 124,66 // jl 7e56 <.literal16+0xd96>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7baa <.literal16+0xcca>
+ .byte 124,66 // jl 7e5a <.literal16+0xd9a>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7bae <.literal16+0xcce>
+ .byte 124,66 // jl 7e5e <.literal16+0xd9e>
.byte 0,0 // add %al,(%eax)
- .byte 124,66 // jl 7bb2 <.literal16+0xcd2>
+ .byte 124,66 // jl 7e62 <.literal16+0xda2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%eax)
.byte 0,240 // add %dh,%al
@@ -60994,13 +62129,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7d35 <.literal16+0xe55>
+ .byte 112,65 // jo 7fe5 <.literal16+0xf25>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7d39 <.literal16+0xe59>
+ .byte 112,65 // jo 7fe9 <.literal16+0xf29>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7d3d <.literal16+0xe5d>
+ .byte 112,65 // jo 7fed <.literal16+0xf2d>
.byte 0,0 // add %al,(%eax)
- .byte 112,65 // jo 7d41 <.literal16+0xe61>
+ .byte 112,65 // jo 7ff1 <.literal16+0xf31>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -61031,11 +62166,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7dab <.literal16+0xecb>
+ .byte 127,67 // jg 805b <.literal16+0xf9b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7daf <.literal16+0xecf>
+ .byte 127,67 // jg 805f <.literal16+0xf9f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7db3 <.literal16+0xed3>
+ .byte 127,67 // jg 8063 <.literal16+0xfa3>
.byte 255,0 // incl (%eax)
.byte 0,0 // add %al,(%eax)
.byte 255,0 // incl (%eax)
@@ -61066,11 +62201,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%ebx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax)
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7e1b <.literal16+0xf3b>
+ .byte 127,67 // jg 80cb <.literal16+0x100b>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7e1f <.literal16+0xf3f>
+ .byte 127,67 // jg 80cf <.literal16+0x100f>
.byte 0,0 // add %al,(%eax)
- .byte 127,67 // jg 7e23 <.literal16+0xf43>
+ .byte 127,67 // jg 80d3 <.literal16+0x1013>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
.byte 0,0 // add %al,(%eax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax)
@@ -61169,13 +62304,13 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 255 // (bad)
- .byte 127,71 // jg 7f4b <.literal16+0x106b>
+ .byte 127,71 // jg 81fb <.literal16+0x113b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7f4f <.literal16+0x106f>
+ .byte 127,71 // jg 81ff <.literal16+0x113f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7f53 <.literal16+0x1073>
+ .byte 127,71 // jg 8203 <.literal16+0x1143>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 7f57 <.literal16+0x1077>
+ .byte 127,71 // jg 8207 <.literal16+0x1147>
.byte 0,0 // add %al,(%eax)
.byte 128,63,0 // cmpb $0x0,(%edi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax)
@@ -61283,7 +62418,7 @@ BALIGN16
.byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 805c <.literal16+0x117c>
+ .byte 120,57 // js 830c <.literal16+0x124c>
.byte 64 // inc %eax
.byte 18,120,57 // adc 0x39(%eax),%bh
.byte 64 // inc %eax
@@ -61476,11 +62611,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 8242 <.literal16+0x1362>
+ .byte 62,114,28 // jb,pt 84f2 <.literal16+0x1432>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8246 <.literal16+0x1366>
+ .byte 62,114,28 // jb,pt 84f6 <.literal16+0x1436>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 824a <.literal16+0x136a>
+ .byte 62,114,28 // jb,pt 84fa <.literal16+0x143a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -61559,13 +62694,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb 830e <.literal16+0x142e>
+ .byte 114,28 // jb 85be <.literal16+0x14fe>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8312 <.literal16+0x1432>
+ .byte 62,114,28 // jb,pt 85c2 <.literal16+0x1502>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8316 <.literal16+0x1436>
+ .byte 62,114,28 // jb,pt 85c6 <.literal16+0x1506>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 831a <.literal16+0x143a>
+ .byte 62,114,28 // jb,pt 85ca <.literal16+0x150a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -61586,11 +62721,11 @@ BALIGN16
.byte 0,0 // add %al,(%eax)
.byte 128,63,114 // cmpb $0x72,(%edi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 8352 <.literal16+0x1472>
+ .byte 62,114,28 // jb,pt 8602 <.literal16+0x1542>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8356 <.literal16+0x1476>
+ .byte 62,114,28 // jb,pt 8606 <.literal16+0x1546>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 835a <.literal16+0x147a>
+ .byte 62,114,28 // jb,pt 860a <.literal16+0x154a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)
@@ -61669,13 +62804,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%edi)
.byte 0,192 // add %al,%al
.byte 63 // aas
- .byte 114,28 // jb 841e <.literal16+0x153e>
+ .byte 114,28 // jb 86ce <.literal16+0x160e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8422 <_sk_callback_sse2+0x15f9>
+ .byte 62,114,28 // jb,pt 86d2 <_sk_callback_sse2+0x16c4>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 8426 <_sk_callback_sse2+0x15fd>
+ .byte 62,114,28 // jb,pt 86d6 <_sk_callback_sse2+0x16c8>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 842a <_sk_callback_sse2+0x1601>
+ .byte 62,114,28 // jb,pt 86da <_sk_callback_sse2+0x16cc>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%edi)
.byte 170 // stos %al,%es:(%edi)