aboutsummaryrefslogtreecommitdiffhomepage
path: root/src
diff options
context:
space:
mode:
authorGravatar Mike Klein <mtklein@chromium.org>2017-06-26 16:12:48 -0400
committerGravatar Skia Commit-Bot <skia-commit-bot@chromium.org>2017-06-26 20:51:52 +0000
commitc4fcbed6b2b2d1e2253e325b292931cb3d05d3fe (patch)
tree2fca874afd369944d62f7d704b8a8459c70f3866 /src
parent660cc9910f636b6092f5f2ee36567999f83fb648 (diff)
somewhat less silly tail loads and stores
No reason to keep going one at a time when we know there are generally better ways to handle loading a power-of-two number of low lanes. This strategy scales up too, with quick answers for 8 (one 8 byte load), 12 (one 8 byte, one 4 byte), etc. $ ninja -C out monobench; and out/monobench SkRasterPipeline_compile 300 Before: 46.946ns After: 43.341ns (This happens to be _lowp. Expect similar small speedups elsewhere.) Change-Id: I08f87769ea3c9f06ad13d2b1d5326e542b9b63a8 Reviewed-on: https://skia-review.googlesource.com/20903 Reviewed-by: Herb Derby <herb@google.com> Commit-Queue: Mike Klein <mtklein@chromium.org>
Diffstat (limited to 'src')
-rw-r--r--src/jumper/SkJumper_generated.S5773
-rw-r--r--src/jumper/SkJumper_generated_win.S5434
-rw-r--r--src/jumper/SkJumper_stages.cpp32
-rw-r--r--src/jumper/SkJumper_stages_lowp.cpp32
4 files changed, 5814 insertions, 5457 deletions
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index b7564be109..ed8d74ada9 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -1311,32 +1311,35 @@ _sk_srcover_rgba_8888_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x6f00e404 // movi v4.2d, #0x0
- .long 0x54000140 // b.eq 1190 <sk_srcover_rgba_8888_aarch64+0xe0> // b.none
+ .long 0x54000300 // b.eq 11c4 <sk_srcover_rgba_8888_aarch64+0x114> // b.none
.long 0x7100093f // cmp w9, #0x2
+ .long 0x6f00e404 // movi v4.2d, #0x0
.long 0x540000c0 // b.eq 1188 <sk_srcover_rgba_8888_aarch64+0xd8> // b.none
.long 0x71000d3f // cmp w9, #0x3
.long 0x54fffa61 // b.ne 10c4 <sk_srcover_rgba_8888_aarch64+0x14> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe4 // dup v4.4s, wzr
.long 0x4d408124 // ld1 {v4.s}[2], [x9]
- .long 0x91001109 // add x9, x8, #0x4
- .long 0x0d409124 // ld1 {v4.s}[1], [x9]
- .long 0x0d408104 // ld1 {v4.s}[0], [x8]
+ .long 0xfd400105 // ldr d5, [x8]
+ .long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8
+ .long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8
.long 0x17ffffcc // b 10c4 <sk_srcover_rgba_8888_aarch64+0x14>
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 11c4 <sk_srcover_rgba_8888_aarch64+0x114> // b.none
+ .long 0x54000180 // b.eq 11d0 <sk_srcover_rgba_8888_aarch64+0x120> // b.none
.long 0x7100093f // cmp w9, #0x2
.long 0x540000a0 // b.eq 11bc <sk_srcover_rgba_8888_aarch64+0x10c> // b.none
.long 0x71000d3f // cmp w9, #0x3
.long 0x54fffd01 // b.ne 1150 <sk_srcover_rgba_8888_aarch64+0xa0> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
- .long 0x91001109 // add x9, x8, #0x4
- .long 0x0d009130 // st1 {v16.s}[1], [x9]
+ .long 0xfd000110 // str d16, [x8]
+ .long 0x17ffffe4 // b 1150 <sk_srcover_rgba_8888_aarch64+0xa0>
+ .long 0x4e040fe4 // dup v4.4s, wzr
+ .long 0x0d408104 // ld1 {v4.s}[0], [x8]
+ .long 0x17ffffbe // b 10c4 <sk_srcover_rgba_8888_aarch64+0x14>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17ffffe2 // b 1150 <sk_srcover_rgba_8888_aarch64+0xa0>
+ .long 0x17ffffdf // b 1150 <sk_srcover_rgba_8888_aarch64+0xa0>
HIDDEN _sk_clamp_0_aarch64
.globl _sk_clamp_0_aarch64
@@ -1720,7 +1723,7 @@ _sk_scale_u8_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020108 // add x8, x8, x2
- .long 0xb50002e4 // cbnz x4, 16e4 <sk_scale_u8_aarch64+0x68>
+ .long 0xb50002e4 // cbnz x4, 16f0 <sk_scale_u8_aarch64+0x68>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -1745,20 +1748,27 @@ _sk_scale_u8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x2f00e410 // movi d16, #0x0
- .long 0x54000140 // b.eq 1718 <sk_scale_u8_aarch64+0x9c> // b.none
+ .long 0x54000220 // b.eq 173c <sk_scale_u8_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000c0 // b.eq 1710 <sk_scale_u8_aarch64+0x94> // b.none
+ .long 0x2f00e410 // movi d16, #0x0
+ .long 0x540000c0 // b.eq 171c <sk_scale_u8_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 16ac <sk_scale_u8_aarch64+0x30> // b.any
+ .long 0x54fffd61 // b.ne 16b8 <sk_scale_u8_aarch64+0x30> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e0a1d30 // mov v16.h[2], w9
- .long 0x39400509 // ldrb w9, [x8, #1]
- .long 0x4e061d30 // mov v16.h[1], w9
+ .long 0x39400109 // ldrb w9, [x8]
+ .long 0x39400508 // ldrb w8, [x8, #1]
+ .long 0x4e041d31 // mov v17.s[0], w9
+ .long 0x4e0c1d11 // mov v17.s[1], w8
+ .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
+ .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
+ .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
+ .long 0x17ffffe0 // b 16b8 <sk_scale_u8_aarch64+0x30>
.long 0x39400108 // ldrb w8, [x8]
+ .long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e021d10 // mov v16.h[0], w8
- .long 0x17ffffe3 // b 16ac <sk_scale_u8_aarch64+0x30>
+ .long 0x17ffffdc // b 16b8 <sk_scale_u8_aarch64+0x30>
HIDDEN _sk_lerp_1_float_aarch64
.globl _sk_lerp_1_float_aarch64
@@ -1787,7 +1797,7 @@ _sk_lerp_u8_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020108 // add x8, x8, x2
- .long 0xb50003e4 // cbnz x4, 17e8 <sk_lerp_u8_aarch64+0x88>
+ .long 0xb50003e4 // cbnz x4, 1810 <sk_lerp_u8_aarch64+0x88>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -1820,20 +1830,27 @@ _sk_lerp_u8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x2f00e410 // movi d16, #0x0
- .long 0x54000140 // b.eq 181c <sk_lerp_u8_aarch64+0xbc> // b.none
+ .long 0x54000220 // b.eq 185c <sk_lerp_u8_aarch64+0xd4> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000c0 // b.eq 1814 <sk_lerp_u8_aarch64+0xb4> // b.none
+ .long 0x2f00e410 // movi d16, #0x0
+ .long 0x540000c0 // b.eq 183c <sk_lerp_u8_aarch64+0xb4> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc61 // b.ne 1790 <sk_lerp_u8_aarch64+0x30> // b.any
+ .long 0x54fffc61 // b.ne 17b8 <sk_lerp_u8_aarch64+0x30> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e0a1d30 // mov v16.h[2], w9
- .long 0x39400509 // ldrb w9, [x8, #1]
- .long 0x4e061d30 // mov v16.h[1], w9
+ .long 0x39400109 // ldrb w9, [x8]
+ .long 0x39400508 // ldrb w8, [x8, #1]
+ .long 0x4e041d31 // mov v17.s[0], w9
+ .long 0x4e0c1d11 // mov v17.s[1], w8
+ .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
+ .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
+ .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
+ .long 0x17ffffd8 // b 17b8 <sk_lerp_u8_aarch64+0x30>
.long 0x39400108 // ldrb w8, [x8]
+ .long 0x0e020ff0 // dup v16.4h, wzr
.long 0x4e021d10 // mov v16.h[0], w8
- .long 0x17ffffdb // b 1790 <sk_lerp_u8_aarch64+0x30>
+ .long 0x17ffffd4 // b 17b8 <sk_lerp_u8_aarch64+0x30>
HIDDEN _sk_lerp_565_aarch64
.globl _sk_lerp_565_aarch64
@@ -1842,7 +1859,7 @@ _sk_lerp_565_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020508 // add x8, x8, x2, lsl #1
- .long 0xb50005c4 // cbnz x4, 18ec <sk_lerp_565_aarch64+0xc4>
+ .long 0xb50005c4 // cbnz x4, 1930 <sk_lerp_565_aarch64+0xc4>
.long 0xfd400110 // ldr d16, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d12 // dup v18.4s, w8
@@ -1890,19 +1907,26 @@ _sk_lerp_565_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x2f00e410 // movi d16, #0x0
- .long 0x54000140 // b.eq 1920 <sk_lerp_565_aarch64+0xf8> // b.none
+ .long 0x54000220 // b.eq 197c <sk_lerp_565_aarch64+0x110> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000c0 // b.eq 1918 <sk_lerp_565_aarch64+0xf0> // b.none
+ .long 0x2f00e410 // movi d16, #0x0
+ .long 0x540000c0 // b.eq 195c <sk_lerp_565_aarch64+0xf0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fff9a1 // b.ne 183c <sk_lerp_565_aarch64+0x14> // b.any
+ .long 0x54fff9a1 // b.ne 1880 <sk_lerp_565_aarch64+0x14> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020ff0 // dup v16.4h, wzr
.long 0x0d405130 // ld1 {v16.h}[2], [x9]
- .long 0x91000909 // add x9, x8, #0x2
- .long 0x0d404930 // ld1 {v16.h}[1], [x9]
+ .long 0x79400109 // ldrh w9, [x8]
+ .long 0x79400508 // ldrh w8, [x8, #2]
+ .long 0x4e041d31 // mov v17.s[0], w9
+ .long 0x4e0c1d11 // mov v17.s[1], w8
+ .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h
+ .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4
+ .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4
+ .long 0x17ffffc2 // b 1880 <sk_lerp_565_aarch64+0x14>
+ .long 0x0e020ff0 // dup v16.4h, wzr
.long 0x0d404110 // ld1 {v16.h}[0], [x8]
- .long 0x17ffffc6 // b 183c <sk_lerp_565_aarch64+0x14>
+ .long 0x17ffffbf // b 1880 <sk_lerp_565_aarch64+0x14>
HIDDEN _sk_load_tables_aarch64
.globl _sk_load_tables_aarch64
@@ -1911,7 +1935,7 @@ _sk_load_tables_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400109 // ldr x9, [x8]
.long 0x8b020929 // add x9, x9, x2, lsl #2
- .long 0xb50006e4 // cbnz x4, 1a10 <sk_load_tables_aarch64+0xe8>
+ .long 0xb50006e4 // cbnz x4, 1a70 <sk_load_tables_aarch64+0xe8>
.long 0x3dc00122 // ldr q2, [x9]
.long 0xa940a909 // ldp x9, x10, [x8, #8]
.long 0x6f00e620 // movi v0.2d, #0xff000000ff
@@ -1968,19 +1992,22 @@ _sk_load_tables_aarch64:
.long 0xd61f00a0 // br x5
.long 0x1200048a // and w10, w4, #0x3
.long 0x7100055f // cmp w10, #0x1
- .long 0x6f00e402 // movi v2.2d, #0x0
- .long 0x54000140 // b.eq 1a44 <sk_load_tables_aarch64+0x11c> // b.none
+ .long 0x540001a0 // b.eq 1aac <sk_load_tables_aarch64+0x124> // b.none
.long 0x7100095f // cmp w10, #0x2
- .long 0x540000c0 // b.eq 1a3c <sk_load_tables_aarch64+0x114> // b.none
+ .long 0x6f00e402 // movi v2.2d, #0x0
+ .long 0x540000c0 // b.eq 1a9c <sk_load_tables_aarch64+0x114> // b.none
.long 0x71000d5f // cmp w10, #0x3
- .long 0x54fff881 // b.ne 193c <sk_load_tables_aarch64+0x14> // b.any
+ .long 0x54fff881 // b.ne 199c <sk_load_tables_aarch64+0x14> // b.any
.long 0x9100212a // add x10, x9, #0x8
.long 0x4e040fe2 // dup v2.4s, wzr
.long 0x4d408142 // ld1 {v2.s}[2], [x10]
- .long 0x9100112a // add x10, x9, #0x4
- .long 0x0d409142 // ld1 {v2.s}[1], [x10]
+ .long 0xfd400120 // ldr d0, [x9]
+ .long 0x6e004040 // ext v0.16b, v2.16b, v0.16b, #8
+ .long 0x6e004002 // ext v2.16b, v0.16b, v0.16b, #8
+ .long 0x17ffffbd // b 199c <sk_load_tables_aarch64+0x14>
+ .long 0x4e040fe2 // dup v2.4s, wzr
.long 0x0d408122 // ld1 {v2.s}[0], [x9]
- .long 0x17ffffbd // b 193c <sk_load_tables_aarch64+0x14>
+ .long 0x17ffffba // b 199c <sk_load_tables_aarch64+0x14>
HIDDEN _sk_load_tables_u16_be_aarch64
.globl _sk_load_tables_u16_be_aarch64
@@ -1989,7 +2016,7 @@ _sk_load_tables_u16_be_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400109 // ldr x9, [x8]
.long 0x8b020d29 // add x9, x9, x2, lsl #3
- .long 0xb5000744 // cbnz x4, 1b40 <sk_load_tables_u16_be_aarch64+0xf4>
+ .long 0xb5000744 // cbnz x4, 1bac <sk_load_tables_u16_be_aarch64+0xf4>
.long 0x0c400520 // ld4 {v0.4h-v3.4h}, [x9]
.long 0xa940a909 // ldp x9, x10, [x8, #8]
.long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8
@@ -2049,14 +2076,14 @@ _sk_load_tables_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606120 // ld4 {v0.h-v3.h}[0], [x9]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fff8c0 // b.eq 1a60 <sk_load_tables_u16_be_aarch64+0x14> // b.none
+ .long 0x54fff8c0 // b.eq 1acc <sk_load_tables_u16_be_aarch64+0x14> // b.none
.long 0x9100212a // add x10, x9, #0x8
.long 0x0d606940 // ld4 {v0.h-v3.h}[1], [x10]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fff843 // b.cc 1a60 <sk_load_tables_u16_be_aarch64+0x14> // b.lo, b.ul, b.last
+ .long 0x54fff843 // b.cc 1acc <sk_load_tables_u16_be_aarch64+0x14> // b.lo, b.ul, b.last
.long 0x91004129 // add x9, x9, #0x10
.long 0x0d607120 // ld4 {v0.h-v3.h}[2], [x9]
- .long 0x17ffffbf // b 1a60 <sk_load_tables_u16_be_aarch64+0x14>
+ .long 0x17ffffbf // b 1acc <sk_load_tables_u16_be_aarch64+0x14>
HIDDEN _sk_load_tables_rgb_u16_be_aarch64
.globl _sk_load_tables_rgb_u16_be_aarch64
@@ -2066,7 +2093,7 @@ _sk_load_tables_rgb_u16_be_aarch64:
.long 0x321f07ea // orr w10, wzr, #0x6
.long 0xf9400109 // ldr x9, [x8]
.long 0x9b0a2449 // madd x9, x2, x10, x9
- .long 0xb5000664 // cbnz x4, 1c44 <sk_load_tables_rgb_u16_be_aarch64+0xdc>
+ .long 0xb5000664 // cbnz x4, 1cb0 <sk_load_tables_rgb_u16_be_aarch64+0xdc>
.long 0x0c404520 // ld3 {v0.4h-v2.4h}, [x9]
.long 0xa940a909 // ldp x9, x10, [x8, #8]
.long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8
@@ -2119,14 +2146,14 @@ _sk_load_tables_rgb_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d406120 // ld3 {v0.h-v2.h}[0], [x9]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fff9a0 // b.eq 1b80 <sk_load_tables_rgb_u16_be_aarch64+0x18> // b.none
+ .long 0x54fff9a0 // b.eq 1bec <sk_load_tables_rgb_u16_be_aarch64+0x18> // b.none
.long 0x9100192a // add x10, x9, #0x6
.long 0x0d406940 // ld3 {v0.h-v2.h}[1], [x10]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fff923 // b.cc 1b80 <sk_load_tables_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last
+ .long 0x54fff923 // b.cc 1bec <sk_load_tables_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last
.long 0x91003129 // add x9, x9, #0xc
.long 0x0d407120 // ld3 {v0.h-v2.h}[2], [x9]
- .long 0x17ffffc6 // b 1b80 <sk_load_tables_rgb_u16_be_aarch64+0x18>
+ .long 0x17ffffc6 // b 1bec <sk_load_tables_rgb_u16_be_aarch64+0x18>
HIDDEN _sk_byte_tables_aarch64
.globl _sk_byte_tables_aarch64
@@ -2771,7 +2798,7 @@ _sk_load_a8_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020108 // add x8, x8, x2
- .long 0xb50002e4 // cbnz x4, 25e8 <sk_load_a8_aarch64+0x68>
+ .long 0xb50002e4 // cbnz x4, 2654 <sk_load_a8_aarch64+0x68>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -2796,20 +2823,27 @@ _sk_load_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x2f00e402 // movi d2, #0x0
- .long 0x54000140 // b.eq 261c <sk_load_a8_aarch64+0x9c> // b.none
+ .long 0x54000220 // b.eq 26a0 <sk_load_a8_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000c0 // b.eq 2614 <sk_load_a8_aarch64+0x94> // b.none
+ .long 0x2f00e402 // movi d2, #0x0
+ .long 0x540000c0 // b.eq 2680 <sk_load_a8_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 25b0 <sk_load_a8_aarch64+0x30> // b.any
+ .long 0x54fffd61 // b.ne 261c <sk_load_a8_aarch64+0x30> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e0a1d22 // mov v2.h[2], w9
- .long 0x39400509 // ldrb w9, [x8, #1]
- .long 0x4e061d22 // mov v2.h[1], w9
+ .long 0x39400109 // ldrb w9, [x8]
+ .long 0x39400508 // ldrb w8, [x8, #1]
+ .long 0x4e041d20 // mov v0.s[0], w9
+ .long 0x4e0c1d00 // mov v0.s[1], w8
+ .long 0x0e401800 // uzp1 v0.4h, v0.4h, v0.4h
+ .long 0x2e002040 // ext v0.8b, v2.8b, v0.8b, #4
+ .long 0x2e002002 // ext v2.8b, v0.8b, v0.8b, #4
+ .long 0x17ffffe0 // b 261c <sk_load_a8_aarch64+0x30>
.long 0x39400108 // ldrb w8, [x8]
+ .long 0x0e020fe2 // dup v2.4h, wzr
.long 0x4e021d02 // mov v2.h[0], w8
- .long 0x17ffffe3 // b 25b0 <sk_load_a8_aarch64+0x30>
+ .long 0x17ffffdc // b 261c <sk_load_a8_aarch64+0x30>
HIDDEN _sk_gather_a8_aarch64
.globl _sk_gather_a8_aarch64
@@ -2858,7 +2892,7 @@ _sk_store_a8_aarch64:
.long 0x6e21aa10 // fcvtnu v16.4s, v16.4s
.long 0x0e612a10 // xtn v16.4h, v16.4s
.long 0x8b020108 // add x8, x8, x2
- .long 0xb5000184 // cbnz x4, 26f0 <sk_store_a8_aarch64+0x50>
+ .long 0xb5000184 // cbnz x4, 2778 <sk_store_a8_aarch64+0x50>
.long 0x0e0e3e09 // umov w9, v16.h[3]
.long 0x0e0a3e0a // umov w10, v16.h[2]
.long 0x0e063e0b // umov w11, v16.h[1]
@@ -2872,18 +2906,21 @@ _sk_store_a8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 271c <sk_store_a8_aarch64+0x7c> // b.none
+ .long 0x54000180 // b.eq 27b0 <sk_store_a8_aarch64+0x88> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2714 <sk_store_a8_aarch64+0x74> // b.none
+ .long 0x540000a0 // b.eq 279c <sk_store_a8_aarch64+0x74> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 26e4 <sk_store_a8_aarch64+0x44> // b.any
+ .long 0x54fffee1 // b.ne 276c <sk_store_a8_aarch64+0x44> // b.any
.long 0x0e0a3e09 // umov w9, v16.h[2]
.long 0x39000909 // strb w9, [x8, #2]
- .long 0x0e063e09 // umov w9, v16.h[1]
- .long 0x39000509 // strb w9, [x8, #1]
+ .long 0x0e023e09 // umov w9, v16.h[0]
+ .long 0x0e063e0a // umov w10, v16.h[1]
+ .long 0x3900050a // strb w10, [x8, #1]
+ .long 0x39000109 // strb w9, [x8]
+ .long 0x17fffff0 // b 276c <sk_store_a8_aarch64+0x44>
.long 0x0e023e09 // umov w9, v16.h[0]
.long 0x39000109 // strb w9, [x8]
- .long 0x17fffff0 // b 26e4 <sk_store_a8_aarch64+0x44>
+ .long 0x17ffffed // b 276c <sk_store_a8_aarch64+0x44>
HIDDEN _sk_load_g8_aarch64
.globl _sk_load_g8_aarch64
@@ -2892,7 +2929,7 @@ _sk_load_g8_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020108 // add x8, x8, x2
- .long 0xb50002e4 // cbnz x4, 2790 <sk_load_g8_aarch64+0x68>
+ .long 0xb50002e4 // cbnz x4, 2824 <sk_load_g8_aarch64+0x68>
.long 0x39400109 // ldrb w9, [x8]
.long 0x3940050a // ldrb w10, [x8, #1]
.long 0x3940090b // ldrb w11, [x8, #2]
@@ -2917,20 +2954,27 @@ _sk_load_g8_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x2f00e400 // movi d0, #0x0
- .long 0x54000140 // b.eq 27c4 <sk_load_g8_aarch64+0x9c> // b.none
+ .long 0x54000220 // b.eq 2870 <sk_load_g8_aarch64+0xb4> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000c0 // b.eq 27bc <sk_load_g8_aarch64+0x94> // b.none
+ .long 0x2f00e400 // movi d0, #0x0
+ .long 0x540000c0 // b.eq 2850 <sk_load_g8_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffd61 // b.ne 2758 <sk_load_g8_aarch64+0x30> // b.any
+ .long 0x54fffd61 // b.ne 27ec <sk_load_g8_aarch64+0x30> // b.any
.long 0x39400909 // ldrb w9, [x8, #2]
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e0a1d20 // mov v0.h[2], w9
- .long 0x39400509 // ldrb w9, [x8, #1]
- .long 0x4e061d20 // mov v0.h[1], w9
+ .long 0x39400109 // ldrb w9, [x8]
+ .long 0x39400508 // ldrb w8, [x8, #1]
+ .long 0x4e041d21 // mov v1.s[0], w9
+ .long 0x4e0c1d01 // mov v1.s[1], w8
+ .long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
+ .long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
+ .long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
+ .long 0x17ffffe0 // b 27ec <sk_load_g8_aarch64+0x30>
.long 0x39400108 // ldrb w8, [x8]
+ .long 0x0e020fe0 // dup v0.4h, wzr
.long 0x4e021d00 // mov v0.h[0], w8
- .long 0x17ffffe3 // b 2758 <sk_load_g8_aarch64+0x30>
+ .long 0x17ffffdc // b 27ec <sk_load_g8_aarch64+0x30>
HIDDEN _sk_gather_g8_aarch64
.globl _sk_gather_g8_aarch64
@@ -2973,9 +3017,9 @@ FUNCTION(_sk_gather_i8_aarch64)
_sk_gather_i8_aarch64:
.long 0xaa0103e8 // mov x8, x1
.long 0xf8408429 // ldr x9, [x1], #8
- .long 0xb4000069 // cbz x9, 285c <sk_gather_i8_aarch64+0x14>
+ .long 0xb4000069 // cbz x9, 290c <sk_gather_i8_aarch64+0x14>
.long 0xaa0903ea // mov x10, x9
- .long 0x14000003 // b 2864 <sk_gather_i8_aarch64+0x1c>
+ .long 0x14000003 // b 2914 <sk_gather_i8_aarch64+0x1c>
.long 0xf940050a // ldr x10, [x8, #8]
.long 0x91004101 // add x1, x8, #0x10
.long 0xf8410548 // ldr x8, [x10], #16
@@ -3038,7 +3082,7 @@ _sk_load_565_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020508 // add x8, x8, x2, lsl #1
- .long 0xb50003c4 // cbnz x4, 29b8 <sk_load_565_aarch64+0x84>
+ .long 0xb50003c4 // cbnz x4, 2a68 <sk_load_565_aarch64+0x84>
.long 0xfd400100 // ldr d0, [x8]
.long 0x321b17e8 // orr w8, wzr, #0x7e0
.long 0x4e040d02 // dup v2.4s, w8
@@ -3070,19 +3114,26 @@ _sk_load_565_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x2f00e400 // movi d0, #0x0
- .long 0x54000140 // b.eq 29ec <sk_load_565_aarch64+0xb8> // b.none
+ .long 0x54000220 // b.eq 2ab4 <sk_load_565_aarch64+0xd0> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000c0 // b.eq 29e4 <sk_load_565_aarch64+0xb0> // b.none
+ .long 0x2f00e400 // movi d0, #0x0
+ .long 0x540000c0 // b.eq 2a94 <sk_load_565_aarch64+0xb0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffba1 // b.ne 2948 <sk_load_565_aarch64+0x14> // b.any
+ .long 0x54fffba1 // b.ne 29f8 <sk_load_565_aarch64+0x14> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
- .long 0x91000909 // add x9, x8, #0x2
- .long 0x0d404920 // ld1 {v0.h}[1], [x9]
+ .long 0x79400109 // ldrh w9, [x8]
+ .long 0x79400508 // ldrh w8, [x8, #2]
+ .long 0x4e041d21 // mov v1.s[0], w9
+ .long 0x4e0c1d01 // mov v1.s[1], w8
+ .long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
+ .long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
+ .long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
+ .long 0x17ffffd2 // b 29f8 <sk_load_565_aarch64+0x14>
+ .long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffd6 // b 2948 <sk_load_565_aarch64+0x14>
+ .long 0x17ffffcf // b 29f8 <sk_load_565_aarch64+0x14>
HIDDEN _sk_gather_565_aarch64
.globl _sk_gather_565_aarch64
@@ -3154,24 +3205,24 @@ _sk_store_565_aarch64:
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
.long 0x8b020508 // add x8, x8, x2, lsl #1
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 2afc <sk_store_565_aarch64+0x58>
+ .long 0xb50000a4 // cbnz x4, 2bc8 <sk_store_565_aarch64+0x58>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 2b28 <sk_store_565_aarch64+0x84> // b.none
+ .long 0x54000120 // b.eq 2bf4 <sk_store_565_aarch64+0x84> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2b20 <sk_store_565_aarch64+0x7c> // b.none
+ .long 0x540000a0 // b.eq 2bec <sk_store_565_aarch64+0x7c> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 2af0 <sk_store_565_aarch64+0x4c> // b.any
+ .long 0x54fffee1 // b.ne 2bbc <sk_store_565_aarch64+0x4c> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 2af0 <sk_store_565_aarch64+0x4c>
+ .long 0x17fffff1 // b 2bbc <sk_store_565_aarch64+0x4c>
HIDDEN _sk_load_4444_aarch64
.globl _sk_load_4444_aarch64
@@ -3180,7 +3231,7 @@ _sk_load_4444_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020508 // add x8, x8, x2, lsl #1
- .long 0xb5000444 // cbnz x4, 2bc4 <sk_load_4444_aarch64+0x94>
+ .long 0xb5000444 // cbnz x4, 2c90 <sk_load_4444_aarch64+0x94>
.long 0xfd400100 // ldr d0, [x8]
.long 0x52a6f108 // mov w8, #0x37880000
.long 0x2f10a400 // uxtl v0.4s, v0.4h
@@ -3216,19 +3267,26 @@ _sk_load_4444_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x2f00e400 // movi d0, #0x0
- .long 0x54000140 // b.eq 2bf8 <sk_load_4444_aarch64+0xc8> // b.none
+ .long 0x54000220 // b.eq 2cdc <sk_load_4444_aarch64+0xe0> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000c0 // b.eq 2bf0 <sk_load_4444_aarch64+0xc0> // b.none
+ .long 0x2f00e400 // movi d0, #0x0
+ .long 0x540000c0 // b.eq 2cbc <sk_load_4444_aarch64+0xc0> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffb21 // b.ne 2b44 <sk_load_4444_aarch64+0x14> // b.any
+ .long 0x54fffb21 // b.ne 2c10 <sk_load_4444_aarch64+0x14> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d405120 // ld1 {v0.h}[2], [x9]
- .long 0x91000909 // add x9, x8, #0x2
- .long 0x0d404920 // ld1 {v0.h}[1], [x9]
+ .long 0x79400109 // ldrh w9, [x8]
+ .long 0x79400508 // ldrh w8, [x8, #2]
+ .long 0x4e041d21 // mov v1.s[0], w9
+ .long 0x4e0c1d01 // mov v1.s[1], w8
+ .long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h
+ .long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4
+ .long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4
+ .long 0x17ffffce // b 2c10 <sk_load_4444_aarch64+0x14>
+ .long 0x0e020fe0 // dup v0.4h, wzr
.long 0x0d404100 // ld1 {v0.h}[0], [x8]
- .long 0x17ffffd2 // b 2b44 <sk_load_4444_aarch64+0x14>
+ .long 0x17ffffcb // b 2c10 <sk_load_4444_aarch64+0x14>
HIDDEN _sk_gather_4444_aarch64
.globl _sk_gather_4444_aarch64
@@ -3307,24 +3365,24 @@ _sk_store_4444_aarch64:
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
.long 0x8b020508 // add x8, x8, x2, lsl #1
.long 0x0e612a10 // xtn v16.4h, v16.4s
- .long 0xb50000a4 // cbnz x4, 2d24 <sk_store_4444_aarch64+0x60>
+ .long 0xb50000a4 // cbnz x4, 2e0c <sk_store_4444_aarch64+0x60>
.long 0xfd000110 // str d16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 2d50 <sk_store_4444_aarch64+0x8c> // b.none
+ .long 0x54000120 // b.eq 2e38 <sk_store_4444_aarch64+0x8c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2d48 <sk_store_4444_aarch64+0x84> // b.none
+ .long 0x540000a0 // b.eq 2e30 <sk_store_4444_aarch64+0x84> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 2d18 <sk_store_4444_aarch64+0x54> // b.any
+ .long 0x54fffee1 // b.ne 2e00 <sk_store_4444_aarch64+0x54> // b.any
.long 0x91001109 // add x9, x8, #0x4
.long 0x0d005130 // st1 {v16.h}[2], [x9]
.long 0x91000909 // add x9, x8, #0x2
.long 0x0d004930 // st1 {v16.h}[1], [x9]
.long 0x0d004110 // st1 {v16.h}[0], [x8]
- .long 0x17fffff1 // b 2d18 <sk_store_4444_aarch64+0x54>
+ .long 0x17fffff1 // b 2e00 <sk_store_4444_aarch64+0x54>
HIDDEN _sk_load_8888_aarch64
.globl _sk_load_8888_aarch64
@@ -3333,7 +3391,7 @@ _sk_load_8888_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020908 // add x8, x8, x2, lsl #2
- .long 0xb50002e4 // cbnz x4, 2dc0 <sk_load_8888_aarch64+0x68>
+ .long 0xb50002e4 // cbnz x4, 2ea8 <sk_load_8888_aarch64+0x68>
.long 0x3dc00100 // ldr q0, [x8]
.long 0x6f00e621 // movi v1.2d, #0xff000000ff
.long 0x52a77008 // mov w8, #0x3b800000
@@ -3358,19 +3416,22 @@ _sk_load_8888_aarch64:
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x6f00e400 // movi v0.2d, #0x0
- .long 0x54000140 // b.eq 2df4 <sk_load_8888_aarch64+0x9c> // b.none
+ .long 0x540001a0 // b.eq 2ee4 <sk_load_8888_aarch64+0xa4> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000c0 // b.eq 2dec <sk_load_8888_aarch64+0x94> // b.none
+ .long 0x6f00e400 // movi v0.2d, #0x0
+ .long 0x540000c0 // b.eq 2ed4 <sk_load_8888_aarch64+0x94> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffc81 // b.ne 2d6c <sk_load_8888_aarch64+0x14> // b.any
+ .long 0x54fffc81 // b.ne 2e54 <sk_load_8888_aarch64+0x14> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4e040fe0 // dup v0.4s, wzr
.long 0x4d408120 // ld1 {v0.s}[2], [x9]
- .long 0x91001109 // add x9, x8, #0x4
- .long 0x0d409120 // ld1 {v0.s}[1], [x9]
+ .long 0xfd400101 // ldr d1, [x8]
+ .long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8
+ .long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8
+ .long 0x17ffffdd // b 2e54 <sk_load_8888_aarch64+0x14>
+ .long 0x4e040fe0 // dup v0.4s, wzr
.long 0x0d408100 // ld1 {v0.s}[0], [x8]
- .long 0x17ffffdd // b 2d6c <sk_load_8888_aarch64+0x14>
+ .long 0x17ffffda // b 2e54 <sk_load_8888_aarch64+0x14>
HIDDEN _sk_gather_8888_aarch64
.globl _sk_gather_8888_aarch64
@@ -3438,24 +3499,24 @@ _sk_store_8888_aarch64:
.long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b
.long 0x8b020908 // add x8, x8, x2, lsl #2
.long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b
- .long 0xb50000a4 // cbnz x4, 2ef4 <sk_store_8888_aarch64+0x60>
+ .long 0xb50000a4 // cbnz x4, 2fe8 <sk_store_8888_aarch64+0x60>
.long 0x3d800110 // str q16, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x12000489 // and w9, w4, #0x3
.long 0x7100053f // cmp w9, #0x1
- .long 0x54000120 // b.eq 2f20 <sk_store_8888_aarch64+0x8c> // b.none
+ .long 0x54000120 // b.eq 3014 <sk_store_8888_aarch64+0x8c> // b.none
.long 0x7100093f // cmp w9, #0x2
- .long 0x540000a0 // b.eq 2f18 <sk_store_8888_aarch64+0x84> // b.none
+ .long 0x540000a0 // b.eq 300c <sk_store_8888_aarch64+0x84> // b.none
.long 0x71000d3f // cmp w9, #0x3
- .long 0x54fffee1 // b.ne 2ee8 <sk_store_8888_aarch64+0x54> // b.any
+ .long 0x54fffee1 // b.ne 2fdc <sk_store_8888_aarch64+0x54> // b.any
.long 0x91002109 // add x9, x8, #0x8
.long 0x4d008130 // st1 {v16.s}[2], [x9]
- .long 0x91001109 // add x9, x8, #0x4
- .long 0x0d009130 // st1 {v16.s}[1], [x9]
+ .long 0xfd000110 // str d16, [x8]
+ .long 0x17fffff3 // b 2fdc <sk_store_8888_aarch64+0x54>
.long 0x0d008110 // st1 {v16.s}[0], [x8]
- .long 0x17fffff1 // b 2ee8 <sk_store_8888_aarch64+0x54>
+ .long 0x17fffff1 // b 2fdc <sk_store_8888_aarch64+0x54>
HIDDEN _sk_load_f16_aarch64
.globl _sk_load_f16_aarch64
@@ -3464,7 +3525,7 @@ _sk_load_f16_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020d08 // add x8, x8, x2, lsl #3
- .long 0xb5000124 // cbnz x4, 2f58 <sk_load_f16_aarch64+0x30>
+ .long 0xb5000124 // cbnz x4, 304c <sk_load_f16_aarch64+0x30>
.long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x0e217a00 // fcvtl v0.4s, v16.4h
@@ -3475,14 +3536,14 @@ _sk_load_f16_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffee0 // b.eq 2f3c <sk_load_f16_aarch64+0x14> // b.none
+ .long 0x54fffee0 // b.eq 3030 <sk_load_f16_aarch64+0x14> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffe63 // b.cc 2f3c <sk_load_f16_aarch64+0x14> // b.lo, b.ul, b.last
+ .long 0x54fffe63 // b.cc 3030 <sk_load_f16_aarch64+0x14> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff0 // b 2f3c <sk_load_f16_aarch64+0x14>
+ .long 0x17fffff0 // b 3030 <sk_load_f16_aarch64+0x14>
HIDDEN _sk_gather_f16_aarch64
.globl _sk_gather_f16_aarch64
@@ -3536,21 +3597,21 @@ _sk_store_f16_aarch64:
.long 0xf9400108 // ldr x8, [x8]
.long 0x0e216873 // fcvtn v19.4h, v3.4s
.long 0x8b020d08 // add x8, x8, x2, lsl #3
- .long 0xb50000a4 // cbnz x4, 3040 <sk_store_f16_aarch64+0x30>
+ .long 0xb50000a4 // cbnz x4, 3134 <sk_store_f16_aarch64+0x30>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3034 <sk_store_f16_aarch64+0x24> // b.none
+ .long 0x54ffff60 // b.eq 3128 <sk_store_f16_aarch64+0x24> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3034 <sk_store_f16_aarch64+0x24> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3128 <sk_store_f16_aarch64+0x24> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3034 <sk_store_f16_aarch64+0x24>
+ .long 0x17fffff4 // b 3128 <sk_store_f16_aarch64+0x24>
HIDDEN _sk_load_u16_be_aarch64
.globl _sk_load_u16_be_aarch64
@@ -3559,7 +3620,7 @@ _sk_load_u16_be_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b020d08 // add x8, x8, x2, lsl #3
- .long 0xb5000404 // cbnz x4, 30f4 <sk_load_u16_be_aarch64+0x8c>
+ .long 0xb5000404 // cbnz x4, 31e8 <sk_load_u16_be_aarch64+0x8c>
.long 0x0c400500 // ld4 {v0.4h-v3.4h}, [x8]
.long 0x0f185410 // shl v16.4h, v0.4h, #8
.long 0x2f180411 // ushr v17.4h, v0.4h, #8
@@ -3593,14 +3654,14 @@ _sk_load_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d606100 // ld4 {v0.h-v3.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc00 // b.eq 307c <sk_load_u16_be_aarch64+0x14> // b.none
+ .long 0x54fffc00 // b.eq 3170 <sk_load_u16_be_aarch64+0x14> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0x0d606920 // ld4 {v0.h-v3.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffb83 // b.cc 307c <sk_load_u16_be_aarch64+0x14> // b.lo, b.ul, b.last
+ .long 0x54fffb83 // b.cc 3170 <sk_load_u16_be_aarch64+0x14> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d607100 // ld4 {v0.h-v3.h}[2], [x8]
- .long 0x17ffffd9 // b 307c <sk_load_u16_be_aarch64+0x14>
+ .long 0x17ffffd9 // b 3170 <sk_load_u16_be_aarch64+0x14>
HIDDEN _sk_load_rgb_u16_be_aarch64
.globl _sk_load_rgb_u16_be_aarch64
@@ -3610,7 +3671,7 @@ _sk_load_rgb_u16_be_aarch64:
.long 0x321f07e9 // orr w9, wzr, #0x6
.long 0xf9400108 // ldr x8, [x8]
.long 0x9b092048 // madd x8, x2, x9, x8
- .long 0xb5000384 // cbnz x4, 319c <sk_load_rgb_u16_be_aarch64+0x80>
+ .long 0xb5000384 // cbnz x4, 3290 <sk_load_rgb_u16_be_aarch64+0x80>
.long 0x0c404500 // ld3 {v0.4h-v2.4h}, [x8]
.long 0x0f185403 // shl v3.4h, v0.4h, #8
.long 0x2f180410 // ushr v16.4h, v0.4h, #8
@@ -3640,14 +3701,14 @@ _sk_load_rgb_u16_be_aarch64:
.long 0xd61f00a0 // br x5
.long 0x0d406100 // ld3 {v0.h-v2.h}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54fffc80 // b.eq 3134 <sk_load_rgb_u16_be_aarch64+0x18> // b.none
+ .long 0x54fffc80 // b.eq 3228 <sk_load_rgb_u16_be_aarch64+0x18> // b.none
.long 0x91001909 // add x9, x8, #0x6
.long 0x0d406920 // ld3 {v0.h-v2.h}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffc03 // b.cc 3134 <sk_load_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last
+ .long 0x54fffc03 // b.cc 3228 <sk_load_rgb_u16_be_aarch64+0x18> // b.lo, b.ul, b.last
.long 0x91003108 // add x8, x8, #0xc
.long 0x0d407100 // ld3 {v0.h-v2.h}[2], [x8]
- .long 0x17ffffdd // b 3134 <sk_load_rgb_u16_be_aarch64+0x18>
+ .long 0x17ffffdd // b 3228 <sk_load_rgb_u16_be_aarch64+0x18>
HIDDEN _sk_store_u16_be_aarch64
.globl _sk_store_u16_be_aarch64
@@ -3683,21 +3744,21 @@ _sk_store_u16_be_aarch64:
.long 0x2f180694 // ushr v20.4h, v20.4h, #8
.long 0x8b020d08 // add x8, x8, x2, lsl #3
.long 0x0eb41eb3 // orr v19.8b, v21.8b, v20.8b
- .long 0xb50000a4 // cbnz x4, 3250 <sk_store_u16_be_aarch64+0x8c>
+ .long 0xb50000a4 // cbnz x4, 3344 <sk_store_u16_be_aarch64+0x8c>
.long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8]
- .long 0x54ffff60 // b.eq 3244 <sk_store_u16_be_aarch64+0x80> // b.none
+ .long 0x54ffff60 // b.eq 3338 <sk_store_u16_be_aarch64+0x80> // b.none
.long 0x91002109 // add x9, x8, #0x8
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9]
- .long 0x54fffee3 // b.cc 3244 <sk_store_u16_be_aarch64+0x80> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3338 <sk_store_u16_be_aarch64+0x80> // b.lo, b.ul, b.last
.long 0x91004108 // add x8, x8, #0x10
.long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8]
- .long 0x17fffff4 // b 3244 <sk_store_u16_be_aarch64+0x80>
+ .long 0x17fffff4 // b 3338 <sk_store_u16_be_aarch64+0x80>
HIDDEN _sk_load_f32_aarch64
.globl _sk_load_f32_aarch64
@@ -3706,21 +3767,21 @@ _sk_load_f32_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b021108 // add x8, x8, x2, lsl #4
- .long 0xb50000a4 // cbnz x4, 3298 <sk_load_f32_aarch64+0x20>
+ .long 0xb50000a4 // cbnz x4, 338c <sk_load_f32_aarch64+0x20>
.long 0x4c400900 // ld4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0x0d60a100 // ld4 {v0.s-v3.s}[0], [x8]
.long 0xf100049f // cmp x4, #0x1
- .long 0x54ffff60 // b.eq 328c <sk_load_f32_aarch64+0x14> // b.none
+ .long 0x54ffff60 // b.eq 3380 <sk_load_f32_aarch64+0x14> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0x0d60b120 // ld4 {v0.s-v3.s}[1], [x9]
.long 0xf1000c9f // cmp x4, #0x3
- .long 0x54fffee3 // b.cc 328c <sk_load_f32_aarch64+0x14> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 3380 <sk_load_f32_aarch64+0x14> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d60a100 // ld4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 328c <sk_load_f32_aarch64+0x14>
+ .long 0x17fffff4 // b 3380 <sk_load_f32_aarch64+0x14>
HIDDEN _sk_store_f32_aarch64
.globl _sk_store_f32_aarch64
@@ -3729,21 +3790,21 @@ _sk_store_f32_aarch64:
.long 0xf9400028 // ldr x8, [x1]
.long 0xf9400108 // ldr x8, [x8]
.long 0x8b021108 // add x8, x8, x2, lsl #4
- .long 0xb50000a4 // cbnz x4, 32e0 <sk_store_f32_aarch64+0x20>
+ .long 0xb50000a4 // cbnz x4, 33d4 <sk_store_f32_aarch64+0x20>
.long 0x4c000900 // st4 {v0.4s-v3.4s}, [x8]
.long 0xf9400425 // ldr x5, [x1, #8]
.long 0x91004021 // add x1, x1, #0x10
.long 0xd61f00a0 // br x5
.long 0xf100049f // cmp x4, #0x1
.long 0x0d20a100 // st4 {v0.s-v3.s}[0], [x8]
- .long 0x54ffff60 // b.eq 32d4 <sk_store_f32_aarch64+0x14> // b.none
+ .long 0x54ffff60 // b.eq 33c8 <sk_store_f32_aarch64+0x14> // b.none
.long 0x91004109 // add x9, x8, #0x10
.long 0xf1000c9f // cmp x4, #0x3
.long 0x0d20b120 // st4 {v0.s-v3.s}[1], [x9]
- .long 0x54fffee3 // b.cc 32d4 <sk_store_f32_aarch64+0x14> // b.lo, b.ul, b.last
+ .long 0x54fffee3 // b.cc 33c8 <sk_store_f32_aarch64+0x14> // b.lo, b.ul, b.last
.long 0x91008108 // add x8, x8, #0x20
.long 0x4d20a100 // st4 {v0.s-v3.s}[2], [x8]
- .long 0x17fffff4 // b 32d4 <sk_store_f32_aarch64+0x14>
+ .long 0x17fffff4 // b 33c8 <sk_store_f32_aarch64+0x14>
HIDDEN _sk_clamp_x_aarch64
.globl _sk_clamp_x_aarch64
@@ -4202,7 +4263,7 @@ _sk_gradient_aarch64:
.long 0x6f00e411 // movi v17.2d, #0x0
.long 0xf9400109 // ldr x9, [x8]
.long 0xf100093f // cmp x9, #0x2
- .long 0x540001c3 // b.cc 3900 <sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
+ .long 0x540001c3 // b.cc 39f4 <sk_gradient_aarch64+0x58> // b.lo, b.ul, b.last
.long 0xf940250a // ldr x10, [x8, #72]
.long 0xd1000529 // sub x9, x9, #0x1
.long 0x6f00e401 // movi v1.2d, #0x0
@@ -4213,7 +4274,7 @@ _sk_gradient_aarch64:
.long 0x6e23e403 // fcmge v3.4s, v0.4s, v3.4s
.long 0x4e221c63 // and v3.16b, v3.16b, v2.16b
.long 0x4ea18461 // add v1.4s, v3.4s, v1.4s
- .long 0xb5ffff69 // cbnz x9, 38e0 <sk_gradient_aarch64+0x38>
+ .long 0xb5ffff69 // cbnz x9, 39d4 <sk_gradient_aarch64+0x38>
.long 0x6f20a431 // uxtl2 v17.2d, v1.4s
.long 0x2f20a421 // uxtl v1.2d, v1.2s
.long 0xa940b10a // ldp x10, x12, [x8, #8]
@@ -9828,7 +9889,7 @@ _sk_seed_shader_hsw:
.byte 197,249,110,194 // vmovd %edx,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,14,75,0,0 // vbroadcastss 0x4b0e(%rip),%ymm1 # 4be8 <_sk_callback_hsw+0x144>
+ .byte 196,226,125,24,13,206,75,0,0 // vbroadcastss 0x4bce(%rip),%ymm1 # 4ca8 <_sk_callback_hsw+0x144>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -9836,7 +9897,7 @@ _sk_seed_shader_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,238,74,0,0 // vbroadcastss 0x4aee(%rip),%ymm2 # 4bec <_sk_callback_hsw+0x148>
+ .byte 196,226,125,24,21,174,75,0,0 // vbroadcastss 0x4bae(%rip),%ymm2 # 4cac <_sk_callback_hsw+0x148>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -9855,13 +9916,13 @@ _sk_dither_hsw:
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9
.byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9
- .byte 196,98,125,88,21,181,74,0,0 // vpbroadcastd 0x4ab5(%rip),%ymm10 # 4bf0 <_sk_callback_hsw+0x14c>
+ .byte 196,98,125,88,21,117,75,0,0 // vpbroadcastd 0x4b75(%rip),%ymm10 # 4cb0 <_sk_callback_hsw+0x14c>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,154,74,0,0 // vpbroadcastd 0x4a9a(%rip),%ymm12 # 4bf4 <_sk_callback_hsw+0x150>
- .byte 196,98,125,88,45,149,74,0,0 // vpbroadcastd 0x4a95(%rip),%ymm13 # 4bf8 <_sk_callback_hsw+0x154>
+ .byte 196,98,125,88,37,90,75,0,0 // vpbroadcastd 0x4b5a(%rip),%ymm12 # 4cb4 <_sk_callback_hsw+0x150>
+ .byte 196,98,125,88,45,85,75,0,0 // vpbroadcastd 0x4b55(%rip),%ymm13 # 4cb8 <_sk_callback_hsw+0x154>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -9876,8 +9937,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,71,74,0,0 // vbroadcastss 0x4a47(%rip),%ymm9 # 4bfc <_sk_callback_hsw+0x158>
- .byte 196,98,125,24,21,66,74,0,0 // vbroadcastss 0x4a42(%rip),%ymm10 # 4c00 <_sk_callback_hsw+0x15c>
+ .byte 196,98,125,24,13,7,75,0,0 // vbroadcastss 0x4b07(%rip),%ymm9 # 4cbc <_sk_callback_hsw+0x158>
+ .byte 196,98,125,24,21,2,75,0,0 // vbroadcastss 0x4b02(%rip),%ymm10 # 4cc0 <_sk_callback_hsw+0x15c>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
@@ -9946,7 +10007,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,154,73,0,0 // vbroadcastss 0x499a(%rip),%ymm8 # 4c04 <_sk_callback_hsw+0x160>
+ .byte 196,98,125,24,5,90,74,0,0 // vbroadcastss 0x4a5a(%rip),%ymm8 # 4cc4 <_sk_callback_hsw+0x160>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -9962,7 +10023,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,109,73,0,0 // vbroadcastss 0x496d(%rip),%ymm8 # 4c08 <_sk_callback_hsw+0x164>
+ .byte 196,98,125,24,5,45,74,0,0 // vbroadcastss 0x4a2d(%rip),%ymm8 # 4cc8 <_sk_callback_hsw+0x164>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -10001,7 +10062,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,20,73,0,0 // vbroadcastss 0x4914(%rip),%ymm8 # 4c0c <_sk_callback_hsw+0x168>
+ .byte 196,98,125,24,5,212,73,0,0 // vbroadcastss 0x49d4(%rip),%ymm8 # 4ccc <_sk_callback_hsw+0x168>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -10014,7 +10075,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,247,72,0,0 // vbroadcastss 0x48f7(%rip),%ymm0 # 4c10 <_sk_callback_hsw+0x16c>
+ .byte 196,226,125,24,5,183,73,0,0 // vbroadcastss 0x49b7(%rip),%ymm0 # 4cd0 <_sk_callback_hsw+0x16c>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -10027,7 +10088,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,218,72,0,0 // vbroadcastss 0x48da(%rip),%ymm8 # 4c14 <_sk_callback_hsw+0x170>
+ .byte 196,98,125,24,5,154,73,0,0 // vbroadcastss 0x499a(%rip),%ymm8 # 4cd4 <_sk_callback_hsw+0x170>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -10040,7 +10101,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,185,72,0,0 // vbroadcastss 0x48b9(%rip),%ymm8 # 4c18 <_sk_callback_hsw+0x174>
+ .byte 196,98,125,24,5,121,73,0,0 // vbroadcastss 0x4979(%rip),%ymm8 # 4cd8 <_sk_callback_hsw+0x174>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -10064,7 +10125,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,132,72,0,0 // vbroadcastss 0x4884(%rip),%ymm8 # 4c1c <_sk_callback_hsw+0x178>
+ .byte 196,98,125,24,5,68,73,0,0 // vbroadcastss 0x4944(%rip),%ymm8 # 4cdc <_sk_callback_hsw+0x178>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -10112,7 +10173,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,255,71,0,0 // vbroadcastss 0x47ff(%rip),%ymm8 # 4c20 <_sk_callback_hsw+0x17c>
+ .byte 196,98,125,24,5,191,72,0,0 // vbroadcastss 0x48bf(%rip),%ymm8 # 4ce0 <_sk_callback_hsw+0x17c>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -10146,7 +10207,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,135,71,0,0 // vbroadcastss 0x4787(%rip),%ymm8 # 4c24 <_sk_callback_hsw+0x180>
+ .byte 196,98,125,24,5,71,72,0,0 // vbroadcastss 0x4847(%rip),%ymm8 # 4ce4 <_sk_callback_hsw+0x180>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -10171,7 +10232,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,54,71,0,0 // vbroadcastss 0x4736(%rip),%ymm8 # 4c28 <_sk_callback_hsw+0x184>
+ .byte 196,98,125,24,5,246,71,0,0 // vbroadcastss 0x47f6(%rip),%ymm8 # 4ce8 <_sk_callback_hsw+0x184>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -10199,7 +10260,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,217,70,0,0 // vbroadcastss 0x46d9(%rip),%ymm8 # 4c2c <_sk_callback_hsw+0x188>
+ .byte 196,98,125,24,5,153,71,0,0 // vbroadcastss 0x4799(%rip),%ymm8 # 4cec <_sk_callback_hsw+0x188>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -10221,7 +10282,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,151,70,0,0 // vbroadcastss 0x4697(%rip),%ymm8 # 4c30 <_sk_callback_hsw+0x18c>
+ .byte 196,98,125,24,5,87,71,0,0 // vbroadcastss 0x4757(%rip),%ymm8 # 4cf0 <_sk_callback_hsw+0x18c>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -10231,7 +10292,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,133,70,0,0 // vbroadcastss 0x4685(%rip),%ymm8 # 4c34 <_sk_callback_hsw+0x190>
+ .byte 196,98,125,24,5,69,71,0,0 // vbroadcastss 0x4745(%rip),%ymm8 # 4cf4 <_sk_callback_hsw+0x190>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -10289,7 +10350,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,144,69,0,0 // vbroadcastss 0x4590(%rip),%ymm9 # 4c38 <_sk_callback_hsw+0x194>
+ .byte 196,98,125,24,13,80,70,0,0 // vbroadcastss 0x4650(%rip),%ymm9 # 4cf8 <_sk_callback_hsw+0x194>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -10342,7 +10403,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,177,68,0,0 // vbroadcastss 0x44b1(%rip),%ymm8 # 4c3c <_sk_callback_hsw+0x198>
+ .byte 196,98,125,24,5,113,69,0,0 // vbroadcastss 0x4571(%rip),%ymm8 # 4cfc <_sk_callback_hsw+0x198>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -10393,7 +10454,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,233,67,0,0 // vbroadcastss 0x43e9(%rip),%ymm8 # 4c40 <_sk_callback_hsw+0x19c>
+ .byte 196,98,125,24,5,169,68,0,0 // vbroadcastss 0x44a9(%rip),%ymm8 # 4d00 <_sk_callback_hsw+0x19c>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -10454,10 +10515,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,244,66,0,0 // vbroadcastss 0x42f4(%rip),%ymm11 # 4c48 <_sk_callback_hsw+0x1a4>
+ .byte 196,98,125,24,29,180,67,0,0 // vbroadcastss 0x43b4(%rip),%ymm11 # 4d08 <_sk_callback_hsw+0x1a4>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,229,66,0,0 // vbroadcastss 0x42e5(%rip),%ymm12 # 4c4c <_sk_callback_hsw+0x1a8>
+ .byte 196,98,125,24,37,165,67,0,0 // vbroadcastss 0x43a5(%rip),%ymm12 # 4d0c <_sk_callback_hsw+0x1a8>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -10467,7 +10528,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,168,66,0,0 // vbroadcastss 0x42a8(%rip),%ymm8 # 4c44 <_sk_callback_hsw+0x1a0>
+ .byte 196,98,125,24,5,104,67,0,0 // vbroadcastss 0x4368(%rip),%ymm8 # 4d04 <_sk_callback_hsw+0x1a0>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -10580,11 +10641,11 @@ _sk_hue_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,172,64,0,0 // vbroadcastss 0x40ac(%rip),%ymm14 # 4c50 <_sk_callback_hsw+0x1ac>
- .byte 196,98,125,24,61,167,64,0,0 // vbroadcastss 0x40a7(%rip),%ymm15 # 4c54 <_sk_callback_hsw+0x1b0>
+ .byte 196,98,125,24,53,108,65,0,0 // vbroadcastss 0x416c(%rip),%ymm14 # 4d10 <_sk_callback_hsw+0x1ac>
+ .byte 196,98,125,24,61,103,65,0,0 // vbroadcastss 0x4167(%rip),%ymm15 # 4d14 <_sk_callback_hsw+0x1b0>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,152,64,0,0 // vbroadcastss 0x4098(%rip),%ymm0 # 4c58 <_sk_callback_hsw+0x1b4>
+ .byte 196,226,125,24,5,88,65,0,0 // vbroadcastss 0x4158(%rip),%ymm0 # 4d18 <_sk_callback_hsw+0x1b4>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -10639,7 +10700,7 @@ _sk_hue_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,133,63,0,0 // vbroadcastss 0x3f85(%rip),%ymm1 # 4c5c <_sk_callback_hsw+0x1b8>
+ .byte 196,226,125,24,13,69,64,0,0 // vbroadcastss 0x4045(%rip),%ymm1 # 4d1c <_sk_callback_hsw+0x1b8>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -10693,11 +10754,11 @@ _sk_saturation_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,156,62,0,0 // vbroadcastss 0x3e9c(%rip),%ymm14 # 4c60 <_sk_callback_hsw+0x1bc>
- .byte 196,98,125,24,61,151,62,0,0 // vbroadcastss 0x3e97(%rip),%ymm15 # 4c64 <_sk_callback_hsw+0x1c0>
+ .byte 196,98,125,24,53,92,63,0,0 // vbroadcastss 0x3f5c(%rip),%ymm14 # 4d20 <_sk_callback_hsw+0x1bc>
+ .byte 196,98,125,24,61,87,63,0,0 // vbroadcastss 0x3f57(%rip),%ymm15 # 4d24 <_sk_callback_hsw+0x1c0>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,136,62,0,0 // vbroadcastss 0x3e88(%rip),%ymm0 # 4c68 <_sk_callback_hsw+0x1c4>
+ .byte 196,226,125,24,5,72,63,0,0 // vbroadcastss 0x3f48(%rip),%ymm0 # 4d28 <_sk_callback_hsw+0x1c4>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -10752,7 +10813,7 @@ _sk_saturation_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,117,61,0,0 // vbroadcastss 0x3d75(%rip),%ymm1 # 4c6c <_sk_callback_hsw+0x1c8>
+ .byte 196,226,125,24,13,53,62,0,0 // vbroadcastss 0x3e35(%rip),%ymm1 # 4d2c <_sk_callback_hsw+0x1c8>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -10780,11 +10841,11 @@ _sk_color_hsw:
.byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
.byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
.byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
- .byte 196,98,125,24,45,14,61,0,0 // vbroadcastss 0x3d0e(%rip),%ymm13 # 4c70 <_sk_callback_hsw+0x1cc>
- .byte 196,98,125,24,53,9,61,0,0 // vbroadcastss 0x3d09(%rip),%ymm14 # 4c74 <_sk_callback_hsw+0x1d0>
+ .byte 196,98,125,24,45,206,61,0,0 // vbroadcastss 0x3dce(%rip),%ymm13 # 4d30 <_sk_callback_hsw+0x1cc>
+ .byte 196,98,125,24,53,201,61,0,0 // vbroadcastss 0x3dc9(%rip),%ymm14 # 4d34 <_sk_callback_hsw+0x1d0>
.byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
.byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
- .byte 196,98,125,24,61,250,60,0,0 // vbroadcastss 0x3cfa(%rip),%ymm15 # 4c78 <_sk_callback_hsw+0x1d4>
+ .byte 196,98,125,24,61,186,61,0,0 // vbroadcastss 0x3dba(%rip),%ymm15 # 4d38 <_sk_callback_hsw+0x1d4>
.byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -10840,7 +10901,7 @@ _sk_color_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,220,59,0,0 // vbroadcastss 0x3bdc(%rip),%ymm0 # 4c7c <_sk_callback_hsw+0x1d8>
+ .byte 196,226,125,24,5,156,60,0,0 // vbroadcastss 0x3c9c(%rip),%ymm0 # 4d3c <_sk_callback_hsw+0x1d8>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -10868,11 +10929,11 @@ _sk_luminosity_hsw:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
.byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
- .byte 196,98,125,24,45,117,59,0,0 // vbroadcastss 0x3b75(%rip),%ymm13 # 4c80 <_sk_callback_hsw+0x1dc>
- .byte 196,98,125,24,53,112,59,0,0 // vbroadcastss 0x3b70(%rip),%ymm14 # 4c84 <_sk_callback_hsw+0x1e0>
+ .byte 196,98,125,24,45,53,60,0,0 // vbroadcastss 0x3c35(%rip),%ymm13 # 4d40 <_sk_callback_hsw+0x1dc>
+ .byte 196,98,125,24,53,48,60,0,0 // vbroadcastss 0x3c30(%rip),%ymm14 # 4d44 <_sk_callback_hsw+0x1e0>
.byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
.byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
- .byte 196,98,125,24,61,97,59,0,0 // vbroadcastss 0x3b61(%rip),%ymm15 # 4c88 <_sk_callback_hsw+0x1e4>
+ .byte 196,98,125,24,61,33,60,0,0 // vbroadcastss 0x3c21(%rip),%ymm15 # 4d48 <_sk_callback_hsw+0x1e4>
.byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -10928,7 +10989,7 @@ _sk_luminosity_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,67,58,0,0 // vbroadcastss 0x3a43(%rip),%ymm0 # 4c8c <_sk_callback_hsw+0x1e8>
+ .byte 196,226,125,24,5,3,59,0,0 // vbroadcastss 0x3b03(%rip),%ymm0 # 4d4c <_sk_callback_hsw+0x1e8>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -10956,17 +11017,17 @@ _sk_srcover_rgba_8888_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,180,0,0,0 // jne 1358 <_sk_srcover_rgba_8888_hsw+0xcd>
.byte 196,193,124,16,58 // vmovups (%r10),%ymm7
- .byte 197,196,84,37,79,61,0,0 // vandps 0x3d4f(%rip),%ymm7,%ymm4 # 5000 <_sk_callback_hsw+0x55c>
+ .byte 197,196,84,37,15,62,0,0 // vandps 0x3e0f(%rip),%ymm7,%ymm4 # 50c0 <_sk_callback_hsw+0x55c>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,69,0,45,98,61,0,0 // vpshufb 0x3d62(%rip),%ymm7,%ymm5 # 5020 <_sk_callback_hsw+0x57c>
+ .byte 196,226,69,0,45,34,62,0,0 // vpshufb 0x3e22(%rip),%ymm7,%ymm5 # 50e0 <_sk_callback_hsw+0x57c>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,69,0,53,117,61,0,0 // vpshufb 0x3d75(%rip),%ymm7,%ymm6 # 5040 <_sk_callback_hsw+0x59c>
+ .byte 196,226,69,0,53,53,62,0,0 // vpshufb 0x3e35(%rip),%ymm7,%ymm6 # 5100 <_sk_callback_hsw+0x59c>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,175,57,0,0 // vbroadcastss 0x39af(%rip),%ymm8 # 4c90 <_sk_callback_hsw+0x1ec>
+ .byte 196,98,125,24,5,111,58,0,0 // vbroadcastss 0x3a6f(%rip),%ymm8 # 4d50 <_sk_callback_hsw+0x1ec>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,166,57,0,0 // vbroadcastss 0x39a6(%rip),%ymm9 # 4c94 <_sk_callback_hsw+0x1f0>
+ .byte 196,98,125,24,13,102,58,0,0 // vbroadcastss 0x3a66(%rip),%ymm9 # 4d54 <_sk_callback_hsw+0x1f0>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -11026,7 +11087,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,203,56,0,0 // vbroadcastss 0x38cb(%rip),%ymm8 # 4c98 <_sk_callback_hsw+0x1f4>
+ .byte 196,98,125,24,5,139,57,0,0 // vbroadcastss 0x398b(%rip),%ymm8 # 4d58 <_sk_callback_hsw+0x1f4>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -11038,7 +11099,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,174,56,0,0 // vbroadcastss 0x38ae(%rip),%ymm8 # 4c9c <_sk_callback_hsw+0x1f8>
+ .byte 196,98,125,24,5,110,57,0,0 // vbroadcastss 0x396e(%rip),%ymm8 # 4d5c <_sk_callback_hsw+0x1f8>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -11124,7 +11185,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,246,55,0,0 // vbroadcastss 0x37f6(%rip),%ymm10 # 4ca0 <_sk_callback_hsw+0x1fc>
+ .byte 196,98,125,24,21,182,56,0,0 // vbroadcastss 0x38b6(%rip),%ymm10 # 4d60 <_sk_callback_hsw+0x1fc>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -11137,16 +11198,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,215,55,0,0 // vbroadcastss 0x37d7(%rip),%ymm8 # 4ca4 <_sk_callback_hsw+0x200>
+ .byte 196,98,125,24,5,151,56,0,0 // vbroadcastss 0x3897(%rip),%ymm8 # 4d64 <_sk_callback_hsw+0x200>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,201,55,0,0 // vbroadcastss 0x37c9(%rip),%ymm11 # 4ca8 <_sk_callback_hsw+0x204>
- .byte 196,98,125,24,37,196,55,0,0 // vbroadcastss 0x37c4(%rip),%ymm12 # 4cac <_sk_callback_hsw+0x208>
+ .byte 196,98,125,24,29,137,56,0,0 // vbroadcastss 0x3889(%rip),%ymm11 # 4d68 <_sk_callback_hsw+0x204>
+ .byte 196,98,125,24,37,132,56,0,0 // vbroadcastss 0x3884(%rip),%ymm12 # 4d6c <_sk_callback_hsw+0x208>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,181,55,0,0 // vbroadcastss 0x37b5(%rip),%ymm14 # 4cb0 <_sk_callback_hsw+0x20c>
+ .byte 196,98,125,24,53,117,56,0,0 // vbroadcastss 0x3875(%rip),%ymm14 # 4d70 <_sk_callback_hsw+0x20c>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,171,55,0,0 // vbroadcastss 0x37ab(%rip),%ymm10 # 4cb4 <_sk_callback_hsw+0x210>
+ .byte 196,98,125,24,21,107,56,0,0 // vbroadcastss 0x386b(%rip),%ymm10 # 4d74 <_sk_callback_hsw+0x210>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -11170,19 +11231,19 @@ HIDDEN _sk_to_srgb_hsw
FUNCTION(_sk_to_srgb_hsw)
_sk_to_srgb_hsw:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,79,55,0,0 // vbroadcastss 0x374f(%rip),%ymm8 # 4cb8 <_sk_callback_hsw+0x214>
+ .byte 196,98,125,24,5,15,56,0,0 // vbroadcastss 0x380f(%rip),%ymm8 # 4d78 <_sk_callback_hsw+0x214>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,69,55,0,0 // vbroadcastss 0x3745(%rip),%ymm11 # 4cbc <_sk_callback_hsw+0x218>
- .byte 196,98,125,24,37,64,55,0,0 // vbroadcastss 0x3740(%rip),%ymm12 # 4cc0 <_sk_callback_hsw+0x21c>
+ .byte 196,98,125,24,29,5,56,0,0 // vbroadcastss 0x3805(%rip),%ymm11 # 4d7c <_sk_callback_hsw+0x218>
+ .byte 196,98,125,24,37,0,56,0,0 // vbroadcastss 0x3800(%rip),%ymm12 # 4d80 <_sk_callback_hsw+0x21c>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13
- .byte 196,98,125,24,53,49,55,0,0 // vbroadcastss 0x3731(%rip),%ymm14 # 4cc4 <_sk_callback_hsw+0x220>
+ .byte 196,98,125,24,53,241,55,0,0 // vbroadcastss 0x37f1(%rip),%ymm14 # 4d84 <_sk_callback_hsw+0x220>
.byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13
- .byte 196,98,125,24,61,39,55,0,0 // vbroadcastss 0x3727(%rip),%ymm15 # 4cc8 <_sk_callback_hsw+0x224>
+ .byte 196,98,125,24,61,231,55,0,0 // vbroadcastss 0x37e7(%rip),%ymm15 # 4d88 <_sk_callback_hsw+0x224>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9
- .byte 196,98,125,24,45,19,55,0,0 // vbroadcastss 0x3713(%rip),%ymm13 # 4ccc <_sk_callback_hsw+0x228>
+ .byte 196,98,125,24,45,211,55,0,0 // vbroadcastss 0x37d3(%rip),%ymm13 # 4d8c <_sk_callback_hsw+0x228>
.byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -11216,26 +11277,26 @@ _sk_rgb_to_hsl_hsw:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,136,54,0,0 // vbroadcastss 0x3688(%rip),%ymm11 # 4cd0 <_sk_callback_hsw+0x22c>
+ .byte 196,98,125,24,29,72,55,0,0 // vbroadcastss 0x3748(%rip),%ymm11 # 4d90 <_sk_callback_hsw+0x22c>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,117,54,0,0 // vbroadcastss 0x3675(%rip),%ymm14 # 4cd4 <_sk_callback_hsw+0x230>
+ .byte 196,98,125,24,53,53,55,0,0 // vbroadcastss 0x3735(%rip),%ymm14 # 4d94 <_sk_callback_hsw+0x230>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,92,54,0,0 // vbroadcastss 0x365c(%rip),%ymm14 # 4cdc <_sk_callback_hsw+0x238>
+ .byte 196,98,125,24,53,28,55,0,0 // vbroadcastss 0x371c(%rip),%ymm14 # 4d9c <_sk_callback_hsw+0x238>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,74,54,0,0 // vbroadcastss 0x364a(%rip),%ymm14 # 4cd8 <_sk_callback_hsw+0x234>
+ .byte 196,98,125,24,53,10,55,0,0 // vbroadcastss 0x370a(%rip),%ymm14 # 4d98 <_sk_callback_hsw+0x234>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,45,54,0,0 // vbroadcastss 0x362d(%rip),%ymm11 # 4ce4 <_sk_callback_hsw+0x240>
+ .byte 196,98,125,24,29,237,54,0,0 // vbroadcastss 0x36ed(%rip),%ymm11 # 4da4 <_sk_callback_hsw+0x240>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -11245,7 +11306,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,240,53,0,0 // vbroadcastss 0x35f0(%rip),%ymm8 # 4ce0 <_sk_callback_hsw+0x23c>
+ .byte 196,98,125,24,5,176,54,0,0 // vbroadcastss 0x36b0(%rip),%ymm8 # 4da0 <_sk_callback_hsw+0x23c>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -11262,30 +11323,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,189,53,0,0 // vbroadcastss 0x35bd(%rip),%ymm8 # 4ce8 <_sk_callback_hsw+0x244>
+ .byte 196,98,125,24,5,125,54,0,0 // vbroadcastss 0x367d(%rip),%ymm8 # 4da8 <_sk_callback_hsw+0x244>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,160,53,0,0 // vbroadcastss 0x35a0(%rip),%ymm9 # 4cec <_sk_callback_hsw+0x248>
+ .byte 196,98,125,24,13,96,54,0,0 // vbroadcastss 0x3660(%rip),%ymm9 # 4dac <_sk_callback_hsw+0x248>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,150,53,0,0 // vbroadcastss 0x3596(%rip),%ymm11 # 4cf0 <_sk_callback_hsw+0x24c>
+ .byte 196,98,125,24,29,86,54,0,0 // vbroadcastss 0x3656(%rip),%ymm11 # 4db0 <_sk_callback_hsw+0x24c>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,128,53,0,0 // vbroadcastss 0x3580(%rip),%ymm13 # 4cf8 <_sk_callback_hsw+0x254>
+ .byte 196,98,125,24,45,64,54,0,0 // vbroadcastss 0x3640(%rip),%ymm13 # 4db8 <_sk_callback_hsw+0x254>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,118,53,0,0 // vbroadcastss 0x3576(%rip),%ymm14 # 4cfc <_sk_callback_hsw+0x258>
+ .byte 196,98,125,24,53,54,54,0,0 // vbroadcastss 0x3636(%rip),%ymm14 # 4dbc <_sk_callback_hsw+0x258>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,92,53,0,0 // vbroadcastss 0x355c(%rip),%ymm3 # 4cf4 <_sk_callback_hsw+0x250>
+ .byte 196,226,125,24,29,28,54,0,0 // vbroadcastss 0x361c(%rip),%ymm3 # 4db4 <_sk_callback_hsw+0x250>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,71,53,0,0 // vbroadcastss 0x3547(%rip),%ymm12 # 4d00 <_sk_callback_hsw+0x25c>
+ .byte 196,98,125,24,37,7,54,0,0 // vbroadcastss 0x3607(%rip),%ymm12 # 4dc0 <_sk_callback_hsw+0x25c>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -11301,7 +11362,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,243,52,0,0 // vbroadcastss 0x34f3(%rip),%ymm0 # 4d04 <_sk_callback_hsw+0x260>
+ .byte 196,226,125,24,5,179,53,0,0 // vbroadcastss 0x35b3(%rip),%ymm0 # 4dc4 <_sk_callback_hsw+0x260>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -11351,10 +11412,10 @@ _sk_scale_u8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,58 // jne 18f2 <_sk_scale_u8_hsw+0x44>
.byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8
- .byte 197,57,219,5,26,57,0,0 // vpand 0x391a(%rip),%xmm8,%xmm8 # 51e0 <_sk_callback_hsw+0x73c>
+ .byte 197,57,219,5,218,57,0,0 // vpand 0x39da(%rip),%xmm8,%xmm8 # 52a0 <_sk_callback_hsw+0x73c>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,47,52,0,0 // vbroadcastss 0x342f(%rip),%ymm9 # 4d08 <_sk_callback_hsw+0x264>
+ .byte 196,98,125,24,13,239,52,0,0 // vbroadcastss 0x34ef(%rip),%ymm9 # 4dc8 <_sk_callback_hsw+0x264>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -11369,10 +11430,21 @@ _sk_scale_u8_hsw:
.byte 65,128,249,6 // cmp $0x6,%r9b
.byte 119,183 // ja 18be <_sk_scale_u8_hsw+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,98,0,0,0 // lea 0x62(%rip),%r10 # 1974 <_sk_scale_u8_hsw+0xc6>
+ .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 198c <_sk_scale_u8_hsw+0xde>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 235,152 // jmp 18be <_sk_scale_u8_hsw+0x10>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 197,121,110,200 // vmovd %eax,%xmm9
+ .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
+ .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ .byte 233,111,255,255,255 // jmpq 18be <_sk_scale_u8_hsw+0x10>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -11380,32 +11452,25 @@ _sk_scale_u8_hsw:
.byte 197,57,196,192,5 // vpinsrw $0x5,%eax,%xmm8,%xmm8
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 197,57,196,192,4 // vpinsrw $0x4,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 197,57,196,192,3 // vpinsrw $0x3,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 197,57,196,192,1 // vpinsrw $0x1,%eax,%xmm8,%xmm8
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 197,57,196,192,0 // vpinsrw $0x0,%eax,%xmm8,%xmm8
- .byte 233,77,255,255,255 // jmpq 18be <_sk_scale_u8_hsw+0x10>
- .byte 15,31,0 // nopl (%rax)
- .byte 238 // out %al,(%dx)
- .byte 255 // (bad)
+ .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9
+ .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
+ .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ .byte 233,51,255,255,255 // jmpq 18be <_sk_scale_u8_hsw+0x10>
+ .byte 144 // nop
+ .byte 143 // (bad)
.byte 255 // (bad)
- .byte 255,227 // jmpq *%rbx
.byte 255 // (bad)
+ .byte 255,170,255,255,255,154 // ljmp *-0x65000001(%rdx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 216,255 // fdivr %st(7),%st
.byte 255 // (bad)
- .byte 255,205 // dec %ebp
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00199c <_sk_callback_hsw+0xffffffffdeffce38>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,194 // inc %edx
+ .byte 255,211 // callq *%rbx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,183,255,255,255,167 // pushq -0x58000001(%rdi)
+ .byte 255,195 // inc %ebx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -11434,12 +11499,12 @@ _sk_lerp_u8_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,78 // jne 1a17 <_sk_lerp_u8_hsw+0x58>
+ .byte 117,78 // jne 1a2f <_sk_lerp_u8_hsw+0x58>
.byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8
- .byte 197,57,219,5,25,56,0,0 // vpand 0x3819(%rip),%xmm8,%xmm8 # 51f0 <_sk_callback_hsw+0x74c>
+ .byte 197,57,219,5,193,56,0,0 // vpand 0x38c1(%rip),%xmm8,%xmm8 # 52b0 <_sk_callback_hsw+0x74c>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,34,51,0,0 // vbroadcastss 0x3322(%rip),%ymm9 # 4d0c <_sk_callback_hsw+0x268>
+ .byte 196,98,125,24,13,202,51,0,0 // vbroadcastss 0x33ca(%rip),%ymm9 # 4dcc <_sk_callback_hsw+0x268>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -11456,12 +11521,23 @@ _sk_lerp_u8_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,163 // ja 19cf <_sk_lerp_u8_hsw+0x10>
+ .byte 119,163 // ja 19e7 <_sk_lerp_u8_hsw+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,97,0,0,0 // lea 0x61(%rip),%r10 # 1a98 <_sk_lerp_u8_hsw+0xd9>
+ .byte 76,141,21,121,0,0,0 // lea 0x79(%rip),%r10 # 1ac8 <_sk_lerp_u8_hsw+0xf1>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 235,132 // jmp 19e7 <_sk_lerp_u8_hsw+0x10>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 197,121,110,200 // vmovd %eax,%xmm9
+ .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
+ .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ .byte 233,91,255,255,255 // jmpq 19e7 <_sk_lerp_u8_hsw+0x10>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -11469,33 +11545,27 @@ _sk_lerp_u8_hsw:
.byte 197,57,196,192,5 // vpinsrw $0x5,%eax,%xmm8,%xmm8
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 197,57,196,192,4 // vpinsrw $0x4,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 197,57,196,192,3 // vpinsrw $0x3,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 197,57,196,192,1 // vpinsrw $0x1,%eax,%xmm8,%xmm8
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 197,57,196,192,0 // vpinsrw $0x0,%eax,%xmm8,%xmm8
- .byte 233,57,255,255,255 // jmpq 19cf <_sk_lerp_u8_hsw+0x10>
- .byte 102,144 // xchg %ax,%ax
- .byte 239 // out %eax,(%dx)
+ .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9
+ .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
+ .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ .byte 233,31,255,255,255 // jmpq 19e7 <_sk_lerp_u8_hsw+0x10>
+ .byte 144 // nop
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
+ .byte 255,171,255,255,255,155 // ljmp *-0x64000001(%rbx)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 217,255 // fcos
+ .byte 234 // (bad)
.byte 255 // (bad)
- .byte 255,206 // dec %esi
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,195 // inc %ebx
+ .byte 223,255 // (bad)
.byte 255 // (bad)
+ .byte 255,212 // callq *%rsp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 184,255,255,255,168 // mov $0xa8ffffff,%eax
+ .byte 255,196 // inc %esp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -11507,23 +11577,23 @@ _sk_lerp_565_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,169,0,0,0 // jne 1b6b <_sk_lerp_565_hsw+0xb7>
+ .byte 15,133,169,0,0,0 // jne 1b9b <_sk_lerp_565_hsw+0xb7>
.byte 196,65,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,58,50,0,0 // vpbroadcastd 0x323a(%rip),%ymm9 # 4d10 <_sk_callback_hsw+0x26c>
+ .byte 196,98,125,88,13,202,50,0,0 // vpbroadcastd 0x32ca(%rip),%ymm9 # 4dd0 <_sk_callback_hsw+0x26c>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,43,50,0,0 // vbroadcastss 0x322b(%rip),%ymm10 # 4d14 <_sk_callback_hsw+0x270>
+ .byte 196,98,125,24,21,187,50,0,0 // vbroadcastss 0x32bb(%rip),%ymm10 # 4dd4 <_sk_callback_hsw+0x270>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,33,50,0,0 // vpbroadcastd 0x3221(%rip),%ymm10 # 4d18 <_sk_callback_hsw+0x274>
+ .byte 196,98,125,88,21,177,50,0,0 // vpbroadcastd 0x32b1(%rip),%ymm10 # 4dd8 <_sk_callback_hsw+0x274>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,18,50,0,0 // vbroadcastss 0x3212(%rip),%ymm11 # 4d1c <_sk_callback_hsw+0x278>
+ .byte 196,98,125,24,29,162,50,0,0 // vbroadcastss 0x32a2(%rip),%ymm11 # 4ddc <_sk_callback_hsw+0x278>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,8,50,0,0 // vpbroadcastd 0x3208(%rip),%ymm11 # 4d20 <_sk_callback_hsw+0x27c>
+ .byte 196,98,125,88,29,152,50,0,0 // vpbroadcastd 0x3298(%rip),%ymm11 # 4de0 <_sk_callback_hsw+0x27c>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,249,49,0,0 // vbroadcastss 0x31f9(%rip),%ymm11 # 4d24 <_sk_callback_hsw+0x280>
+ .byte 196,98,125,24,29,137,50,0,0 // vbroadcastss 0x3289(%rip),%ymm11 # 4de4 <_sk_callback_hsw+0x280>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0
@@ -11544,40 +11614,46 @@ _sk_lerp_565_hsw:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,68,255,255,255 // ja 1ac8 <_sk_lerp_565_hsw+0x14>
+ .byte 15,135,68,255,255,255 // ja 1af8 <_sk_lerp_565_hsw+0x14>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,77,0,0,0 // lea 0x4d(%rip),%r10 # 1bdc <_sk_lerp_565_hsw+0x128>
+ .byte 76,141,21,101,0,0,0 // lea 0x65(%rip),%r10 # 1c24 <_sk_lerp_565_hsw+0x140>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 233,34,255,255,255 // jmpq 1af8 <_sk_lerp_565_hsw+0x14>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8
+ .byte 196,65,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm9
+ .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ .byte 233,4,255,255,255 // jmpq 1af8 <_sk_lerp_565_hsw+0x14>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm8,%xmm8
- .byte 196,65,57,196,68,83,6,3 // vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm8,%xmm8
- .byte 196,65,57,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8
- .byte 196,65,57,196,68,83,2,1 // vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm8,%xmm8
- .byte 196,65,57,196,4,83,0 // vpinsrw $0x0,(%r11,%rdx,2),%xmm8,%xmm8
- .byte 233,239,254,255,255 // jmpq 1ac8 <_sk_lerp_565_hsw+0x14>
- .byte 15,31,0 // nopl (%rax)
- .byte 241 // icebp
+ .byte 196,65,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm9
+ .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ .byte 233,214,254,255,255 // jmpq 1af8 <_sk_lerp_565_hsw+0x14>
+ .byte 102,144 // xchg %ax,%ax
+ .byte 164 // movsb %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,225 // jmpq ffffffffe2001be4 <_sk_callback_hsw+0xffffffffe1ffd140>
+ .byte 191,255,255,255,178 // mov $0xb2ffffff,%edi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 217,255 // fcos
+ .byte 237 // in (%dx),%eax
.byte 255 // (bad)
- .byte 255,209 // callq *%rcx
.byte 255 // (bad)
+ .byte 255,229 // jmpq *%rbp
.byte 255 // (bad)
- .byte 255,201 // dec %ecx
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 221,255 // (bad)
.byte 255 // (bad)
- .byte 188 // .byte 0xbc
+ .byte 255,208 // callq *%rax
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -11591,23 +11667,23 @@ _sk_load_tables_hsw:
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 76,3,16 // add (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,105 // jne 1c76 <_sk_load_tables_hsw+0x7e>
+ .byte 117,105 // jne 1cbe <_sk_load_tables_hsw+0x7e>
.byte 196,193,124,16,26 // vmovups (%r10),%ymm3
- .byte 197,228,84,13,70,52,0,0 // vandps 0x3446(%rip),%ymm3,%ymm1 # 5060 <_sk_callback_hsw+0x5bc>
+ .byte 197,228,84,13,190,52,0,0 // vandps 0x34be(%rip),%ymm3,%ymm1 # 5120 <_sk_callback_hsw+0x5bc>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 72,139,72,8 // mov 0x8(%rax),%rcx
.byte 76,139,80,16 // mov 0x10(%rax),%r10
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,226,109,146,4,137 // vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,70,52,0,0 // vpshufb 0x3446(%rip),%ymm3,%ymm2 # 5080 <_sk_callback_hsw+0x5dc>
+ .byte 196,226,101,0,21,190,52,0,0 // vpshufb 0x34be(%rip),%ymm3,%ymm2 # 5140 <_sk_callback_hsw+0x5dc>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,78,52,0,0 // vpshufb 0x344e(%rip),%ymm3,%ymm9 # 50a0 <_sk_callback_hsw+0x5fc>
+ .byte 196,98,101,0,13,198,52,0,0 // vpshufb 0x34c6(%rip),%ymm3,%ymm9 # 5160 <_sk_callback_hsw+0x5fc>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,190,48,0,0 // vbroadcastss 0x30be(%rip),%ymm8 # 4d28 <_sk_callback_hsw+0x284>
+ .byte 196,98,125,24,5,54,49,0,0 // vbroadcastss 0x3136(%rip),%ymm8 # 4de8 <_sk_callback_hsw+0x284>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -11620,7 +11696,7 @@ _sk_load_tables_hsw:
.byte 196,193,249,110,195 // vmovq %r11,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,194,125,44,26 // vmaskmovps (%r10),%ymm0,%ymm3
- .byte 233,115,255,255,255 // jmpq 1c12 <_sk_load_tables_hsw+0x1a>
+ .byte 233,115,255,255,255 // jmpq 1c5a <_sk_load_tables_hsw+0x1a>
HIDDEN _sk_load_tables_u16_be_hsw
.globl _sk_load_tables_u16_be_hsw
@@ -11630,7 +11706,7 @@ _sk_load_tables_u16_be_hsw:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,201,0,0,0 // jne 1d7e <_sk_load_tables_u16_be_hsw+0xdf>
+ .byte 15,133,201,0,0,0 // jne 1dc6 <_sk_load_tables_u16_be_hsw+0xdf>
.byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8
.byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2
.byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -11646,7 +11722,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,250,52,0,0 // vmovdqa 0x34fa(%rip),%xmm10 # 5200 <_sk_callback_hsw+0x75c>
+ .byte 197,121,111,21,114,53,0,0 // vmovdqa 0x3572(%rip),%xmm10 # 52c0 <_sk_callback_hsw+0x75c>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -11668,36 +11744,36 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,183,47,0,0 // vbroadcastss 0x2fb7(%rip),%ymm8 # 4d2c <_sk_callback_hsw+0x288>
+ .byte 196,98,125,24,5,47,48,0,0 // vbroadcastss 0x302f(%rip),%ymm8 # 4dec <_sk_callback_hsw+0x288>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 1de4 <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 116,85 // je 1e2c <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 1de4 <_sk_load_tables_u16_be_hsw+0x145>
+ .byte 114,72 // jb 1e2c <_sk_load_tables_u16_be_hsw+0x145>
.byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 1df1 <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 116,72 // je 1e39 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 1df1 <_sk_load_tables_u16_be_hsw+0x152>
+ .byte 114,59 // jb 1e39 <_sk_load_tables_u16_be_hsw+0x152>
.byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,9,255,255,255 // je 1cd0 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,132,9,255,255,255 // je 1d18 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,248,254,255,255 // jb 1cd0 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 15,130,248,254,255,255 // jb 1d18 <_sk_load_tables_u16_be_hsw+0x31>
.byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9
- .byte 233,236,254,255,255 // jmpq 1cd0 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,236,254,255,255 // jmpq 1d18 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,223,254,255,255 // jmpq 1cd0 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,223,254,255,255 // jmpq 1d18 <_sk_load_tables_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,214,254,255,255 // jmpq 1cd0 <_sk_load_tables_u16_be_hsw+0x31>
+ .byte 233,214,254,255,255 // jmpq 1d18 <_sk_load_tables_u16_be_hsw+0x31>
HIDDEN _sk_load_tables_rgb_u16_be_hsw
.globl _sk_load_tables_rgb_u16_be_hsw
@@ -11707,7 +11783,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,193,0,0,0 // jne 1ecd <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ .byte 15,133,193,0,0,0 // jne 1f15 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
.byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0
.byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2
.byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -11728,7 +11804,7 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,154,51,0,0 // vmovdqa 0x339a(%rip),%xmm9 # 5210 <_sk_callback_hsw+0x76c>
+ .byte 197,121,111,13,18,52,0,0 // vmovdqa 0x3412(%rip),%xmm9 # 52d0 <_sk_callback_hsw+0x76c>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -11745,48 +11821,48 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8
.byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,101,46,0,0 // vbroadcastss 0x2e65(%rip),%ymm3 # 4d30 <_sk_callback_hsw+0x28c>
+ .byte 196,226,125,24,29,221,46,0,0 // vbroadcastss 0x2edd(%rip),%ymm3 # 4df0 <_sk_callback_hsw+0x28c>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
.byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 1ee6 <_sk_load_tables_rgb_u16_be_hsw+0xec>
- .byte 233,90,255,255,255 // jmpq 1e40 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,5 // jne 1f2e <_sk_load_tables_rgb_u16_be_hsw+0xec>
+ .byte 233,90,255,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1
.byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 1f15 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
+ .byte 114,26 // jb 1f5d <_sk_load_tables_rgb_u16_be_hsw+0x11b>
.byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1
.byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 1f1a <_sk_load_tables_rgb_u16_be_hsw+0x120>
- .byte 233,43,255,255,255 // jmpq 1e40 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,38,255,255,255 // jmpq 1e40 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 1f62 <_sk_load_tables_rgb_u16_be_hsw+0x120>
+ .byte 233,43,255,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,38,255,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1
.byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 1f49 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
+ .byte 114,26 // jb 1f91 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
.byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1
.byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 1f4e <_sk_load_tables_rgb_u16_be_hsw+0x154>
- .byte 233,247,254,255,255 // jmpq 1e40 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,242,254,255,255 // jmpq 1e40 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 1f96 <_sk_load_tables_rgb_u16_be_hsw+0x154>
+ .byte 233,247,254,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,242,254,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46>
.byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3
.byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 1f77 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
+ .byte 114,20 // jb 1fbf <_sk_load_tables_rgb_u16_be_hsw+0x17d>
.byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3
.byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- .byte 233,201,254,255,255 // jmpq 1e40 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,196,254,255,255 // jmpq 1e40 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,201,254,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 233,196,254,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46>
HIDDEN _sk_byte_tables_hsw
.globl _sk_byte_tables_hsw
FUNCTION(_sk_byte_tables_hsw)
_sk_byte_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,173,45,0,0 // vbroadcastss 0x2dad(%rip),%ymm8 # 4d34 <_sk_callback_hsw+0x290>
+ .byte 196,98,125,24,5,37,46,0,0 // vbroadcastss 0x2e25(%rip),%ymm8 # 4df4 <_sk_callback_hsw+0x290>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -11908,7 +11984,7 @@ _sk_byte_tables_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,82,43,0,0 // vbroadcastss 0x2b52(%rip),%ymm8 # 4d38 <_sk_callback_hsw+0x294>
+ .byte 196,98,125,24,5,202,43,0,0 // vbroadcastss 0x2bca(%rip),%ymm8 # 4df8 <_sk_callback_hsw+0x294>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -12024,7 +12100,7 @@ _sk_byte_tables_rgb_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,62,41,0,0 // vbroadcastss 0x293e(%rip),%ymm8 # 4d3c <_sk_callback_hsw+0x298>
+ .byte 196,98,125,24,5,182,41,0,0 // vbroadcastss 0x29b6(%rip),%ymm8 # 4dfc <_sk_callback_hsw+0x298>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -12123,33 +12199,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,24,40,0,0 // vbroadcastss 0x2818(%rip),%ymm12 # 4d40 <_sk_callback_hsw+0x29c>
- .byte 196,98,125,24,45,19,40,0,0 // vbroadcastss 0x2813(%rip),%ymm13 # 4d44 <_sk_callback_hsw+0x2a0>
+ .byte 196,98,125,24,37,144,40,0,0 // vbroadcastss 0x2890(%rip),%ymm12 # 4e00 <_sk_callback_hsw+0x29c>
+ .byte 196,98,125,24,45,139,40,0,0 // vbroadcastss 0x288b(%rip),%ymm13 # 4e04 <_sk_callback_hsw+0x2a0>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,9,40,0,0 // vbroadcastss 0x2809(%rip),%ymm13 # 4d48 <_sk_callback_hsw+0x2a4>
+ .byte 196,98,125,24,45,129,40,0,0 // vbroadcastss 0x2881(%rip),%ymm13 # 4e08 <_sk_callback_hsw+0x2a4>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,255,39,0,0 // vbroadcastss 0x27ff(%rip),%ymm13 # 4d4c <_sk_callback_hsw+0x2a8>
+ .byte 196,98,125,24,45,119,40,0,0 // vbroadcastss 0x2877(%rip),%ymm13 # 4e0c <_sk_callback_hsw+0x2a8>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,245,39,0,0 // vbroadcastss 0x27f5(%rip),%ymm11 # 4d50 <_sk_callback_hsw+0x2ac>
+ .byte 196,98,125,24,29,109,40,0,0 // vbroadcastss 0x286d(%rip),%ymm11 # 4e10 <_sk_callback_hsw+0x2ac>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,235,39,0,0 // vbroadcastss 0x27eb(%rip),%ymm12 # 4d54 <_sk_callback_hsw+0x2b0>
+ .byte 196,98,125,24,37,99,40,0,0 // vbroadcastss 0x2863(%rip),%ymm12 # 4e14 <_sk_callback_hsw+0x2b0>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,225,39,0,0 // vbroadcastss 0x27e1(%rip),%ymm12 # 4d58 <_sk_callback_hsw+0x2b4>
+ .byte 196,98,125,24,37,89,40,0,0 // vbroadcastss 0x2859(%rip),%ymm12 # 4e18 <_sk_callback_hsw+0x2b4>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,194,39,0,0 // vbroadcastss 0x27c2(%rip),%ymm11 # 4d5c <_sk_callback_hsw+0x2b8>
+ .byte 196,98,125,24,29,58,40,0,0 // vbroadcastss 0x283a(%rip),%ymm11 # 4e1c <_sk_callback_hsw+0x2b8>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,184,39,0,0 // vbroadcastss 0x27b8(%rip),%ymm11 # 4d60 <_sk_callback_hsw+0x2bc>
+ .byte 196,98,125,24,29,48,40,0,0 // vbroadcastss 0x2830(%rip),%ymm11 # 4e20 <_sk_callback_hsw+0x2bc>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,174,39,0,0 // vbroadcastss 0x27ae(%rip),%ymm0 # 4d64 <_sk_callback_hsw+0x2c0>
+ .byte 196,226,125,24,5,38,40,0,0 // vbroadcastss 0x2826(%rip),%ymm0 # 4e24 <_sk_callback_hsw+0x2c0>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,164,39,0,0 // vbroadcastss 0x27a4(%rip),%ymm10 # 4d68 <_sk_callback_hsw+0x2c4>
+ .byte 196,98,125,24,21,28,40,0,0 // vbroadcastss 0x281c(%rip),%ymm10 # 4e28 <_sk_callback_hsw+0x2c4>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,151,39,0,0 // vbroadcastss 0x2797(%rip),%ymm10 # 4d6c <_sk_callback_hsw+0x2c8>
+ .byte 196,98,125,24,21,15,40,0,0 // vbroadcastss 0x280f(%rip),%ymm10 # 4e2c <_sk_callback_hsw+0x2c8>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12157,7 +12233,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,110,39,0,0 // vbroadcastss 0x276e(%rip),%ymm8 # 4d70 <_sk_callback_hsw+0x2cc>
+ .byte 196,98,125,24,5,230,39,0,0 // vbroadcastss 0x27e6(%rip),%ymm8 # 4e30 <_sk_callback_hsw+0x2cc>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12177,33 +12253,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,38,39,0,0 // vbroadcastss 0x2726(%rip),%ymm12 # 4d74 <_sk_callback_hsw+0x2d0>
- .byte 196,98,125,24,45,33,39,0,0 // vbroadcastss 0x2721(%rip),%ymm13 # 4d78 <_sk_callback_hsw+0x2d4>
+ .byte 196,98,125,24,37,158,39,0,0 // vbroadcastss 0x279e(%rip),%ymm12 # 4e34 <_sk_callback_hsw+0x2d0>
+ .byte 196,98,125,24,45,153,39,0,0 // vbroadcastss 0x2799(%rip),%ymm13 # 4e38 <_sk_callback_hsw+0x2d4>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,23,39,0,0 // vbroadcastss 0x2717(%rip),%ymm13 # 4d7c <_sk_callback_hsw+0x2d8>
+ .byte 196,98,125,24,45,143,39,0,0 // vbroadcastss 0x278f(%rip),%ymm13 # 4e3c <_sk_callback_hsw+0x2d8>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,13,39,0,0 // vbroadcastss 0x270d(%rip),%ymm13 # 4d80 <_sk_callback_hsw+0x2dc>
+ .byte 196,98,125,24,45,133,39,0,0 // vbroadcastss 0x2785(%rip),%ymm13 # 4e40 <_sk_callback_hsw+0x2dc>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,3,39,0,0 // vbroadcastss 0x2703(%rip),%ymm11 # 4d84 <_sk_callback_hsw+0x2e0>
+ .byte 196,98,125,24,29,123,39,0,0 // vbroadcastss 0x277b(%rip),%ymm11 # 4e44 <_sk_callback_hsw+0x2e0>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,249,38,0,0 // vbroadcastss 0x26f9(%rip),%ymm12 # 4d88 <_sk_callback_hsw+0x2e4>
+ .byte 196,98,125,24,37,113,39,0,0 // vbroadcastss 0x2771(%rip),%ymm12 # 4e48 <_sk_callback_hsw+0x2e4>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,239,38,0,0 // vbroadcastss 0x26ef(%rip),%ymm12 # 4d8c <_sk_callback_hsw+0x2e8>
+ .byte 196,98,125,24,37,103,39,0,0 // vbroadcastss 0x2767(%rip),%ymm12 # 4e4c <_sk_callback_hsw+0x2e8>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,208,38,0,0 // vbroadcastss 0x26d0(%rip),%ymm11 # 4d90 <_sk_callback_hsw+0x2ec>
+ .byte 196,98,125,24,29,72,39,0,0 // vbroadcastss 0x2748(%rip),%ymm11 # 4e50 <_sk_callback_hsw+0x2ec>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,198,38,0,0 // vbroadcastss 0x26c6(%rip),%ymm11 # 4d94 <_sk_callback_hsw+0x2f0>
+ .byte 196,98,125,24,29,62,39,0,0 // vbroadcastss 0x273e(%rip),%ymm11 # 4e54 <_sk_callback_hsw+0x2f0>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,188,38,0,0 // vbroadcastss 0x26bc(%rip),%ymm1 # 4d98 <_sk_callback_hsw+0x2f4>
+ .byte 196,226,125,24,13,52,39,0,0 // vbroadcastss 0x2734(%rip),%ymm1 # 4e58 <_sk_callback_hsw+0x2f4>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,178,38,0,0 // vbroadcastss 0x26b2(%rip),%ymm10 # 4d9c <_sk_callback_hsw+0x2f8>
+ .byte 196,98,125,24,21,42,39,0,0 // vbroadcastss 0x272a(%rip),%ymm10 # 4e5c <_sk_callback_hsw+0x2f8>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,165,38,0,0 // vbroadcastss 0x26a5(%rip),%ymm10 # 4da0 <_sk_callback_hsw+0x2fc>
+ .byte 196,98,125,24,21,29,39,0,0 // vbroadcastss 0x271d(%rip),%ymm10 # 4e60 <_sk_callback_hsw+0x2fc>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12211,7 +12287,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,124,38,0,0 // vbroadcastss 0x267c(%rip),%ymm8 # 4da4 <_sk_callback_hsw+0x300>
+ .byte 196,98,125,24,5,244,38,0,0 // vbroadcastss 0x26f4(%rip),%ymm8 # 4e64 <_sk_callback_hsw+0x300>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12231,33 +12307,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,52,38,0,0 // vbroadcastss 0x2634(%rip),%ymm12 # 4da8 <_sk_callback_hsw+0x304>
- .byte 196,98,125,24,45,47,38,0,0 // vbroadcastss 0x262f(%rip),%ymm13 # 4dac <_sk_callback_hsw+0x308>
+ .byte 196,98,125,24,37,172,38,0,0 // vbroadcastss 0x26ac(%rip),%ymm12 # 4e68 <_sk_callback_hsw+0x304>
+ .byte 196,98,125,24,45,167,38,0,0 // vbroadcastss 0x26a7(%rip),%ymm13 # 4e6c <_sk_callback_hsw+0x308>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,37,38,0,0 // vbroadcastss 0x2625(%rip),%ymm13 # 4db0 <_sk_callback_hsw+0x30c>
+ .byte 196,98,125,24,45,157,38,0,0 // vbroadcastss 0x269d(%rip),%ymm13 # 4e70 <_sk_callback_hsw+0x30c>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,27,38,0,0 // vbroadcastss 0x261b(%rip),%ymm13 # 4db4 <_sk_callback_hsw+0x310>
+ .byte 196,98,125,24,45,147,38,0,0 // vbroadcastss 0x2693(%rip),%ymm13 # 4e74 <_sk_callback_hsw+0x310>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,17,38,0,0 // vbroadcastss 0x2611(%rip),%ymm11 # 4db8 <_sk_callback_hsw+0x314>
+ .byte 196,98,125,24,29,137,38,0,0 // vbroadcastss 0x2689(%rip),%ymm11 # 4e78 <_sk_callback_hsw+0x314>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,7,38,0,0 // vbroadcastss 0x2607(%rip),%ymm12 # 4dbc <_sk_callback_hsw+0x318>
+ .byte 196,98,125,24,37,127,38,0,0 // vbroadcastss 0x267f(%rip),%ymm12 # 4e7c <_sk_callback_hsw+0x318>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,253,37,0,0 // vbroadcastss 0x25fd(%rip),%ymm12 # 4dc0 <_sk_callback_hsw+0x31c>
+ .byte 196,98,125,24,37,117,38,0,0 // vbroadcastss 0x2675(%rip),%ymm12 # 4e80 <_sk_callback_hsw+0x31c>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,222,37,0,0 // vbroadcastss 0x25de(%rip),%ymm11 # 4dc4 <_sk_callback_hsw+0x320>
+ .byte 196,98,125,24,29,86,38,0,0 // vbroadcastss 0x2656(%rip),%ymm11 # 4e84 <_sk_callback_hsw+0x320>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,212,37,0,0 // vbroadcastss 0x25d4(%rip),%ymm11 # 4dc8 <_sk_callback_hsw+0x324>
+ .byte 196,98,125,24,29,76,38,0,0 // vbroadcastss 0x264c(%rip),%ymm11 # 4e88 <_sk_callback_hsw+0x324>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,202,37,0,0 // vbroadcastss 0x25ca(%rip),%ymm2 # 4dcc <_sk_callback_hsw+0x328>
+ .byte 196,226,125,24,21,66,38,0,0 // vbroadcastss 0x2642(%rip),%ymm2 # 4e8c <_sk_callback_hsw+0x328>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,192,37,0,0 // vbroadcastss 0x25c0(%rip),%ymm10 # 4dd0 <_sk_callback_hsw+0x32c>
+ .byte 196,98,125,24,21,56,38,0,0 // vbroadcastss 0x2638(%rip),%ymm10 # 4e90 <_sk_callback_hsw+0x32c>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,179,37,0,0 // vbroadcastss 0x25b3(%rip),%ymm10 # 4dd4 <_sk_callback_hsw+0x330>
+ .byte 196,98,125,24,21,43,38,0,0 // vbroadcastss 0x262b(%rip),%ymm10 # 4e94 <_sk_callback_hsw+0x330>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12265,7 +12341,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,138,37,0,0 // vbroadcastss 0x258a(%rip),%ymm8 # 4dd8 <_sk_callback_hsw+0x334>
+ .byte 196,98,125,24,5,2,38,0,0 // vbroadcastss 0x2602(%rip),%ymm8 # 4e98 <_sk_callback_hsw+0x334>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12285,33 +12361,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,66,37,0,0 // vbroadcastss 0x2542(%rip),%ymm12 # 4ddc <_sk_callback_hsw+0x338>
- .byte 196,98,125,24,45,61,37,0,0 // vbroadcastss 0x253d(%rip),%ymm13 # 4de0 <_sk_callback_hsw+0x33c>
+ .byte 196,98,125,24,37,186,37,0,0 // vbroadcastss 0x25ba(%rip),%ymm12 # 4e9c <_sk_callback_hsw+0x338>
+ .byte 196,98,125,24,45,181,37,0,0 // vbroadcastss 0x25b5(%rip),%ymm13 # 4ea0 <_sk_callback_hsw+0x33c>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,51,37,0,0 // vbroadcastss 0x2533(%rip),%ymm13 # 4de4 <_sk_callback_hsw+0x340>
+ .byte 196,98,125,24,45,171,37,0,0 // vbroadcastss 0x25ab(%rip),%ymm13 # 4ea4 <_sk_callback_hsw+0x340>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,41,37,0,0 // vbroadcastss 0x2529(%rip),%ymm13 # 4de8 <_sk_callback_hsw+0x344>
+ .byte 196,98,125,24,45,161,37,0,0 // vbroadcastss 0x25a1(%rip),%ymm13 # 4ea8 <_sk_callback_hsw+0x344>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,31,37,0,0 // vbroadcastss 0x251f(%rip),%ymm11 # 4dec <_sk_callback_hsw+0x348>
+ .byte 196,98,125,24,29,151,37,0,0 // vbroadcastss 0x2597(%rip),%ymm11 # 4eac <_sk_callback_hsw+0x348>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,21,37,0,0 // vbroadcastss 0x2515(%rip),%ymm12 # 4df0 <_sk_callback_hsw+0x34c>
+ .byte 196,98,125,24,37,141,37,0,0 // vbroadcastss 0x258d(%rip),%ymm12 # 4eb0 <_sk_callback_hsw+0x34c>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,11,37,0,0 // vbroadcastss 0x250b(%rip),%ymm12 # 4df4 <_sk_callback_hsw+0x350>
+ .byte 196,98,125,24,37,131,37,0,0 // vbroadcastss 0x2583(%rip),%ymm12 # 4eb4 <_sk_callback_hsw+0x350>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,236,36,0,0 // vbroadcastss 0x24ec(%rip),%ymm11 # 4df8 <_sk_callback_hsw+0x354>
+ .byte 196,98,125,24,29,100,37,0,0 // vbroadcastss 0x2564(%rip),%ymm11 # 4eb8 <_sk_callback_hsw+0x354>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,226,36,0,0 // vbroadcastss 0x24e2(%rip),%ymm11 # 4dfc <_sk_callback_hsw+0x358>
+ .byte 196,98,125,24,29,90,37,0,0 // vbroadcastss 0x255a(%rip),%ymm11 # 4ebc <_sk_callback_hsw+0x358>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,216,36,0,0 // vbroadcastss 0x24d8(%rip),%ymm3 # 4e00 <_sk_callback_hsw+0x35c>
+ .byte 196,226,125,24,29,80,37,0,0 // vbroadcastss 0x2550(%rip),%ymm3 # 4ec0 <_sk_callback_hsw+0x35c>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,206,36,0,0 // vbroadcastss 0x24ce(%rip),%ymm10 # 4e04 <_sk_callback_hsw+0x360>
+ .byte 196,98,125,24,21,70,37,0,0 // vbroadcastss 0x2546(%rip),%ymm10 # 4ec4 <_sk_callback_hsw+0x360>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,193,36,0,0 // vbroadcastss 0x24c1(%rip),%ymm10 # 4e08 <_sk_callback_hsw+0x364>
+ .byte 196,98,125,24,21,57,37,0,0 // vbroadcastss 0x2539(%rip),%ymm10 # 4ec8 <_sk_callback_hsw+0x364>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12319,7 +12395,7 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,152,36,0,0 // vbroadcastss 0x2498(%rip),%ymm8 # 4e0c <_sk_callback_hsw+0x368>
+ .byte 196,98,125,24,5,16,37,0,0 // vbroadcastss 0x2510(%rip),%ymm8 # 4ecc <_sk_callback_hsw+0x368>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12328,26 +12404,26 @@ HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,138,36,0,0 // vbroadcastss 0x248a(%rip),%ymm8 # 4e10 <_sk_callback_hsw+0x36c>
- .byte 196,98,125,24,13,133,36,0,0 // vbroadcastss 0x2485(%rip),%ymm9 # 4e14 <_sk_callback_hsw+0x370>
- .byte 196,98,125,24,21,128,36,0,0 // vbroadcastss 0x2480(%rip),%ymm10 # 4e18 <_sk_callback_hsw+0x374>
+ .byte 196,98,125,24,5,2,37,0,0 // vbroadcastss 0x2502(%rip),%ymm8 # 4ed0 <_sk_callback_hsw+0x36c>
+ .byte 196,98,125,24,13,253,36,0,0 // vbroadcastss 0x24fd(%rip),%ymm9 # 4ed4 <_sk_callback_hsw+0x370>
+ .byte 196,98,125,24,21,248,36,0,0 // vbroadcastss 0x24f8(%rip),%ymm10 # 4ed8 <_sk_callback_hsw+0x374>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,113,36,0,0 // vbroadcastss 0x2471(%rip),%ymm9 # 4e1c <_sk_callback_hsw+0x378>
+ .byte 196,98,125,24,13,233,36,0,0 // vbroadcastss 0x24e9(%rip),%ymm9 # 4edc <_sk_callback_hsw+0x378>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,103,36,0,0 // vbroadcastss 0x2467(%rip),%ymm0 # 4e20 <_sk_callback_hsw+0x37c>
+ .byte 196,226,125,24,5,223,36,0,0 // vbroadcastss 0x24df(%rip),%ymm0 # 4ee0 <_sk_callback_hsw+0x37c>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,94,36,0,0 // vbroadcastss 0x245e(%rip),%ymm8 # 4e24 <_sk_callback_hsw+0x380>
+ .byte 196,98,125,24,5,214,36,0,0 // vbroadcastss 0x24d6(%rip),%ymm8 # 4ee4 <_sk_callback_hsw+0x380>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,84,36,0,0 // vbroadcastss 0x2454(%rip),%ymm9 # 4e28 <_sk_callback_hsw+0x384>
+ .byte 196,98,125,24,13,204,36,0,0 // vbroadcastss 0x24cc(%rip),%ymm9 # 4ee8 <_sk_callback_hsw+0x384>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,65,36,0,0 // vbroadcastss 0x2441(%rip),%ymm2 # 4e2c <_sk_callback_hsw+0x388>
+ .byte 196,226,125,24,21,185,36,0,0 // vbroadcastss 0x24b9(%rip),%ymm2 # 4eec <_sk_callback_hsw+0x388>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,55,36,0,0 // vbroadcastss 0x2437(%rip),%ymm11 # 4e30 <_sk_callback_hsw+0x38c>
+ .byte 196,98,125,24,29,175,36,0,0 // vbroadcastss 0x24af(%rip),%ymm11 # 4ef0 <_sk_callback_hsw+0x38c>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,45,36,0,0 // vbroadcastss 0x242d(%rip),%ymm12 # 4e34 <_sk_callback_hsw+0x390>
+ .byte 196,98,125,24,37,165,36,0,0 // vbroadcastss 0x24a5(%rip),%ymm12 # 4ef4 <_sk_callback_hsw+0x390>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -12362,9 +12438,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,226,35,0,0 // vbroadcastss 0x23e2(%rip),%ymm0 # 4e38 <_sk_callback_hsw+0x394>
+ .byte 196,226,125,24,5,90,36,0,0 // vbroadcastss 0x245a(%rip),%ymm0 # 4ef8 <_sk_callback_hsw+0x394>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,217,35,0,0 // vbroadcastss 0x23d9(%rip),%ymm8 # 4e3c <_sk_callback_hsw+0x398>
+ .byte 196,98,125,24,5,81,36,0,0 // vbroadcastss 0x2451(%rip),%ymm8 # 4efc <_sk_callback_hsw+0x398>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12376,12 +12452,12 @@ _sk_load_a8_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,52 // jne 2aaa <_sk_load_a8_hsw+0x3e>
+ .byte 117,52 // jne 2af2 <_sk_load_a8_hsw+0x3e>
.byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0
- .byte 197,249,219,5,156,39,0,0 // vpand 0x279c(%rip),%xmm0,%xmm0 # 5220 <_sk_callback_hsw+0x77c>
+ .byte 197,249,219,5,20,40,0,0 // vpand 0x2814(%rip),%xmm0,%xmm0 # 52e0 <_sk_callback_hsw+0x77c>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,170,35,0,0 // vbroadcastss 0x23aa(%rip),%ymm1 # 4e40 <_sk_callback_hsw+0x39c>
+ .byte 196,226,125,24,13,34,36,0,0 // vbroadcastss 0x2422(%rip),%ymm1 # 4f00 <_sk_callback_hsw+0x39c>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -12393,12 +12469,23 @@ _sk_load_a8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,190 // ja 2a7c <_sk_load_a8_hsw+0x10>
+ .byte 119,190 // ja 2ac4 <_sk_load_a8_hsw+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,95,0,0,0 // lea 0x5f(%rip),%r10 # 2b28 <_sk_load_a8_hsw+0xbc>
+ .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 2b88 <_sk_load_a8_hsw+0xd4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 197,249,110,192 // vmovd %eax,%xmm0
+ .byte 235,159 // jmp 2ac4 <_sk_load_a8_hsw+0x10>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 197,249,110,200 // vmovd %eax,%xmm1
+ .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
+ .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
+ .byte 233,119,255,255,255 // jmpq 2ac4 <_sk_load_a8_hsw+0x10>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -12406,32 +12493,26 @@ _sk_load_a8_hsw:
.byte 197,249,196,192,5 // vpinsrw $0x5,%eax,%xmm0,%xmm0
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 197,249,196,192,4 // vpinsrw $0x4,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 197,249,196,192,3 // vpinsrw $0x3,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 197,249,196,192,1 // vpinsrw $0x1,%eax,%xmm0,%xmm0
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 197,249,196,192,0 // vpinsrw $0x0,%eax,%xmm0,%xmm0
- .byte 233,85,255,255,255 // jmpq 2a7c <_sk_load_a8_hsw+0x10>
- .byte 144 // nop
- .byte 240,255 // lock (bad)
+ .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1
+ .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
+ .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
+ .byte 233,60,255,255,255 // jmpq 2ac4 <_sk_load_a8_hsw+0x10>
+ .byte 146 // xchg %eax,%edx
.byte 255 // (bad)
- .byte 255,229 // jmpq *%rbp
.byte 255 // (bad)
+ .byte 255,172,255,255,255,157,255 // ljmp *-0x620001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 218,255 // (bad)
+ .byte 234 // (bad)
.byte 255 // (bad)
- .byte 255,207 // dec %edi
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,196 // inc %esp
+ .byte 223,255 // (bad)
.byte 255 // (bad)
+ .byte 255,212 // callq *%rsp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 185,255,255,255,170 // mov $0xaaffffff,%ecx
+ .byte 255,197 // inc %ebp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -12476,7 +12557,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,74,34,0,0 // vbroadcastss 0x224a(%rip),%ymm1 # 4e44 <_sk_callback_hsw+0x3a0>
+ .byte 196,226,125,24,13,170,34,0,0 // vbroadcastss 0x22aa(%rip),%ymm1 # 4f04 <_sk_callback_hsw+0x3a0>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -12490,14 +12571,14 @@ FUNCTION(_sk_store_a8_hsw)
_sk_store_a8_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
- .byte 196,98,125,24,5,44,34,0,0 // vbroadcastss 0x222c(%rip),%ymm8 # 4e48 <_sk_callback_hsw+0x3a4>
+ .byte 196,98,125,24,5,140,34,0,0 // vbroadcastss 0x228c(%rip),%ymm8 # 4f08 <_sk_callback_hsw+0x3a4>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 2c45 <_sk_store_a8_hsw+0x37>
+ .byte 117,10 // jne 2ca5 <_sk_store_a8_hsw+0x37>
.byte 196,65,123,17,4,19 // vmovsd %xmm8,(%r11,%rdx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12505,41 +12586,42 @@ _sk_store_a8_hsw:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 2c41 <_sk_store_a8_hsw+0x33>
+ .byte 119,236 // ja 2ca1 <_sk_store_a8_hsw+0x33>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,67,0,0,0 // lea 0x43(%rip),%r10 # 2ca8 <_sk_store_a8_hsw+0x9a>
+ .byte 76,141,21,87,0,0,0 // lea 0x57(%rip),%r10 # 2d1c <_sk_store_a8_hsw+0xae>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 196,67,121,20,4,19,0 // vpextrb $0x0,%xmm8,(%r11,%rdx,1)
+ .byte 235,202 // jmp 2ca1 <_sk_store_a8_hsw+0x33>
+ .byte 196,67,121,20,68,19,2,4 // vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1)
+ .byte 196,98,57,0,5,8,38,0,0 // vpshufb 0x2608(%rip),%xmm8,%xmm8 # 52f0 <_sk_callback_hsw+0x78c>
+ .byte 196,67,121,21,4,19,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,1)
+ .byte 235,176 // jmp 2ca1 <_sk_store_a8_hsw+0x33>
.byte 196,67,121,20,68,19,6,12 // vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1)
.byte 196,67,121,20,68,19,5,10 // vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1)
.byte 196,67,121,20,68,19,4,8 // vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1)
- .byte 196,67,121,20,68,19,3,6 // vpextrb $0x6,%xmm8,0x3(%r11,%rdx,1)
- .byte 196,67,121,20,68,19,2,4 // vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1)
- .byte 196,67,121,20,68,19,1,2 // vpextrb $0x2,%xmm8,0x1(%r11,%rdx,1)
- .byte 196,67,121,20,4,19,0 // vpextrb $0x0,%xmm8,(%r11,%rdx,1)
- .byte 235,154 // jmp 2c41 <_sk_store_a8_hsw+0x33>
- .byte 144 // nop
- .byte 246,255 // idiv %bh
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 238 // out %al,(%dx)
+ .byte 196,98,57,0,5,238,37,0,0 // vpshufb 0x25ee(%rip),%xmm8,%xmm8 # 5300 <_sk_callback_hsw+0x79c>
+ .byte 196,65,121,126,4,19 // vmovd %xmm8,(%r11,%rdx,1)
+ .byte 235,135 // jmp 2ca1 <_sk_store_a8_hsw+0x33>
+ .byte 102,144 // xchg %ax,%ax
+ .byte 178,255 // mov $0xff,%dl
.byte 255 // (bad)
+ .byte 255,195 // inc %ebx
.byte 255 // (bad)
- .byte 255,230 // jmpq *%rsi
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 187,255,255,255,237 // mov $0xedffffff,%ebx
.byte 255 // (bad)
- .byte 222,255 // fdivrp %st,%st(7)
.byte 255 // (bad)
- .byte 255,214 // callq *%rsi
+ .byte 255,229 // jmpq *%rbp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,206 // dec %esi
.byte 255 // (bad)
+ .byte 221,255 // (bad)
.byte 255 // (bad)
- .byte 255,198 // inc %esi
+ .byte 255,213 // callq *%rbp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -12551,15 +12633,15 @@ _sk_load_g8_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,57 // jne 2d07 <_sk_load_g8_hsw+0x43>
+ .byte 117,57 // jne 2d7b <_sk_load_g8_hsw+0x43>
.byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0
- .byte 197,249,219,5,84,37,0,0 // vpand 0x2554(%rip),%xmm0,%xmm0 # 5230 <_sk_callback_hsw+0x78c>
+ .byte 197,249,219,5,192,37,0,0 // vpand 0x25c0(%rip),%xmm0,%xmm0 # 5310 <_sk_callback_hsw+0x7ac>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,94,33,0,0 // vbroadcastss 0x215e(%rip),%ymm1 # 4e4c <_sk_callback_hsw+0x3a8>
+ .byte 196,226,125,24,13,170,33,0,0 // vbroadcastss 0x21aa(%rip),%ymm1 # 4f0c <_sk_callback_hsw+0x3a8>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,83,33,0,0 // vbroadcastss 0x2153(%rip),%ymm3 # 4e50 <_sk_callback_hsw+0x3ac>
+ .byte 196,226,125,24,29,159,33,0,0 // vbroadcastss 0x219f(%rip),%ymm3 # 4f10 <_sk_callback_hsw+0x3ac>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -12568,12 +12650,23 @@ _sk_load_g8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,185 // ja 2cd4 <_sk_load_g8_hsw+0x10>
+ .byte 119,185 // ja 2d48 <_sk_load_g8_hsw+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,94,0,0,0 // lea 0x5e(%rip),%r10 # 2d84 <_sk_load_g8_hsw+0xc0>
+ .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 2e14 <_sk_load_g8_hsw+0xdc>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 197,249,110,192 // vmovd %eax,%xmm0
+ .byte 235,154 // jmp 2d48 <_sk_load_g8_hsw+0x10>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 197,249,110,200 // vmovd %eax,%xmm1
+ .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
+ .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
+ .byte 233,114,255,255,255 // jmpq 2d48 <_sk_load_g8_hsw+0x10>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -12581,32 +12674,27 @@ _sk_load_g8_hsw:
.byte 197,249,196,192,5 // vpinsrw $0x5,%eax,%xmm0,%xmm0
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 197,249,196,192,4 // vpinsrw $0x4,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 197,249,196,192,3 // vpinsrw $0x3,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 197,249,196,192,1 // vpinsrw $0x1,%eax,%xmm0,%xmm0
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 197,249,196,192,0 // vpinsrw $0x0,%eax,%xmm0,%xmm0
- .byte 233,80,255,255,255 // jmpq 2cd4 <_sk_load_g8_hsw+0x10>
- .byte 241 // icebp
- .byte 255 // (bad)
+ .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1
+ .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
+ .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
+ .byte 233,55,255,255,255 // jmpq 2d48 <_sk_load_g8_hsw+0x10>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 143 // (bad)
.byte 255 // (bad)
- .byte 255,230 // jmpq *%rsi
.byte 255 // (bad)
+ .byte 255,169,255,255,255,154 // ljmp *-0x65000001(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 219,255 // (bad)
+ .byte 255,231 // jmpq *%rdi
.byte 255 // (bad)
- .byte 255,208 // callq *%rax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,197 // inc %ebp
+ .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
+ .byte 255,209 // callq *%rcx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 186,255,255,255,171 // mov $0xabffffff,%edx
+ .byte 255,194 // inc %edx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -12651,10 +12739,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,254,31,0,0 // vbroadcastss 0x1ffe(%rip),%ymm1 # 4e54 <_sk_callback_hsw+0x3b0>
+ .byte 196,226,125,24,13,46,32,0,0 // vbroadcastss 0x202e(%rip),%ymm1 # 4f14 <_sk_callback_hsw+0x3b0>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,243,31,0,0 // vbroadcastss 0x1ff3(%rip),%ymm3 # 4e58 <_sk_callback_hsw+0x3b4>
+ .byte 196,226,125,24,29,35,32,0,0 // vbroadcastss 0x2023(%rip),%ymm3 # 4f18 <_sk_callback_hsw+0x3b4>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -12666,9 +12754,9 @@ _sk_gather_i8_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,137,193 // mov %rax,%r9
.byte 77,133,201 // test %r9,%r9
- .byte 116,5 // je 2e7e <_sk_gather_i8_hsw+0xf>
+ .byte 116,5 // je 2f0e <_sk_gather_i8_hsw+0xf>
.byte 76,137,200 // mov %r9,%rax
- .byte 235,2 // jmp 2e80 <_sk_gather_i8_hsw+0x11>
+ .byte 235,2 // jmp 2f10 <_sk_gather_i8_hsw+0x11>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 83 // push %rbx
.byte 76,139,16 // mov (%rax),%r10
@@ -12702,14 +12790,14 @@ _sk_gather_i8_hsw:
.byte 73,139,65,8 // mov 0x8(%r9),%rax
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,226,117,144,28,128 // vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3
- .byte 197,229,219,5,155,33,0,0 // vpand 0x219b(%rip),%ymm3,%ymm0 # 50c0 <_sk_callback_hsw+0x61c>
+ .byte 197,229,219,5,203,33,0,0 // vpand 0x21cb(%rip),%ymm3,%ymm0 # 5180 <_sk_callback_hsw+0x61c>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,42,31,0,0 // vbroadcastss 0x1f2a(%rip),%ymm8 # 4e5c <_sk_callback_hsw+0x3b8>
+ .byte 196,98,125,24,5,90,31,0,0 // vbroadcastss 0x1f5a(%rip),%ymm8 # 4f1c <_sk_callback_hsw+0x3b8>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,160,33,0,0 // vpshufb 0x21a0(%rip),%ymm3,%ymm1 # 50e0 <_sk_callback_hsw+0x63c>
+ .byte 196,226,101,0,13,208,33,0,0 // vpshufb 0x21d0(%rip),%ymm3,%ymm1 # 51a0 <_sk_callback_hsw+0x63c>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,174,33,0,0 // vpshufb 0x21ae(%rip),%ymm3,%ymm2 # 5100 <_sk_callback_hsw+0x65c>
+ .byte 196,226,101,0,21,222,33,0,0 // vpshufb 0x21de(%rip),%ymm3,%ymm2 # 51c0 <_sk_callback_hsw+0x65c>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -12726,68 +12814,69 @@ _sk_load_565_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,114 // jne 2fea <_sk_load_565_hsw+0x7c>
+ .byte 117,114 // jne 307a <_sk_load_565_hsw+0x7c>
.byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,212,30,0,0 // vpbroadcastd 0x1ed4(%rip),%ymm0 # 4e60 <_sk_callback_hsw+0x3bc>
+ .byte 196,226,125,88,5,4,31,0,0 // vpbroadcastd 0x1f04(%rip),%ymm0 # 4f20 <_sk_callback_hsw+0x3bc>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,199,30,0,0 // vbroadcastss 0x1ec7(%rip),%ymm1 # 4e64 <_sk_callback_hsw+0x3c0>
+ .byte 196,226,125,24,13,247,30,0,0 // vbroadcastss 0x1ef7(%rip),%ymm1 # 4f24 <_sk_callback_hsw+0x3c0>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,190,30,0,0 // vpbroadcastd 0x1ebe(%rip),%ymm1 # 4e68 <_sk_callback_hsw+0x3c4>
+ .byte 196,226,125,88,13,238,30,0,0 // vpbroadcastd 0x1eee(%rip),%ymm1 # 4f28 <_sk_callback_hsw+0x3c4>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,177,30,0,0 // vbroadcastss 0x1eb1(%rip),%ymm3 # 4e6c <_sk_callback_hsw+0x3c8>
+ .byte 196,226,125,24,29,225,30,0,0 // vbroadcastss 0x1ee1(%rip),%ymm3 # 4f2c <_sk_callback_hsw+0x3c8>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,168,30,0,0 // vpbroadcastd 0x1ea8(%rip),%ymm3 # 4e70 <_sk_callback_hsw+0x3cc>
+ .byte 196,226,125,88,29,216,30,0,0 // vpbroadcastd 0x1ed8(%rip),%ymm3 # 4f30 <_sk_callback_hsw+0x3cc>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,155,30,0,0 // vbroadcastss 0x1e9b(%rip),%ymm3 # 4e74 <_sk_callback_hsw+0x3d0>
+ .byte 196,226,125,24,29,203,30,0,0 // vbroadcastss 0x1ecb(%rip),%ymm3 # 4f34 <_sk_callback_hsw+0x3d0>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,144,30,0,0 // vbroadcastss 0x1e90(%rip),%ymm3 # 4e78 <_sk_callback_hsw+0x3d4>
+ .byte 196,226,125,24,29,192,30,0,0 // vbroadcastss 0x1ec0(%rip),%ymm3 # 4f38 <_sk_callback_hsw+0x3d4>
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,128 // ja 2f7e <_sk_load_565_hsw+0x10>
+ .byte 119,128 // ja 300e <_sk_load_565_hsw+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,75,0,0,0 // lea 0x4b(%rip),%r10 # 3054 <_sk_load_565_hsw+0xe6>
+ .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 30fc <_sk_load_565_hsw+0xfe>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax
+ .byte 197,249,110,192 // vmovd %eax,%xmm0
+ .byte 233,94,255,255,255 // jmpq 300e <_sk_load_565_hsw+0x10>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
+ .byte 196,193,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm1
+ .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
+ .byte 233,65,255,255,255 // jmpq 300e <_sk_load_565_hsw+0x10>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,6,3 // vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,2,1 // vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,4,83,0 // vpinsrw $0x0,(%r11,%rdx,2),%xmm0,%xmm0
- .byte 233,44,255,255,255 // jmpq 2f7e <_sk_load_565_hsw+0x10>
+ .byte 196,193,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm1
+ .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
+ .byte 233,20,255,255,255 // jmpq 300e <_sk_load_565_hsw+0x10>
.byte 102,144 // xchg %ax,%ax
- .byte 242,255 // repnz (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 234 // (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 255,226 // jmpq *%rdx
+ .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,192 // inc %eax
.byte 255 // (bad)
- .byte 218,255 // (bad)
.byte 255 // (bad)
- .byte 255,210 // callq *%rdx
+ .byte 255,180,255,255,255,237,255 // pushq -0x120001(%rdi,%rdi,8)
.byte 255 // (bad)
+ .byte 255,229 // jmpq *%rbp
.byte 255 // (bad)
- .byte 255,202 // dec %edx
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 221,255 // (bad)
.byte 255 // (bad)
- .byte 190 // .byte 0xbe
+ .byte 255,209 // callq *%rcx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -12833,23 +12922,23 @@ _sk_gather_565_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,91,29,0,0 // vpbroadcastd 0x1d5b(%rip),%ymm0 # 4e7c <_sk_callback_hsw+0x3d8>
+ .byte 196,226,125,88,5,115,29,0,0 // vpbroadcastd 0x1d73(%rip),%ymm0 # 4f3c <_sk_callback_hsw+0x3d8>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,78,29,0,0 // vbroadcastss 0x1d4e(%rip),%ymm1 # 4e80 <_sk_callback_hsw+0x3dc>
+ .byte 196,226,125,24,13,102,29,0,0 // vbroadcastss 0x1d66(%rip),%ymm1 # 4f40 <_sk_callback_hsw+0x3dc>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,69,29,0,0 // vpbroadcastd 0x1d45(%rip),%ymm1 # 4e84 <_sk_callback_hsw+0x3e0>
+ .byte 196,226,125,88,13,93,29,0,0 // vpbroadcastd 0x1d5d(%rip),%ymm1 # 4f44 <_sk_callback_hsw+0x3e0>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,56,29,0,0 // vbroadcastss 0x1d38(%rip),%ymm3 # 4e88 <_sk_callback_hsw+0x3e4>
+ .byte 196,226,125,24,29,80,29,0,0 // vbroadcastss 0x1d50(%rip),%ymm3 # 4f48 <_sk_callback_hsw+0x3e4>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,47,29,0,0 // vpbroadcastd 0x1d2f(%rip),%ymm3 # 4e8c <_sk_callback_hsw+0x3e8>
+ .byte 196,226,125,88,29,71,29,0,0 // vpbroadcastd 0x1d47(%rip),%ymm3 # 4f4c <_sk_callback_hsw+0x3e8>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,34,29,0,0 // vbroadcastss 0x1d22(%rip),%ymm3 # 4e90 <_sk_callback_hsw+0x3ec>
+ .byte 196,226,125,24,29,58,29,0,0 // vbroadcastss 0x1d3a(%rip),%ymm3 # 4f50 <_sk_callback_hsw+0x3ec>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,23,29,0,0 // vbroadcastss 0x1d17(%rip),%ymm3 # 4e94 <_sk_callback_hsw+0x3f0>
+ .byte 196,226,125,24,29,47,29,0,0 // vbroadcastss 0x1d2f(%rip),%ymm3 # 4f54 <_sk_callback_hsw+0x3f0>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_hsw
@@ -12858,11 +12947,11 @@ FUNCTION(_sk_store_565_hsw)
_sk_store_565_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
- .byte 196,98,125,24,5,11,29,0,0 // vbroadcastss 0x1d0b(%rip),%ymm8 # 4e98 <_sk_callback_hsw+0x3f4>
+ .byte 196,98,125,24,5,35,29,0,0 // vbroadcastss 0x1d23(%rip),%ymm8 # 4f58 <_sk_callback_hsw+0x3f4>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,246,28,0,0 // vbroadcastss 0x1cf6(%rip),%ymm10 # 4e9c <_sk_callback_hsw+0x3f8>
+ .byte 196,98,125,24,21,14,29,0,0 // vbroadcastss 0x1d0e(%rip),%ymm10 # 4f5c <_sk_callback_hsw+0x3f8>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -12873,7 +12962,7 @@ _sk_store_565_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 31e4 <_sk_store_565_hsw+0x65>
+ .byte 117,10 // jne 328c <_sk_store_565_hsw+0x65>
.byte 196,65,122,127,4,83 // vmovdqu %xmm8,(%r11,%rdx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12881,42 +12970,44 @@ _sk_store_565_hsw:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 31e0 <_sk_store_565_hsw+0x61>
+ .byte 119,236 // ja 3288 <_sk_store_565_hsw+0x61>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # 3244 <_sk_store_565_hsw+0xc5>
+ .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # 32ec <_sk_store_565_hsw+0xc5>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2)
+ .byte 235,207 // jmp 3288 <_sk_store_565_hsw+0x61>
+ .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
+ .byte 196,65,121,126,4,83 // vmovd %xmm8,(%r11,%rdx,2)
+ .byte 235,191 // jmp 3288 <_sk_store_565_hsw+0x61>
.byte 196,67,121,21,68,83,12,6 // vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2)
.byte 196,67,121,21,68,83,10,5 // vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2)
.byte 196,67,121,21,68,83,8,4 // vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,6,3 // vpextrw $0x3,%xmm8,0x6(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,2,1 // vpextrw $0x1,%xmm8,0x2(%r11,%rdx,2)
- .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2)
- .byte 235,159 // jmp 31e0 <_sk_store_565_hsw+0x61>
+ .byte 196,65,121,214,4,83 // vmovq %xmm8,(%r11,%rdx,2)
+ .byte 235,159 // jmp 3288 <_sk_store_565_hsw+0x61>
.byte 15,31,0 // nopl (%rax)
- .byte 244 // hlt
+ .byte 196 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,213 // callq *%rbp
.byte 255 // (bad)
- .byte 236 // in (%dx),%al
.byte 255 // (bad)
+ .byte 255,205 // dec %ebp
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
.byte 255 // (bad)
+ .byte 255,245 // push %rbp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
- .byte 255,212 // callq *%rsp
+ .byte 237 // in (%dx),%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,204 // dec %esp
+ .byte 255,229 // jmpq *%rbp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,196 // inc %esp
.byte 255 // (bad)
+ .byte 221,255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -12927,28 +13018,28 @@ _sk_load_4444_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,138,0,0,0 // jne 32f8 <_sk_load_4444_hsw+0x98>
+ .byte 15,133,138,0,0,0 // jne 33a0 <_sk_load_4444_hsw+0x98>
.byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,30,28,0,0 // vpbroadcastd 0x1c1e(%rip),%ymm0 # 4ea0 <_sk_callback_hsw+0x3fc>
+ .byte 196,226,125,88,5,54,28,0,0 // vpbroadcastd 0x1c36(%rip),%ymm0 # 4f60 <_sk_callback_hsw+0x3fc>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,17,28,0,0 // vbroadcastss 0x1c11(%rip),%ymm1 # 4ea4 <_sk_callback_hsw+0x400>
+ .byte 196,226,125,24,13,41,28,0,0 // vbroadcastss 0x1c29(%rip),%ymm1 # 4f64 <_sk_callback_hsw+0x400>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,8,28,0,0 // vpbroadcastd 0x1c08(%rip),%ymm1 # 4ea8 <_sk_callback_hsw+0x404>
+ .byte 196,226,125,88,13,32,28,0,0 // vpbroadcastd 0x1c20(%rip),%ymm1 # 4f68 <_sk_callback_hsw+0x404>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,251,27,0,0 // vbroadcastss 0x1bfb(%rip),%ymm2 # 4eac <_sk_callback_hsw+0x408>
+ .byte 196,226,125,24,21,19,28,0,0 // vbroadcastss 0x1c13(%rip),%ymm2 # 4f6c <_sk_callback_hsw+0x408>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,242,27,0,0 // vpbroadcastd 0x1bf2(%rip),%ymm2 # 4eb0 <_sk_callback_hsw+0x40c>
+ .byte 196,226,125,88,21,10,28,0,0 // vpbroadcastd 0x1c0a(%rip),%ymm2 # 4f70 <_sk_callback_hsw+0x40c>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,229,27,0,0 // vbroadcastss 0x1be5(%rip),%ymm8 # 4eb4 <_sk_callback_hsw+0x410>
+ .byte 196,98,125,24,5,253,27,0,0 // vbroadcastss 0x1bfd(%rip),%ymm8 # 4f74 <_sk_callback_hsw+0x410>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,219,27,0,0 // vpbroadcastd 0x1bdb(%rip),%ymm8 # 4eb8 <_sk_callback_hsw+0x414>
+ .byte 196,98,125,88,5,243,27,0,0 // vpbroadcastd 0x1bf3(%rip),%ymm8 # 4f78 <_sk_callback_hsw+0x414>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,205,27,0,0 // vbroadcastss 0x1bcd(%rip),%ymm8 # 4ebc <_sk_callback_hsw+0x418>
+ .byte 196,98,125,24,5,229,27,0,0 // vbroadcastss 0x1be5(%rip),%ymm8 # 4f7c <_sk_callback_hsw+0x418>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12957,41 +13048,42 @@ _sk_load_4444_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,100,255,255,255 // ja 3274 <_sk_load_4444_hsw+0x14>
+ .byte 15,135,100,255,255,255 // ja 331c <_sk_load_4444_hsw+0x14>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,73,0,0,0 // lea 0x49(%rip),%r10 # 3364 <_sk_load_4444_hsw+0x104>
+ .byte 76,141,21,97,0,0,0 // lea 0x61(%rip),%r10 # 3424 <_sk_load_4444_hsw+0x11c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax
+ .byte 197,249,110,192 // vmovd %eax,%xmm0
+ .byte 233,66,255,255,255 // jmpq 331c <_sk_load_4444_hsw+0x14>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
+ .byte 196,193,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm1
+ .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
+ .byte 233,37,255,255,255 // jmpq 331c <_sk_load_4444_hsw+0x14>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,6,3 // vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,2,1 // vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,4,83,0 // vpinsrw $0x0,(%r11,%rdx,2),%xmm0,%xmm0
- .byte 233,16,255,255,255 // jmpq 3274 <_sk_load_4444_hsw+0x14>
- .byte 244 // hlt
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 236 // in (%dx),%al
- .byte 255 // (bad)
+ .byte 196,193,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm1
+ .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
+ .byte 233,248,254,255,255 // jmpq 331c <_sk_load_4444_hsw+0x14>
+ .byte 168,255 // test $0xff,%al
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
+ .byte 255,194 // inc %edx
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,182,255,255,255,239 // pushq -0x10000001(%rsi)
.byte 255 // (bad)
- .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
- .byte 255,212 // callq *%rsp
+ .byte 255,231 // jmpq *%rdi
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,204 // dec %esp
.byte 255 // (bad)
+ .byte 223,255 // (bad)
.byte 255 // (bad)
- .byte 255,192 // inc %eax
+ .byte 255,211 // callq *%rbx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -13037,25 +13129,25 @@ _sk_gather_4444_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,143,26,0,0 // vpbroadcastd 0x1a8f(%rip),%ymm0 # 4ec0 <_sk_callback_hsw+0x41c>
+ .byte 196,226,125,88,5,143,26,0,0 // vpbroadcastd 0x1a8f(%rip),%ymm0 # 4f80 <_sk_callback_hsw+0x41c>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,130,26,0,0 // vbroadcastss 0x1a82(%rip),%ymm1 # 4ec4 <_sk_callback_hsw+0x420>
+ .byte 196,226,125,24,13,130,26,0,0 // vbroadcastss 0x1a82(%rip),%ymm1 # 4f84 <_sk_callback_hsw+0x420>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,121,26,0,0 // vpbroadcastd 0x1a79(%rip),%ymm1 # 4ec8 <_sk_callback_hsw+0x424>
+ .byte 196,226,125,88,13,121,26,0,0 // vpbroadcastd 0x1a79(%rip),%ymm1 # 4f88 <_sk_callback_hsw+0x424>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,108,26,0,0 // vbroadcastss 0x1a6c(%rip),%ymm2 # 4ecc <_sk_callback_hsw+0x428>
+ .byte 196,226,125,24,21,108,26,0,0 // vbroadcastss 0x1a6c(%rip),%ymm2 # 4f8c <_sk_callback_hsw+0x428>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,99,26,0,0 // vpbroadcastd 0x1a63(%rip),%ymm2 # 4ed0 <_sk_callback_hsw+0x42c>
+ .byte 196,226,125,88,21,99,26,0,0 // vpbroadcastd 0x1a63(%rip),%ymm2 # 4f90 <_sk_callback_hsw+0x42c>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,86,26,0,0 // vbroadcastss 0x1a56(%rip),%ymm8 # 4ed4 <_sk_callback_hsw+0x430>
+ .byte 196,98,125,24,5,86,26,0,0 // vbroadcastss 0x1a56(%rip),%ymm8 # 4f94 <_sk_callback_hsw+0x430>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,76,26,0,0 // vpbroadcastd 0x1a4c(%rip),%ymm8 # 4ed8 <_sk_callback_hsw+0x434>
+ .byte 196,98,125,88,5,76,26,0,0 // vpbroadcastd 0x1a4c(%rip),%ymm8 # 4f98 <_sk_callback_hsw+0x434>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,62,26,0,0 // vbroadcastss 0x1a3e(%rip),%ymm8 # 4edc <_sk_callback_hsw+0x438>
+ .byte 196,98,125,24,5,62,26,0,0 // vbroadcastss 0x1a3e(%rip),%ymm8 # 4f9c <_sk_callback_hsw+0x438>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13066,7 +13158,7 @@ FUNCTION(_sk_store_4444_hsw)
_sk_store_4444_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
- .byte 196,98,125,24,5,43,26,0,0 // vbroadcastss 0x1a2b(%rip),%ymm8 # 4ee0 <_sk_callback_hsw+0x43c>
+ .byte 196,98,125,24,5,43,26,0,0 // vbroadcastss 0x1a2b(%rip),%ymm8 # 4fa0 <_sk_callback_hsw+0x43c>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -13084,7 +13176,7 @@ _sk_store_4444_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3518 <_sk_store_4444_hsw+0x71>
+ .byte 117,10 // jne 35d8 <_sk_store_4444_hsw+0x71>
.byte 196,65,122,127,4,83 // vmovdqu %xmm8,(%r11,%rdx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13092,42 +13184,44 @@ _sk_store_4444_hsw:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 3514 <_sk_store_4444_hsw+0x6d>
+ .byte 119,236 // ja 35d4 <_sk_store_4444_hsw+0x6d>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # 3578 <_sk_store_4444_hsw+0xd1>
+ .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # 3638 <_sk_store_4444_hsw+0xd1>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2)
+ .byte 235,207 // jmp 35d4 <_sk_store_4444_hsw+0x6d>
+ .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
+ .byte 196,65,121,126,4,83 // vmovd %xmm8,(%r11,%rdx,2)
+ .byte 235,191 // jmp 35d4 <_sk_store_4444_hsw+0x6d>
.byte 196,67,121,21,68,83,12,6 // vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2)
.byte 196,67,121,21,68,83,10,5 // vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2)
.byte 196,67,121,21,68,83,8,4 // vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,6,3 // vpextrw $0x3,%xmm8,0x6(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,2,1 // vpextrw $0x1,%xmm8,0x2(%r11,%rdx,2)
- .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2)
- .byte 235,159 // jmp 3514 <_sk_store_4444_hsw+0x6d>
+ .byte 196,65,121,214,4,83 // vmovq %xmm8,(%r11,%rdx,2)
+ .byte 235,159 // jmp 35d4 <_sk_store_4444_hsw+0x6d>
.byte 15,31,0 // nopl (%rax)
- .byte 244 // hlt
+ .byte 196 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,213 // callq *%rbp
.byte 255 // (bad)
- .byte 236 // in (%dx),%al
.byte 255 // (bad)
+ .byte 255,205 // dec %ebp
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
.byte 255 // (bad)
+ .byte 255,245 // push %rbp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
- .byte 255,212 // callq *%rsp
+ .byte 237 // in (%dx),%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,204 // dec %esp
+ .byte 255,229 // jmpq *%rbp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,196 // inc %esp
.byte 255 // (bad)
+ .byte 221,255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -13140,16 +13234,16 @@ _sk_load_8888_hsw:
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 76,3,16 // add (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,88 // jne 3601 <_sk_load_8888_hsw+0x6d>
+ .byte 117,88 // jne 36c1 <_sk_load_8888_hsw+0x6d>
.byte 196,193,124,16,26 // vmovups (%r10),%ymm3
- .byte 197,228,84,5,106,27,0,0 // vandps 0x1b6a(%rip),%ymm3,%ymm0 # 5120 <_sk_callback_hsw+0x67c>
+ .byte 197,228,84,5,106,27,0,0 // vandps 0x1b6a(%rip),%ymm3,%ymm0 # 51e0 <_sk_callback_hsw+0x67c>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,33,25,0,0 // vbroadcastss 0x1921(%rip),%ymm8 # 4ee4 <_sk_callback_hsw+0x440>
+ .byte 196,98,125,24,5,33,25,0,0 // vbroadcastss 0x1921(%rip),%ymm8 # 4fa4 <_sk_callback_hsw+0x440>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,111,27,0,0 // vpshufb 0x1b6f(%rip),%ymm3,%ymm1 # 5140 <_sk_callback_hsw+0x69c>
+ .byte 196,226,101,0,13,111,27,0,0 // vpshufb 0x1b6f(%rip),%ymm3,%ymm1 # 5200 <_sk_callback_hsw+0x69c>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,125,27,0,0 // vpshufb 0x1b7d(%rip),%ymm3,%ymm2 # 5160 <_sk_callback_hsw+0x6bc>
+ .byte 196,226,101,0,21,125,27,0,0 // vpshufb 0x1b7d(%rip),%ymm3,%ymm2 # 5220 <_sk_callback_hsw+0x6bc>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13166,7 +13260,7 @@ _sk_load_8888_hsw:
.byte 196,225,249,110,192 // vmovq %rax,%xmm0
.byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0
.byte 196,194,125,44,26 // vmaskmovps (%r10),%ymm0,%ymm3
- .byte 235,135 // jmp 35ae <_sk_load_8888_hsw+0x1a>
+ .byte 235,135 // jmp 366e <_sk_load_8888_hsw+0x1a>
HIDDEN _sk_gather_8888_hsw
.globl _sk_gather_8888_hsw
@@ -13181,14 +13275,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,43,27,0,0 // vpand 0x1b2b(%rip),%ymm3,%ymm0 # 5180 <_sk_callback_hsw+0x6dc>
+ .byte 197,229,219,5,43,27,0,0 // vpand 0x1b2b(%rip),%ymm3,%ymm0 # 5240 <_sk_callback_hsw+0x6dc>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,134,24,0,0 // vbroadcastss 0x1886(%rip),%ymm8 # 4ee8 <_sk_callback_hsw+0x444>
+ .byte 196,98,125,24,5,134,24,0,0 // vbroadcastss 0x1886(%rip),%ymm8 # 4fa8 <_sk_callback_hsw+0x444>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,48,27,0,0 // vpshufb 0x1b30(%rip),%ymm3,%ymm1 # 51a0 <_sk_callback_hsw+0x6fc>
+ .byte 196,226,101,0,13,48,27,0,0 // vpshufb 0x1b30(%rip),%ymm3,%ymm1 # 5260 <_sk_callback_hsw+0x6fc>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,62,27,0,0 // vpshufb 0x1b3e(%rip),%ymm3,%ymm2 # 51c0 <_sk_callback_hsw+0x71c>
+ .byte 196,226,101,0,21,62,27,0,0 // vpshufb 0x1b3e(%rip),%ymm3,%ymm2 # 5280 <_sk_callback_hsw+0x71c>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13205,7 +13299,7 @@ _sk_store_8888_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 76,3,16 // add (%rax),%r10
- .byte 196,98,125,24,5,54,24,0,0 // vbroadcastss 0x1836(%rip),%ymm8 # 4eec <_sk_callback_hsw+0x448>
+ .byte 196,98,125,24,5,54,24,0,0 // vbroadcastss 0x1836(%rip),%ymm8 # 4fac <_sk_callback_hsw+0x448>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -13221,7 +13315,7 @@ _sk_store_8888_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,12 // jne 3710 <_sk_store_8888_hsw+0x73>
+ .byte 117,12 // jne 37d0 <_sk_store_8888_hsw+0x73>
.byte 196,65,124,17,2 // vmovups %ymm8,(%r10)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -13234,7 +13328,7 @@ _sk_store_8888_hsw:
.byte 196,97,249,110,200 // vmovq %rax,%xmm9
.byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9
.byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10)
- .byte 235,211 // jmp 3709 <_sk_store_8888_hsw+0x6c>
+ .byte 235,211 // jmp 37c9 <_sk_store_8888_hsw+0x6c>
HIDDEN _sk_load_f16_hsw
.globl _sk_load_f16_hsw
@@ -13243,7 +13337,7 @@ _sk_load_f16_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,97 // jne 37a1 <_sk_load_f16_hsw+0x6b>
+ .byte 117,97 // jne 3861 <_sk_load_f16_hsw+0x6b>
.byte 197,121,16,4,208 // vmovupd (%rax,%rdx,8),%xmm8
.byte 197,249,16,84,208,16 // vmovupd 0x10(%rax,%rdx,8),%xmm2
.byte 197,249,16,92,208,32 // vmovupd 0x20(%rax,%rdx,8),%xmm3
@@ -13269,29 +13363,29 @@ _sk_load_f16_hsw:
.byte 197,123,16,4,208 // vmovsd (%rax,%rdx,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,79 // je 3800 <_sk_load_f16_hsw+0xca>
+ .byte 116,79 // je 38c0 <_sk_load_f16_hsw+0xca>
.byte 197,57,22,68,208,8 // vmovhpd 0x8(%rax,%rdx,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,67 // jb 3800 <_sk_load_f16_hsw+0xca>
+ .byte 114,67 // jb 38c0 <_sk_load_f16_hsw+0xca>
.byte 197,251,16,84,208,16 // vmovsd 0x10(%rax,%rdx,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,68 // je 380d <_sk_load_f16_hsw+0xd7>
+ .byte 116,68 // je 38cd <_sk_load_f16_hsw+0xd7>
.byte 197,233,22,84,208,24 // vmovhpd 0x18(%rax,%rdx,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,56 // jb 380d <_sk_load_f16_hsw+0xd7>
+ .byte 114,56 // jb 38cd <_sk_load_f16_hsw+0xd7>
.byte 197,251,16,92,208,32 // vmovsd 0x20(%rax,%rdx,8),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,114,255,255,255 // je 3757 <_sk_load_f16_hsw+0x21>
+ .byte 15,132,114,255,255,255 // je 3817 <_sk_load_f16_hsw+0x21>
.byte 197,225,22,92,208,40 // vmovhpd 0x28(%rax,%rdx,8),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,98,255,255,255 // jb 3757 <_sk_load_f16_hsw+0x21>
+ .byte 15,130,98,255,255,255 // jb 3817 <_sk_load_f16_hsw+0x21>
.byte 197,122,126,76,208,48 // vmovq 0x30(%rax,%rdx,8),%xmm9
- .byte 233,87,255,255,255 // jmpq 3757 <_sk_load_f16_hsw+0x21>
+ .byte 233,87,255,255,255 // jmpq 3817 <_sk_load_f16_hsw+0x21>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,74,255,255,255 // jmpq 3757 <_sk_load_f16_hsw+0x21>
+ .byte 233,74,255,255,255 // jmpq 3817 <_sk_load_f16_hsw+0x21>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,65,255,255,255 // jmpq 3757 <_sk_load_f16_hsw+0x21>
+ .byte 233,65,255,255,255 // jmpq 3817 <_sk_load_f16_hsw+0x21>
HIDDEN _sk_gather_f16_hsw
.globl _sk_gather_f16_hsw
@@ -13349,7 +13443,7 @@ _sk_store_f16_hsw:
.byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9
.byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,27 // jne 3905 <_sk_store_f16_hsw+0x65>
+ .byte 117,27 // jne 39c5 <_sk_store_f16_hsw+0x65>
.byte 197,120,17,28,208 // vmovups %xmm11,(%rax,%rdx,8)
.byte 197,120,17,84,208,16 // vmovups %xmm10,0x10(%rax,%rdx,8)
.byte 197,120,17,76,208,32 // vmovups %xmm9,0x20(%rax,%rdx,8)
@@ -13358,22 +13452,22 @@ _sk_store_f16_hsw:
.byte 255,224 // jmpq *%rax
.byte 197,121,214,28,208 // vmovq %xmm11,(%rax,%rdx,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,241 // je 3901 <_sk_store_f16_hsw+0x61>
+ .byte 116,241 // je 39c1 <_sk_store_f16_hsw+0x61>
.byte 197,121,23,92,208,8 // vmovhpd %xmm11,0x8(%rax,%rdx,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,229 // jb 3901 <_sk_store_f16_hsw+0x61>
+ .byte 114,229 // jb 39c1 <_sk_store_f16_hsw+0x61>
.byte 197,121,214,84,208,16 // vmovq %xmm10,0x10(%rax,%rdx,8)
- .byte 116,221 // je 3901 <_sk_store_f16_hsw+0x61>
+ .byte 116,221 // je 39c1 <_sk_store_f16_hsw+0x61>
.byte 197,121,23,84,208,24 // vmovhpd %xmm10,0x18(%rax,%rdx,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,209 // jb 3901 <_sk_store_f16_hsw+0x61>
+ .byte 114,209 // jb 39c1 <_sk_store_f16_hsw+0x61>
.byte 197,121,214,76,208,32 // vmovq %xmm9,0x20(%rax,%rdx,8)
- .byte 116,201 // je 3901 <_sk_store_f16_hsw+0x61>
+ .byte 116,201 // je 39c1 <_sk_store_f16_hsw+0x61>
.byte 197,121,23,76,208,40 // vmovhpd %xmm9,0x28(%rax,%rdx,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,189 // jb 3901 <_sk_store_f16_hsw+0x61>
+ .byte 114,189 // jb 39c1 <_sk_store_f16_hsw+0x61>
.byte 197,121,214,68,208,48 // vmovq %xmm8,0x30(%rax,%rdx,8)
- .byte 235,181 // jmp 3901 <_sk_store_f16_hsw+0x61>
+ .byte 235,181 // jmp 39c1 <_sk_store_f16_hsw+0x61>
HIDDEN _sk_load_u16_be_hsw
.globl _sk_load_u16_be_hsw
@@ -13383,7 +13477,7 @@ _sk_load_u16_be_hsw:
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 3a2e <_sk_load_u16_be_hsw+0xe2>
+ .byte 15,133,204,0,0,0 // jne 3aee <_sk_load_u16_be_hsw+0xe2>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -13402,7 +13496,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,45,21,0,0 // vbroadcastss 0x152d(%rip),%ymm10 # 4ef0 <_sk_callback_hsw+0x44c>
+ .byte 196,98,125,24,21,45,21,0,0 // vbroadcastss 0x152d(%rip),%ymm10 # 4fb0 <_sk_callback_hsw+0x44c>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -13430,29 +13524,29 @@ _sk_load_u16_be_hsw:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 3a94 <_sk_load_u16_be_hsw+0x148>
+ .byte 116,85 // je 3b54 <_sk_load_u16_be_hsw+0x148>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 3a94 <_sk_load_u16_be_hsw+0x148>
+ .byte 114,72 // jb 3b54 <_sk_load_u16_be_hsw+0x148>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 3aa1 <_sk_load_u16_be_hsw+0x155>
+ .byte 116,72 // je 3b61 <_sk_load_u16_be_hsw+0x155>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 3aa1 <_sk_load_u16_be_hsw+0x155>
+ .byte 114,59 // jb 3b61 <_sk_load_u16_be_hsw+0x155>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,6,255,255,255 // je 397d <_sk_load_u16_be_hsw+0x31>
+ .byte 15,132,6,255,255,255 // je 3a3d <_sk_load_u16_be_hsw+0x31>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,245,254,255,255 // jb 397d <_sk_load_u16_be_hsw+0x31>
+ .byte 15,130,245,254,255,255 // jb 3a3d <_sk_load_u16_be_hsw+0x31>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,233,254,255,255 // jmpq 397d <_sk_load_u16_be_hsw+0x31>
+ .byte 233,233,254,255,255 // jmpq 3a3d <_sk_load_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,220,254,255,255 // jmpq 397d <_sk_load_u16_be_hsw+0x31>
+ .byte 233,220,254,255,255 // jmpq 3a3d <_sk_load_u16_be_hsw+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,211,254,255,255 // jmpq 397d <_sk_load_u16_be_hsw+0x31>
+ .byte 233,211,254,255,255 // jmpq 3a3d <_sk_load_u16_be_hsw+0x31>
HIDDEN _sk_load_rgb_u16_be_hsw
.globl _sk_load_rgb_u16_be_hsw
@@ -13462,7 +13556,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,82 // lea (%rdx,%rdx,2),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 3b88 <_sk_load_rgb_u16_be_hsw+0xde>
+ .byte 15,133,204,0,0,0 // jne 3c48 <_sk_load_rgb_u16_be_hsw+0xde>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -13486,7 +13580,7 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,190,19,0,0 // vbroadcastss 0x13be(%rip),%ymm10 # 4ef4 <_sk_callback_hsw+0x450>
+ .byte 196,98,125,24,21,190,19,0,0 // vbroadcastss 0x13be(%rip),%ymm10 # 4fb4 <_sk_callback_hsw+0x450>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -13503,41 +13597,41 @@ _sk_load_rgb_u16_be_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,114,19,0,0 // vbroadcastss 0x1372(%rip),%ymm3 # 4ef8 <_sk_callback_hsw+0x454>
+ .byte 196,226,125,24,29,114,19,0,0 // vbroadcastss 0x1372(%rip),%ymm3 # 4fb8 <_sk_callback_hsw+0x454>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 3ba1 <_sk_load_rgb_u16_be_hsw+0xf7>
- .byte 233,79,255,255,255 // jmpq 3af0 <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 117,5 // jne 3c61 <_sk_load_rgb_u16_be_hsw+0xf7>
+ .byte 233,79,255,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 3bd0 <_sk_load_rgb_u16_be_hsw+0x126>
+ .byte 114,26 // jb 3c90 <_sk_load_rgb_u16_be_hsw+0x126>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 3bd5 <_sk_load_rgb_u16_be_hsw+0x12b>
- .byte 233,32,255,255,255 // jmpq 3af0 <_sk_load_rgb_u16_be_hsw+0x46>
- .byte 233,27,255,255,255 // jmpq 3af0 <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 3c95 <_sk_load_rgb_u16_be_hsw+0x12b>
+ .byte 233,32,255,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 233,27,255,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 3c04 <_sk_load_rgb_u16_be_hsw+0x15a>
+ .byte 114,26 // jb 3cc4 <_sk_load_rgb_u16_be_hsw+0x15a>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 3c09 <_sk_load_rgb_u16_be_hsw+0x15f>
- .byte 233,236,254,255,255 // jmpq 3af0 <_sk_load_rgb_u16_be_hsw+0x46>
- .byte 233,231,254,255,255 // jmpq 3af0 <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 117,10 // jne 3cc9 <_sk_load_rgb_u16_be_hsw+0x15f>
+ .byte 233,236,254,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 233,231,254,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 3c32 <_sk_load_rgb_u16_be_hsw+0x188>
+ .byte 114,20 // jb 3cf2 <_sk_load_rgb_u16_be_hsw+0x188>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,190,254,255,255 // jmpq 3af0 <_sk_load_rgb_u16_be_hsw+0x46>
- .byte 233,185,254,255,255 // jmpq 3af0 <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 233,190,254,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
+ .byte 233,185,254,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
HIDDEN _sk_store_u16_be_hsw
.globl _sk_store_u16_be_hsw
@@ -13546,7 +13640,7 @@ _sk_store_u16_be_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax
- .byte 196,98,125,24,5,175,18,0,0 // vbroadcastss 0x12af(%rip),%ymm8 # 4efc <_sk_callback_hsw+0x458>
+ .byte 196,98,125,24,5,175,18,0,0 // vbroadcastss 0x12af(%rip),%ymm8 # 4fbc <_sk_callback_hsw+0x458>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -13584,7 +13678,7 @@ _sk_store_u16_be_hsw:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 3d31 <_sk_store_u16_be_hsw+0xfa>
+ .byte 117,31 // jne 3df1 <_sk_store_u16_be_hsw+0xfa>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -13593,22 +13687,22 @@ _sk_store_u16_be_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 3d2d <_sk_store_u16_be_hsw+0xf6>
+ .byte 116,240 // je 3ded <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 3d2d <_sk_store_u16_be_hsw+0xf6>
+ .byte 114,227 // jb 3ded <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je 3d2d <_sk_store_u16_be_hsw+0xf6>
+ .byte 116,218 // je 3ded <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 3d2d <_sk_store_u16_be_hsw+0xf6>
+ .byte 114,205 // jb 3ded <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je 3d2d <_sk_store_u16_be_hsw+0xf6>
+ .byte 116,196 // je 3ded <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 3d2d <_sk_store_u16_be_hsw+0xf6>
+ .byte 114,183 // jb 3ded <_sk_store_u16_be_hsw+0xf6>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp 3d2d <_sk_store_u16_be_hsw+0xf6>
+ .byte 235,174 // jmp 3ded <_sk_store_u16_be_hsw+0xf6>
HIDDEN _sk_load_f32_hsw
.globl _sk_load_f32_hsw
@@ -13616,10 +13710,10 @@ FUNCTION(_sk_load_f32_hsw)
_sk_load_f32_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 119,110 // ja 3df5 <_sk_load_f32_hsw+0x76>
+ .byte 119,110 // ja 3eb5 <_sk_load_f32_hsw+0x76>
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
- .byte 76,141,29,135,0,0,0 // lea 0x87(%rip),%r11 # 3e20 <_sk_load_f32_hsw+0xa1>
+ .byte 76,141,29,135,0,0,0 // lea 0x87(%rip),%r11 # 3ee0 <_sk_load_f32_hsw+0xa1>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -13680,7 +13774,7 @@ _sk_store_f32_hsw:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne 3ead <_sk_store_f32_hsw+0x6d>
+ .byte 117,55 // jne 3f6d <_sk_store_f32_hsw+0x6d>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -13693,22 +13787,22 @@ _sk_store_f32_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 3ea9 <_sk_store_f32_hsw+0x69>
+ .byte 116,240 // je 3f69 <_sk_store_f32_hsw+0x69>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 3ea9 <_sk_store_f32_hsw+0x69>
+ .byte 114,227 // jb 3f69 <_sk_store_f32_hsw+0x69>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je 3ea9 <_sk_store_f32_hsw+0x69>
+ .byte 116,218 // je 3f69 <_sk_store_f32_hsw+0x69>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 3ea9 <_sk_store_f32_hsw+0x69>
+ .byte 114,205 // jb 3f69 <_sk_store_f32_hsw+0x69>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je 3ea9 <_sk_store_f32_hsw+0x69>
+ .byte 116,195 // je 3f69 <_sk_store_f32_hsw+0x69>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb 3ea9 <_sk_store_f32_hsw+0x69>
+ .byte 114,181 // jb 3f69 <_sk_store_f32_hsw+0x69>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp 3ea9 <_sk_store_f32_hsw+0x69>
+ .byte 235,171 // jmp 3f69 <_sk_store_f32_hsw+0x69>
HIDDEN _sk_clamp_x_hsw
.globl _sk_clamp_x_hsw
@@ -13781,7 +13875,7 @@ _sk_mirror_x_hsw:
.byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8
- .byte 197,178,89,5,61,15,0,0 // vmulss 0xf3d(%rip),%xmm9,%xmm0 # 4f00 <_sk_callback_hsw+0x45c>
+ .byte 197,178,89,5,61,15,0,0 // vmulss 0xf3d(%rip),%xmm9,%xmm0 # 4fc0 <_sk_callback_hsw+0x45c>
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
.byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0
@@ -13807,7 +13901,7 @@ _sk_mirror_y_hsw:
.byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8
- .byte 197,178,89,13,225,14,0,0 // vmulss 0xee1(%rip),%xmm9,%xmm1 # 4f04 <_sk_callback_hsw+0x460>
+ .byte 197,178,89,13,225,14,0,0 // vmulss 0xee1(%rip),%xmm9,%xmm1 # 4fc4 <_sk_callback_hsw+0x460>
.byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
.byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1
@@ -13828,7 +13922,7 @@ FUNCTION(_sk_clamp_x_1_hsw)
_sk_clamp_x_1_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,154,14,0,0 // vbroadcastss 0xe9a(%rip),%ymm8 # 4f08 <_sk_callback_hsw+0x464>
+ .byte 196,98,125,24,5,154,14,0,0 // vbroadcastss 0xe9a(%rip),%ymm8 # 4fc8 <_sk_callback_hsw+0x464>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13846,9 +13940,9 @@ HIDDEN _sk_mirror_x_1_hsw
.globl _sk_mirror_x_1_hsw
FUNCTION(_sk_mirror_x_1_hsw)
_sk_mirror_x_1_hsw:
- .byte 196,98,125,24,5,125,14,0,0 // vbroadcastss 0xe7d(%rip),%ymm8 # 4f0c <_sk_callback_hsw+0x468>
+ .byte 196,98,125,24,5,125,14,0,0 // vbroadcastss 0xe7d(%rip),%ymm8 # 4fcc <_sk_callback_hsw+0x468>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,115,14,0,0 // vbroadcastss 0xe73(%rip),%ymm9 # 4f10 <_sk_callback_hsw+0x46c>
+ .byte 196,98,125,24,13,115,14,0,0 // vbroadcastss 0xe73(%rip),%ymm9 # 4fd0 <_sk_callback_hsw+0x46c>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -13864,11 +13958,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,67,14,0,0 // vbroadcastss 0xe43(%rip),%ymm3 # 4f14 <_sk_callback_hsw+0x470>
- .byte 196,98,125,24,5,62,14,0,0 // vbroadcastss 0xe3e(%rip),%ymm8 # 4f18 <_sk_callback_hsw+0x474>
+ .byte 196,226,125,24,29,67,14,0,0 // vbroadcastss 0xe43(%rip),%ymm3 # 4fd4 <_sk_callback_hsw+0x470>
+ .byte 196,98,125,24,5,62,14,0,0 // vbroadcastss 0xe3e(%rip),%ymm8 # 4fd8 <_sk_callback_hsw+0x474>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,47,14,0,0 // vbroadcastss 0xe2f(%rip),%ymm3 # 4f1c <_sk_callback_hsw+0x478>
+ .byte 196,226,125,24,29,47,14,0,0 // vbroadcastss 0xe2f(%rip),%ymm3 # 4fdc <_sk_callback_hsw+0x478>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -14042,9 +14136,9 @@ _sk_evenly_spaced_gradient_hsw:
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 77,137,211 // mov %r10,%r11
.byte 73,255,203 // dec %r11
- .byte 120,7 // js 43a6 <_sk_evenly_spaced_gradient_hsw+0x19>
+ .byte 120,7 // js 4466 <_sk_evenly_spaced_gradient_hsw+0x19>
.byte 196,193,242,42,203 // vcvtsi2ss %r11,%xmm1,%xmm1
- .byte 235,22 // jmp 43bc <_sk_evenly_spaced_gradient_hsw+0x2f>
+ .byte 235,22 // jmp 447c <_sk_evenly_spaced_gradient_hsw+0x2f>
.byte 76,137,219 // mov %r11,%rbx
.byte 72,209,235 // shr %rbx
.byte 65,131,227,1 // and $0x1,%r11d
@@ -14055,7 +14149,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1
.byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11
.byte 73,131,250,8 // cmp $0x8,%r10
- .byte 119,70 // ja 4415 <_sk_evenly_spaced_gradient_hsw+0x88>
+ .byte 119,70 // ja 44d5 <_sk_evenly_spaced_gradient_hsw+0x88>
.byte 196,66,37,22,1 // vpermps (%r9),%ymm11,%ymm8
.byte 72,139,88,40 // mov 0x28(%rax),%rbx
.byte 196,98,37,22,11 // vpermps (%rbx),%ymm11,%ymm9
@@ -14071,7 +14165,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 196,226,37,22,27 // vpermps (%rbx),%ymm11,%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13
- .byte 235,110 // jmp 4483 <_sk_evenly_spaced_gradient_hsw+0xf6>
+ .byte 235,110 // jmp 4543 <_sk_evenly_spaced_gradient_hsw+0xf6>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,153 // vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -14108,14 +14202,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw
.globl _sk_gauss_a_to_rgba_hsw
FUNCTION(_sk_gauss_a_to_rgba_hsw)
_sk_gauss_a_to_rgba_hsw:
- .byte 196,226,125,24,5,119,10,0,0 // vbroadcastss 0xa77(%rip),%ymm0 # 4f20 <_sk_callback_hsw+0x47c>
- .byte 196,226,125,24,13,114,10,0,0 // vbroadcastss 0xa72(%rip),%ymm1 # 4f24 <_sk_callback_hsw+0x480>
+ .byte 196,226,125,24,5,119,10,0,0 // vbroadcastss 0xa77(%rip),%ymm0 # 4fe0 <_sk_callback_hsw+0x47c>
+ .byte 196,226,125,24,13,114,10,0,0 // vbroadcastss 0xa72(%rip),%ymm1 # 4fe4 <_sk_callback_hsw+0x480>
.byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,104,10,0,0 // vbroadcastss 0xa68(%rip),%ymm0 # 4f28 <_sk_callback_hsw+0x484>
+ .byte 196,226,125,24,5,104,10,0,0 // vbroadcastss 0xa68(%rip),%ymm0 # 4fe8 <_sk_callback_hsw+0x484>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
- .byte 196,226,125,24,13,94,10,0,0 // vbroadcastss 0xa5e(%rip),%ymm1 # 4f2c <_sk_callback_hsw+0x488>
+ .byte 196,226,125,24,13,94,10,0,0 // vbroadcastss 0xa5e(%rip),%ymm1 # 4fec <_sk_callback_hsw+0x488>
.byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,84,10,0,0 // vbroadcastss 0xa54(%rip),%ymm0 # 4f30 <_sk_callback_hsw+0x48c>
+ .byte 196,226,125,24,5,84,10,0,0 // vbroadcastss 0xa54(%rip),%ymm0 # 4ff0 <_sk_callback_hsw+0x48c>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -14130,11 +14224,11 @@ _sk_gradient_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 73,131,249,1 // cmp $0x1,%r9
- .byte 15,134,180,0,0,0 // jbe 45b4 <_sk_gradient_hsw+0xc3>
+ .byte 15,134,180,0,0,0 // jbe 4674 <_sk_gradient_hsw+0xc3>
.byte 76,139,80,72 // mov 0x48(%rax),%r10
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 65,187,1,0,0,0 // mov $0x1,%r11d
- .byte 196,226,125,24,21,29,10,0,0 // vbroadcastss 0xa1d(%rip),%ymm2 # 4f34 <_sk_callback_hsw+0x490>
+ .byte 196,226,125,24,21,29,10,0,0 // vbroadcastss 0xa1d(%rip),%ymm2 # 4ff4 <_sk_callback_hsw+0x490>
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
.byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3
.byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3
@@ -14142,10 +14236,10 @@ _sk_gradient_hsw:
.byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9
.byte 73,255,195 // inc %r11
.byte 77,57,217 // cmp %r11,%r9
- .byte 117,226 // jne 451c <_sk_gradient_hsw+0x2b>
+ .byte 117,226 // jne 45dc <_sk_gradient_hsw+0x2b>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 73,131,249,8 // cmp $0x8,%r9
- .byte 118,121 // jbe 45bd <_sk_gradient_hsw+0xcc>
+ .byte 118,121 // jbe 467d <_sk_gradient_hsw+0xcc>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,138 // vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -14169,7 +14263,7 @@ _sk_gradient_hsw:
.byte 196,130,21,146,28,137 // vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- .byte 235,77 // jmp 4601 <_sk_gradient_hsw+0x110>
+ .byte 235,77 // jmp 46c1 <_sk_gradient_hsw+0x110>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 196,66,53,22,2 // vpermps (%r10),%ymm9,%ymm8
@@ -14229,24 +14323,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,156,8,0,0 // vbroadcastss 0x89c(%rip),%ymm13 # 4f38 <_sk_callback_hsw+0x494>
- .byte 196,98,125,24,53,151,8,0,0 // vbroadcastss 0x897(%rip),%ymm14 # 4f3c <_sk_callback_hsw+0x498>
+ .byte 196,98,125,24,45,156,8,0,0 // vbroadcastss 0x89c(%rip),%ymm13 # 4ff8 <_sk_callback_hsw+0x494>
+ .byte 196,98,125,24,53,151,8,0,0 // vbroadcastss 0x897(%rip),%ymm14 # 4ffc <_sk_callback_hsw+0x498>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,141,8,0,0 // vbroadcastss 0x88d(%rip),%ymm13 # 4f40 <_sk_callback_hsw+0x49c>
+ .byte 196,98,125,24,45,141,8,0,0 // vbroadcastss 0x88d(%rip),%ymm13 # 5000 <_sk_callback_hsw+0x49c>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,131,8,0,0 // vbroadcastss 0x883(%rip),%ymm14 # 4f44 <_sk_callback_hsw+0x4a0>
+ .byte 196,98,125,24,53,131,8,0,0 // vbroadcastss 0x883(%rip),%ymm14 # 5004 <_sk_callback_hsw+0x4a0>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,110,8,0,0 // vbroadcastss 0x86e(%rip),%ymm10 # 4f48 <_sk_callback_hsw+0x4a4>
+ .byte 196,98,125,24,21,110,8,0,0 // vbroadcastss 0x86e(%rip),%ymm10 # 5008 <_sk_callback_hsw+0x4a4>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,88,8,0,0 // vbroadcastss 0x858(%rip),%ymm10 # 4f4c <_sk_callback_hsw+0x4a8>
+ .byte 196,98,125,24,21,88,8,0,0 // vbroadcastss 0x858(%rip),%ymm10 # 500c <_sk_callback_hsw+0x4a8>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,66,8,0,0 // vbroadcastss 0x842(%rip),%ymm10 # 4f50 <_sk_callback_hsw+0x4ac>
+ .byte 196,98,125,24,21,66,8,0,0 // vbroadcastss 0x842(%rip),%ymm10 # 5010 <_sk_callback_hsw+0x4ac>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -14269,7 +14363,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,15,8,0,0 // vbroadcastss 0x80f(%rip),%ymm8 # 4f54 <_sk_callback_hsw+0x4b0>
+ .byte 196,98,125,24,5,15,8,0,0 // vbroadcastss 0x80f(%rip),%ymm8 # 5014 <_sk_callback_hsw+0x4b0>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -14303,9 +14397,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,163,7,0,0 // vbroadcastss 0x7a3(%rip),%ymm0 # 4f58 <_sk_callback_hsw+0x4b4>
+ .byte 196,226,125,24,5,163,7,0,0 // vbroadcastss 0x7a3(%rip),%ymm0 # 5018 <_sk_callback_hsw+0x4b4>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,154,7,0,0 // vbroadcastss 0x79a(%rip),%ymm8 # 4f5c <_sk_callback_hsw+0x4b8>
+ .byte 196,98,125,24,5,154,7,0,0 // vbroadcastss 0x79a(%rip),%ymm8 # 501c <_sk_callback_hsw+0x4b8>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -14316,7 +14410,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,130,7,0,0 // vbroadcastss 0x782(%rip),%ymm0 # 4f60 <_sk_callback_hsw+0x4bc>
+ .byte 196,226,125,24,5,130,7,0,0 // vbroadcastss 0x782(%rip),%ymm0 # 5020 <_sk_callback_hsw+0x4bc>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -14328,9 +14422,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,102,7,0,0 // vbroadcastss 0x766(%rip),%ymm1 # 4f64 <_sk_callback_hsw+0x4c0>
+ .byte 196,226,125,24,13,102,7,0,0 // vbroadcastss 0x766(%rip),%ymm1 # 5024 <_sk_callback_hsw+0x4c0>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,92,7,0,0 // vbroadcastss 0x75c(%rip),%ymm8 # 4f68 <_sk_callback_hsw+0x4c4>
+ .byte 196,98,125,24,5,92,7,0,0 // vbroadcastss 0x75c(%rip),%ymm8 # 5028 <_sk_callback_hsw+0x4c4>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -14341,7 +14435,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,68,7,0,0 // vbroadcastss 0x744(%rip),%ymm1 # 4f6c <_sk_callback_hsw+0x4c8>
+ .byte 196,226,125,24,13,68,7,0,0 // vbroadcastss 0x744(%rip),%ymm1 # 502c <_sk_callback_hsw+0x4c8>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -14353,13 +14447,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,39,7,0,0 // vbroadcastss 0x727(%rip),%ymm0 # 4f70 <_sk_callback_hsw+0x4cc>
+ .byte 196,226,125,24,5,39,7,0,0 // vbroadcastss 0x727(%rip),%ymm0 # 5030 <_sk_callback_hsw+0x4cc>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,30,7,0,0 // vbroadcastss 0x71e(%rip),%ymm8 # 4f74 <_sk_callback_hsw+0x4d0>
+ .byte 196,98,125,24,5,30,7,0,0 // vbroadcastss 0x71e(%rip),%ymm8 # 5034 <_sk_callback_hsw+0x4d0>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,15,7,0,0 // vbroadcastss 0x70f(%rip),%ymm10 # 4f78 <_sk_callback_hsw+0x4d4>
- .byte 196,98,125,24,29,10,7,0,0 // vbroadcastss 0x70a(%rip),%ymm11 # 4f7c <_sk_callback_hsw+0x4d8>
+ .byte 196,98,125,24,21,15,7,0,0 // vbroadcastss 0x70f(%rip),%ymm10 # 5038 <_sk_callback_hsw+0x4d4>
+ .byte 196,98,125,24,29,10,7,0,0 // vbroadcastss 0x70a(%rip),%ymm11 # 503c <_sk_callback_hsw+0x4d8>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -14371,16 +14465,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,237,6,0,0 // vbroadcastss 0x6ed(%rip),%ymm0 # 4f80 <_sk_callback_hsw+0x4dc>
+ .byte 196,226,125,24,5,237,6,0,0 // vbroadcastss 0x6ed(%rip),%ymm0 # 5040 <_sk_callback_hsw+0x4dc>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,228,6,0,0 // vbroadcastss 0x6e4(%rip),%ymm8 # 4f84 <_sk_callback_hsw+0x4e0>
+ .byte 196,98,125,24,5,228,6,0,0 // vbroadcastss 0x6e4(%rip),%ymm8 # 5044 <_sk_callback_hsw+0x4e0>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm9 # 4f88 <_sk_callback_hsw+0x4e4>
- .byte 196,98,125,24,21,213,6,0,0 // vbroadcastss 0x6d5(%rip),%ymm10 # 4f8c <_sk_callback_hsw+0x4e8>
+ .byte 196,98,125,24,13,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm9 # 5048 <_sk_callback_hsw+0x4e4>
+ .byte 196,98,125,24,21,213,6,0,0 // vbroadcastss 0x6d5(%rip),%ymm10 # 504c <_sk_callback_hsw+0x4e8>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,203,6,0,0 // vbroadcastss 0x6cb(%rip),%ymm9 # 4f90 <_sk_callback_hsw+0x4ec>
+ .byte 196,98,125,24,13,203,6,0,0 // vbroadcastss 0x6cb(%rip),%ymm9 # 5050 <_sk_callback_hsw+0x4ec>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,193,6,0,0 // vbroadcastss 0x6c1(%rip),%ymm10 # 4f94 <_sk_callback_hsw+0x4f0>
+ .byte 196,98,125,24,21,193,6,0,0 // vbroadcastss 0x6c1(%rip),%ymm10 # 5054 <_sk_callback_hsw+0x4f0>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -14391,14 +14485,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,169,6,0,0 // vbroadcastss 0x6a9(%rip),%ymm8 # 4f98 <_sk_callback_hsw+0x4f4>
+ .byte 196,98,125,24,5,169,6,0,0 // vbroadcastss 0x6a9(%rip),%ymm8 # 5058 <_sk_callback_hsw+0x4f4>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,155,6,0,0 // vbroadcastss 0x69b(%rip),%ymm10 # 4f9c <_sk_callback_hsw+0x4f8>
- .byte 196,98,125,24,29,150,6,0,0 // vbroadcastss 0x696(%rip),%ymm11 # 4fa0 <_sk_callback_hsw+0x4fc>
+ .byte 196,98,125,24,21,155,6,0,0 // vbroadcastss 0x69b(%rip),%ymm10 # 505c <_sk_callback_hsw+0x4f8>
+ .byte 196,98,125,24,29,150,6,0,0 // vbroadcastss 0x696(%rip),%ymm11 # 5060 <_sk_callback_hsw+0x4fc>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,135,6,0,0 // vbroadcastss 0x687(%rip),%ymm8 # 4fa4 <_sk_callback_hsw+0x500>
+ .byte 196,98,125,24,5,135,6,0,0 // vbroadcastss 0x687(%rip),%ymm8 # 5064 <_sk_callback_hsw+0x500>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -14409,12 +14503,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,111,6,0,0 // vbroadcastss 0x66f(%rip),%ymm0 # 4fa8 <_sk_callback_hsw+0x504>
+ .byte 196,226,125,24,5,111,6,0,0 // vbroadcastss 0x66f(%rip),%ymm0 # 5068 <_sk_callback_hsw+0x504>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,92,6,0,0 // vbroadcastss 0x65c(%rip),%ymm10 # 4fac <_sk_callback_hsw+0x508>
- .byte 196,98,125,24,29,87,6,0,0 // vbroadcastss 0x657(%rip),%ymm11 # 4fb0 <_sk_callback_hsw+0x50c>
+ .byte 196,98,125,24,21,92,6,0,0 // vbroadcastss 0x65c(%rip),%ymm10 # 506c <_sk_callback_hsw+0x508>
+ .byte 196,98,125,24,29,87,6,0,0 // vbroadcastss 0x657(%rip),%ymm11 # 5070 <_sk_callback_hsw+0x50c>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -14426,13 +14520,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,58,6,0,0 // vbroadcastss 0x63a(%rip),%ymm1 # 4fb4 <_sk_callback_hsw+0x510>
+ .byte 196,226,125,24,13,58,6,0,0 // vbroadcastss 0x63a(%rip),%ymm1 # 5074 <_sk_callback_hsw+0x510>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,48,6,0,0 // vbroadcastss 0x630(%rip),%ymm8 # 4fb8 <_sk_callback_hsw+0x514>
+ .byte 196,98,125,24,5,48,6,0,0 // vbroadcastss 0x630(%rip),%ymm8 # 5078 <_sk_callback_hsw+0x514>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,33,6,0,0 // vbroadcastss 0x621(%rip),%ymm10 # 4fbc <_sk_callback_hsw+0x518>
- .byte 196,98,125,24,29,28,6,0,0 // vbroadcastss 0x61c(%rip),%ymm11 # 4fc0 <_sk_callback_hsw+0x51c>
+ .byte 196,98,125,24,21,33,6,0,0 // vbroadcastss 0x621(%rip),%ymm10 # 507c <_sk_callback_hsw+0x518>
+ .byte 196,98,125,24,29,28,6,0,0 // vbroadcastss 0x61c(%rip),%ymm11 # 5080 <_sk_callback_hsw+0x51c>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -14444,16 +14538,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,255,5,0,0 // vbroadcastss 0x5ff(%rip),%ymm1 # 4fc4 <_sk_callback_hsw+0x520>
+ .byte 196,226,125,24,13,255,5,0,0 // vbroadcastss 0x5ff(%rip),%ymm1 # 5084 <_sk_callback_hsw+0x520>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,245,5,0,0 // vbroadcastss 0x5f5(%rip),%ymm8 # 4fc8 <_sk_callback_hsw+0x524>
+ .byte 196,98,125,24,5,245,5,0,0 // vbroadcastss 0x5f5(%rip),%ymm8 # 5088 <_sk_callback_hsw+0x524>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,235,5,0,0 // vbroadcastss 0x5eb(%rip),%ymm9 # 4fcc <_sk_callback_hsw+0x528>
- .byte 196,98,125,24,21,230,5,0,0 // vbroadcastss 0x5e6(%rip),%ymm10 # 4fd0 <_sk_callback_hsw+0x52c>
+ .byte 196,98,125,24,13,235,5,0,0 // vbroadcastss 0x5eb(%rip),%ymm9 # 508c <_sk_callback_hsw+0x528>
+ .byte 196,98,125,24,21,230,5,0,0 // vbroadcastss 0x5e6(%rip),%ymm10 # 5090 <_sk_callback_hsw+0x52c>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,220,5,0,0 // vbroadcastss 0x5dc(%rip),%ymm9 # 4fd4 <_sk_callback_hsw+0x530>
+ .byte 196,98,125,24,13,220,5,0,0 // vbroadcastss 0x5dc(%rip),%ymm9 # 5094 <_sk_callback_hsw+0x530>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,210,5,0,0 // vbroadcastss 0x5d2(%rip),%ymm10 # 4fd8 <_sk_callback_hsw+0x534>
+ .byte 196,98,125,24,21,210,5,0,0 // vbroadcastss 0x5d2(%rip),%ymm10 # 5098 <_sk_callback_hsw+0x534>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -14464,14 +14558,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,186,5,0,0 // vbroadcastss 0x5ba(%rip),%ymm8 # 4fdc <_sk_callback_hsw+0x538>
+ .byte 196,98,125,24,5,186,5,0,0 // vbroadcastss 0x5ba(%rip),%ymm8 # 509c <_sk_callback_hsw+0x538>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,171,5,0,0 // vbroadcastss 0x5ab(%rip),%ymm10 # 4fe0 <_sk_callback_hsw+0x53c>
- .byte 196,98,125,24,29,166,5,0,0 // vbroadcastss 0x5a6(%rip),%ymm11 # 4fe4 <_sk_callback_hsw+0x540>
+ .byte 196,98,125,24,21,171,5,0,0 // vbroadcastss 0x5ab(%rip),%ymm10 # 50a0 <_sk_callback_hsw+0x53c>
+ .byte 196,98,125,24,29,166,5,0,0 // vbroadcastss 0x5a6(%rip),%ymm11 # 50a4 <_sk_callback_hsw+0x540>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,151,5,0,0 // vbroadcastss 0x597(%rip),%ymm8 # 4fe8 <_sk_callback_hsw+0x544>
+ .byte 196,98,125,24,5,151,5,0,0 // vbroadcastss 0x597(%rip),%ymm8 # 50a8 <_sk_callback_hsw+0x544>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -14482,12 +14576,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,127,5,0,0 // vbroadcastss 0x57f(%rip),%ymm1 # 4fec <_sk_callback_hsw+0x548>
+ .byte 196,226,125,24,13,127,5,0,0 // vbroadcastss 0x57f(%rip),%ymm1 # 50ac <_sk_callback_hsw+0x548>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,107,5,0,0 // vbroadcastss 0x56b(%rip),%ymm10 # 4ff0 <_sk_callback_hsw+0x54c>
- .byte 196,98,125,24,29,102,5,0,0 // vbroadcastss 0x566(%rip),%ymm11 # 4ff4 <_sk_callback_hsw+0x550>
+ .byte 196,98,125,24,21,107,5,0,0 // vbroadcastss 0x56b(%rip),%ymm10 # 50b0 <_sk_callback_hsw+0x54c>
+ .byte 196,98,125,24,29,102,5,0,0 // vbroadcastss 0x566(%rip),%ymm11 # 50b4 <_sk_callback_hsw+0x550>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -14617,25 +14711,25 @@ BALIGN4
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 4c99 <.literal4+0xb1>
+ .byte 71,225,61 // rex.RXB loope 4d59 <.literal4+0xb1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 4ca9 <.literal4+0xc1>
+ .byte 71,225,61 // rex.RXB loope 4d69 <.literal4+0xc1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 4cb9 <.literal4+0xd1>
+ .byte 71,225,61 // rex.RXB loope 4d79 <.literal4+0xd1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 4cc9 <.literal4+0xe1>
+ .byte 71,225,61 // rex.RXB loope 4d89 <.literal4+0xe1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
@@ -14685,7 +14779,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 4d21 <.literal4+0x139>
+ .byte 224,7 // loopne 4de1 <.literal4+0x139>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -14701,10 +14795,10 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 4d48 <.literal4+0x160>
+ .byte 127,0 // jg 4e08 <.literal4+0x160>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4dc1 <.literal4+0x1d9>
+ .byte 119,115 // ja 4e81 <.literal4+0x1d9>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -14718,10 +14812,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 4d7c <.literal4+0x194>
+ .byte 127,0 // jg 4e3c <.literal4+0x194>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4df5 <.literal4+0x20d>
+ .byte 119,115 // ja 4eb5 <.literal4+0x20d>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -14735,10 +14829,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 4db0 <.literal4+0x1c8>
+ .byte 127,0 // jg 4e70 <.literal4+0x1c8>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4e29 <.literal4+0x241>
+ .byte 119,115 // ja 4ee9 <.literal4+0x241>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -14752,10 +14846,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 4de4 <.literal4+0x1fc>
+ .byte 127,0 // jg 4ea4 <.literal4+0x1fc>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 4e5d <.literal4+0x275>
+ .byte 119,115 // ja 4f1d <.literal4+0x275>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -14768,7 +14862,7 @@ BALIGN4
.byte 0,75,0 // add %cl,0x0(%rbx)
.byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax)
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 4e5b <.literal4+0x273>
+ .byte 127,67 // jg 4f1b <.literal4+0x273>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -14780,10 +14874,10 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 4e7b <.literal4+0x293>
+ .byte 118,63 // jbe 4f3b <.literal4+0x293>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
- .byte 127,67 // jg 4e8f <.literal4+0x2a7>
+ .byte 127,67 // jg 4f4f <.literal4+0x2a7>
.byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax)
@@ -14792,7 +14886,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 4e71 <.literal4+0x289>
+ .byte 224,7 // loopne 4f31 <.literal4+0x289>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -14804,7 +14898,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 4e8d <.literal4+0x2a5>
+ .byte 224,7 // loopne 4f4d <.literal4+0x2a5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -14815,7 +14909,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 4ee2 <.literal4+0x2fa>
+ .byte 124,66 // jl 4fa2 <.literal4+0x2fa>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -14833,9 +14927,9 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 4f25 <.literal4+0x33d>
+ .byte 112,65 // jo 4fe5 <.literal4+0x33d>
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
- .byte 127,67 // jg 4f33 <.literal4+0x34b>
+ .byte 127,67 // jg 4ff3 <.literal4+0x34b>
.byte 128,0,128 // addb $0x80,(%rax)
.byte 55 // (bad)
.byte 128,0,128 // addb $0x80,(%rax)
@@ -14843,7 +14937,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 4f47 <.literal4+0x35f>
+ .byte 127,71 // jg 5007 <.literal4+0x35f>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -14955,16 +15049,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005028 <_sk_callback_hsw+0xa000584>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0050e8 <_sk_callback_hsw+0xa000584>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005030 <_sk_callback_hsw+0x1200058c>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120050f0 <_sk_callback_hsw+0x1200058c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005038 <_sk_callback_hsw+0x1a000594>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0050f8 <_sk_callback_hsw+0x1a000594>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005040 <_sk_callback_hsw+0x300059c>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005100 <_sk_callback_hsw+0x300059c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -15007,16 +15101,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005088 <_sk_callback_hsw+0xa0005e4>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005148 <_sk_callback_hsw+0xa0005e4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005090 <_sk_callback_hsw+0x120005ec>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005150 <_sk_callback_hsw+0x120005ec>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005098 <_sk_callback_hsw+0x1a0005f4>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005158 <_sk_callback_hsw+0x1a0005f4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30050a0 <_sk_callback_hsw+0x30005fc>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005160 <_sk_callback_hsw+0x30005fc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -15059,16 +15153,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0050e8 <_sk_callback_hsw+0xa000644>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0051a8 <_sk_callback_hsw+0xa000644>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120050f0 <_sk_callback_hsw+0x1200064c>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120051b0 <_sk_callback_hsw+0x1200064c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0050f8 <_sk_callback_hsw+0x1a000654>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0051b8 <_sk_callback_hsw+0x1a000654>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005100 <_sk_callback_hsw+0x300065c>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30051c0 <_sk_callback_hsw+0x300065c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -15111,16 +15205,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005148 <_sk_callback_hsw+0xa0006a4>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005208 <_sk_callback_hsw+0xa0006a4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005150 <_sk_callback_hsw+0x120006ac>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005210 <_sk_callback_hsw+0x120006ac>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005158 <_sk_callback_hsw+0x1a0006b4>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005218 <_sk_callback_hsw+0x1a0006b4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005160 <_sk_callback_hsw+0x30006bc>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005220 <_sk_callback_hsw+0x30006bc>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -15163,16 +15257,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0051a8 <_sk_callback_hsw+0xa000704>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005268 <_sk_callback_hsw+0xa000704>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120051b0 <_sk_callback_hsw+0x1200070c>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005270 <_sk_callback_hsw+0x1200070c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0051b8 <_sk_callback_hsw+0x1a000714>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005278 <_sk_callback_hsw+0x1a000714>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30051c0 <_sk_callback_hsw+0x300071c>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005280 <_sk_callback_hsw+0x300071c>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -15239,6 +15333,22 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
+ .byte 0,2 // add %al,(%rdx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,2 // add %al,(%rdx)
+ .byte 4,6 // add $0x6,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
@@ -15333,7 +15443,7 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,28,103,0,0 // vbroadcastss 0x671c(%rip),%ymm1 # 67fc <_sk_callback_avx+0x142>
+ .byte 196,226,125,24,13,224,103,0,0 // vbroadcastss 0x67e0(%rip),%ymm1 # 68c0 <_sk_callback_avx+0x142>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -15342,7 +15452,7 @@ _sk_seed_shader_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,246,102,0,0 // vbroadcastss 0x66f6(%rip),%ymm2 # 6800 <_sk_callback_avx+0x146>
+ .byte 196,226,125,24,21,186,103,0,0 // vbroadcastss 0x67ba(%rip),%ymm2 # 68c4 <_sk_callback_avx+0x146>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -15366,7 +15476,7 @@ _sk_dither_avx:
.byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,159,102,0,0 // vbroadcastss 0x669f(%rip),%ymm11 # 6804 <_sk_callback_avx+0x14a>
+ .byte 196,98,125,24,29,99,103,0,0 // vbroadcastss 0x6763(%rip),%ymm11 # 68c8 <_sk_callback_avx+0x14a>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -15377,8 +15487,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,96,102,0,0 // vbroadcastss 0x6660(%rip),%ymm12 # 6808 <_sk_callback_avx+0x14e>
- .byte 196,98,125,24,45,91,102,0,0 // vbroadcastss 0x665b(%rip),%ymm13 # 680c <_sk_callback_avx+0x152>
+ .byte 196,98,125,24,37,36,103,0,0 // vbroadcastss 0x6724(%rip),%ymm12 # 68cc <_sk_callback_avx+0x14e>
+ .byte 196,98,125,24,45,31,103,0,0 // vbroadcastss 0x671f(%rip),%ymm13 # 68d0 <_sk_callback_avx+0x152>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -15405,9 +15515,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,198,101,0,0 // vbroadcastss 0x65c6(%rip),%ymm9 # 6810 <_sk_callback_avx+0x156>
+ .byte 196,98,125,24,13,138,102,0,0 // vbroadcastss 0x668a(%rip),%ymm9 # 68d4 <_sk_callback_avx+0x156>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,188,101,0,0 // vbroadcastss 0x65bc(%rip),%ymm9 # 6814 <_sk_callback_avx+0x15a>
+ .byte 196,98,125,24,13,128,102,0,0 // vbroadcastss 0x6680(%rip),%ymm9 # 68d8 <_sk_callback_avx+0x15a>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
@@ -15476,7 +15586,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,20,101,0,0 // vbroadcastss 0x6514(%rip),%ymm8 # 6818 <_sk_callback_avx+0x15e>
+ .byte 196,98,125,24,5,216,101,0,0 // vbroadcastss 0x65d8(%rip),%ymm8 # 68dc <_sk_callback_avx+0x15e>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -15497,7 +15607,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,214,100,0,0 // vbroadcastss 0x64d6(%rip),%ymm9 # 681c <_sk_callback_avx+0x162>
+ .byte 196,98,125,24,13,154,101,0,0 // vbroadcastss 0x659a(%rip),%ymm9 # 68e0 <_sk_callback_avx+0x162>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -15539,7 +15649,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,117,100,0,0 // vbroadcastss 0x6475(%rip),%ymm8 # 6820 <_sk_callback_avx+0x166>
+ .byte 196,98,125,24,5,57,101,0,0 // vbroadcastss 0x6539(%rip),%ymm8 # 68e4 <_sk_callback_avx+0x166>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -15552,7 +15662,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,88,100,0,0 // vbroadcastss 0x6458(%rip),%ymm0 # 6824 <_sk_callback_avx+0x16a>
+ .byte 196,226,125,24,5,28,101,0,0 // vbroadcastss 0x651c(%rip),%ymm0 # 68e8 <_sk_callback_avx+0x16a>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -15565,7 +15675,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,59,100,0,0 // vbroadcastss 0x643b(%rip),%ymm8 # 6828 <_sk_callback_avx+0x16e>
+ .byte 196,98,125,24,5,255,100,0,0 // vbroadcastss 0x64ff(%rip),%ymm8 # 68ec <_sk_callback_avx+0x16e>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -15582,7 +15692,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,14,100,0,0 // vbroadcastss 0x640e(%rip),%ymm8 # 682c <_sk_callback_avx+0x172>
+ .byte 196,98,125,24,5,210,100,0,0 // vbroadcastss 0x64d2(%rip),%ymm8 # 68f0 <_sk_callback_avx+0x172>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -15610,7 +15720,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,205,99,0,0 // vbroadcastss 0x63cd(%rip),%ymm8 # 6830 <_sk_callback_avx+0x176>
+ .byte 196,98,125,24,5,145,100,0,0 // vbroadcastss 0x6491(%rip),%ymm8 # 68f4 <_sk_callback_avx+0x176>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -15670,7 +15780,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,28,99,0,0 // vbroadcastss 0x631c(%rip),%ymm8 # 6834 <_sk_callback_avx+0x17a>
+ .byte 196,98,125,24,5,224,99,0,0 // vbroadcastss 0x63e0(%rip),%ymm8 # 68f8 <_sk_callback_avx+0x17a>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -15707,7 +15817,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,156,98,0,0 // vbroadcastss 0x629c(%rip),%ymm8 # 6838 <_sk_callback_avx+0x17e>
+ .byte 196,98,125,24,5,96,99,0,0 // vbroadcastss 0x6360(%rip),%ymm8 # 68fc <_sk_callback_avx+0x17e>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -15733,7 +15843,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,72,98,0,0 // vbroadcastss 0x6248(%rip),%ymm8 # 683c <_sk_callback_avx+0x182>
+ .byte 196,98,125,24,5,12,99,0,0 // vbroadcastss 0x630c(%rip),%ymm8 # 6900 <_sk_callback_avx+0x182>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -15762,7 +15872,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,232,97,0,0 // vbroadcastss 0x61e8(%rip),%ymm8 # 6840 <_sk_callback_avx+0x186>
+ .byte 196,98,125,24,5,172,98,0,0 // vbroadcastss 0x62ac(%rip),%ymm8 # 6904 <_sk_callback_avx+0x186>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -15785,7 +15895,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,163,97,0,0 // vbroadcastss 0x61a3(%rip),%ymm8 # 6844 <_sk_callback_avx+0x18a>
+ .byte 196,98,125,24,5,103,98,0,0 // vbroadcastss 0x6267(%rip),%ymm8 # 6908 <_sk_callback_avx+0x18a>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -15796,7 +15906,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,142,97,0,0 // vbroadcastss 0x618e(%rip),%ymm8 # 6848 <_sk_callback_avx+0x18e>
+ .byte 196,98,125,24,5,82,98,0,0 // vbroadcastss 0x6252(%rip),%ymm8 # 690c <_sk_callback_avx+0x18e>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -15858,7 +15968,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,138,96,0,0 // vbroadcastss 0x608a(%rip),%ymm9 # 684c <_sk_callback_avx+0x192>
+ .byte 196,98,125,24,13,78,97,0,0 // vbroadcastss 0x614e(%rip),%ymm9 # 6910 <_sk_callback_avx+0x192>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -15915,7 +16025,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,156,95,0,0 // vbroadcastss 0x5f9c(%rip),%ymm8 # 6850 <_sk_callback_avx+0x196>
+ .byte 196,98,125,24,5,96,96,0,0 // vbroadcastss 0x6060(%rip),%ymm8 # 6914 <_sk_callback_avx+0x196>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -15970,7 +16080,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,197,94,0,0 // vbroadcastss 0x5ec5(%rip),%ymm8 # 6854 <_sk_callback_avx+0x19a>
+ .byte 196,98,125,24,5,137,95,0,0 // vbroadcastss 0x5f89(%rip),%ymm8 # 6918 <_sk_callback_avx+0x19a>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16036,10 +16146,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,188,93,0,0 // vbroadcastss 0x5dbc(%rip),%ymm11 # 685c <_sk_callback_avx+0x1a2>
+ .byte 196,98,125,24,29,128,94,0,0 // vbroadcastss 0x5e80(%rip),%ymm11 # 6920 <_sk_callback_avx+0x1a2>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,173,93,0,0 // vbroadcastss 0x5dad(%rip),%ymm13 # 6860 <_sk_callback_avx+0x1a6>
+ .byte 196,98,125,24,45,113,94,0,0 // vbroadcastss 0x5e71(%rip),%ymm13 # 6924 <_sk_callback_avx+0x1a6>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -16050,7 +16160,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,107,93,0,0 // vbroadcastss 0x5d6b(%rip),%ymm8 # 6858 <_sk_callback_avx+0x19e>
+ .byte 196,98,125,24,5,47,94,0,0 // vbroadcastss 0x5e2f(%rip),%ymm8 # 691c <_sk_callback_avx+0x19e>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -16177,12 +16287,12 @@ _sk_hue_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,58,91,0,0 // vbroadcastss 0x5b3a(%rip),%ymm14 # 6864 <_sk_callback_avx+0x1aa>
+ .byte 196,98,125,24,53,254,91,0,0 // vbroadcastss 0x5bfe(%rip),%ymm14 # 6928 <_sk_callback_avx+0x1aa>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,48,91,0,0 // vbroadcastss 0x5b30(%rip),%ymm15 # 6868 <_sk_callback_avx+0x1ae>
+ .byte 196,98,125,24,61,244,91,0,0 // vbroadcastss 0x5bf4(%rip),%ymm15 # 692c <_sk_callback_avx+0x1ae>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,33,91,0,0 // vbroadcastss 0x5b21(%rip),%ymm0 # 686c <_sk_callback_avx+0x1b2>
+ .byte 196,226,125,24,5,229,91,0,0 // vbroadcastss 0x5be5(%rip),%ymm0 # 6930 <_sk_callback_avx+0x1b2>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -16243,7 +16353,7 @@ _sk_hue_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,250,89,0,0 // vbroadcastss 0x59fa(%rip),%ymm8 # 6870 <_sk_callback_avx+0x1b6>
+ .byte 196,98,125,24,5,190,90,0,0 // vbroadcastss 0x5abe(%rip),%ymm8 # 6934 <_sk_callback_avx+0x1b6>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16300,12 +16410,12 @@ _sk_saturation_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,8,89,0,0 // vbroadcastss 0x5908(%rip),%ymm14 # 6874 <_sk_callback_avx+0x1ba>
+ .byte 196,98,125,24,53,204,89,0,0 // vbroadcastss 0x59cc(%rip),%ymm14 # 6938 <_sk_callback_avx+0x1ba>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,254,88,0,0 // vbroadcastss 0x58fe(%rip),%ymm15 # 6878 <_sk_callback_avx+0x1be>
+ .byte 196,98,125,24,61,194,89,0,0 // vbroadcastss 0x59c2(%rip),%ymm15 # 693c <_sk_callback_avx+0x1be>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,239,88,0,0 // vbroadcastss 0x58ef(%rip),%ymm0 # 687c <_sk_callback_avx+0x1c2>
+ .byte 196,226,125,24,5,179,89,0,0 // vbroadcastss 0x59b3(%rip),%ymm0 # 6940 <_sk_callback_avx+0x1c2>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -16366,7 +16476,7 @@ _sk_saturation_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,200,87,0,0 // vbroadcastss 0x57c8(%rip),%ymm8 # 6880 <_sk_callback_avx+0x1c6>
+ .byte 196,98,125,24,5,140,88,0,0 // vbroadcastss 0x588c(%rip),%ymm8 # 6944 <_sk_callback_avx+0x1c6>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16395,12 +16505,12 @@ _sk_color_avx:
.byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
.byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
.byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
- .byte 196,98,125,24,45,94,87,0,0 // vbroadcastss 0x575e(%rip),%ymm13 # 6884 <_sk_callback_avx+0x1ca>
+ .byte 196,98,125,24,45,34,88,0,0 // vbroadcastss 0x5822(%rip),%ymm13 # 6948 <_sk_callback_avx+0x1ca>
.byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
- .byte 196,98,125,24,53,84,87,0,0 // vbroadcastss 0x5754(%rip),%ymm14 # 6888 <_sk_callback_avx+0x1ce>
+ .byte 196,98,125,24,53,24,88,0,0 // vbroadcastss 0x5818(%rip),%ymm14 # 694c <_sk_callback_avx+0x1ce>
.byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,69,87,0,0 // vbroadcastss 0x5745(%rip),%ymm15 # 688c <_sk_callback_avx+0x1d2>
+ .byte 196,98,125,24,61,9,88,0,0 // vbroadcastss 0x5809(%rip),%ymm15 # 6950 <_sk_callback_avx+0x1d2>
.byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -16463,7 +16573,7 @@ _sk_color_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,12,86,0,0 // vbroadcastss 0x560c(%rip),%ymm0 # 6890 <_sk_callback_avx+0x1d6>
+ .byte 196,226,125,24,5,208,86,0,0 // vbroadcastss 0x56d0(%rip),%ymm0 # 6954 <_sk_callback_avx+0x1d6>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -16493,12 +16603,12 @@ _sk_luminosity_avx:
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
- .byte 196,98,125,24,45,158,85,0,0 // vbroadcastss 0x559e(%rip),%ymm13 # 6894 <_sk_callback_avx+0x1da>
+ .byte 196,98,125,24,45,98,86,0,0 // vbroadcastss 0x5662(%rip),%ymm13 # 6958 <_sk_callback_avx+0x1da>
.byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
- .byte 196,98,125,24,53,148,85,0,0 // vbroadcastss 0x5594(%rip),%ymm14 # 6898 <_sk_callback_avx+0x1de>
+ .byte 196,98,125,24,53,88,86,0,0 // vbroadcastss 0x5658(%rip),%ymm14 # 695c <_sk_callback_avx+0x1de>
.byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,133,85,0,0 // vbroadcastss 0x5585(%rip),%ymm15 # 689c <_sk_callback_avx+0x1e2>
+ .byte 196,98,125,24,61,73,86,0,0 // vbroadcastss 0x5649(%rip),%ymm15 # 6960 <_sk_callback_avx+0x1e2>
.byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -16561,7 +16671,7 @@ _sk_luminosity_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,76,84,0,0 // vbroadcastss 0x544c(%rip),%ymm0 # 68a0 <_sk_callback_avx+0x1e6>
+ .byte 196,226,125,24,5,16,85,0,0 // vbroadcastss 0x5510(%rip),%ymm0 # 6964 <_sk_callback_avx+0x1e6>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -16592,7 +16702,7 @@ _sk_srcover_rgba_8888_avx:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,43,1,0,0 // jne 15e3 <_sk_srcover_rgba_8888_avx+0x144>
.byte 196,193,124,16,58 // vmovups (%r10),%ymm7
- .byte 197,124,40,13,91,88,0,0 // vmovaps 0x585b(%rip),%ymm9 # 6d20 <_sk_callback_avx+0x666>
+ .byte 197,124,40,13,59,89,0,0 // vmovaps 0x593b(%rip),%ymm9 # 6e00 <_sk_callback_avx+0x682>
.byte 196,193,68,84,225 // vandps %ymm9,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5
@@ -16610,9 +16720,9 @@ _sk_srcover_rgba_8888_avx:
.byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7
.byte 196,227,53,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,126,83,0,0 // vbroadcastss 0x537e(%rip),%ymm8 # 68a4 <_sk_callback_avx+0x1ea>
+ .byte 196,98,125,24,5,66,84,0,0 // vbroadcastss 0x5442(%rip),%ymm8 # 6968 <_sk_callback_avx+0x1ea>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,117,83,0,0 // vbroadcastss 0x5375(%rip),%ymm9 # 68a8 <_sk_callback_avx+0x1ee>
+ .byte 196,98,125,24,13,57,84,0,0 // vbroadcastss 0x5439(%rip),%ymm9 # 696c <_sk_callback_avx+0x1ee>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
@@ -16657,9 +16767,9 @@ _sk_srcover_rgba_8888_avx:
.byte 72,211,232 // shr %cl,%rax
.byte 196,225,249,110,224 // vmovq %rax,%xmm4
.byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4
- .byte 196,226,89,0,45,53,86,0,0 // vpshufb 0x5635(%rip),%xmm4,%xmm5 # 6c40 <_sk_callback_avx+0x586>
+ .byte 196,226,89,0,45,245,86,0,0 // vpshufb 0x56f5(%rip),%xmm4,%xmm5 # 6d00 <_sk_callback_avx+0x582>
.byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5
- .byte 196,226,89,0,37,55,86,0,0 // vpshufb 0x5637(%rip),%xmm4,%xmm4 # 6c50 <_sk_callback_avx+0x596>
+ .byte 196,226,89,0,37,247,86,0,0 // vpshufb 0x56f7(%rip),%xmm4,%xmm4 # 6d10 <_sk_callback_avx+0x592>
.byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4
.byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
.byte 196,194,93,44,58 // vmaskmovps (%r10),%ymm4,%ymm7
@@ -16671,9 +16781,9 @@ _sk_srcover_rgba_8888_avx:
.byte 72,211,232 // shr %cl,%rax
.byte 196,97,249,110,200 // vmovq %rax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,234,85,0,0 // vpshufb 0x55ea(%rip),%xmm9,%xmm10 # 6c40 <_sk_callback_avx+0x586>
+ .byte 196,98,49,0,21,170,86,0,0 // vpshufb 0x56aa(%rip),%xmm9,%xmm10 # 6d00 <_sk_callback_avx+0x582>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,236,85,0,0 // vpshufb 0x55ec(%rip),%xmm9,%xmm9 # 6c50 <_sk_callback_avx+0x596>
+ .byte 196,98,49,0,13,172,86,0,0 // vpshufb 0x56ac(%rip),%xmm9,%xmm9 # 6d10 <_sk_callback_avx+0x592>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10)
@@ -16695,7 +16805,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,13,82,0,0 // vbroadcastss 0x520d(%rip),%ymm8 # 68ac <_sk_callback_avx+0x1f2>
+ .byte 196,98,125,24,5,209,82,0,0 // vbroadcastss 0x52d1(%rip),%ymm8 # 6970 <_sk_callback_avx+0x1f2>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -16707,7 +16817,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,240,81,0,0 // vbroadcastss 0x51f0(%rip),%ymm8 # 68b0 <_sk_callback_avx+0x1f6>
+ .byte 196,98,125,24,5,180,82,0,0 // vbroadcastss 0x52b4(%rip),%ymm8 # 6974 <_sk_callback_avx+0x1f6>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -16793,7 +16903,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,56,81,0,0 // vbroadcastss 0x5138(%rip),%ymm10 # 68b4 <_sk_callback_avx+0x1fa>
+ .byte 196,98,125,24,21,252,81,0,0 // vbroadcastss 0x51fc(%rip),%ymm10 # 6978 <_sk_callback_avx+0x1fa>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -16806,17 +16916,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,25,81,0,0 // vbroadcastss 0x5119(%rip),%ymm8 # 68b8 <_sk_callback_avx+0x1fe>
+ .byte 196,98,125,24,5,221,81,0,0 // vbroadcastss 0x51dd(%rip),%ymm8 # 697c <_sk_callback_avx+0x1fe>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,11,81,0,0 // vbroadcastss 0x510b(%rip),%ymm11 # 68bc <_sk_callback_avx+0x202>
+ .byte 196,98,125,24,29,207,81,0,0 // vbroadcastss 0x51cf(%rip),%ymm11 # 6980 <_sk_callback_avx+0x202>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,1,81,0,0 // vbroadcastss 0x5101(%rip),%ymm13 # 68c0 <_sk_callback_avx+0x206>
+ .byte 196,98,125,24,45,197,81,0,0 // vbroadcastss 0x51c5(%rip),%ymm13 # 6984 <_sk_callback_avx+0x206>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,242,80,0,0 // vbroadcastss 0x50f2(%rip),%ymm12 # 68c4 <_sk_callback_avx+0x20a>
+ .byte 196,98,125,24,37,182,81,0,0 // vbroadcastss 0x51b6(%rip),%ymm12 # 6988 <_sk_callback_avx+0x20a>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,232,80,0,0 // vbroadcastss 0x50e8(%rip),%ymm14 # 68c8 <_sk_callback_avx+0x20e>
+ .byte 196,98,125,24,53,172,81,0,0 // vbroadcastss 0x51ac(%rip),%ymm14 # 698c <_sk_callback_avx+0x20e>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -16843,20 +16953,20 @@ HIDDEN _sk_to_srgb_avx
FUNCTION(_sk_to_srgb_avx)
_sk_to_srgb_avx:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,125,80,0,0 // vbroadcastss 0x507d(%rip),%ymm8 # 68cc <_sk_callback_avx+0x212>
+ .byte 196,98,125,24,5,65,81,0,0 // vbroadcastss 0x5141(%rip),%ymm8 # 6990 <_sk_callback_avx+0x212>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,115,80,0,0 // vbroadcastss 0x5073(%rip),%ymm11 # 68d0 <_sk_callback_avx+0x216>
+ .byte 196,98,125,24,29,55,81,0,0 // vbroadcastss 0x5137(%rip),%ymm11 # 6994 <_sk_callback_avx+0x216>
.byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12
- .byte 196,98,125,24,45,105,80,0,0 // vbroadcastss 0x5069(%rip),%ymm13 # 68d4 <_sk_callback_avx+0x21a>
+ .byte 196,98,125,24,45,45,81,0,0 // vbroadcastss 0x512d(%rip),%ymm13 # 6998 <_sk_callback_avx+0x21a>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12
- .byte 196,98,125,24,53,90,80,0,0 // vbroadcastss 0x505a(%rip),%ymm14 # 68d8 <_sk_callback_avx+0x21e>
+ .byte 196,98,125,24,53,30,81,0,0 // vbroadcastss 0x511e(%rip),%ymm14 # 699c <_sk_callback_avx+0x21e>
.byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12
- .byte 196,98,125,24,61,80,80,0,0 // vbroadcastss 0x5050(%rip),%ymm15 # 68dc <_sk_callback_avx+0x222>
+ .byte 196,98,125,24,61,20,81,0,0 // vbroadcastss 0x5114(%rip),%ymm15 # 69a0 <_sk_callback_avx+0x222>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,37,60,80,0,0 // vbroadcastss 0x503c(%rip),%ymm12 # 68e0 <_sk_callback_avx+0x226>
+ .byte 196,98,125,24,37,0,81,0,0 // vbroadcastss 0x5100(%rip),%ymm12 # 69a4 <_sk_callback_avx+0x226>
.byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -16893,7 +17003,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9
.byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,162,79,0,0 // vbroadcastss 0x4fa2(%rip),%ymm11 # 68e4 <_sk_callback_avx+0x22a>
+ .byte 196,98,125,24,29,102,80,0,0 // vbroadcastss 0x5066(%rip),%ymm11 # 69a8 <_sk_callback_avx+0x22a>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -16903,19 +17013,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,123,79,0,0 // vbroadcastss 0x4f7b(%rip),%ymm11 # 68f0 <_sk_callback_avx+0x236>
+ .byte 196,98,125,24,29,63,80,0,0 // vbroadcastss 0x503f(%rip),%ymm11 # 69b4 <_sk_callback_avx+0x236>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,105,79,0,0 // vbroadcastss 0x4f69(%rip),%ymm11 # 68ec <_sk_callback_avx+0x232>
+ .byte 196,98,125,24,29,45,80,0,0 // vbroadcastss 0x502d(%rip),%ymm11 # 69b0 <_sk_callback_avx+0x232>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,81,79,0,0 // vbroadcastss 0x4f51(%rip),%ymm2 # 68e8 <_sk_callback_avx+0x22e>
+ .byte 196,226,125,24,21,21,80,0,0 // vbroadcastss 0x5015(%rip),%ymm2 # 69ac <_sk_callback_avx+0x22e>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,56,79,0,0 // vbroadcastss 0x4f38(%rip),%ymm12 # 68f8 <_sk_callback_avx+0x23e>
+ .byte 196,98,125,24,37,252,79,0,0 // vbroadcastss 0x4ffc(%rip),%ymm12 # 69bc <_sk_callback_avx+0x23e>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -16925,7 +17035,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,251,78,0,0 // vbroadcastss 0x4efb(%rip),%ymm8 # 68f4 <_sk_callback_avx+0x23a>
+ .byte 196,98,125,24,5,191,79,0,0 // vbroadcastss 0x4fbf(%rip),%ymm8 # 69b8 <_sk_callback_avx+0x23a>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -16942,7 +17052,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,200,78,0,0 // vbroadcastss 0x4ec8(%rip),%ymm8 # 68fc <_sk_callback_avx+0x242>
+ .byte 196,98,125,24,5,140,79,0,0 // vbroadcastss 0x4f8c(%rip),%ymm8 # 69c0 <_sk_callback_avx+0x242>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -16950,23 +17060,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,162,78,0,0 // vbroadcastss 0x4ea2(%rip),%ymm11 # 6900 <_sk_callback_avx+0x246>
+ .byte 196,98,125,24,29,102,79,0,0 // vbroadcastss 0x4f66(%rip),%ymm11 # 69c4 <_sk_callback_avx+0x246>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,140,78,0,0 // vbroadcastss 0x4e8c(%rip),%ymm12 # 6908 <_sk_callback_avx+0x24e>
+ .byte 196,98,125,24,37,80,79,0,0 // vbroadcastss 0x4f50(%rip),%ymm12 # 69cc <_sk_callback_avx+0x24e>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,130,78,0,0 // vbroadcastss 0x4e82(%rip),%ymm13 # 690c <_sk_callback_avx+0x252>
+ .byte 196,98,125,24,45,70,79,0,0 // vbroadcastss 0x4f46(%rip),%ymm13 # 69d0 <_sk_callback_avx+0x252>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,99,78,0,0 // vbroadcastss 0x4e63(%rip),%ymm1 # 6904 <_sk_callback_avx+0x24a>
+ .byte 196,226,125,24,13,39,79,0,0 // vbroadcastss 0x4f27(%rip),%ymm1 # 69c8 <_sk_callback_avx+0x24a>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,78,78,0,0 // vbroadcastss 0x4e4e(%rip),%ymm14 # 6910 <_sk_callback_avx+0x256>
+ .byte 196,98,125,24,53,18,79,0,0 // vbroadcastss 0x4f12(%rip),%ymm14 # 69d4 <_sk_callback_avx+0x256>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -16985,7 +17095,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,240,77,0,0 // vbroadcastss 0x4df0(%rip),%ymm0 # 6914 <_sk_callback_avx+0x25a>
+ .byte 196,226,125,24,5,180,78,0,0 // vbroadcastss 0x4eb4(%rip),%ymm0 # 69d8 <_sk_callback_avx+0x25a>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -17037,13 +17147,13 @@ _sk_scale_u8_avx:
.byte 77,133,192 // test %r8,%r8
.byte 117,74 // jne 1c1b <_sk_scale_u8_avx+0x54>
.byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8
- .byte 197,57,219,5,129,80,0,0 // vpand 0x5081(%rip),%xmm8,%xmm8 # 6c60 <_sk_callback_avx+0x5a6>
+ .byte 197,57,219,5,65,81,0,0 // vpand 0x5141(%rip),%xmm8,%xmm8 # 6d20 <_sk_callback_avx+0x5a2>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,22,77,0,0 // vbroadcastss 0x4d16(%rip),%ymm9 # 6918 <_sk_callback_avx+0x25e>
+ .byte 196,98,125,24,13,218,77,0,0 // vbroadcastss 0x4dda(%rip),%ymm9 # 69dc <_sk_callback_avx+0x25e>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -17058,10 +17168,21 @@ _sk_scale_u8_avx:
.byte 65,128,249,6 // cmp $0x6,%r9b
.byte 119,167 // ja 1bd7 <_sk_scale_u8_avx+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,97,0,0,0 // lea 0x61(%rip),%r10 # 1c9c <_sk_scale_u8_avx+0xd5>
+ .byte 76,141,21,121,0,0,0 // lea 0x79(%rip),%r10 # 1cb4 <_sk_scale_u8_avx+0xed>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 235,136 // jmp 1bd7 <_sk_scale_u8_avx+0x10>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 197,121,110,200 // vmovd %eax,%xmm9
+ .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
+ .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ .byte 233,95,255,255,255 // jmpq 1bd7 <_sk_scale_u8_avx+0x10>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -17069,33 +17190,27 @@ _sk_scale_u8_avx:
.byte 197,57,196,192,5 // vpinsrw $0x5,%eax,%xmm8,%xmm8
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 197,57,196,192,4 // vpinsrw $0x4,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 197,57,196,192,3 // vpinsrw $0x3,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 197,57,196,192,1 // vpinsrw $0x1,%eax,%xmm8,%xmm8
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 197,57,196,192,0 // vpinsrw $0x0,%eax,%xmm8,%xmm8
- .byte 233,61,255,255,255 // jmpq 1bd7 <_sk_scale_u8_avx+0x10>
- .byte 102,144 // xchg %ax,%ax
- .byte 239 // out %eax,(%dx)
+ .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9
+ .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
+ .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ .byte 233,35,255,255,255 // jmpq 1bd7 <_sk_scale_u8_avx+0x10>
+ .byte 144 // nop
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
+ .byte 255,171,255,255,255,155 // ljmp *-0x64000001(%rbx)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 217,255 // fcos
+ .byte 234 // (bad)
.byte 255 // (bad)
- .byte 255,206 // dec %esi
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,195 // inc %ebx
+ .byte 223,255 // (bad)
.byte 255 // (bad)
+ .byte 255,212 // callq *%rsp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 184,255,255,255,168 // mov $0xa8ffffff,%eax
+ .byte 255,196 // inc %esp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -17128,15 +17243,15 @@ _sk_lerp_u8_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,110 // jne 1d6f <_sk_lerp_u8_avx+0x78>
+ .byte 117,110 // jne 1d87 <_sk_lerp_u8_avx+0x78>
.byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8
- .byte 197,57,219,5,97,79,0,0 // vpand 0x4f61(%rip),%xmm8,%xmm8 # 6c70 <_sk_callback_avx+0x5b6>
+ .byte 197,57,219,5,9,80,0,0 // vpand 0x5009(%rip),%xmm8,%xmm8 # 6d30 <_sk_callback_avx+0x5b2>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,234,75,0,0 // vbroadcastss 0x4bea(%rip),%ymm9 # 691c <_sk_callback_avx+0x262>
+ .byte 196,98,125,24,13,150,76,0,0 // vbroadcastss 0x4c96(%rip),%ymm9 # 69e0 <_sk_callback_avx+0x262>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -17157,12 +17272,23 @@ _sk_lerp_u8_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,131 // ja 1d07 <_sk_lerp_u8_avx+0x10>
+ .byte 119,131 // ja 1d1f <_sk_lerp_u8_avx+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,97,0,0,0 // lea 0x61(%rip),%r10 # 1df0 <_sk_lerp_u8_avx+0xf9>
+ .byte 76,141,21,125,0,0,0 // lea 0x7d(%rip),%r10 # 1e24 <_sk_lerp_u8_avx+0x115>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 233,97,255,255,255 // jmpq 1d1f <_sk_lerp_u8_avx+0x10>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 197,121,110,200 // vmovd %eax,%xmm9
+ .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
+ .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ .byte 233,56,255,255,255 // jmpq 1d1f <_sk_lerp_u8_avx+0x10>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -17170,35 +17296,26 @@ _sk_lerp_u8_avx:
.byte 197,57,196,192,5 // vpinsrw $0x5,%eax,%xmm8,%xmm8
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 197,57,196,192,4 // vpinsrw $0x4,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 197,57,196,192,3 // vpinsrw $0x3,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 197,57,196,192,1 // vpinsrw $0x1,%eax,%xmm8,%xmm8
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 197,57,196,192,0 // vpinsrw $0x0,%eax,%xmm8,%xmm8
- .byte 233,25,255,255,255 // jmpq 1d07 <_sk_lerp_u8_avx+0x10>
- .byte 102,144 // xchg %ax,%ax
- .byte 239 // out %eax,(%dx)
+ .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9
+ .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
+ .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ .byte 233,252,254,255,255 // jmpq 1d1f <_sk_lerp_u8_avx+0x10>
+ .byte 144 // nop
+ .byte 140,255 // mov %?,%edi
.byte 255 // (bad)
+ .byte 255,170,255,255,255,154 // ljmp *-0x65000001(%rdx)
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 233,255,255,255,222 // jmpq ffffffffdf001e34 <_sk_callback_avx+0xffffffffdeffb6b6>
.byte 255 // (bad)
- .byte 217,255 // fcos
.byte 255 // (bad)
- .byte 255,206 // dec %esi
+ .byte 255,211 // callq *%rbx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,195 // inc %ebx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255 // (bad)
- .byte 184,255,255,255,168 // mov $0xa8ffffff,%eax
- .byte 255 // (bad)
- .byte 255 // (bad)
.byte 255 // .byte 0xff
HIDDEN _sk_lerp_565_avx
@@ -17208,26 +17325,26 @@ _sk_lerp_565_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,208,0,0,0 // jne 1eea <_sk_lerp_565_avx+0xde>
+ .byte 15,133,208,0,0,0 // jne 1f1e <_sk_lerp_565_avx+0xde>
.byte 196,65,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,226,74,0,0 // vbroadcastss 0x4ae2(%rip),%ymm9 # 6920 <_sk_callback_avx+0x266>
+ .byte 196,98,125,24,13,114,75,0,0 // vbroadcastss 0x4b72(%rip),%ymm9 # 69e4 <_sk_callback_avx+0x266>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,211,74,0,0 // vbroadcastss 0x4ad3(%rip),%ymm10 # 6924 <_sk_callback_avx+0x26a>
+ .byte 196,98,125,24,21,99,75,0,0 // vbroadcastss 0x4b63(%rip),%ymm10 # 69e8 <_sk_callback_avx+0x26a>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,201,74,0,0 // vbroadcastss 0x4ac9(%rip),%ymm10 # 6928 <_sk_callback_avx+0x26e>
+ .byte 196,98,125,24,21,89,75,0,0 // vbroadcastss 0x4b59(%rip),%ymm10 # 69ec <_sk_callback_avx+0x26e>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,186,74,0,0 // vbroadcastss 0x4aba(%rip),%ymm11 # 692c <_sk_callback_avx+0x272>
+ .byte 196,98,125,24,29,74,75,0,0 // vbroadcastss 0x4b4a(%rip),%ymm11 # 69f0 <_sk_callback_avx+0x272>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,176,74,0,0 // vbroadcastss 0x4ab0(%rip),%ymm11 # 6930 <_sk_callback_avx+0x276>
+ .byte 196,98,125,24,29,64,75,0,0 // vbroadcastss 0x4b40(%rip),%ymm11 # 69f4 <_sk_callback_avx+0x276>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,161,74,0,0 // vbroadcastss 0x4aa1(%rip),%ymm11 # 6934 <_sk_callback_avx+0x27a>
+ .byte 196,98,125,24,29,49,75,0,0 // vbroadcastss 0x4b31(%rip),%ymm11 # 69f8 <_sk_callback_avx+0x27a>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
@@ -17254,22 +17371,29 @@ _sk_lerp_565_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,29,255,255,255 // ja 1e20 <_sk_lerp_565_avx+0x14>
+ .byte 15,135,29,255,255,255 // ja 1e54 <_sk_lerp_565_avx+0x14>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,74,0,0,0 // lea 0x4a(%rip),%r10 # 1f58 <_sk_lerp_565_avx+0x14c>
+ .byte 76,141,21,102,0,0,0 // lea 0x66(%rip),%r10 # 1fa8 <_sk_lerp_565_avx+0x168>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax
+ .byte 197,121,110,192 // vmovd %eax,%xmm8
+ .byte 233,251,254,255,255 // jmpq 1e54 <_sk_lerp_565_avx+0x14>
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 196,65,57,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8
+ .byte 196,65,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm9
+ .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ .byte 233,221,254,255,255 // jmpq 1e54 <_sk_lerp_565_avx+0x14>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm8,%xmm8
- .byte 196,65,57,196,68,83,6,3 // vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm8,%xmm8
- .byte 196,65,57,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8
- .byte 196,65,57,196,68,83,2,1 // vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm8,%xmm8
- .byte 196,65,57,196,4,83,0 // vpinsrw $0x0,(%r11,%rdx,2),%xmm8,%xmm8
- .byte 233,200,254,255,255 // jmpq 1e20 <_sk_lerp_565_avx+0x14>
- .byte 244 // hlt
+ .byte 196,65,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm9
+ .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ .byte 233,175,254,255,255 // jmpq 1e54 <_sk_lerp_565_avx+0x14>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -17282,14 +17406,7 @@ _sk_lerp_565_avx:
.byte 255 // (bad)
.byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
- .byte 255,212 // callq *%rsp
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 255,204 // dec %esp
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 191 // .byte 0xbf
+ .byte 255,207 // dec %edi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -17305,9 +17422,9 @@ _sk_load_tables_avx:
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 76,3,16 // add (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,248,1,0,0 // jne 218c <_sk_load_tables_avx+0x218>
+ .byte 15,133,248,1,0,0 // jne 21dc <_sk_load_tables_avx+0x218>
.byte 196,65,124,16,18 // vmovups (%r10),%ymm10
- .byte 197,124,40,13,159,77,0,0 // vmovaps 0x4d9f(%rip),%ymm9 # 6d40 <_sk_callback_avx+0x686>
+ .byte 197,124,40,13,47,78,0,0 // vmovaps 0x4e2f(%rip),%ymm9 # 6e20 <_sk_callback_avx+0x6a2>
.byte 196,193,44,84,201 // vandps %ymm9,%ymm10,%ymm1
.byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0
.byte 196,193,249,126,195 // vmovq %xmm0,%r11
@@ -17399,7 +17516,7 @@ _sk_load_tables_avx:
.byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,190,71,0,0 // vbroadcastss 0x47be(%rip),%ymm7 # 6938 <_sk_callback_avx+0x27e>
+ .byte 196,226,125,24,61,50,72,0,0 // vbroadcastss 0x4832(%rip),%ymm7 # 69fc <_sk_callback_avx+0x27e>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -17413,13 +17530,13 @@ _sk_load_tables_avx:
.byte 73,211,235 // shr %cl,%r11
.byte 196,193,249,110,195 // vmovq %r11,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,204,74,0,0 // vpshufb 0x4acc(%rip),%xmm0,%xmm1 # 6c80 <_sk_callback_avx+0x5c6>
+ .byte 196,226,121,0,13,60,75,0,0 // vpshufb 0x4b3c(%rip),%xmm0,%xmm1 # 6d40 <_sk_callback_avx+0x5c2>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,206,74,0,0 // vpshufb 0x4ace(%rip),%xmm0,%xmm0 # 6c90 <_sk_callback_avx+0x5d6>
+ .byte 196,226,121,0,5,62,75,0,0 // vpshufb 0x4b3e(%rip),%xmm0,%xmm0 # 6d50 <_sk_callback_avx+0x5d2>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,66,125,44,18 // vmaskmovps (%r10),%ymm0,%ymm10
- .byte 233,194,253,255,255 // jmpq 1f99 <_sk_load_tables_avx+0x25>
+ .byte 233,194,253,255,255 // jmpq 1fe9 <_sk_load_tables_avx+0x25>
HIDDEN _sk_load_tables_u16_be_avx
.globl _sk_load_tables_u16_be_avx
@@ -17430,7 +17547,7 @@ _sk_load_tables_u16_be_avx:
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
- .byte 15,133,84,2,0,0 // jne 2447 <_sk_load_tables_u16_be_avx+0x270>
+ .byte 15,133,84,2,0,0 // jne 2497 <_sk_load_tables_u16_be_avx+0x270>
.byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8
.byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2
.byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -17445,7 +17562,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11
.byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1
.byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12
- .byte 197,121,111,21,96,74,0,0 // vmovdqa 0x4a60(%rip),%xmm10 # 6ca0 <_sk_callback_avx+0x5e6>
+ .byte 197,121,111,21,208,74,0,0 // vmovdqa 0x4ad0(%rip),%xmm10 # 6d60 <_sk_callback_avx+0x5e2>
.byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -17543,7 +17660,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,3,69,0,0 // vbroadcastss 0x4503(%rip),%ymm7 # 693c <_sk_callback_avx+0x282>
+ .byte 196,226,125,24,61,119,69,0,0 // vbroadcastss 0x4577(%rip),%ymm7 # 6a00 <_sk_callback_avx+0x282>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -17551,29 +17668,29 @@ _sk_load_tables_u16_be_avx:
.byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 24ad <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 116,85 // je 24fd <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 24ad <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 114,72 // jb 24fd <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 24ba <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 116,72 // je 250a <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 24ba <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 114,59 // jb 250a <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,126,253,255,255 // je 220e <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,132,126,253,255,255 // je 225e <_sk_load_tables_u16_be_avx+0x37>
.byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,109,253,255,255 // jb 220e <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,130,109,253,255,255 // jb 225e <_sk_load_tables_u16_be_avx+0x37>
.byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9
- .byte 233,97,253,255,255 // jmpq 220e <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,97,253,255,255 // jmpq 225e <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,84,253,255,255 // jmpq 220e <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,84,253,255,255 // jmpq 225e <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,75,253,255,255 // jmpq 220e <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,75,253,255,255 // jmpq 225e <_sk_load_tables_u16_be_avx+0x37>
HIDDEN _sk_load_tables_rgb_u16_be_avx
.globl _sk_load_tables_rgb_u16_be_avx
@@ -17585,7 +17702,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 77,133,192 // test %r8,%r8
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
.byte 197,252,17,116,36,168 // vmovups %ymm6,-0x58(%rsp)
- .byte 15,133,71,2,0,0 // jne 2728 <_sk_load_tables_rgb_u16_be_avx+0x265>
+ .byte 15,133,71,2,0,0 // jne 2778 <_sk_load_tables_rgb_u16_be_avx+0x265>
.byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0
.byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2
.byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -17606,7 +17723,7 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
.byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11
.byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,101,71,0,0 // vmovdqa 0x4765(%rip),%xmm9 # 6cb0 <_sk_callback_avx+0x5f6>
+ .byte 197,121,111,13,213,71,0,0 // vmovdqa 0x47d5(%rip),%xmm9 # 6d70 <_sk_callback_avx+0x5f2>
.byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -17696,50 +17813,50 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2
.byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,38,66,0,0 // vbroadcastss 0x4226(%rip),%ymm3 # 6940 <_sk_callback_avx+0x286>
+ .byte 196,226,125,24,29,154,66,0,0 // vbroadcastss 0x429a(%rip),%ymm3 # 6a04 <_sk_callback_avx+0x286>
.byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
.byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 2741 <_sk_load_tables_rgb_u16_be_avx+0x27e>
- .byte 233,212,253,255,255 // jmpq 2515 <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 117,5 // jne 2791 <_sk_load_tables_rgb_u16_be_avx+0x27e>
+ .byte 233,212,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52>
.byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1
.byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 2770 <_sk_load_tables_rgb_u16_be_avx+0x2ad>
+ .byte 114,26 // jb 27c0 <_sk_load_tables_rgb_u16_be_avx+0x2ad>
.byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1
.byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 2775 <_sk_load_tables_rgb_u16_be_avx+0x2b2>
- .byte 233,165,253,255,255 // jmpq 2515 <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,160,253,255,255 // jmpq 2515 <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 117,10 // jne 27c5 <_sk_load_tables_rgb_u16_be_avx+0x2b2>
+ .byte 233,165,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,160,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52>
.byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1
.byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 27a4 <_sk_load_tables_rgb_u16_be_avx+0x2e1>
+ .byte 114,26 // jb 27f4 <_sk_load_tables_rgb_u16_be_avx+0x2e1>
.byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1
.byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 27a9 <_sk_load_tables_rgb_u16_be_avx+0x2e6>
- .byte 233,113,253,255,255 // jmpq 2515 <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,108,253,255,255 // jmpq 2515 <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 117,10 // jne 27f9 <_sk_load_tables_rgb_u16_be_avx+0x2e6>
+ .byte 233,113,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,108,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52>
.byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3
.byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 27d2 <_sk_load_tables_rgb_u16_be_avx+0x30f>
+ .byte 114,20 // jb 2822 <_sk_load_tables_rgb_u16_be_avx+0x30f>
.byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3
.byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- .byte 233,67,253,255,255 // jmpq 2515 <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,62,253,255,255 // jmpq 2515 <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,67,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 233,62,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52>
HIDDEN _sk_byte_tables_avx
.globl _sk_byte_tables_avx
FUNCTION(_sk_byte_tables_avx)
_sk_byte_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,98,65,0,0 // vbroadcastss 0x4162(%rip),%ymm8 # 6944 <_sk_callback_avx+0x28a>
+ .byte 196,98,125,24,5,214,65,0,0 // vbroadcastss 0x41d6(%rip),%ymm8 # 6a08 <_sk_callback_avx+0x28a>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -17858,7 +17975,7 @@ _sk_byte_tables_avx:
.byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1
.byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- .byte 196,98,125,24,13,12,63,0,0 // vbroadcastss 0x3f0c(%rip),%ymm9 # 6948 <_sk_callback_avx+0x28e>
+ .byte 196,98,125,24,13,128,63,0,0 // vbroadcastss 0x3f80(%rip),%ymm9 # 6a0c <_sk_callback_avx+0x28e>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -17974,7 +18091,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,237,60,0,0 // vbroadcastss 0x3ced(%rip),%ymm9 # 694c <_sk_callback_avx+0x292>
+ .byte 196,98,125,24,13,97,61,0,0 // vbroadcastss 0x3d61(%rip),%ymm9 # 6a10 <_sk_callback_avx+0x292>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1
.byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2
@@ -18179,36 +18296,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,154,57,0,0 // vbroadcastss 0x399a(%rip),%ymm12 # 6950 <_sk_callback_avx+0x296>
+ .byte 196,98,125,24,37,14,58,0,0 // vbroadcastss 0x3a0e(%rip),%ymm12 # 6a14 <_sk_callback_avx+0x296>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,144,57,0,0 // vbroadcastss 0x3990(%rip),%ymm12 # 6954 <_sk_callback_avx+0x29a>
+ .byte 196,98,125,24,37,4,58,0,0 // vbroadcastss 0x3a04(%rip),%ymm12 # 6a18 <_sk_callback_avx+0x29a>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,134,57,0,0 // vbroadcastss 0x3986(%rip),%ymm12 # 6958 <_sk_callback_avx+0x29e>
+ .byte 196,98,125,24,37,250,57,0,0 // vbroadcastss 0x39fa(%rip),%ymm12 # 6a1c <_sk_callback_avx+0x29e>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,124,57,0,0 // vbroadcastss 0x397c(%rip),%ymm12 # 695c <_sk_callback_avx+0x2a2>
+ .byte 196,98,125,24,37,240,57,0,0 // vbroadcastss 0x39f0(%rip),%ymm12 # 6a20 <_sk_callback_avx+0x2a2>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,114,57,0,0 // vbroadcastss 0x3972(%rip),%ymm12 # 6960 <_sk_callback_avx+0x2a6>
+ .byte 196,98,125,24,37,230,57,0,0 // vbroadcastss 0x39e6(%rip),%ymm12 # 6a24 <_sk_callback_avx+0x2a6>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,99,57,0,0 // vbroadcastss 0x3963(%rip),%ymm12 # 6964 <_sk_callback_avx+0x2aa>
+ .byte 196,98,125,24,37,215,57,0,0 // vbroadcastss 0x39d7(%rip),%ymm12 # 6a28 <_sk_callback_avx+0x2aa>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,89,57,0,0 // vbroadcastss 0x3959(%rip),%ymm12 # 6968 <_sk_callback_avx+0x2ae>
+ .byte 196,98,125,24,37,205,57,0,0 // vbroadcastss 0x39cd(%rip),%ymm12 # 6a2c <_sk_callback_avx+0x2ae>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,61,57,0,0 // vbroadcastss 0x393d(%rip),%ymm11 # 696c <_sk_callback_avx+0x2b2>
+ .byte 196,98,125,24,29,177,57,0,0 // vbroadcastss 0x39b1(%rip),%ymm11 # 6a30 <_sk_callback_avx+0x2b2>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,51,57,0,0 // vbroadcastss 0x3933(%rip),%ymm11 # 6970 <_sk_callback_avx+0x2b6>
+ .byte 196,98,125,24,29,167,57,0,0 // vbroadcastss 0x39a7(%rip),%ymm11 # 6a34 <_sk_callback_avx+0x2b6>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,36,57,0,0 // vbroadcastss 0x3924(%rip),%ymm11 # 6974 <_sk_callback_avx+0x2ba>
+ .byte 196,98,125,24,29,152,57,0,0 // vbroadcastss 0x3998(%rip),%ymm11 # 6a38 <_sk_callback_avx+0x2ba>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,26,57,0,0 // vbroadcastss 0x391a(%rip),%ymm11 # 6978 <_sk_callback_avx+0x2be>
+ .byte 196,98,125,24,29,142,57,0,0 // vbroadcastss 0x398e(%rip),%ymm11 # 6a3c <_sk_callback_avx+0x2be>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,11,57,0,0 // vbroadcastss 0x390b(%rip),%ymm10 # 697c <_sk_callback_avx+0x2c2>
+ .byte 196,98,125,24,21,127,57,0,0 // vbroadcastss 0x397f(%rip),%ymm10 # 6a40 <_sk_callback_avx+0x2c2>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -18216,7 +18333,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,226,56,0,0 // vbroadcastss 0x38e2(%rip),%ymm8 # 6980 <_sk_callback_avx+0x2c6>
+ .byte 196,98,125,24,5,86,57,0,0 // vbroadcastss 0x3956(%rip),%ymm8 # 6a44 <_sk_callback_avx+0x2c6>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18238,36 +18355,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,147,56,0,0 // vbroadcastss 0x3893(%rip),%ymm12 # 6984 <_sk_callback_avx+0x2ca>
+ .byte 196,98,125,24,37,7,57,0,0 // vbroadcastss 0x3907(%rip),%ymm12 # 6a48 <_sk_callback_avx+0x2ca>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,137,56,0,0 // vbroadcastss 0x3889(%rip),%ymm12 # 6988 <_sk_callback_avx+0x2ce>
+ .byte 196,98,125,24,37,253,56,0,0 // vbroadcastss 0x38fd(%rip),%ymm12 # 6a4c <_sk_callback_avx+0x2ce>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,127,56,0,0 // vbroadcastss 0x387f(%rip),%ymm12 # 698c <_sk_callback_avx+0x2d2>
+ .byte 196,98,125,24,37,243,56,0,0 // vbroadcastss 0x38f3(%rip),%ymm12 # 6a50 <_sk_callback_avx+0x2d2>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,117,56,0,0 // vbroadcastss 0x3875(%rip),%ymm12 # 6990 <_sk_callback_avx+0x2d6>
+ .byte 196,98,125,24,37,233,56,0,0 // vbroadcastss 0x38e9(%rip),%ymm12 # 6a54 <_sk_callback_avx+0x2d6>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,107,56,0,0 // vbroadcastss 0x386b(%rip),%ymm12 # 6994 <_sk_callback_avx+0x2da>
+ .byte 196,98,125,24,37,223,56,0,0 // vbroadcastss 0x38df(%rip),%ymm12 # 6a58 <_sk_callback_avx+0x2da>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,92,56,0,0 // vbroadcastss 0x385c(%rip),%ymm12 # 6998 <_sk_callback_avx+0x2de>
+ .byte 196,98,125,24,37,208,56,0,0 // vbroadcastss 0x38d0(%rip),%ymm12 # 6a5c <_sk_callback_avx+0x2de>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,82,56,0,0 // vbroadcastss 0x3852(%rip),%ymm12 # 699c <_sk_callback_avx+0x2e2>
+ .byte 196,98,125,24,37,198,56,0,0 // vbroadcastss 0x38c6(%rip),%ymm12 # 6a60 <_sk_callback_avx+0x2e2>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,54,56,0,0 // vbroadcastss 0x3836(%rip),%ymm11 # 69a0 <_sk_callback_avx+0x2e6>
+ .byte 196,98,125,24,29,170,56,0,0 // vbroadcastss 0x38aa(%rip),%ymm11 # 6a64 <_sk_callback_avx+0x2e6>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,44,56,0,0 // vbroadcastss 0x382c(%rip),%ymm11 # 69a4 <_sk_callback_avx+0x2ea>
+ .byte 196,98,125,24,29,160,56,0,0 // vbroadcastss 0x38a0(%rip),%ymm11 # 6a68 <_sk_callback_avx+0x2ea>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,29,56,0,0 // vbroadcastss 0x381d(%rip),%ymm11 # 69a8 <_sk_callback_avx+0x2ee>
+ .byte 196,98,125,24,29,145,56,0,0 // vbroadcastss 0x3891(%rip),%ymm11 # 6a6c <_sk_callback_avx+0x2ee>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,19,56,0,0 // vbroadcastss 0x3813(%rip),%ymm11 # 69ac <_sk_callback_avx+0x2f2>
+ .byte 196,98,125,24,29,135,56,0,0 // vbroadcastss 0x3887(%rip),%ymm11 # 6a70 <_sk_callback_avx+0x2f2>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,4,56,0,0 // vbroadcastss 0x3804(%rip),%ymm10 # 69b0 <_sk_callback_avx+0x2f6>
+ .byte 196,98,125,24,21,120,56,0,0 // vbroadcastss 0x3878(%rip),%ymm10 # 6a74 <_sk_callback_avx+0x2f6>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -18275,7 +18392,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,219,55,0,0 // vbroadcastss 0x37db(%rip),%ymm8 # 69b4 <_sk_callback_avx+0x2fa>
+ .byte 196,98,125,24,5,79,56,0,0 // vbroadcastss 0x384f(%rip),%ymm8 # 6a78 <_sk_callback_avx+0x2fa>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18297,36 +18414,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,140,55,0,0 // vbroadcastss 0x378c(%rip),%ymm12 # 69b8 <_sk_callback_avx+0x2fe>
+ .byte 196,98,125,24,37,0,56,0,0 // vbroadcastss 0x3800(%rip),%ymm12 # 6a7c <_sk_callback_avx+0x2fe>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,130,55,0,0 // vbroadcastss 0x3782(%rip),%ymm12 # 69bc <_sk_callback_avx+0x302>
+ .byte 196,98,125,24,37,246,55,0,0 // vbroadcastss 0x37f6(%rip),%ymm12 # 6a80 <_sk_callback_avx+0x302>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,120,55,0,0 // vbroadcastss 0x3778(%rip),%ymm12 # 69c0 <_sk_callback_avx+0x306>
+ .byte 196,98,125,24,37,236,55,0,0 // vbroadcastss 0x37ec(%rip),%ymm12 # 6a84 <_sk_callback_avx+0x306>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,110,55,0,0 // vbroadcastss 0x376e(%rip),%ymm12 # 69c4 <_sk_callback_avx+0x30a>
+ .byte 196,98,125,24,37,226,55,0,0 // vbroadcastss 0x37e2(%rip),%ymm12 # 6a88 <_sk_callback_avx+0x30a>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,100,55,0,0 // vbroadcastss 0x3764(%rip),%ymm12 # 69c8 <_sk_callback_avx+0x30e>
+ .byte 196,98,125,24,37,216,55,0,0 // vbroadcastss 0x37d8(%rip),%ymm12 # 6a8c <_sk_callback_avx+0x30e>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,85,55,0,0 // vbroadcastss 0x3755(%rip),%ymm12 # 69cc <_sk_callback_avx+0x312>
+ .byte 196,98,125,24,37,201,55,0,0 // vbroadcastss 0x37c9(%rip),%ymm12 # 6a90 <_sk_callback_avx+0x312>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,75,55,0,0 // vbroadcastss 0x374b(%rip),%ymm12 # 69d0 <_sk_callback_avx+0x316>
+ .byte 196,98,125,24,37,191,55,0,0 // vbroadcastss 0x37bf(%rip),%ymm12 # 6a94 <_sk_callback_avx+0x316>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,47,55,0,0 // vbroadcastss 0x372f(%rip),%ymm11 # 69d4 <_sk_callback_avx+0x31a>
+ .byte 196,98,125,24,29,163,55,0,0 // vbroadcastss 0x37a3(%rip),%ymm11 # 6a98 <_sk_callback_avx+0x31a>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,37,55,0,0 // vbroadcastss 0x3725(%rip),%ymm11 # 69d8 <_sk_callback_avx+0x31e>
+ .byte 196,98,125,24,29,153,55,0,0 // vbroadcastss 0x3799(%rip),%ymm11 # 6a9c <_sk_callback_avx+0x31e>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,22,55,0,0 // vbroadcastss 0x3716(%rip),%ymm11 # 69dc <_sk_callback_avx+0x322>
+ .byte 196,98,125,24,29,138,55,0,0 // vbroadcastss 0x378a(%rip),%ymm11 # 6aa0 <_sk_callback_avx+0x322>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,12,55,0,0 // vbroadcastss 0x370c(%rip),%ymm11 # 69e0 <_sk_callback_avx+0x326>
+ .byte 196,98,125,24,29,128,55,0,0 // vbroadcastss 0x3780(%rip),%ymm11 # 6aa4 <_sk_callback_avx+0x326>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,253,54,0,0 // vbroadcastss 0x36fd(%rip),%ymm10 # 69e4 <_sk_callback_avx+0x32a>
+ .byte 196,98,125,24,21,113,55,0,0 // vbroadcastss 0x3771(%rip),%ymm10 # 6aa8 <_sk_callback_avx+0x32a>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -18334,7 +18451,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,212,54,0,0 // vbroadcastss 0x36d4(%rip),%ymm8 # 69e8 <_sk_callback_avx+0x32e>
+ .byte 196,98,125,24,5,72,55,0,0 // vbroadcastss 0x3748(%rip),%ymm8 # 6aac <_sk_callback_avx+0x32e>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18356,36 +18473,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,133,54,0,0 // vbroadcastss 0x3685(%rip),%ymm12 # 69ec <_sk_callback_avx+0x332>
+ .byte 196,98,125,24,37,249,54,0,0 // vbroadcastss 0x36f9(%rip),%ymm12 # 6ab0 <_sk_callback_avx+0x332>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,123,54,0,0 // vbroadcastss 0x367b(%rip),%ymm12 # 69f0 <_sk_callback_avx+0x336>
+ .byte 196,98,125,24,37,239,54,0,0 // vbroadcastss 0x36ef(%rip),%ymm12 # 6ab4 <_sk_callback_avx+0x336>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,113,54,0,0 // vbroadcastss 0x3671(%rip),%ymm12 # 69f4 <_sk_callback_avx+0x33a>
+ .byte 196,98,125,24,37,229,54,0,0 // vbroadcastss 0x36e5(%rip),%ymm12 # 6ab8 <_sk_callback_avx+0x33a>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,103,54,0,0 // vbroadcastss 0x3667(%rip),%ymm12 # 69f8 <_sk_callback_avx+0x33e>
+ .byte 196,98,125,24,37,219,54,0,0 // vbroadcastss 0x36db(%rip),%ymm12 # 6abc <_sk_callback_avx+0x33e>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,93,54,0,0 // vbroadcastss 0x365d(%rip),%ymm12 # 69fc <_sk_callback_avx+0x342>
+ .byte 196,98,125,24,37,209,54,0,0 // vbroadcastss 0x36d1(%rip),%ymm12 # 6ac0 <_sk_callback_avx+0x342>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,78,54,0,0 // vbroadcastss 0x364e(%rip),%ymm12 # 6a00 <_sk_callback_avx+0x346>
+ .byte 196,98,125,24,37,194,54,0,0 // vbroadcastss 0x36c2(%rip),%ymm12 # 6ac4 <_sk_callback_avx+0x346>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,68,54,0,0 // vbroadcastss 0x3644(%rip),%ymm12 # 6a04 <_sk_callback_avx+0x34a>
+ .byte 196,98,125,24,37,184,54,0,0 // vbroadcastss 0x36b8(%rip),%ymm12 # 6ac8 <_sk_callback_avx+0x34a>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,40,54,0,0 // vbroadcastss 0x3628(%rip),%ymm11 # 6a08 <_sk_callback_avx+0x34e>
+ .byte 196,98,125,24,29,156,54,0,0 // vbroadcastss 0x369c(%rip),%ymm11 # 6acc <_sk_callback_avx+0x34e>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,30,54,0,0 // vbroadcastss 0x361e(%rip),%ymm11 # 6a0c <_sk_callback_avx+0x352>
+ .byte 196,98,125,24,29,146,54,0,0 // vbroadcastss 0x3692(%rip),%ymm11 # 6ad0 <_sk_callback_avx+0x352>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,15,54,0,0 // vbroadcastss 0x360f(%rip),%ymm11 # 6a10 <_sk_callback_avx+0x356>
+ .byte 196,98,125,24,29,131,54,0,0 // vbroadcastss 0x3683(%rip),%ymm11 # 6ad4 <_sk_callback_avx+0x356>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,5,54,0,0 // vbroadcastss 0x3605(%rip),%ymm11 # 6a14 <_sk_callback_avx+0x35a>
+ .byte 196,98,125,24,29,121,54,0,0 // vbroadcastss 0x3679(%rip),%ymm11 # 6ad8 <_sk_callback_avx+0x35a>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,246,53,0,0 // vbroadcastss 0x35f6(%rip),%ymm10 # 6a18 <_sk_callback_avx+0x35e>
+ .byte 196,98,125,24,21,106,54,0,0 // vbroadcastss 0x366a(%rip),%ymm10 # 6adc <_sk_callback_avx+0x35e>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -18393,7 +18510,7 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,205,53,0,0 // vbroadcastss 0x35cd(%rip),%ymm8 # 6a1c <_sk_callback_avx+0x362>
+ .byte 196,98,125,24,5,65,54,0,0 // vbroadcastss 0x3641(%rip),%ymm8 # 6ae0 <_sk_callback_avx+0x362>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18402,31 +18519,31 @@ HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,191,53,0,0 // vbroadcastss 0x35bf(%rip),%ymm8 # 6a20 <_sk_callback_avx+0x366>
+ .byte 196,98,125,24,5,51,54,0,0 // vbroadcastss 0x3633(%rip),%ymm8 # 6ae4 <_sk_callback_avx+0x366>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,181,53,0,0 // vbroadcastss 0x35b5(%rip),%ymm8 # 6a24 <_sk_callback_avx+0x36a>
+ .byte 196,98,125,24,5,41,54,0,0 // vbroadcastss 0x3629(%rip),%ymm8 # 6ae8 <_sk_callback_avx+0x36a>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,171,53,0,0 // vbroadcastss 0x35ab(%rip),%ymm9 # 6a28 <_sk_callback_avx+0x36e>
+ .byte 196,98,125,24,13,31,54,0,0 // vbroadcastss 0x361f(%rip),%ymm9 # 6aec <_sk_callback_avx+0x36e>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,151,53,0,0 // vbroadcastss 0x3597(%rip),%ymm8 # 6a2c <_sk_callback_avx+0x372>
+ .byte 196,98,125,24,5,11,54,0,0 // vbroadcastss 0x360b(%rip),%ymm8 # 6af0 <_sk_callback_avx+0x372>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,141,53,0,0 // vbroadcastss 0x358d(%rip),%ymm8 # 6a30 <_sk_callback_avx+0x376>
+ .byte 196,98,125,24,5,1,54,0,0 // vbroadcastss 0x3601(%rip),%ymm8 # 6af4 <_sk_callback_avx+0x376>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,131,53,0,0 // vbroadcastss 0x3583(%rip),%ymm8 # 6a34 <_sk_callback_avx+0x37a>
+ .byte 196,98,125,24,5,247,53,0,0 // vbroadcastss 0x35f7(%rip),%ymm8 # 6af8 <_sk_callback_avx+0x37a>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,117,53,0,0 // vbroadcastss 0x3575(%rip),%ymm8 # 6a38 <_sk_callback_avx+0x37e>
+ .byte 196,98,125,24,5,233,53,0,0 // vbroadcastss 0x35e9(%rip),%ymm8 # 6afc <_sk_callback_avx+0x37e>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,94,53,0,0 // vbroadcastss 0x355e(%rip),%ymm9 # 6a3c <_sk_callback_avx+0x382>
+ .byte 196,98,125,24,13,210,53,0,0 // vbroadcastss 0x35d2(%rip),%ymm9 # 6b00 <_sk_callback_avx+0x382>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,83,53,0,0 // vbroadcastss 0x3553(%rip),%ymm11 # 6a40 <_sk_callback_avx+0x386>
+ .byte 196,98,125,24,29,199,53,0,0 // vbroadcastss 0x35c7(%rip),%ymm11 # 6b04 <_sk_callback_avx+0x386>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,73,53,0,0 // vbroadcastss 0x3549(%rip),%ymm12 # 6a44 <_sk_callback_avx+0x38a>
+ .byte 196,98,125,24,37,189,53,0,0 // vbroadcastss 0x35bd(%rip),%ymm12 # 6b08 <_sk_callback_avx+0x38a>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -18441,9 +18558,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,255,52,0,0 // vbroadcastss 0x34ff(%rip),%ymm0 # 6a48 <_sk_callback_avx+0x38e>
+ .byte 196,226,125,24,5,115,53,0,0 // vbroadcastss 0x3573(%rip),%ymm0 # 6b0c <_sk_callback_avx+0x38e>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,246,52,0,0 // vbroadcastss 0x34f6(%rip),%ymm8 # 6a4c <_sk_callback_avx+0x392>
+ .byte 196,98,125,24,5,106,53,0,0 // vbroadcastss 0x356a(%rip),%ymm8 # 6b10 <_sk_callback_avx+0x392>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18455,15 +18572,15 @@ _sk_load_a8_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 35ab <_sk_load_a8_avx+0x4c>
+ .byte 117,66 // jne 35fb <_sk_load_a8_avx+0x4c>
.byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0
- .byte 197,249,219,5,73,55,0,0 // vpand 0x3749(%rip),%xmm0,%xmm0 # 6cc0 <_sk_callback_avx+0x606>
+ .byte 197,249,219,5,185,55,0,0 // vpand 0x37b9(%rip),%xmm0,%xmm0 # 6d80 <_sk_callback_avx+0x602>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,185,52,0,0 // vbroadcastss 0x34b9(%rip),%ymm1 # 6a50 <_sk_callback_avx+0x396>
+ .byte 196,226,125,24,13,45,53,0,0 // vbroadcastss 0x352d(%rip),%ymm1 # 6b14 <_sk_callback_avx+0x396>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -18475,12 +18592,23 @@ _sk_load_a8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,176 // ja 356f <_sk_load_a8_avx+0x10>
+ .byte 119,176 // ja 35bf <_sk_load_a8_avx+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,94,0,0,0 // lea 0x5e(%rip),%r10 # 3628 <_sk_load_a8_avx+0xc9>
+ .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 3694 <_sk_load_a8_avx+0xe5>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 197,249,110,192 // vmovd %eax,%xmm0
+ .byte 235,145 // jmp 35bf <_sk_load_a8_avx+0x10>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 197,249,110,200 // vmovd %eax,%xmm1
+ .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
+ .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
+ .byte 233,105,255,255,255 // jmpq 35bf <_sk_load_a8_avx+0x10>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -18488,32 +18616,27 @@ _sk_load_a8_avx:
.byte 197,249,196,192,5 // vpinsrw $0x5,%eax,%xmm0,%xmm0
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 197,249,196,192,4 // vpinsrw $0x4,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 197,249,196,192,3 // vpinsrw $0x3,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 197,249,196,192,1 // vpinsrw $0x1,%eax,%xmm0,%xmm0
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 197,249,196,192,0 // vpinsrw $0x0,%eax,%xmm0,%xmm0
- .byte 233,71,255,255,255 // jmpq 356f <_sk_load_a8_avx+0x10>
- .byte 241 // icebp
- .byte 255 // (bad)
+ .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1
+ .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
+ .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
+ .byte 233,46,255,255,255 // jmpq 35bf <_sk_load_a8_avx+0x10>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 143 // (bad)
.byte 255 // (bad)
- .byte 255,230 // jmpq *%rsi
.byte 255 // (bad)
+ .byte 255,169,255,255,255,154 // ljmp *-0x65000001(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 219,255 // (bad)
+ .byte 255,231 // jmpq *%rdi
.byte 255 // (bad)
- .byte 255,208 // callq *%rax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,197 // inc %ebp
+ .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
+ .byte 255,209 // callq *%rcx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 186,255,255,255,171 // mov $0xabffffff,%edx
+ .byte 255,194 // inc %edx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -18562,7 +18685,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,68,51,0,0 // vbroadcastss 0x3344(%rip),%ymm1 # 6a54 <_sk_callback_avx+0x39a>
+ .byte 196,226,125,24,13,156,51,0,0 // vbroadcastss 0x339c(%rip),%ymm1 # 6b18 <_sk_callback_avx+0x39a>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -18576,14 +18699,14 @@ FUNCTION(_sk_store_a8_avx)
_sk_store_a8_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
- .byte 196,98,125,24,5,38,51,0,0 // vbroadcastss 0x3326(%rip),%ymm8 # 6a58 <_sk_callback_avx+0x39e>
+ .byte 196,98,125,24,5,126,51,0,0 // vbroadcastss 0x337e(%rip),%ymm8 # 6b1c <_sk_callback_avx+0x39e>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 375b <_sk_store_a8_avx+0x37>
+ .byte 117,10 // jne 37c7 <_sk_store_a8_avx+0x37>
.byte 196,65,123,17,4,19 // vmovsd %xmm8,(%r11,%rdx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18591,42 +18714,41 @@ _sk_store_a8_avx:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 3757 <_sk_store_a8_avx+0x33>
+ .byte 119,236 // ja 37c3 <_sk_store_a8_avx+0x33>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # 37c0 <_sk_store_a8_avx+0x9c>
+ .byte 76,141,21,85,0,0,0 // lea 0x55(%rip),%r10 # 383c <_sk_store_a8_avx+0xac>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 196,67,121,20,4,19,0 // vpextrb $0x0,%xmm8,(%r11,%rdx,1)
+ .byte 235,202 // jmp 37c3 <_sk_store_a8_avx+0x33>
+ .byte 196,67,121,20,68,19,2,4 // vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1)
+ .byte 196,98,57,0,5,134,53,0,0 // vpshufb 0x3586(%rip),%xmm8,%xmm8 # 6d90 <_sk_callback_avx+0x612>
+ .byte 196,67,121,21,4,19,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,1)
+ .byte 235,176 // jmp 37c3 <_sk_store_a8_avx+0x33>
.byte 196,67,121,20,68,19,6,12 // vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1)
.byte 196,67,121,20,68,19,5,10 // vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1)
.byte 196,67,121,20,68,19,4,8 // vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1)
- .byte 196,67,121,20,68,19,3,6 // vpextrb $0x6,%xmm8,0x3(%r11,%rdx,1)
- .byte 196,67,121,20,68,19,2,4 // vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1)
- .byte 196,67,121,20,68,19,1,2 // vpextrb $0x2,%xmm8,0x1(%r11,%rdx,1)
- .byte 196,67,121,20,4,19,0 // vpextrb $0x0,%xmm8,(%r11,%rdx,1)
- .byte 235,154 // jmp 3757 <_sk_store_a8_avx+0x33>
- .byte 15,31,0 // nopl (%rax)
- .byte 244 // hlt
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 236 // in (%dx),%al
+ .byte 196,98,57,0,5,108,53,0,0 // vpshufb 0x356c(%rip),%xmm8,%xmm8 # 6da0 <_sk_callback_avx+0x622>
+ .byte 196,65,121,126,4,19 // vmovd %xmm8,(%r11,%rdx,1)
+ .byte 235,135 // jmp 37c3 <_sk_store_a8_avx+0x33>
+ .byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
+ .byte 255,197 // inc %ebp
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 189,255,255,255,239 // mov $0xefffffff,%ebp
.byte 255 // (bad)
- .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
- .byte 255,212 // callq *%rsp
+ .byte 255,231 // jmpq *%rdi
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,204 // dec %esp
.byte 255 // (bad)
+ .byte 223,255 // (bad)
.byte 255 // (bad)
- .byte 255,196 // inc %esp
+ .byte 255,215 // callq *%rdi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -18638,18 +18760,18 @@ _sk_load_g8_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,71 // jne 382d <_sk_load_g8_avx+0x51>
+ .byte 117,71 // jne 38a9 <_sk_load_g8_avx+0x51>
.byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0
- .byte 197,249,219,5,220,52,0,0 // vpand 0x34dc(%rip),%xmm0,%xmm0 # 6cd0 <_sk_callback_avx+0x616>
+ .byte 197,249,219,5,64,53,0,0 // vpand 0x3540(%rip),%xmm0,%xmm0 # 6db0 <_sk_callback_avx+0x632>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,72,50,0,0 // vbroadcastss 0x3248(%rip),%ymm1 # 6a5c <_sk_callback_avx+0x3a2>
+ .byte 196,226,125,24,13,144,50,0,0 // vbroadcastss 0x3290(%rip),%ymm1 # 6b20 <_sk_callback_avx+0x3a2>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,61,50,0,0 // vbroadcastss 0x323d(%rip),%ymm3 # 6a60 <_sk_callback_avx+0x3a6>
+ .byte 196,226,125,24,29,133,50,0,0 // vbroadcastss 0x3285(%rip),%ymm3 # 6b24 <_sk_callback_avx+0x3a6>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -18658,12 +18780,23 @@ _sk_load_g8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,171 // ja 37ec <_sk_load_g8_avx+0x10>
+ .byte 119,171 // ja 3868 <_sk_load_g8_avx+0x10>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,96,0,0,0 // lea 0x60(%rip),%r10 # 38ac <_sk_load_g8_avx+0xd0>
+ .byte 76,141,21,120,0,0,0 // lea 0x78(%rip),%r10 # 3940 <_sk_load_g8_avx+0xe8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 197,249,110,192 // vmovd %eax,%xmm0
+ .byte 235,140 // jmp 3868 <_sk_load_g8_avx+0x10>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 197,249,110,200 // vmovd %eax,%xmm1
+ .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
+ .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
+ .byte 233,100,255,255,255 // jmpq 3868 <_sk_load_g8_avx+0x10>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -18671,33 +18804,25 @@ _sk_load_g8_avx:
.byte 197,249,196,192,5 // vpinsrw $0x5,%eax,%xmm0,%xmm0
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 197,249,196,192,4 // vpinsrw $0x4,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 197,249,196,192,3 // vpinsrw $0x3,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 197,249,196,192,1 // vpinsrw $0x1,%eax,%xmm0,%xmm0
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 197,249,196,192,0 // vpinsrw $0x0,%eax,%xmm0,%xmm0
- .byte 233,66,255,255,255 // jmpq 37ec <_sk_load_g8_avx+0x10>
- .byte 102,144 // xchg %ax,%ax
- .byte 239 // out %eax,(%dx)
+ .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1
+ .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
+ .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
+ .byte 233,41,255,255,255 // jmpq 3868 <_sk_load_g8_avx+0x10>
+ .byte 144 // nop
+ .byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
+ .byte 255,171,255,255,255,156 // ljmp *-0x63000001(%rbx)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 217,255 // fcos
+ .byte 233,255,255,255,222 // jmpq ffffffffdf003950 <_sk_callback_avx+0xffffffffdeffd1d2>
.byte 255 // (bad)
- .byte 255,206 // dec %esi
.byte 255 // (bad)
+ .byte 255,211 // callq *%rbx
.byte 255 // (bad)
- .byte 255,195 // inc %ebx
.byte 255 // (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 184,255,255,255,169 // mov $0xa9ffffff,%eax
+ .byte 255,196 // inc %esp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -18746,10 +18871,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,208,48,0,0 // vbroadcastss 0x30d0(%rip),%ymm1 # 6a64 <_sk_callback_avx+0x3aa>
+ .byte 196,226,125,24,13,0,49,0,0 // vbroadcastss 0x3100(%rip),%ymm1 # 6b28 <_sk_callback_avx+0x3aa>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,197,48,0,0 // vbroadcastss 0x30c5(%rip),%ymm3 # 6a68 <_sk_callback_avx+0x3ae>
+ .byte 196,226,125,24,29,245,48,0,0 // vbroadcastss 0x30f5(%rip),%ymm3 # 6b2c <_sk_callback_avx+0x3ae>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -18761,9 +18886,9 @@ _sk_gather_i8_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,137,193 // mov %rax,%r9
.byte 77,133,201 // test %r9,%r9
- .byte 116,5 // je 39bc <_sk_gather_i8_avx+0xf>
+ .byte 116,5 // je 3a50 <_sk_gather_i8_avx+0xf>
.byte 76,137,200 // mov %r9,%rax
- .byte 235,2 // jmp 39be <_sk_gather_i8_avx+0x11>
+ .byte 235,2 // jmp 3a52 <_sk_gather_i8_avx+0x11>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 83 // push %rbx
.byte 76,139,16 // mov (%rax),%r10
@@ -18821,10 +18946,10 @@ _sk_gather_i8_avx:
.byte 72,193,235,30 // shr $0x1e,%rbx
.byte 196,195,121,34,28,27,3 // vpinsrd $0x3,(%r11,%rbx,1),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,132,50,0,0 // vmovaps 0x3284(%rip),%ymm10 # 6d60 <_sk_callback_avx+0x6a6>
+ .byte 197,124,40,21,208,50,0,0 // vmovaps 0x32d0(%rip),%ymm10 # 6e40 <_sk_callback_avx+0x6c2>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,126,47,0,0 // vbroadcastss 0x2f7e(%rip),%ymm9 # 6a6c <_sk_callback_avx+0x3b2>
+ .byte 196,98,125,24,13,174,47,0,0 // vbroadcastss 0x2fae(%rip),%ymm9 # 6b30 <_sk_callback_avx+0x3b2>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -18854,71 +18979,72 @@ _sk_load_565_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,128,0,0,0 // jne 3bde <_sk_load_565_avx+0x8e>
+ .byte 15,133,128,0,0,0 // jne 3c72 <_sk_load_565_avx+0x8e>
.byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,240,46,0,0 // vbroadcastss 0x2ef0(%rip),%ymm0 # 6a70 <_sk_callback_avx+0x3b6>
+ .byte 196,226,125,24,5,32,47,0,0 // vbroadcastss 0x2f20(%rip),%ymm0 # 6b34 <_sk_callback_avx+0x3b6>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,227,46,0,0 // vbroadcastss 0x2ee3(%rip),%ymm1 # 6a74 <_sk_callback_avx+0x3ba>
+ .byte 196,226,125,24,13,19,47,0,0 // vbroadcastss 0x2f13(%rip),%ymm1 # 6b38 <_sk_callback_avx+0x3ba>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,218,46,0,0 // vbroadcastss 0x2eda(%rip),%ymm1 # 6a78 <_sk_callback_avx+0x3be>
+ .byte 196,226,125,24,13,10,47,0,0 // vbroadcastss 0x2f0a(%rip),%ymm1 # 6b3c <_sk_callback_avx+0x3be>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,205,46,0,0 // vbroadcastss 0x2ecd(%rip),%ymm3 # 6a7c <_sk_callback_avx+0x3c2>
+ .byte 196,226,125,24,29,253,46,0,0 // vbroadcastss 0x2efd(%rip),%ymm3 # 6b40 <_sk_callback_avx+0x3c2>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,196,46,0,0 // vbroadcastss 0x2ec4(%rip),%ymm3 # 6a80 <_sk_callback_avx+0x3c6>
+ .byte 196,226,125,24,29,244,46,0,0 // vbroadcastss 0x2ef4(%rip),%ymm3 # 6b44 <_sk_callback_avx+0x3c6>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,183,46,0,0 // vbroadcastss 0x2eb7(%rip),%ymm3 # 6a84 <_sk_callback_avx+0x3ca>
+ .byte 196,226,125,24,29,231,46,0,0 // vbroadcastss 0x2ee7(%rip),%ymm3 # 6b48 <_sk_callback_avx+0x3ca>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,172,46,0,0 // vbroadcastss 0x2eac(%rip),%ymm3 # 6a88 <_sk_callback_avx+0x3ce>
+ .byte 196,226,125,24,29,220,46,0,0 // vbroadcastss 0x2edc(%rip),%ymm3 # 6b4c <_sk_callback_avx+0x3ce>
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,110,255,255,255 // ja 3b64 <_sk_load_565_avx+0x14>
+ .byte 15,135,110,255,255,255 // ja 3bf8 <_sk_load_565_avx+0x14>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,75,0,0,0 // lea 0x4b(%rip),%r10 # 3c4c <_sk_load_565_avx+0xfc>
+ .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 3cf8 <_sk_load_565_avx+0x114>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax
+ .byte 197,249,110,192 // vmovd %eax,%xmm0
+ .byte 233,76,255,255,255 // jmpq 3bf8 <_sk_load_565_avx+0x14>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
+ .byte 196,193,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm1
+ .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
+ .byte 233,47,255,255,255 // jmpq 3bf8 <_sk_load_565_avx+0x14>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,6,3 // vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,2,1 // vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,4,83,0 // vpinsrw $0x0,(%r11,%rdx,2),%xmm0,%xmm0
- .byte 233,26,255,255,255 // jmpq 3b64 <_sk_load_565_avx+0x14>
+ .byte 196,193,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm1
+ .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
+ .byte 233,2,255,255,255 // jmpq 3bf8 <_sk_load_565_avx+0x14>
.byte 102,144 // xchg %ax,%ax
- .byte 242,255 // repnz (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 234 // (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 255,226 // jmpq *%rdx
+ .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,192 // inc %eax
.byte 255 // (bad)
- .byte 218,255 // (bad)
.byte 255 // (bad)
- .byte 255,210 // callq *%rdx
+ .byte 255,180,255,255,255,237,255 // pushq -0x120001(%rdi,%rdi,8)
.byte 255 // (bad)
+ .byte 255,229 // jmpq *%rbp
.byte 255 // (bad)
- .byte 255,202 // dec %edx
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 221,255 // (bad)
.byte 255 // (bad)
- .byte 190 // .byte 0xbe
+ .byte 255,209 // callq *%rcx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -18971,23 +19097,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,82,45,0,0 // vbroadcastss 0x2d52(%rip),%ymm0 # 6a8c <_sk_callback_avx+0x3d2>
+ .byte 196,226,125,24,5,106,45,0,0 // vbroadcastss 0x2d6a(%rip),%ymm0 # 6b50 <_sk_callback_avx+0x3d2>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,69,45,0,0 // vbroadcastss 0x2d45(%rip),%ymm1 # 6a90 <_sk_callback_avx+0x3d6>
+ .byte 196,226,125,24,13,93,45,0,0 // vbroadcastss 0x2d5d(%rip),%ymm1 # 6b54 <_sk_callback_avx+0x3d6>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,60,45,0,0 // vbroadcastss 0x2d3c(%rip),%ymm1 # 6a94 <_sk_callback_avx+0x3da>
+ .byte 196,226,125,24,13,84,45,0,0 // vbroadcastss 0x2d54(%rip),%ymm1 # 6b58 <_sk_callback_avx+0x3da>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,47,45,0,0 // vbroadcastss 0x2d2f(%rip),%ymm3 # 6a98 <_sk_callback_avx+0x3de>
+ .byte 196,226,125,24,29,71,45,0,0 // vbroadcastss 0x2d47(%rip),%ymm3 # 6b5c <_sk_callback_avx+0x3de>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,38,45,0,0 // vbroadcastss 0x2d26(%rip),%ymm3 # 6a9c <_sk_callback_avx+0x3e2>
+ .byte 196,226,125,24,29,62,45,0,0 // vbroadcastss 0x2d3e(%rip),%ymm3 # 6b60 <_sk_callback_avx+0x3e2>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,25,45,0,0 // vbroadcastss 0x2d19(%rip),%ymm3 # 6aa0 <_sk_callback_avx+0x3e6>
+ .byte 196,226,125,24,29,49,45,0,0 // vbroadcastss 0x2d31(%rip),%ymm3 # 6b64 <_sk_callback_avx+0x3e6>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,14,45,0,0 // vbroadcastss 0x2d0e(%rip),%ymm3 # 6aa4 <_sk_callback_avx+0x3ea>
+ .byte 196,226,125,24,29,38,45,0,0 // vbroadcastss 0x2d26(%rip),%ymm3 # 6b68 <_sk_callback_avx+0x3ea>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_avx
@@ -18996,14 +19122,14 @@ FUNCTION(_sk_store_565_avx)
_sk_store_565_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
- .byte 196,98,125,24,5,2,45,0,0 // vbroadcastss 0x2d02(%rip),%ymm8 # 6aa8 <_sk_callback_avx+0x3ee>
+ .byte 196,98,125,24,5,26,45,0,0 // vbroadcastss 0x2d1a(%rip),%ymm8 # 6b6c <_sk_callback_avx+0x3ee>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,219,44,0,0 // vbroadcastss 0x2cdb(%rip),%ymm10 # 6aac <_sk_callback_avx+0x3f2>
+ .byte 196,98,125,24,21,243,44,0,0 // vbroadcastss 0x2cf3(%rip),%ymm10 # 6b70 <_sk_callback_avx+0x3f2>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -19017,7 +19143,7 @@ _sk_store_565_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3e21 <_sk_store_565_avx+0x89>
+ .byte 117,10 // jne 3ecd <_sk_store_565_avx+0x89>
.byte 196,65,122,127,4,83 // vmovdqu %xmm8,(%r11,%rdx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19025,42 +19151,42 @@ _sk_store_565_avx:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 3e1d <_sk_store_565_avx+0x85>
+ .byte 119,236 // ja 3ec9 <_sk_store_565_avx+0x85>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,68,0,0,0 // lea 0x44(%rip),%r10 # 3e80 <_sk_store_565_avx+0xe8>
+ .byte 76,141,21,68,0,0,0 // lea 0x44(%rip),%r10 # 3f2c <_sk_store_565_avx+0xe8>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2)
+ .byte 235,207 // jmp 3ec9 <_sk_store_565_avx+0x85>
+ .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
+ .byte 196,65,121,126,4,83 // vmovd %xmm8,(%r11,%rdx,2)
+ .byte 235,191 // jmp 3ec9 <_sk_store_565_avx+0x85>
.byte 196,67,121,21,68,83,12,6 // vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2)
.byte 196,67,121,21,68,83,10,5 // vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2)
.byte 196,67,121,21,68,83,8,4 // vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,6,3 // vpextrw $0x3,%xmm8,0x6(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,2,1 // vpextrw $0x1,%xmm8,0x2(%r11,%rdx,2)
- .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2)
- .byte 235,159 // jmp 3e1d <_sk_store_565_avx+0x85>
+ .byte 196,65,121,214,4,83 // vmovq %xmm8,(%r11,%rdx,2)
+ .byte 235,159 // jmp 3ec9 <_sk_store_565_avx+0x85>
.byte 102,144 // xchg %ax,%ax
- .byte 245 // cmc
- .byte 255 // (bad)
- .byte 255 // (bad)
+ .byte 197,255,255 // (bad)
+ .byte 255,214 // callq *%rsi
.byte 255 // (bad)
- .byte 237 // in (%dx),%eax
.byte 255 // (bad)
+ .byte 255,206 // dec %esi
.byte 255 // (bad)
- .byte 255,229 // jmpq *%rbp
.byte 255 // (bad)
+ .byte 255,246 // push %rsi
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 221,255 // (bad)
.byte 255 // (bad)
- .byte 255,213 // callq *%rbp
+ .byte 238 // out %al,(%dx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,205 // dec %ebp
+ .byte 255,230 // jmpq *%rsi
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,197 // inc %ebp
.byte 255 // (bad)
+ .byte 222,255 // fdivrp %st,%st(7)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -19071,31 +19197,31 @@ _sk_load_4444_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,152,0,0,0 // jne 3f42 <_sk_load_4444_avx+0xa6>
+ .byte 15,133,152,0,0,0 // jne 3fee <_sk_load_4444_avx+0xa6>
.byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,228,43,0,0 // vbroadcastss 0x2be4(%rip),%ymm0 # 6ab0 <_sk_callback_avx+0x3f6>
+ .byte 196,226,125,24,5,252,43,0,0 // vbroadcastss 0x2bfc(%rip),%ymm0 # 6b74 <_sk_callback_avx+0x3f6>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,215,43,0,0 // vbroadcastss 0x2bd7(%rip),%ymm1 # 6ab4 <_sk_callback_avx+0x3fa>
+ .byte 196,226,125,24,13,239,43,0,0 // vbroadcastss 0x2bef(%rip),%ymm1 # 6b78 <_sk_callback_avx+0x3fa>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,206,43,0,0 // vbroadcastss 0x2bce(%rip),%ymm1 # 6ab8 <_sk_callback_avx+0x3fe>
+ .byte 196,226,125,24,13,230,43,0,0 // vbroadcastss 0x2be6(%rip),%ymm1 # 6b7c <_sk_callback_avx+0x3fe>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,193,43,0,0 // vbroadcastss 0x2bc1(%rip),%ymm2 # 6abc <_sk_callback_avx+0x402>
+ .byte 196,226,125,24,21,217,43,0,0 // vbroadcastss 0x2bd9(%rip),%ymm2 # 6b80 <_sk_callback_avx+0x402>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,184,43,0,0 // vbroadcastss 0x2bb8(%rip),%ymm2 # 6ac0 <_sk_callback_avx+0x406>
+ .byte 196,226,125,24,21,208,43,0,0 // vbroadcastss 0x2bd0(%rip),%ymm2 # 6b84 <_sk_callback_avx+0x406>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,171,43,0,0 // vbroadcastss 0x2bab(%rip),%ymm8 # 6ac4 <_sk_callback_avx+0x40a>
+ .byte 196,98,125,24,5,195,43,0,0 // vbroadcastss 0x2bc3(%rip),%ymm8 # 6b88 <_sk_callback_avx+0x40a>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,161,43,0,0 // vbroadcastss 0x2ba1(%rip),%ymm8 # 6ac8 <_sk_callback_avx+0x40e>
+ .byte 196,98,125,24,5,185,43,0,0 // vbroadcastss 0x2bb9(%rip),%ymm8 # 6b8c <_sk_callback_avx+0x40e>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,147,43,0,0 // vbroadcastss 0x2b93(%rip),%ymm8 # 6acc <_sk_callback_avx+0x412>
+ .byte 196,98,125,24,5,171,43,0,0 // vbroadcastss 0x2bab(%rip),%ymm8 # 6b90 <_sk_callback_avx+0x412>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19104,42 +19230,43 @@ _sk_load_4444_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,86,255,255,255 // ja 3eb0 <_sk_load_4444_avx+0x14>
+ .byte 15,135,86,255,255,255 // ja 3f5c <_sk_load_4444_avx+0x14>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,75,0,0,0 // lea 0x4b(%rip),%r10 # 3fb0 <_sk_load_4444_avx+0x114>
+ .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 4074 <_sk_load_4444_avx+0x12c>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax
+ .byte 197,249,110,192 // vmovd %eax,%xmm0
+ .byte 233,52,255,255,255 // jmpq 3f5c <_sk_load_4444_avx+0x14>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
+ .byte 196,193,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm1
+ .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
+ .byte 233,23,255,255,255 // jmpq 3f5c <_sk_load_4444_avx+0x14>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,6,3 // vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,68,83,2,1 // vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm0,%xmm0
- .byte 196,193,121,196,4,83,0 // vpinsrw $0x0,(%r11,%rdx,2),%xmm0,%xmm0
- .byte 233,2,255,255,255 // jmpq 3eb0 <_sk_load_4444_avx+0x14>
+ .byte 196,193,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm1
+ .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
+ .byte 233,234,254,255,255 // jmpq 3f5c <_sk_load_4444_avx+0x14>
.byte 102,144 // xchg %ax,%ax
- .byte 242,255 // repnz (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 234 // (bad)
- .byte 255 // (bad)
- .byte 255 // (bad)
- .byte 255,226 // jmpq *%rdx
+ .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,192 // inc %eax
.byte 255 // (bad)
- .byte 218,255 // (bad)
.byte 255 // (bad)
- .byte 255,210 // callq *%rdx
+ .byte 255,180,255,255,255,237,255 // pushq -0x120001(%rdi,%rdi,8)
.byte 255 // (bad)
+ .byte 255,229 // jmpq *%rbp
.byte 255 // (bad)
- .byte 255,202 // dec %edx
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 221,255 // (bad)
.byte 255 // (bad)
- .byte 190 // .byte 0xbe
+ .byte 255,209 // callq *%rcx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -19192,25 +19319,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,50,42,0,0 // vbroadcastss 0x2a32(%rip),%ymm0 # 6ad0 <_sk_callback_avx+0x416>
+ .byte 196,226,125,24,5,50,42,0,0 // vbroadcastss 0x2a32(%rip),%ymm0 # 6b94 <_sk_callback_avx+0x416>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,37,42,0,0 // vbroadcastss 0x2a25(%rip),%ymm1 # 6ad4 <_sk_callback_avx+0x41a>
+ .byte 196,226,125,24,13,37,42,0,0 // vbroadcastss 0x2a25(%rip),%ymm1 # 6b98 <_sk_callback_avx+0x41a>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,28,42,0,0 // vbroadcastss 0x2a1c(%rip),%ymm1 # 6ad8 <_sk_callback_avx+0x41e>
+ .byte 196,226,125,24,13,28,42,0,0 // vbroadcastss 0x2a1c(%rip),%ymm1 # 6b9c <_sk_callback_avx+0x41e>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,15,42,0,0 // vbroadcastss 0x2a0f(%rip),%ymm2 # 6adc <_sk_callback_avx+0x422>
+ .byte 196,226,125,24,21,15,42,0,0 // vbroadcastss 0x2a0f(%rip),%ymm2 # 6ba0 <_sk_callback_avx+0x422>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,6,42,0,0 // vbroadcastss 0x2a06(%rip),%ymm2 # 6ae0 <_sk_callback_avx+0x426>
+ .byte 196,226,125,24,21,6,42,0,0 // vbroadcastss 0x2a06(%rip),%ymm2 # 6ba4 <_sk_callback_avx+0x426>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,249,41,0,0 // vbroadcastss 0x29f9(%rip),%ymm8 # 6ae4 <_sk_callback_avx+0x42a>
+ .byte 196,98,125,24,5,249,41,0,0 // vbroadcastss 0x29f9(%rip),%ymm8 # 6ba8 <_sk_callback_avx+0x42a>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,239,41,0,0 // vbroadcastss 0x29ef(%rip),%ymm8 # 6ae8 <_sk_callback_avx+0x42e>
+ .byte 196,98,125,24,5,239,41,0,0 // vbroadcastss 0x29ef(%rip),%ymm8 # 6bac <_sk_callback_avx+0x42e>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,225,41,0,0 // vbroadcastss 0x29e1(%rip),%ymm8 # 6aec <_sk_callback_avx+0x432>
+ .byte 196,98,125,24,5,225,41,0,0 // vbroadcastss 0x29e1(%rip),%ymm8 # 6bb0 <_sk_callback_avx+0x432>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19221,7 +19348,7 @@ FUNCTION(_sk_store_4444_avx)
_sk_store_4444_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
- .byte 196,98,125,24,5,206,41,0,0 // vbroadcastss 0x29ce(%rip),%ymm8 # 6af0 <_sk_callback_avx+0x436>
+ .byte 196,98,125,24,5,206,41,0,0 // vbroadcastss 0x29ce(%rip),%ymm8 # 6bb4 <_sk_callback_avx+0x436>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -19248,7 +19375,7 @@ _sk_store_4444_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 41bb <_sk_store_4444_avx+0xa7>
+ .byte 117,10 // jne 427f <_sk_store_4444_avx+0xa7>
.byte 196,65,122,127,4,83 // vmovdqu %xmm8,(%r11,%rdx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19256,39 +19383,40 @@ _sk_store_4444_avx:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 41b7 <_sk_store_4444_avx+0xa3>
+ .byte 119,236 // ja 427b <_sk_store_4444_avx+0xa3>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,66,0,0,0 // lea 0x42(%rip),%r10 # 4218 <_sk_store_4444_avx+0x104>
+ .byte 76,141,21,66,0,0,0 // lea 0x42(%rip),%r10 # 42dc <_sk_store_4444_avx+0x104>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2)
+ .byte 235,207 // jmp 427b <_sk_store_4444_avx+0xa3>
+ .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
+ .byte 196,65,121,126,4,83 // vmovd %xmm8,(%r11,%rdx,2)
+ .byte 235,191 // jmp 427b <_sk_store_4444_avx+0xa3>
.byte 196,67,121,21,68,83,12,6 // vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2)
.byte 196,67,121,21,68,83,10,5 // vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2)
.byte 196,67,121,21,68,83,8,4 // vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,6,3 // vpextrw $0x3,%xmm8,0x6(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
- .byte 196,67,121,21,68,83,2,1 // vpextrw $0x1,%xmm8,0x2(%r11,%rdx,2)
- .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2)
- .byte 235,159 // jmp 41b7 <_sk_store_4444_avx+0xa3>
- .byte 247,255 // idiv %edi
+ .byte 196,65,121,214,4,83 // vmovq %xmm8,(%r11,%rdx,2)
+ .byte 235,159 // jmp 427b <_sk_store_4444_avx+0xa3>
+ .byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 239 // out %eax,(%dx)
.byte 255 // (bad)
+ .byte 216,255 // fdivr %st(7),%st
.byte 255 // (bad)
- .byte 255,231 // jmpq *%rdi
+ .byte 255,208 // callq *%rax
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 223,255 // (bad)
+ .byte 248 // clc
.byte 255 // (bad)
- .byte 255,215 // callq *%rdi
.byte 255 // (bad)
+ .byte 255,240 // push %rax
.byte 255 // (bad)
- .byte 255,207 // dec %edi
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,199 // inc %edi
+ .byte 232,255,255,255,224 // callq ffffffffe10042f4 <_sk_callback_avx+0xffffffffe0ffdb76>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -19302,12 +19430,12 @@ _sk_load_8888_avx:
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 76,3,16 // add (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,137,0,0,0 // jne 42d6 <_sk_load_8888_avx+0xa2>
+ .byte 15,133,137,0,0,0 // jne 439a <_sk_load_8888_avx+0xa2>
.byte 196,193,124,16,26 // vmovups (%r10),%ymm3
- .byte 197,124,40,21,38,43,0,0 // vmovaps 0x2b26(%rip),%ymm10 # 6d80 <_sk_callback_avx+0x6c6>
+ .byte 197,124,40,21,66,43,0,0 // vmovaps 0x2b42(%rip),%ymm10 # 6e60 <_sk_callback_avx+0x6e2>
.byte 196,193,100,84,194 // vandps %ymm10,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,136,40,0,0 // vbroadcastss 0x2888(%rip),%ymm8 # 6af4 <_sk_callback_avx+0x43a>
+ .byte 196,98,125,24,5,136,40,0,0 // vbroadcastss 0x2888(%rip),%ymm8 # 6bb8 <_sk_callback_avx+0x43a>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
.byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9
@@ -19337,13 +19465,13 @@ _sk_load_8888_avx:
.byte 72,211,232 // shr %cl,%rax
.byte 196,225,249,110,192 // vmovq %rax,%xmm0
.byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0
- .byte 196,226,121,0,13,226,41,0,0 // vpshufb 0x29e2(%rip),%xmm0,%xmm1 # 6ce0 <_sk_callback_avx+0x626>
+ .byte 196,226,121,0,13,254,41,0,0 // vpshufb 0x29fe(%rip),%xmm0,%xmm1 # 6dc0 <_sk_callback_avx+0x642>
.byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1
- .byte 196,226,121,0,5,228,41,0,0 // vpshufb 0x29e4(%rip),%xmm0,%xmm0 # 6cf0 <_sk_callback_avx+0x636>
+ .byte 196,226,121,0,5,0,42,0,0 // vpshufb 0x2a00(%rip),%xmm0,%xmm0 # 6dd0 <_sk_callback_avx+0x652>
.byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 196,194,125,44,26 // vmaskmovps (%r10),%ymm0,%ymm3
- .byte 233,49,255,255,255 // jmpq 4252 <_sk_load_8888_avx+0x1e>
+ .byte 233,49,255,255,255 // jmpq 4316 <_sk_load_8888_avx+0x1e>
HIDDEN _sk_gather_8888_avx
.globl _sk_gather_8888_avx
@@ -19382,10 +19510,10 @@ _sk_gather_8888_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,212,41,0,0 // vmovaps 0x29d4(%rip),%ymm10 # 6da0 <_sk_callback_avx+0x6e6>
+ .byte 197,124,40,21,240,41,0,0 // vmovaps 0x29f0(%rip),%ymm10 # 6e80 <_sk_callback_avx+0x702>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,26,39,0,0 // vbroadcastss 0x271a(%rip),%ymm9 # 6af8 <_sk_callback_avx+0x43e>
+ .byte 196,98,125,24,13,26,39,0,0 // vbroadcastss 0x271a(%rip),%ymm9 # 6bbc <_sk_callback_avx+0x43e>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -19415,7 +19543,7 @@ _sk_store_8888_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 76,3,16 // add (%rax),%r10
- .byte 196,98,125,24,5,164,38,0,0 // vbroadcastss 0x26a4(%rip),%ymm8 # 6afc <_sk_callback_avx+0x442>
+ .byte 196,98,125,24,5,164,38,0,0 // vbroadcastss 0x26a4(%rip),%ymm8 # 6bc0 <_sk_callback_avx+0x442>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -19440,7 +19568,7 @@ _sk_store_8888_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,12 // jne 44e8 <_sk_store_8888_avx+0xa9>
+ .byte 117,12 // jne 45ac <_sk_store_8888_avx+0xa9>
.byte 196,65,124,17,2 // vmovups %ymm8,(%r10)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,137,201 // mov %r9,%rcx
@@ -19452,13 +19580,13 @@ _sk_store_8888_avx:
.byte 72,211,232 // shr %cl,%rax
.byte 196,97,249,110,200 // vmovq %rax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
- .byte 196,98,49,0,21,240,39,0,0 // vpshufb 0x27f0(%rip),%xmm9,%xmm10 # 6d00 <_sk_callback_avx+0x646>
+ .byte 196,98,49,0,21,12,40,0,0 // vpshufb 0x280c(%rip),%xmm9,%xmm10 # 6de0 <_sk_callback_avx+0x662>
.byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10
- .byte 196,98,49,0,13,242,39,0,0 // vpshufb 0x27f2(%rip),%xmm9,%xmm9 # 6d10 <_sk_callback_avx+0x656>
+ .byte 196,98,49,0,13,14,40,0,0 // vpshufb 0x280e(%rip),%xmm9,%xmm9 # 6df0 <_sk_callback_avx+0x672>
.byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
.byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10)
- .byte 235,177 // jmp 44e1 <_sk_store_8888_avx+0xa2>
+ .byte 235,177 // jmp 45a5 <_sk_store_8888_avx+0xa2>
HIDDEN _sk_load_f16_avx
.globl _sk_load_f16_avx
@@ -19472,7 +19600,7 @@ _sk_load_f16_avx:
.byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp)
.byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp)
.byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp)
- .byte 15,133,141,2,0,0 // jne 47e7 <_sk_load_f16_avx+0x2b7>
+ .byte 15,133,141,2,0,0 // jne 48ab <_sk_load_f16_avx+0x2b7>
.byte 197,121,16,4,208 // vmovupd (%rax,%rdx,8),%xmm8
.byte 197,249,16,84,208,16 // vmovupd 0x10(%rax,%rdx,8),%xmm2
.byte 197,249,16,76,208,32 // vmovupd 0x20(%rax,%rdx,8),%xmm1
@@ -19490,13 +19618,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,77,37,0,0 // vbroadcastss 0x254d(%rip),%ymm12 # 6b00 <_sk_callback_avx+0x446>
+ .byte 196,98,125,24,37,77,37,0,0 // vbroadcastss 0x254d(%rip),%ymm12 # 6bc4 <_sk_callback_avx+0x446>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,57,37,0,0 // vbroadcastss 0x2539(%rip),%xmm11 # 6b04 <_sk_callback_avx+0x44a>
+ .byte 196,98,121,24,29,57,37,0,0 // vbroadcastss 0x2539(%rip),%xmm11 # 6bc8 <_sk_callback_avx+0x44a>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,47,37,0,0 // vbroadcastss 0x252f(%rip),%xmm13 # 6b08 <_sk_callback_avx+0x44e>
+ .byte 196,98,121,24,45,47,37,0,0 // vbroadcastss 0x252f(%rip),%xmm13 # 6bcc <_sk_callback_avx+0x44e>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -19510,7 +19638,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,229,36,0,0 // vbroadcastss 0x24e5(%rip),%xmm3 # 6b0c <_sk_callback_avx+0x452>
+ .byte 196,226,121,24,29,229,36,0,0 // vbroadcastss 0x24e5(%rip),%xmm3 # 6bd0 <_sk_callback_avx+0x452>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -19603,29 +19731,29 @@ _sk_load_f16_avx:
.byte 197,123,16,4,208 // vmovsd (%rax,%rdx,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,79 // je 4846 <_sk_load_f16_avx+0x316>
+ .byte 116,79 // je 490a <_sk_load_f16_avx+0x316>
.byte 197,57,22,68,208,8 // vmovhpd 0x8(%rax,%rdx,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,67 // jb 4846 <_sk_load_f16_avx+0x316>
+ .byte 114,67 // jb 490a <_sk_load_f16_avx+0x316>
.byte 197,251,16,84,208,16 // vmovsd 0x10(%rax,%rdx,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,68 // je 4853 <_sk_load_f16_avx+0x323>
+ .byte 116,68 // je 4917 <_sk_load_f16_avx+0x323>
.byte 197,233,22,84,208,24 // vmovhpd 0x18(%rax,%rdx,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,56 // jb 4853 <_sk_load_f16_avx+0x323>
+ .byte 114,56 // jb 4917 <_sk_load_f16_avx+0x323>
.byte 197,251,16,76,208,32 // vmovsd 0x20(%rax,%rdx,8),%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,70,253,255,255 // je 4571 <_sk_load_f16_avx+0x41>
+ .byte 15,132,70,253,255,255 // je 4635 <_sk_load_f16_avx+0x41>
.byte 197,241,22,76,208,40 // vmovhpd 0x28(%rax,%rdx,8),%xmm1,%xmm1
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,54,253,255,255 // jb 4571 <_sk_load_f16_avx+0x41>
+ .byte 15,130,54,253,255,255 // jb 4635 <_sk_load_f16_avx+0x41>
.byte 197,122,126,76,208,48 // vmovq 0x30(%rax,%rdx,8),%xmm9
- .byte 233,43,253,255,255 // jmpq 4571 <_sk_load_f16_avx+0x41>
+ .byte 233,43,253,255,255 // jmpq 4635 <_sk_load_f16_avx+0x41>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,30,253,255,255 // jmpq 4571 <_sk_load_f16_avx+0x41>
+ .byte 233,30,253,255,255 // jmpq 4635 <_sk_load_f16_avx+0x41>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
- .byte 233,21,253,255,255 // jmpq 4571 <_sk_load_f16_avx+0x41>
+ .byte 233,21,253,255,255 // jmpq 4635 <_sk_load_f16_avx+0x41>
HIDDEN _sk_gather_f16_avx
.globl _sk_gather_f16_avx
@@ -19686,13 +19814,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,170,33,0,0 // vbroadcastss 0x21aa(%rip),%ymm12 # 6b10 <_sk_callback_avx+0x456>
+ .byte 196,98,125,24,37,170,33,0,0 // vbroadcastss 0x21aa(%rip),%ymm12 # 6bd4 <_sk_callback_avx+0x456>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,150,33,0,0 // vbroadcastss 0x2196(%rip),%xmm11 # 6b14 <_sk_callback_avx+0x45a>
+ .byte 196,98,121,24,29,150,33,0,0 // vbroadcastss 0x2196(%rip),%xmm11 # 6bd8 <_sk_callback_avx+0x45a>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,140,33,0,0 // vbroadcastss 0x218c(%rip),%xmm13 # 6b18 <_sk_callback_avx+0x45e>
+ .byte 196,98,121,24,45,140,33,0,0 // vbroadcastss 0x218c(%rip),%xmm13 # 6bdc <_sk_callback_avx+0x45e>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -19706,7 +19834,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,66,33,0,0 // vbroadcastss 0x2142(%rip),%xmm3 # 6b1c <_sk_callback_avx+0x462>
+ .byte 196,226,121,24,29,66,33,0,0 // vbroadcastss 0x2142(%rip),%xmm3 # 6be0 <_sk_callback_avx+0x462>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -19806,12 +19934,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,98,31,0,0 // vbroadcastss 0x1f62(%rip),%ymm9 # 6b20 <_sk_callback_avx+0x466>
+ .byte 196,98,125,24,13,98,31,0,0 // vbroadcastss 0x1f62(%rip),%ymm9 # 6be4 <_sk_callback_avx+0x466>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,71,31,0,0 // vbroadcastss 0x1f47(%rip),%xmm8 # 6b24 <_sk_callback_avx+0x46a>
+ .byte 196,98,121,24,5,71,31,0,0 // vbroadcastss 0x1f47(%rip),%xmm8 # 6be8 <_sk_callback_avx+0x46a>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -19821,7 +19949,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,14,31,0,0 // vbroadcastss 0x1f0e(%rip),%ymm10 # 6b28 <_sk_callback_avx+0x46e>
+ .byte 196,98,125,24,21,14,31,0,0 // vbroadcastss 0x1f0e(%rip),%ymm10 # 6bec <_sk_callback_avx+0x46e>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -19903,7 +20031,7 @@ _sk_store_f16_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 4df8 <_sk_store_f16_avx+0x25e>
+ .byte 117,66 // jne 4ebc <_sk_store_f16_avx+0x25e>
.byte 197,120,17,28,208 // vmovups %xmm11,(%rax,%rdx,8)
.byte 197,120,17,84,208,16 // vmovups %xmm10,0x10(%rax,%rdx,8)
.byte 197,120,17,76,208,32 // vmovups %xmm9,0x20(%rax,%rdx,8)
@@ -19919,22 +20047,22 @@ _sk_store_f16_avx:
.byte 255,224 // jmpq *%rax
.byte 197,121,214,28,208 // vmovq %xmm11,(%rax,%rdx,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,202 // je 4dcd <_sk_store_f16_avx+0x233>
+ .byte 116,202 // je 4e91 <_sk_store_f16_avx+0x233>
.byte 197,121,23,92,208,8 // vmovhpd %xmm11,0x8(%rax,%rdx,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,190 // jb 4dcd <_sk_store_f16_avx+0x233>
+ .byte 114,190 // jb 4e91 <_sk_store_f16_avx+0x233>
.byte 197,121,214,84,208,16 // vmovq %xmm10,0x10(%rax,%rdx,8)
- .byte 116,182 // je 4dcd <_sk_store_f16_avx+0x233>
+ .byte 116,182 // je 4e91 <_sk_store_f16_avx+0x233>
.byte 197,121,23,84,208,24 // vmovhpd %xmm10,0x18(%rax,%rdx,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,170 // jb 4dcd <_sk_store_f16_avx+0x233>
+ .byte 114,170 // jb 4e91 <_sk_store_f16_avx+0x233>
.byte 197,121,214,76,208,32 // vmovq %xmm9,0x20(%rax,%rdx,8)
- .byte 116,162 // je 4dcd <_sk_store_f16_avx+0x233>
+ .byte 116,162 // je 4e91 <_sk_store_f16_avx+0x233>
.byte 197,121,23,76,208,40 // vmovhpd %xmm9,0x28(%rax,%rdx,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,150 // jb 4dcd <_sk_store_f16_avx+0x233>
+ .byte 114,150 // jb 4e91 <_sk_store_f16_avx+0x233>
.byte 197,121,214,68,208,48 // vmovq %xmm8,0x30(%rax,%rdx,8)
- .byte 235,142 // jmp 4dcd <_sk_store_f16_avx+0x233>
+ .byte 235,142 // jmp 4e91 <_sk_store_f16_avx+0x233>
HIDDEN _sk_load_u16_be_avx
.globl _sk_load_u16_be_avx
@@ -19944,7 +20072,7 @@ _sk_load_u16_be_avx:
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,253,0,0,0 // jne 4f52 <_sk_load_u16_be_avx+0x113>
+ .byte 15,133,253,0,0,0 // jne 5016 <_sk_load_u16_be_avx+0x113>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -19966,7 +20094,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,102,28,0,0 // vbroadcastss 0x1c66(%rip),%ymm11 # 6b2c <_sk_callback_avx+0x472>
+ .byte 196,98,125,24,29,102,28,0,0 // vbroadcastss 0x1c66(%rip),%ymm11 # 6bf0 <_sk_callback_avx+0x472>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -20000,29 +20128,29 @@ _sk_load_u16_be_avx:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4fb8 <_sk_load_u16_be_avx+0x179>
+ .byte 116,85 // je 507c <_sk_load_u16_be_avx+0x179>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4fb8 <_sk_load_u16_be_avx+0x179>
+ .byte 114,72 // jb 507c <_sk_load_u16_be_avx+0x179>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4fc5 <_sk_load_u16_be_avx+0x186>
+ .byte 116,72 // je 5089 <_sk_load_u16_be_avx+0x186>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4fc5 <_sk_load_u16_be_avx+0x186>
+ .byte 114,59 // jb 5089 <_sk_load_u16_be_avx+0x186>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,213,254,255,255 // je 4e70 <_sk_load_u16_be_avx+0x31>
+ .byte 15,132,213,254,255,255 // je 4f34 <_sk_load_u16_be_avx+0x31>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,196,254,255,255 // jb 4e70 <_sk_load_u16_be_avx+0x31>
+ .byte 15,130,196,254,255,255 // jb 4f34 <_sk_load_u16_be_avx+0x31>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,184,254,255,255 // jmpq 4e70 <_sk_load_u16_be_avx+0x31>
+ .byte 233,184,254,255,255 // jmpq 4f34 <_sk_load_u16_be_avx+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,171,254,255,255 // jmpq 4e70 <_sk_load_u16_be_avx+0x31>
+ .byte 233,171,254,255,255 // jmpq 4f34 <_sk_load_u16_be_avx+0x31>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,162,254,255,255 // jmpq 4e70 <_sk_load_u16_be_avx+0x31>
+ .byte 233,162,254,255,255 // jmpq 4f34 <_sk_load_u16_be_avx+0x31>
HIDDEN _sk_load_rgb_u16_be_avx
.globl _sk_load_rgb_u16_be_avx
@@ -20032,7 +20160,7 @@ _sk_load_rgb_u16_be_avx:
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,82 // lea (%rdx,%rdx,2),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,243,0,0,0 // jne 50d3 <_sk_load_rgb_u16_be_avx+0x105>
+ .byte 15,133,243,0,0,0 // jne 5197 <_sk_load_rgb_u16_be_avx+0x105>
.byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
.byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
.byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -20059,7 +20187,7 @@ _sk_load_rgb_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,198,26,0,0 // vbroadcastss 0x1ac6(%rip),%ymm11 # 6b30 <_sk_callback_avx+0x476>
+ .byte 196,98,125,24,29,198,26,0,0 // vbroadcastss 0x1ac6(%rip),%ymm11 # 6bf4 <_sk_callback_avx+0x476>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -20080,41 +20208,41 @@ _sk_load_rgb_u16_be_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,99,26,0,0 // vbroadcastss 0x1a63(%rip),%ymm3 # 6b34 <_sk_callback_avx+0x47a>
+ .byte 196,226,125,24,29,99,26,0,0 // vbroadcastss 0x1a63(%rip),%ymm3 # 6bf8 <_sk_callback_avx+0x47a>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
.byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 50ec <_sk_load_rgb_u16_be_avx+0x11e>
- .byte 233,40,255,255,255 // jmpq 5014 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 117,5 // jne 51b0 <_sk_load_rgb_u16_be_avx+0x11e>
+ .byte 233,40,255,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46>
.byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
.byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 511b <_sk_load_rgb_u16_be_avx+0x14d>
+ .byte 114,26 // jb 51df <_sk_load_rgb_u16_be_avx+0x14d>
.byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
.byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 5120 <_sk_load_rgb_u16_be_avx+0x152>
- .byte 233,249,254,255,255 // jmpq 5014 <_sk_load_rgb_u16_be_avx+0x46>
- .byte 233,244,254,255,255 // jmpq 5014 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 117,10 // jne 51e4 <_sk_load_rgb_u16_be_avx+0x152>
+ .byte 233,249,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 233,244,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46>
.byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
.byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 514f <_sk_load_rgb_u16_be_avx+0x181>
+ .byte 114,26 // jb 5213 <_sk_load_rgb_u16_be_avx+0x181>
.byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
.byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 5154 <_sk_load_rgb_u16_be_avx+0x186>
- .byte 233,197,254,255,255 // jmpq 5014 <_sk_load_rgb_u16_be_avx+0x46>
- .byte 233,192,254,255,255 // jmpq 5014 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 117,10 // jne 5218 <_sk_load_rgb_u16_be_avx+0x186>
+ .byte 233,197,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 233,192,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46>
.byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
.byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 517d <_sk_load_rgb_u16_be_avx+0x1af>
+ .byte 114,20 // jb 5241 <_sk_load_rgb_u16_be_avx+0x1af>
.byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
.byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,151,254,255,255 // jmpq 5014 <_sk_load_rgb_u16_be_avx+0x46>
- .byte 233,146,254,255,255 // jmpq 5014 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 233,151,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46>
+ .byte 233,146,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46>
HIDDEN _sk_store_u16_be_avx
.globl _sk_store_u16_be_avx
@@ -20123,7 +20251,7 @@ _sk_store_u16_be_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax
- .byte 196,98,125,24,5,160,25,0,0 // vbroadcastss 0x19a0(%rip),%ymm8 # 6b38 <_sk_callback_avx+0x47e>
+ .byte 196,98,125,24,5,160,25,0,0 // vbroadcastss 0x19a0(%rip),%ymm8 # 6bfc <_sk_callback_avx+0x47e>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -20161,7 +20289,7 @@ _sk_store_u16_be_avx:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 527c <_sk_store_u16_be_avx+0xfa>
+ .byte 117,31 // jne 5340 <_sk_store_u16_be_avx+0xfa>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -20170,22 +20298,22 @@ _sk_store_u16_be_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 5278 <_sk_store_u16_be_avx+0xf6>
+ .byte 116,240 // je 533c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 5278 <_sk_store_u16_be_avx+0xf6>
+ .byte 114,227 // jb 533c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je 5278 <_sk_store_u16_be_avx+0xf6>
+ .byte 116,218 // je 533c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 5278 <_sk_store_u16_be_avx+0xf6>
+ .byte 114,205 // jb 533c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je 5278 <_sk_store_u16_be_avx+0xf6>
+ .byte 116,196 // je 533c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 5278 <_sk_store_u16_be_avx+0xf6>
+ .byte 114,183 // jb 533c <_sk_store_u16_be_avx+0xf6>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp 5278 <_sk_store_u16_be_avx+0xf6>
+ .byte 235,174 // jmp 533c <_sk_store_u16_be_avx+0xf6>
HIDDEN _sk_load_f32_avx
.globl _sk_load_f32_avx
@@ -20193,10 +20321,10 @@ FUNCTION(_sk_load_f32_avx)
_sk_load_f32_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 119,110 // ja 5340 <_sk_load_f32_avx+0x76>
+ .byte 119,110 // ja 5404 <_sk_load_f32_avx+0x76>
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 5368 <_sk_load_f32_avx+0x9e>
+ .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 542c <_sk_load_f32_avx+0x9e>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
@@ -20255,7 +20383,7 @@ _sk_store_f32_avx:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne 53f5 <_sk_store_f32_avx+0x6d>
+ .byte 117,55 // jne 54b9 <_sk_store_f32_avx+0x6d>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -20268,22 +20396,22 @@ _sk_store_f32_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 53f1 <_sk_store_f32_avx+0x69>
+ .byte 116,240 // je 54b5 <_sk_store_f32_avx+0x69>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 53f1 <_sk_store_f32_avx+0x69>
+ .byte 114,227 // jb 54b5 <_sk_store_f32_avx+0x69>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je 53f1 <_sk_store_f32_avx+0x69>
+ .byte 116,218 // je 54b5 <_sk_store_f32_avx+0x69>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 53f1 <_sk_store_f32_avx+0x69>
+ .byte 114,205 // jb 54b5 <_sk_store_f32_avx+0x69>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je 53f1 <_sk_store_f32_avx+0x69>
+ .byte 116,195 // je 54b5 <_sk_store_f32_avx+0x69>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb 53f1 <_sk_store_f32_avx+0x69>
+ .byte 114,181 // jb 54b5 <_sk_store_f32_avx+0x69>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp 53f1 <_sk_store_f32_avx+0x69>
+ .byte 235,171 // jmp 54b5 <_sk_store_f32_avx+0x69>
HIDDEN _sk_clamp_x_avx
.globl _sk_clamp_x_avx
@@ -20372,7 +20500,7 @@ _sk_mirror_x_avx:
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- .byte 197,178,89,5,211,21,0,0 // vmulss 0x15d3(%rip),%xmm9,%xmm0 # 6b3c <_sk_callback_avx+0x482>
+ .byte 197,178,89,5,211,21,0,0 // vmulss 0x15d3(%rip),%xmm9,%xmm0 # 6c00 <_sk_callback_avx+0x482>
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
@@ -20405,7 +20533,7 @@ _sk_mirror_y_avx:
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- .byte 197,178,89,13,78,21,0,0 // vmulss 0x154e(%rip),%xmm9,%xmm1 # 6b40 <_sk_callback_avx+0x486>
+ .byte 197,178,89,13,78,21,0,0 // vmulss 0x154e(%rip),%xmm9,%xmm1 # 6c04 <_sk_callback_avx+0x486>
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
@@ -20431,7 +20559,7 @@ FUNCTION(_sk_clamp_x_1_avx)
_sk_clamp_x_1_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,236,20,0,0 // vbroadcastss 0x14ec(%rip),%ymm8 # 6b44 <_sk_callback_avx+0x48a>
+ .byte 196,98,125,24,5,236,20,0,0 // vbroadcastss 0x14ec(%rip),%ymm8 # 6c08 <_sk_callback_avx+0x48a>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -20449,9 +20577,9 @@ HIDDEN _sk_mirror_x_1_avx
.globl _sk_mirror_x_1_avx
FUNCTION(_sk_mirror_x_1_avx)
_sk_mirror_x_1_avx:
- .byte 196,98,125,24,5,207,20,0,0 // vbroadcastss 0x14cf(%rip),%ymm8 # 6b48 <_sk_callback_avx+0x48e>
+ .byte 196,98,125,24,5,207,20,0,0 // vbroadcastss 0x14cf(%rip),%ymm8 # 6c0c <_sk_callback_avx+0x48e>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,197,20,0,0 // vbroadcastss 0x14c5(%rip),%ymm9 # 6b4c <_sk_callback_avx+0x492>
+ .byte 196,98,125,24,13,197,20,0,0 // vbroadcastss 0x14c5(%rip),%ymm9 # 6c10 <_sk_callback_avx+0x492>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -20467,12 +20595,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,149,20,0,0 // vbroadcastss 0x1495(%rip),%ymm3 # 6b50 <_sk_callback_avx+0x496>
+ .byte 196,226,125,24,29,149,20,0,0 // vbroadcastss 0x1495(%rip),%ymm3 # 6c14 <_sk_callback_avx+0x496>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,140,20,0,0 // vbroadcastss 0x148c(%rip),%ymm3 # 6b54 <_sk_callback_avx+0x49a>
+ .byte 196,226,125,24,29,140,20,0,0 // vbroadcastss 0x148c(%rip),%ymm3 # 6c18 <_sk_callback_avx+0x49a>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,127,20,0,0 // vbroadcastss 0x147f(%rip),%ymm1 # 6b58 <_sk_callback_avx+0x49e>
+ .byte 196,226,125,24,13,127,20,0,0 // vbroadcastss 0x147f(%rip),%ymm1 # 6c1c <_sk_callback_avx+0x49e>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -20692,9 +20820,9 @@ _sk_evenly_spaced_gradient_avx:
.byte 72,139,24 // mov (%rax),%rbx
.byte 72,139,104,8 // mov 0x8(%rax),%rbp
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 5a35 <_sk_evenly_spaced_gradient_avx+0x25>
+ .byte 120,7 // js 5af9 <_sk_evenly_spaced_gradient_avx+0x25>
.byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1
- .byte 235,21 // jmp 5a4a <_sk_evenly_spaced_gradient_avx+0x3a>
+ .byte 235,21 // jmp 5b0e <_sk_evenly_spaced_gradient_avx+0x3a>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -20852,18 +20980,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx
.globl _sk_gauss_a_to_rgba_avx
FUNCTION(_sk_gauss_a_to_rgba_avx)
_sk_gauss_a_to_rgba_avx:
- .byte 196,226,125,24,5,174,13,0,0 // vbroadcastss 0xdae(%rip),%ymm0 # 6b5c <_sk_callback_avx+0x4a2>
+ .byte 196,226,125,24,5,174,13,0,0 // vbroadcastss 0xdae(%rip),%ymm0 # 6c20 <_sk_callback_avx+0x4a2>
.byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
- .byte 196,226,125,24,13,165,13,0,0 // vbroadcastss 0xda5(%rip),%ymm1 # 6b60 <_sk_callback_avx+0x4a6>
+ .byte 196,226,125,24,13,165,13,0,0 // vbroadcastss 0xda5(%rip),%ymm1 # 6c24 <_sk_callback_avx+0x4a6>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,152,13,0,0 // vbroadcastss 0xd98(%rip),%ymm1 # 6b64 <_sk_callback_avx+0x4aa>
+ .byte 196,226,125,24,13,152,13,0,0 // vbroadcastss 0xd98(%rip),%ymm1 # 6c28 <_sk_callback_avx+0x4aa>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,139,13,0,0 // vbroadcastss 0xd8b(%rip),%ymm1 # 6b68 <_sk_callback_avx+0x4ae>
+ .byte 196,226,125,24,13,139,13,0,0 // vbroadcastss 0xd8b(%rip),%ymm1 # 6c2c <_sk_callback_avx+0x4ae>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,126,13,0,0 // vbroadcastss 0xd7e(%rip),%ymm1 # 6b6c <_sk_callback_avx+0x4b2>
+ .byte 196,226,125,24,13,126,13,0,0 // vbroadcastss 0xd7e(%rip),%ymm1 # 6c30 <_sk_callback_avx+0x4b2>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -20886,12 +21014,12 @@ _sk_gradient_avx:
.byte 76,139,8 // mov (%rax),%r9
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,80 // jb 5e71 <_sk_gradient_avx+0x6f>
+ .byte 114,80 // jb 5f35 <_sk_gradient_avx+0x6f>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
- .byte 196,98,125,24,21,54,13,0,0 // vbroadcastss 0xd36(%rip),%ymm10 # 6b70 <_sk_callback_avx+0x4b6>
+ .byte 196,98,125,24,21,54,13,0,0 // vbroadcastss 0xd36(%rip),%ymm10 # 6c34 <_sk_callback_avx+0x4b6>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8
.byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8
@@ -20903,7 +21031,7 @@ _sk_gradient_avx:
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,205 // jne 5e3e <_sk_gradient_avx+0x3c>
+ .byte 117,205 // jne 5f02 <_sk_gradient_avx+0x3c>
.byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -21086,27 +21214,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,44,9,0,0 // vbroadcastss 0x92c(%rip),%ymm13 # 6b74 <_sk_callback_avx+0x4ba>
+ .byte 196,98,125,24,45,44,9,0,0 // vbroadcastss 0x92c(%rip),%ymm13 # 6c38 <_sk_callback_avx+0x4ba>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,34,9,0,0 // vbroadcastss 0x922(%rip),%ymm14 # 6b78 <_sk_callback_avx+0x4be>
+ .byte 196,98,125,24,53,34,9,0,0 // vbroadcastss 0x922(%rip),%ymm14 # 6c3c <_sk_callback_avx+0x4be>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,19,9,0,0 // vbroadcastss 0x913(%rip),%ymm14 # 6b7c <_sk_callback_avx+0x4c2>
+ .byte 196,98,125,24,53,19,9,0,0 // vbroadcastss 0x913(%rip),%ymm14 # 6c40 <_sk_callback_avx+0x4c2>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,4,9,0,0 // vbroadcastss 0x904(%rip),%ymm13 # 6b80 <_sk_callback_avx+0x4c6>
+ .byte 196,98,125,24,45,4,9,0,0 // vbroadcastss 0x904(%rip),%ymm13 # 6c44 <_sk_callback_avx+0x4c6>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,239,8,0,0 // vbroadcastss 0x8ef(%rip),%ymm10 # 6b84 <_sk_callback_avx+0x4ca>
+ .byte 196,98,125,24,21,239,8,0,0 // vbroadcastss 0x8ef(%rip),%ymm10 # 6c48 <_sk_callback_avx+0x4ca>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,217,8,0,0 // vbroadcastss 0x8d9(%rip),%ymm10 # 6b88 <_sk_callback_avx+0x4ce>
+ .byte 196,98,125,24,21,217,8,0,0 // vbroadcastss 0x8d9(%rip),%ymm10 # 6c4c <_sk_callback_avx+0x4ce>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,195,8,0,0 // vbroadcastss 0x8c3(%rip),%ymm10 # 6b8c <_sk_callback_avx+0x4d2>
+ .byte 196,98,125,24,21,195,8,0,0 // vbroadcastss 0x8c3(%rip),%ymm10 # 6c50 <_sk_callback_avx+0x4d2>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -21130,7 +21258,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,141,8,0,0 // vbroadcastss 0x88d(%rip),%ymm8 # 6b90 <_sk_callback_avx+0x4d6>
+ .byte 196,98,125,24,5,141,8,0,0 // vbroadcastss 0x88d(%rip),%ymm8 # 6c54 <_sk_callback_avx+0x4d6>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -21167,9 +21295,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,25,8,0,0 // vbroadcastss 0x819(%rip),%ymm0 # 6b94 <_sk_callback_avx+0x4da>
+ .byte 196,226,125,24,5,25,8,0,0 // vbroadcastss 0x819(%rip),%ymm0 # 6c58 <_sk_callback_avx+0x4da>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,16,8,0,0 // vbroadcastss 0x810(%rip),%ymm8 # 6b98 <_sk_callback_avx+0x4de>
+ .byte 196,98,125,24,5,16,8,0,0 // vbroadcastss 0x810(%rip),%ymm8 # 6c5c <_sk_callback_avx+0x4de>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -21180,7 +21308,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,248,7,0,0 // vbroadcastss 0x7f8(%rip),%ymm0 # 6b9c <_sk_callback_avx+0x4e2>
+ .byte 196,226,125,24,5,248,7,0,0 // vbroadcastss 0x7f8(%rip),%ymm0 # 6c60 <_sk_callback_avx+0x4e2>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -21192,9 +21320,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,220,7,0,0 // vbroadcastss 0x7dc(%rip),%ymm1 # 6ba0 <_sk_callback_avx+0x4e6>
+ .byte 196,226,125,24,13,220,7,0,0 // vbroadcastss 0x7dc(%rip),%ymm1 # 6c64 <_sk_callback_avx+0x4e6>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,210,7,0,0 // vbroadcastss 0x7d2(%rip),%ymm8 # 6ba4 <_sk_callback_avx+0x4ea>
+ .byte 196,98,125,24,5,210,7,0,0 // vbroadcastss 0x7d2(%rip),%ymm8 # 6c68 <_sk_callback_avx+0x4ea>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -21205,7 +21333,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,186,7,0,0 // vbroadcastss 0x7ba(%rip),%ymm1 # 6ba8 <_sk_callback_avx+0x4ee>
+ .byte 196,226,125,24,13,186,7,0,0 // vbroadcastss 0x7ba(%rip),%ymm1 # 6c6c <_sk_callback_avx+0x4ee>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -21217,14 +21345,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,157,7,0,0 // vbroadcastss 0x79d(%rip),%ymm0 # 6bac <_sk_callback_avx+0x4f2>
+ .byte 196,226,125,24,5,157,7,0,0 // vbroadcastss 0x79d(%rip),%ymm0 # 6c70 <_sk_callback_avx+0x4f2>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,148,7,0,0 // vbroadcastss 0x794(%rip),%ymm8 # 6bb0 <_sk_callback_avx+0x4f6>
+ .byte 196,98,125,24,5,148,7,0,0 // vbroadcastss 0x794(%rip),%ymm8 # 6c74 <_sk_callback_avx+0x4f6>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,133,7,0,0 // vbroadcastss 0x785(%rip),%ymm10 # 6bb4 <_sk_callback_avx+0x4fa>
+ .byte 196,98,125,24,21,133,7,0,0 // vbroadcastss 0x785(%rip),%ymm10 # 6c78 <_sk_callback_avx+0x4fa>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,123,7,0,0 // vbroadcastss 0x77b(%rip),%ymm10 # 6bb8 <_sk_callback_avx+0x4fe>
+ .byte 196,98,125,24,21,123,7,0,0 // vbroadcastss 0x77b(%rip),%ymm10 # 6c7c <_sk_callback_avx+0x4fe>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -21236,19 +21364,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,94,7,0,0 // vbroadcastss 0x75e(%rip),%ymm0 # 6bbc <_sk_callback_avx+0x502>
+ .byte 196,226,125,24,5,94,7,0,0 // vbroadcastss 0x75e(%rip),%ymm0 # 6c80 <_sk_callback_avx+0x502>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,85,7,0,0 // vbroadcastss 0x755(%rip),%ymm8 # 6bc0 <_sk_callback_avx+0x506>
+ .byte 196,98,125,24,5,85,7,0,0 // vbroadcastss 0x755(%rip),%ymm8 # 6c84 <_sk_callback_avx+0x506>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,75,7,0,0 // vbroadcastss 0x74b(%rip),%ymm9 # 6bc4 <_sk_callback_avx+0x50a>
+ .byte 196,98,125,24,13,75,7,0,0 // vbroadcastss 0x74b(%rip),%ymm9 # 6c88 <_sk_callback_avx+0x50a>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,65,7,0,0 // vbroadcastss 0x741(%rip),%ymm10 # 6bc8 <_sk_callback_avx+0x50e>
+ .byte 196,98,125,24,21,65,7,0,0 // vbroadcastss 0x741(%rip),%ymm10 # 6c8c <_sk_callback_avx+0x50e>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,50,7,0,0 // vbroadcastss 0x732(%rip),%ymm10 # 6bcc <_sk_callback_avx+0x512>
+ .byte 196,98,125,24,21,50,7,0,0 // vbroadcastss 0x732(%rip),%ymm10 # 6c90 <_sk_callback_avx+0x512>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,35,7,0,0 // vbroadcastss 0x723(%rip),%ymm9 # 6bd0 <_sk_callback_avx+0x516>
+ .byte 196,98,125,24,13,35,7,0,0 // vbroadcastss 0x723(%rip),%ymm9 # 6c94 <_sk_callback_avx+0x516>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -21259,17 +21387,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,11,7,0,0 // vbroadcastss 0x70b(%rip),%ymm8 # 6bd4 <_sk_callback_avx+0x51a>
+ .byte 196,98,125,24,5,11,7,0,0 // vbroadcastss 0x70b(%rip),%ymm8 # 6c98 <_sk_callback_avx+0x51a>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,253,6,0,0 // vbroadcastss 0x6fd(%rip),%ymm10 # 6bd8 <_sk_callback_avx+0x51e>
+ .byte 196,98,125,24,21,253,6,0,0 // vbroadcastss 0x6fd(%rip),%ymm10 # 6c9c <_sk_callback_avx+0x51e>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm11 # 6bdc <_sk_callback_avx+0x522>
+ .byte 196,98,125,24,29,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm11 # 6ca0 <_sk_callback_avx+0x522>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm9 # 6be0 <_sk_callback_avx+0x526>
+ .byte 196,98,125,24,13,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm9 # 6ca4 <_sk_callback_avx+0x526>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -21280,13 +21408,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,194,6,0,0 // vbroadcastss 0x6c2(%rip),%ymm0 # 6be4 <_sk_callback_avx+0x52a>
+ .byte 196,226,125,24,5,194,6,0,0 // vbroadcastss 0x6c2(%rip),%ymm0 # 6ca8 <_sk_callback_avx+0x52a>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,175,6,0,0 // vbroadcastss 0x6af(%rip),%ymm10 # 6be8 <_sk_callback_avx+0x52e>
+ .byte 196,98,125,24,21,175,6,0,0 // vbroadcastss 0x6af(%rip),%ymm10 # 6cac <_sk_callback_avx+0x52e>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,165,6,0,0 // vbroadcastss 0x6a5(%rip),%ymm10 # 6bec <_sk_callback_avx+0x532>
+ .byte 196,98,125,24,21,165,6,0,0 // vbroadcastss 0x6a5(%rip),%ymm10 # 6cb0 <_sk_callback_avx+0x532>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -21298,14 +21426,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,136,6,0,0 // vbroadcastss 0x688(%rip),%ymm1 # 6bf0 <_sk_callback_avx+0x536>
+ .byte 196,226,125,24,13,136,6,0,0 // vbroadcastss 0x688(%rip),%ymm1 # 6cb4 <_sk_callback_avx+0x536>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,126,6,0,0 // vbroadcastss 0x67e(%rip),%ymm8 # 6bf4 <_sk_callback_avx+0x53a>
+ .byte 196,98,125,24,5,126,6,0,0 // vbroadcastss 0x67e(%rip),%ymm8 # 6cb8 <_sk_callback_avx+0x53a>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,111,6,0,0 // vbroadcastss 0x66f(%rip),%ymm10 # 6bf8 <_sk_callback_avx+0x53e>
+ .byte 196,98,125,24,21,111,6,0,0 // vbroadcastss 0x66f(%rip),%ymm10 # 6cbc <_sk_callback_avx+0x53e>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,101,6,0,0 // vbroadcastss 0x665(%rip),%ymm10 # 6bfc <_sk_callback_avx+0x542>
+ .byte 196,98,125,24,21,101,6,0,0 // vbroadcastss 0x665(%rip),%ymm10 # 6cc0 <_sk_callback_avx+0x542>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -21317,19 +21445,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,72,6,0,0 // vbroadcastss 0x648(%rip),%ymm1 # 6c00 <_sk_callback_avx+0x546>
+ .byte 196,226,125,24,13,72,6,0,0 // vbroadcastss 0x648(%rip),%ymm1 # 6cc4 <_sk_callback_avx+0x546>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,62,6,0,0 // vbroadcastss 0x63e(%rip),%ymm8 # 6c04 <_sk_callback_avx+0x54a>
+ .byte 196,98,125,24,5,62,6,0,0 // vbroadcastss 0x63e(%rip),%ymm8 # 6cc8 <_sk_callback_avx+0x54a>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,52,6,0,0 // vbroadcastss 0x634(%rip),%ymm9 # 6c08 <_sk_callback_avx+0x54e>
+ .byte 196,98,125,24,13,52,6,0,0 // vbroadcastss 0x634(%rip),%ymm9 # 6ccc <_sk_callback_avx+0x54e>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,42,6,0,0 // vbroadcastss 0x62a(%rip),%ymm10 # 6c0c <_sk_callback_avx+0x552>
+ .byte 196,98,125,24,21,42,6,0,0 // vbroadcastss 0x62a(%rip),%ymm10 # 6cd0 <_sk_callback_avx+0x552>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,27,6,0,0 // vbroadcastss 0x61b(%rip),%ymm10 # 6c10 <_sk_callback_avx+0x556>
+ .byte 196,98,125,24,21,27,6,0,0 // vbroadcastss 0x61b(%rip),%ymm10 # 6cd4 <_sk_callback_avx+0x556>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,12,6,0,0 // vbroadcastss 0x60c(%rip),%ymm9 # 6c14 <_sk_callback_avx+0x55a>
+ .byte 196,98,125,24,13,12,6,0,0 // vbroadcastss 0x60c(%rip),%ymm9 # 6cd8 <_sk_callback_avx+0x55a>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -21340,17 +21468,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,244,5,0,0 // vbroadcastss 0x5f4(%rip),%ymm8 # 6c18 <_sk_callback_avx+0x55e>
+ .byte 196,98,125,24,5,244,5,0,0 // vbroadcastss 0x5f4(%rip),%ymm8 # 6cdc <_sk_callback_avx+0x55e>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,229,5,0,0 // vbroadcastss 0x5e5(%rip),%ymm10 # 6c1c <_sk_callback_avx+0x562>
+ .byte 196,98,125,24,21,229,5,0,0 // vbroadcastss 0x5e5(%rip),%ymm10 # 6ce0 <_sk_callback_avx+0x562>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,219,5,0,0 // vbroadcastss 0x5db(%rip),%ymm11 # 6c20 <_sk_callback_avx+0x566>
+ .byte 196,98,125,24,29,219,5,0,0 // vbroadcastss 0x5db(%rip),%ymm11 # 6ce4 <_sk_callback_avx+0x566>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,194,5,0,0 // vbroadcastss 0x5c2(%rip),%ymm9 # 6c24 <_sk_callback_avx+0x56a>
+ .byte 196,98,125,24,13,194,5,0,0 // vbroadcastss 0x5c2(%rip),%ymm9 # 6ce8 <_sk_callback_avx+0x56a>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -21361,13 +21489,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,170,5,0,0 // vbroadcastss 0x5aa(%rip),%ymm1 # 6c28 <_sk_callback_avx+0x56e>
+ .byte 196,226,125,24,13,170,5,0,0 // vbroadcastss 0x5aa(%rip),%ymm1 # 6cec <_sk_callback_avx+0x56e>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,150,5,0,0 // vbroadcastss 0x596(%rip),%ymm10 # 6c2c <_sk_callback_avx+0x572>
+ .byte 196,98,125,24,21,150,5,0,0 // vbroadcastss 0x596(%rip),%ymm10 # 6cf0 <_sk_callback_avx+0x572>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,140,5,0,0 // vbroadcastss 0x58c(%rip),%ymm10 # 6c30 <_sk_callback_avx+0x576>
+ .byte 196,98,125,24,21,140,5,0,0 // vbroadcastss 0x58c(%rip),%ymm10 # 6cf4 <_sk_callback_avx+0x576>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -21497,25 +21625,25 @@ BALIGN4
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 68ad <.literal4+0xb1>
+ .byte 71,225,61 // rex.RXB loope 6971 <.literal4+0xb1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 68bd <.literal4+0xc1>
+ .byte 71,225,61 // rex.RXB loope 6981 <.literal4+0xc1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 68cd <.literal4+0xd1>
+ .byte 71,225,61 // rex.RXB loope 6991 <.literal4+0xd1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,154 // cmpb $0x9a,(%rdi)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 68dd <.literal4+0xe1>
+ .byte 71,225,61 // rex.RXB loope 69a1 <.literal4+0xe1>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
@@ -21567,7 +21695,7 @@ BALIGN4
.byte 190,129,128,128,59 // mov $0x3b808081,%esi
.byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6931 <.literal4+0x135>
+ .byte 224,7 // loopne 69f5 <.literal4+0x135>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -21583,10 +21711,10 @@ BALIGN4
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 6958 <.literal4+0x15c>
+ .byte 127,0 // jg 6a1c <.literal4+0x15c>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 69d1 <.literal4+0x1d5>
+ .byte 119,115 // ja 6a95 <.literal4+0x1d5>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -21600,10 +21728,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 698c <.literal4+0x190>
+ .byte 127,0 // jg 6a50 <.literal4+0x190>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6a05 <.literal4+0x209>
+ .byte 119,115 // ja 6ac9 <.literal4+0x209>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -21617,10 +21745,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 69c0 <.literal4+0x1c4>
+ .byte 127,0 // jg 6a84 <.literal4+0x1c4>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6a39 <.literal4+0x23d>
+ .byte 119,115 // ja 6afd <.literal4+0x23d>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -21634,10 +21762,10 @@ BALIGN4
.byte 0,128,63,0,0,0 // add %al,0x3f(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 69f4 <.literal4+0x1f8>
+ .byte 127,0 // jg 6ab8 <.literal4+0x1f8>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 6a6d <.literal4+0x271>
+ .byte 119,115 // ja 6b31 <.literal4+0x271>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -21650,7 +21778,7 @@ BALIGN4
.byte 0,75,0 // add %cl,0x0(%rbx)
.byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax)
.byte 66,0,0 // rex.X add %al,(%rax)
- .byte 127,67 // jg 6a6b <.literal4+0x26f>
+ .byte 127,67 // jg 6b2f <.literal4+0x26f>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -21662,10 +21790,10 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6a8b <.literal4+0x28f>
+ .byte 118,63 // jbe 6b4f <.literal4+0x28f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
- .byte 127,67 // jg 6a9f <.literal4+0x2a3>
+ .byte 127,67 // jg 6b63 <.literal4+0x2a3>
.byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax)
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax)
@@ -21674,7 +21802,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6a81 <.literal4+0x285>
+ .byte 224,7 // loopne 6b45 <.literal4+0x285>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -21686,7 +21814,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6a9d <.literal4+0x2a1>
+ .byte 224,7 // loopne 6b61 <.literal4+0x2a1>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -21697,7 +21825,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 6af2 <.literal4+0x2f6>
+ .byte 124,66 // jl 6bb6 <.literal4+0x2f6>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -21715,9 +21843,9 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 6b35 <.literal4+0x339>
+ .byte 112,65 // jo 6bf9 <.literal4+0x339>
.byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax)
- .byte 127,67 // jg 6b43 <.literal4+0x347>
+ .byte 127,67 // jg 6c07 <.literal4+0x347>
.byte 0,128,0,0,0,0 // add %al,0x0(%rax)
.byte 0,128,0,4,0,128 // add %al,-0x7ffffc00(%rax)
.byte 0,0 // add %al,(%rax)
@@ -21733,7 +21861,7 @@ BALIGN4
.byte 0,128,55,0,0,128 // add %al,-0x7fffffc9(%rax)
.byte 63 // (bad)
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 6b83 <.literal4+0x387>
+ .byte 127,71 // jg 6c47 <.literal4+0x387>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -21906,6 +22034,22 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
+ .byte 0,2 // add %al,(%rdx)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,2 // add %al,(%rdx)
+ .byte 4,6 // add $0x6,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
@@ -22120,7 +22264,7 @@ _sk_seed_shader_sse41:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,124,80,0,0 // movaps 0x507c(%rip),%xmm2 # 5150 <_sk_callback_sse41+0xf7>
+ .byte 15,40,21,236,80,0,0 // movaps 0x50ec(%rip),%xmm2 # 51c0 <_sk_callback_sse41+0xfd>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -22129,7 +22273,7 @@ _sk_seed_shader_sse41:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,107,80,0,0 // movaps 0x506b(%rip),%xmm2 # 5160 <_sk_callback_sse41+0x107>
+ .byte 15,40,21,219,80,0,0 // movaps 0x50db(%rip),%xmm2 # 51d0 <_sk_callback_sse41+0x10d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -22149,14 +22293,14 @@ _sk_dither_sse41:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,57,80,0,0 // movdqa 0x5039(%rip),%xmm10 # 5170 <_sk_callback_sse41+0x117>
+ .byte 102,68,15,111,21,169,80,0,0 // movdqa 0x50a9(%rip),%xmm10 # 51e0 <_sk_callback_sse41+0x11d>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,37,80,0,0 // movdqa 0x5025(%rip),%xmm12 # 5180 <_sk_callback_sse41+0x127>
- .byte 102,68,15,111,45,44,80,0,0 // movdqa 0x502c(%rip),%xmm13 # 5190 <_sk_callback_sse41+0x137>
+ .byte 102,68,15,111,37,149,80,0,0 // movdqa 0x5095(%rip),%xmm12 # 51f0 <_sk_callback_sse41+0x12d>
+ .byte 102,68,15,111,45,156,80,0,0 // movdqa 0x509c(%rip),%xmm13 # 5200 <_sk_callback_sse41+0x13d>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -22172,8 +22316,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,231,79,0,0 // mulps 0x4fe7(%rip),%xmm8 # 51a0 <_sk_callback_sse41+0x147>
- .byte 68,15,88,5,239,79,0,0 // addps 0x4fef(%rip),%xmm8 # 51b0 <_sk_callback_sse41+0x157>
+ .byte 68,15,89,5,87,80,0,0 // mulps 0x5057(%rip),%xmm8 # 5210 <_sk_callback_sse41+0x14d>
+ .byte 68,15,88,5,95,80,0,0 // addps 0x505f(%rip),%xmm8 # 5220 <_sk_callback_sse41+0x15d>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -22250,7 +22394,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,73,79,0,0 // movaps 0x4f49(%rip),%xmm8 # 51c0 <_sk_callback_sse41+0x167>
+ .byte 68,15,40,5,185,79,0,0 // movaps 0x4fb9(%rip),%xmm8 # 5230 <_sk_callback_sse41+0x16d>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -22275,7 +22419,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,12,79,0,0 // movaps 0x4f0c(%rip),%xmm9 # 51d0 <_sk_callback_sse41+0x177>
+ .byte 68,15,40,13,124,79,0,0 // movaps 0x4f7c(%rip),%xmm9 # 5240 <_sk_callback_sse41+0x17d>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -22322,7 +22466,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,176,78,0,0 // movaps 0x4eb0(%rip),%xmm8 # 51e0 <_sk_callback_sse41+0x187>
+ .byte 68,15,40,5,32,79,0,0 // movaps 0x4f20(%rip),%xmm8 # 5250 <_sk_callback_sse41+0x18d>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -22335,7 +22479,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,160,78,0,0 // movaps 0x4ea0(%rip),%xmm8 # 51f0 <_sk_callback_sse41+0x197>
+ .byte 68,15,40,5,16,79,0,0 // movaps 0x4f10(%rip),%xmm8 # 5260 <_sk_callback_sse41+0x19d>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -22352,7 +22496,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,131,78,0,0 // movaps 0x4e83(%rip),%xmm8 # 5200 <_sk_callback_sse41+0x1a7>
+ .byte 68,15,40,5,243,78,0,0 // movaps 0x4ef3(%rip),%xmm8 # 5270 <_sk_callback_sse41+0x1ad>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -22372,7 +22516,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,87,78,0,0 // movaps 0x4e57(%rip),%xmm8 # 5210 <_sk_callback_sse41+0x1b7>
+ .byte 68,15,40,5,199,78,0,0 // movaps 0x4ec7(%rip),%xmm8 # 5280 <_sk_callback_sse41+0x1bd>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -22400,7 +22544,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,43,78,0,0 // movaps 0x4e2b(%rip),%xmm8 # 5220 <_sk_callback_sse41+0x1c7>
+ .byte 68,15,40,5,155,78,0,0 // movaps 0x4e9b(%rip),%xmm8 # 5290 <_sk_callback_sse41+0x1cd>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -22475,7 +22619,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,96,77,0,0 // movaps 0x4d60(%rip),%xmm3 # 5230 <_sk_callback_sse41+0x1d7>
+ .byte 15,40,29,208,77,0,0 // movaps 0x4dd0(%rip),%xmm3 # 52a0 <_sk_callback_sse41+0x1dd>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -22523,7 +22667,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,203,76,0,0 // movaps 0x4ccb(%rip),%xmm2 # 5240 <_sk_callback_sse41+0x1e7>
+ .byte 15,40,21,59,77,0,0 // movaps 0x4d3b(%rip),%xmm2 # 52b0 <_sk_callback_sse41+0x1ed>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -22557,7 +22701,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,112,76,0,0 // movaps 0x4c70(%rip),%xmm2 # 5250 <_sk_callback_sse41+0x1f7>
+ .byte 15,40,21,224,76,0,0 // movaps 0x4ce0(%rip),%xmm2 # 52c0 <_sk_callback_sse41+0x1fd>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -22594,7 +22738,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,10,76,0,0 // movaps 0x4c0a(%rip),%xmm2 # 5260 <_sk_callback_sse41+0x207>
+ .byte 15,40,21,122,76,0,0 // movaps 0x4c7a(%rip),%xmm2 # 52d0 <_sk_callback_sse41+0x20d>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -22622,7 +22766,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,202,75,0,0 // movaps 0x4bca(%rip),%xmm2 # 5270 <_sk_callback_sse41+0x217>
+ .byte 15,40,21,58,76,0,0 // movaps 0x4c3a(%rip),%xmm2 # 52e0 <_sk_callback_sse41+0x21d>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -22635,7 +22779,7 @@ HIDDEN _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,189,75,0,0 // movaps 0x4bbd(%rip),%xmm10 # 5280 <_sk_callback_sse41+0x227>
+ .byte 68,15,40,21,45,76,0,0 // movaps 0x4c2d(%rip),%xmm10 # 52f0 <_sk_callback_sse41+0x22d>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,203 // movaps %xmm11,%xmm9
@@ -22717,7 +22861,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,155,74,0,0 // movaps 0x4a9b(%rip),%xmm10 # 5290 <_sk_callback_sse41+0x237>
+ .byte 68,15,40,21,11,75,0,0 // movaps 0x4b0b(%rip),%xmm10 # 5300 <_sk_callback_sse41+0x23d>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -22799,7 +22943,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,116,73,0,0 // movaps 0x4974(%rip),%xmm10 # 52a0 <_sk_callback_sse41+0x247>
+ .byte 68,15,40,21,228,73,0,0 // movaps 0x49e4(%rip),%xmm10 # 5310 <_sk_callback_sse41+0x24d>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -22882,7 +23026,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,89,72,0,0 // movaps 0x4859(%rip),%xmm10 # 52b0 <_sk_callback_sse41+0x257>
+ .byte 68,15,40,21,201,72,0,0 // movaps 0x48c9(%rip),%xmm10 # 5320 <_sk_callback_sse41+0x25d>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -22967,7 +23111,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,48,71,0,0 // movaps 0x4730(%rip),%xmm1 # 52c0 <_sk_callback_sse41+0x267>
+ .byte 15,40,13,160,71,0,0 // movaps 0x47a0(%rip),%xmm1 # 5330 <_sk_callback_sse41+0x26d>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -22980,10 +23124,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,14,71,0,0 // movaps 0x470e(%rip),%xmm13 # 52d0 <_sk_callback_sse41+0x277>
+ .byte 68,15,40,45,126,71,0,0 // movaps 0x477e(%rip),%xmm13 # 5340 <_sk_callback_sse41+0x27d>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,14,71,0,0 // movaps 0x470e(%rip),%xmm12 # 52e0 <_sk_callback_sse41+0x287>
+ .byte 68,15,40,37,126,71,0,0 // movaps 0x477e(%rip),%xmm12 # 5350 <_sk_callback_sse41+0x28d>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -23169,12 +23313,12 @@ _sk_hue_sse41:
.byte 68,15,84,208 // andps %xmm0,%xmm10
.byte 15,84,200 // andps %xmm0,%xmm1
.byte 68,15,84,232 // andps %xmm0,%xmm13
- .byte 15,40,5,121,68,0,0 // movaps 0x4479(%rip),%xmm0 # 52f0 <_sk_callback_sse41+0x297>
+ .byte 15,40,5,233,68,0,0 // movaps 0x44e9(%rip),%xmm0 # 5360 <_sk_callback_sse41+0x29d>
.byte 68,15,89,224 // mulps %xmm0,%xmm12
- .byte 15,40,21,126,68,0,0 // movaps 0x447e(%rip),%xmm2 # 5300 <_sk_callback_sse41+0x2a7>
+ .byte 15,40,21,238,68,0,0 // movaps 0x44ee(%rip),%xmm2 # 5370 <_sk_callback_sse41+0x2ad>
.byte 15,89,250 // mulps %xmm2,%xmm7
.byte 65,15,88,252 // addps %xmm12,%xmm7
- .byte 68,15,40,53,127,68,0,0 // movaps 0x447f(%rip),%xmm14 # 5310 <_sk_callback_sse41+0x2b7>
+ .byte 68,15,40,53,239,68,0,0 // movaps 0x44ef(%rip),%xmm14 # 5380 <_sk_callback_sse41+0x2bd>
.byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,255 // addps %xmm7,%xmm15
@@ -23257,7 +23401,7 @@ _sk_hue_sse41:
.byte 65,15,88,214 // addps %xmm14,%xmm2
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,40,13,67,67,0,0 // movaps 0x4343(%rip),%xmm9 # 5320 <_sk_callback_sse41+0x2c7>
+ .byte 68,15,40,13,179,67,0,0 // movaps 0x43b3(%rip),%xmm9 # 5390 <_sk_callback_sse41+0x2cd>
.byte 65,15,40,225 // movaps %xmm9,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
@@ -23351,14 +23495,14 @@ _sk_saturation_sse41:
.byte 68,15,84,215 // andps %xmm7,%xmm10
.byte 68,15,84,223 // andps %xmm7,%xmm11
.byte 68,15,84,199 // andps %xmm7,%xmm8
- .byte 15,40,21,253,65,0,0 // movaps 0x41fd(%rip),%xmm2 # 5330 <_sk_callback_sse41+0x2d7>
+ .byte 15,40,21,109,66,0,0 // movaps 0x426d(%rip),%xmm2 # 53a0 <_sk_callback_sse41+0x2dd>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,40,13,0,66,0,0 // movaps 0x4200(%rip),%xmm1 # 5340 <_sk_callback_sse41+0x2e7>
+ .byte 15,40,13,112,66,0,0 // movaps 0x4270(%rip),%xmm1 # 53b0 <_sk_callback_sse41+0x2ed>
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,251 // addps %xmm3,%xmm7
- .byte 68,15,40,45,255,65,0,0 // movaps 0x41ff(%rip),%xmm13 # 5350 <_sk_callback_sse41+0x2f7>
+ .byte 68,15,40,45,111,66,0,0 // movaps 0x426f(%rip),%xmm13 # 53c0 <_sk_callback_sse41+0x2fd>
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 68,15,88,247 // addps %xmm7,%xmm14
.byte 65,15,40,218 // movaps %xmm10,%xmm3
@@ -23439,7 +23583,7 @@ _sk_saturation_sse41:
.byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
- .byte 68,15,40,13,197,64,0,0 // movaps 0x40c5(%rip),%xmm9 # 5360 <_sk_callback_sse41+0x307>
+ .byte 68,15,40,13,53,65,0,0 // movaps 0x4135(%rip),%xmm9 # 53d0 <_sk_callback_sse41+0x30d>
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 68,15,92,204 // subps %xmm4,%xmm9
.byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
@@ -23494,14 +23638,14 @@ _sk_color_sse41:
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 68,15,89,244 // mulps %xmm4,%xmm14
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 68,15,40,13,16,64,0,0 // movaps 0x4010(%rip),%xmm9 # 5370 <_sk_callback_sse41+0x317>
+ .byte 68,15,40,13,128,64,0,0 // movaps 0x4080(%rip),%xmm9 # 53e0 <_sk_callback_sse41+0x31d>
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 65,15,89,249 // mulps %xmm9,%xmm7
- .byte 68,15,40,21,16,64,0,0 // movaps 0x4010(%rip),%xmm10 # 5380 <_sk_callback_sse41+0x327>
+ .byte 68,15,40,21,128,64,0,0 // movaps 0x4080(%rip),%xmm10 # 53f0 <_sk_callback_sse41+0x32d>
.byte 65,15,40,219 // movaps %xmm11,%xmm3
.byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,40,29,13,64,0,0 // movaps 0x400d(%rip),%xmm11 # 5390 <_sk_callback_sse41+0x337>
+ .byte 68,15,40,29,125,64,0,0 // movaps 0x407d(%rip),%xmm11 # 5400 <_sk_callback_sse41+0x33d>
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
@@ -23586,7 +23730,7 @@ _sk_color_sse41:
.byte 65,15,88,251 // addps %xmm11,%xmm7
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
- .byte 68,15,40,13,201,62,0,0 // movaps 0x3ec9(%rip),%xmm9 # 53a0 <_sk_callback_sse41+0x347>
+ .byte 68,15,40,13,57,63,0,0 // movaps 0x3f39(%rip),%xmm9 # 5410 <_sk_callback_sse41+0x34d>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 68,15,89,192 // mulps %xmm0,%xmm8
@@ -23638,13 +23782,13 @@ _sk_luminosity_sse41:
.byte 69,15,89,216 // mulps %xmm8,%xmm11
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,89,205 // mulps %xmm5,%xmm9
- .byte 68,15,40,5,33,62,0,0 // movaps 0x3e21(%rip),%xmm8 # 53b0 <_sk_callback_sse41+0x357>
+ .byte 68,15,40,5,145,62,0,0 // movaps 0x3e91(%rip),%xmm8 # 5420 <_sk_callback_sse41+0x35d>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,21,37,62,0,0 // movaps 0x3e25(%rip),%xmm10 # 53c0 <_sk_callback_sse41+0x367>
+ .byte 68,15,40,21,149,62,0,0 // movaps 0x3e95(%rip),%xmm10 # 5430 <_sk_callback_sse41+0x36d>
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 65,15,89,234 // mulps %xmm10,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 68,15,40,37,35,62,0,0 // movaps 0x3e23(%rip),%xmm12 # 53d0 <_sk_callback_sse41+0x377>
+ .byte 68,15,40,37,147,62,0,0 // movaps 0x3e93(%rip),%xmm12 # 5440 <_sk_callback_sse41+0x37d>
.byte 68,15,40,242 // movaps %xmm2,%xmm14
.byte 69,15,89,244 // mulps %xmm12,%xmm14
.byte 68,15,88,245 // addps %xmm5,%xmm14
@@ -23729,7 +23873,7 @@ _sk_luminosity_sse41:
.byte 65,15,88,244 // addps %xmm12,%xmm6
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
- .byte 15,40,5,217,60,0,0 // movaps 0x3cd9(%rip),%xmm0 # 53e0 <_sk_callback_sse41+0x387>
+ .byte 15,40,5,73,61,0,0 // movaps 0x3d49(%rip),%xmm0 # 5450 <_sk_callback_sse41+0x38d>
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,226 // mulps %xmm2,%xmm4
@@ -23772,20 +23916,20 @@ _sk_srcover_rgba_8888_sse41:
.byte 15,133,217,0,0,0 // jne 185b <_sk_srcover_rgba_8888_sse41+0xe7>
.byte 243,15,111,60,144 // movdqu (%rax,%rdx,4),%xmm7
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,94,60,0,0 // movdqa 0x3c5e(%rip),%xmm4 # 53f0 <_sk_callback_sse41+0x397>
+ .byte 102,15,111,37,206,60,0,0 // movdqa 0x3cce(%rip),%xmm4 # 5460 <_sk_callback_sse41+0x39d>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,90,60,0,0 // pshufb 0x3c5a(%rip),%xmm5 # 5400 <_sk_callback_sse41+0x3a7>
+ .byte 102,15,56,0,45,202,60,0,0 // pshufb 0x3cca(%rip),%xmm5 # 5470 <_sk_callback_sse41+0x3ad>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,90,60,0,0 // pshufb 0x3c5a(%rip),%xmm6 # 5410 <_sk_callback_sse41+0x3b7>
+ .byte 102,15,56,0,53,202,60,0,0 // pshufb 0x3cca(%rip),%xmm6 # 5480 <_sk_callback_sse41+0x3bd>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 68,15,40,5,87,60,0,0 // movaps 0x3c57(%rip),%xmm8 # 5420 <_sk_callback_sse41+0x3c7>
+ .byte 68,15,40,5,199,60,0,0 // movaps 0x3cc7(%rip),%xmm8 # 5490 <_sk_callback_sse41+0x3cd>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,91,60,0,0 // movaps 0x3c5b(%rip),%xmm12 # 5430 <_sk_callback_sse41+0x3d7>
+ .byte 68,15,40,37,203,60,0,0 // movaps 0x3ccb(%rip),%xmm12 # 54a0 <_sk_callback_sse41+0x3dd>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -23811,7 +23955,7 @@ _sk_srcover_rgba_8888_sse41:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,89 // jne 189b <_sk_srcover_rgba_8888_sse41+0x127>
+ .byte 117,85 // jne 1897 <_sk_srcover_rgba_8888_sse41+0x123>
.byte 243,15,127,4,144 // movdqu %xmm0,(%rax,%rdx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -23821,30 +23965,33 @@ _sk_srcover_rgba_8888_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,35 // je 188f <_sk_srcover_rgba_8888_sse41+0x11b>
+ .byte 116,87 // je 18bf <_sk_srcover_rgba_8888_sse41+0x14b>
+ .byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,249,2 // cmp $0x2,%r9b
.byte 116,21 // je 1887 <_sk_srcover_rgba_8888_sse41+0x113>
.byte 65,128,249,3 // cmp $0x3,%r9b
.byte 15,133,11,255,255,255 // jne 1787 <_sk_srcover_rgba_8888_sse41+0x13>
.byte 102,15,110,100,144,8 // movd 0x8(%rax,%rdx,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
- .byte 102,15,58,34,124,144,4,1 // pinsrd $0x1,0x4(%rax,%rdx,4),%xmm7
- .byte 102,15,58,34,60,144,0 // pinsrd $0x0,(%rax,%rdx,4),%xmm7
- .byte 233,236,254,255,255 // jmpq 1787 <_sk_srcover_rgba_8888_sse41+0x13>
+ .byte 243,15,126,36,144 // movq (%rax,%rdx,4),%xmm4
+ .byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
+ .byte 233,240,254,255,255 // jmpq 1787 <_sk_srcover_rgba_8888_sse41+0x13>
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,28 // je 18c4 <_sk_srcover_rgba_8888_sse41+0x150>
+ .byte 116,37 // je 18c9 <_sk_srcover_rgba_8888_sse41+0x155>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,14 // je 18bc <_sk_srcover_rgba_8888_sse41+0x148>
+ .byte 116,14 // je 18b8 <_sk_srcover_rgba_8888_sse41+0x144>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,147 // jne 1847 <_sk_srcover_rgba_8888_sse41+0xd3>
+ .byte 117,151 // jne 1847 <_sk_srcover_rgba_8888_sse41+0xd3>
.byte 102,15,58,22,68,144,8,2 // pextrd $0x2,%xmm0,0x8(%rax,%rdx,4)
- .byte 102,15,58,22,68,144,4,1 // pextrd $0x1,%xmm0,0x4(%rax,%rdx,4)
+ .byte 102,15,214,4,144 // movq %xmm0,(%rax,%rdx,4)
+ .byte 235,136 // jmp 1847 <_sk_srcover_rgba_8888_sse41+0xd3>
+ .byte 102,15,110,60,144 // movd (%rax,%rdx,4),%xmm7
+ .byte 233,190,254,255,255 // jmpq 1787 <_sk_srcover_rgba_8888_sse41+0x13>
.byte 102,15,126,4,144 // movd %xmm0,(%rax,%rdx,4)
- .byte 233,121,255,255,255 // jmpq 1847 <_sk_srcover_rgba_8888_sse41+0xd3>
+ .byte 233,116,255,255,255 // jmpq 1847 <_sk_srcover_rgba_8888_sse41+0xd3>
HIDDEN _sk_clamp_0_sse41
.globl _sk_clamp_0_sse41
@@ -23862,7 +24009,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,82,59,0,0 // movaps 0x3b52(%rip),%xmm8 # 5440 <_sk_callback_sse41+0x3e7>
+ .byte 68,15,40,5,189,59,0,0 // movaps 0x3bbd(%rip),%xmm8 # 54b0 <_sk_callback_sse41+0x3ed>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -23874,7 +24021,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,71,59,0,0 // minps 0x3b47(%rip),%xmm3 # 5450 <_sk_callback_sse41+0x3f7>
+ .byte 15,93,29,178,59,0,0 // minps 0x3bb2(%rip),%xmm3 # 54c0 <_sk_callback_sse41+0x3fd>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -23961,7 +24108,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,178,58,0,0 // movaps 0x3ab2(%rip),%xmm9 # 5460 <_sk_callback_sse41+0x407>
+ .byte 68,15,40,13,29,59,0,0 // movaps 0x3b1d(%rip),%xmm9 # 54d0 <_sk_callback_sse41+0x40d>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -23975,20 +24122,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,157,58,0,0 // movaps 0x3a9d(%rip),%xmm11 # 5470 <_sk_callback_sse41+0x417>
+ .byte 68,15,40,29,8,59,0,0 // movaps 0x3b08(%rip),%xmm11 # 54e0 <_sk_callback_sse41+0x41d>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,149,58,0,0 // movaps 0x3a95(%rip),%xmm12 # 5480 <_sk_callback_sse41+0x427>
+ .byte 68,15,40,37,0,59,0,0 // movaps 0x3b00(%rip),%xmm12 # 54f0 <_sk_callback_sse41+0x42d>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,149,58,0,0 // movaps 0x3a95(%rip),%xmm13 # 5490 <_sk_callback_sse41+0x437>
+ .byte 68,15,40,45,0,59,0,0 // movaps 0x3b00(%rip),%xmm13 # 5500 <_sk_callback_sse41+0x43d>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,149,58,0,0 // movaps 0x3a95(%rip),%xmm14 # 54a0 <_sk_callback_sse41+0x447>
+ .byte 68,15,40,53,0,59,0,0 // movaps 0x3b00(%rip),%xmm14 # 5510 <_sk_callback_sse41+0x44d>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,153,58,0,0 // movaps 0x3a99(%rip),%xmm15 # 54b0 <_sk_callback_sse41+0x457>
+ .byte 68,15,40,61,4,59,0,0 // movaps 0x3b04(%rip),%xmm15 # 5520 <_sk_callback_sse41+0x45d>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -24031,22 +24178,22 @@ _sk_to_srgb_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
- .byte 68,15,40,29,17,58,0,0 // movaps 0x3a11(%rip),%xmm11 # 54c0 <_sk_callback_sse41+0x467>
+ .byte 68,15,40,29,124,58,0,0 // movaps 0x3a7c(%rip),%xmm11 # 5530 <_sk_callback_sse41+0x46d>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 68,15,40,37,17,58,0,0 // movaps 0x3a11(%rip),%xmm12 # 54d0 <_sk_callback_sse41+0x477>
+ .byte 68,15,40,37,124,58,0,0 // movaps 0x3a7c(%rip),%xmm12 # 5540 <_sk_callback_sse41+0x47d>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,40,21,17,58,0,0 // movaps 0x3a11(%rip),%xmm10 # 54e0 <_sk_callback_sse41+0x487>
+ .byte 68,15,40,21,124,58,0,0 // movaps 0x3a7c(%rip),%xmm10 # 5550 <_sk_callback_sse41+0x48d>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 68,15,40,45,17,58,0,0 // movaps 0x3a11(%rip),%xmm13 # 54f0 <_sk_callback_sse41+0x497>
+ .byte 68,15,40,45,124,58,0,0 // movaps 0x3a7c(%rip),%xmm13 # 5560 <_sk_callback_sse41+0x49d>
.byte 69,15,88,253 // addps %xmm13,%xmm15
- .byte 68,15,40,53,21,58,0,0 // movaps 0x3a15(%rip),%xmm14 # 5500 <_sk_callback_sse41+0x4a7>
+ .byte 68,15,40,53,128,58,0,0 // movaps 0x3a80(%rip),%xmm14 # 5570 <_sk_callback_sse41+0x4ad>
.byte 69,15,88,198 // addps %xmm14,%xmm8
.byte 69,15,83,192 // rcpps %xmm8,%xmm8
.byte 69,15,89,199 // mulps %xmm15,%xmm8
- .byte 68,15,40,61,17,58,0,0 // movaps 0x3a11(%rip),%xmm15 # 5510 <_sk_callback_sse41+0x4b7>
+ .byte 68,15,40,61,124,58,0,0 // movaps 0x3a7c(%rip),%xmm15 # 5580 <_sk_callback_sse41+0x4bd>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,82,202 // rsqrtps %xmm2,%xmm9
@@ -24099,7 +24246,7 @@ _sk_rgb_to_hsl_sse41:
.byte 68,15,93,226 // minps %xmm2,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,94,57,0,0 // movaps 0x395e(%rip),%xmm14 # 5520 <_sk_callback_sse41+0x4c7>
+ .byte 68,15,40,53,201,57,0,0 // movaps 0x39c9(%rip),%xmm14 # 5590 <_sk_callback_sse41+0x4cd>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -24108,27 +24255,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,69,57,0,0 // andps 0x3945(%rip),%xmm15 # 5530 <_sk_callback_sse41+0x4d7>
+ .byte 68,15,84,61,176,57,0,0 // andps 0x39b0(%rip),%xmm15 # 55a0 <_sk_callback_sse41+0x4dd>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,56,57,0,0 // movaps 0x3938(%rip),%xmm13 # 5540 <_sk_callback_sse41+0x4e7>
+ .byte 68,15,40,45,163,57,0,0 // movaps 0x39a3(%rip),%xmm13 # 55b0 <_sk_callback_sse41+0x4ed>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,52,57,0,0 // addps 0x3934(%rip),%xmm8 # 5550 <_sk_callback_sse41+0x4f7>
+ .byte 68,15,88,5,159,57,0,0 // addps 0x399f(%rip),%xmm8 # 55c0 <_sk_callback_sse41+0x4fd>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,44,57,0,0 // mulps 0x392c(%rip),%xmm8 # 5560 <_sk_callback_sse41+0x507>
+ .byte 68,15,89,5,151,57,0,0 // mulps 0x3997(%rip),%xmm8 # 55d0 <_sk_callback_sse41+0x50d>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,32,57,0,0 // movaps 0x3920(%rip),%xmm0 # 5570 <_sk_callback_sse41+0x517>
+ .byte 15,40,5,139,57,0,0 // movaps 0x398b(%rip),%xmm0 # 55e0 <_sk_callback_sse41+0x51d>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -24150,7 +24297,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,230,56,0,0 // movaps 0x38e6(%rip),%xmm9 # 5580 <_sk_callback_sse41+0x527>
+ .byte 68,15,40,13,81,57,0,0 // movaps 0x3951(%rip),%xmm9 # 55f0 <_sk_callback_sse41+0x52d>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -24163,19 +24310,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,193,56,0,0 // movaps 0x38c1(%rip),%xmm14 # 5590 <_sk_callback_sse41+0x537>
+ .byte 68,15,40,53,44,57,0,0 // movaps 0x392c(%rip),%xmm14 # 5600 <_sk_callback_sse41+0x53d>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,186,56,0,0 // movaps 0x38ba(%rip),%xmm11 # 55a0 <_sk_callback_sse41+0x547>
+ .byte 68,15,40,29,37,57,0,0 // movaps 0x3925(%rip),%xmm11 # 5610 <_sk_callback_sse41+0x54d>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,179,56,0,0 // movaps 0x38b3(%rip),%xmm7 # 55b0 <_sk_callback_sse41+0x557>
+ .byte 15,40,61,30,57,0,0 // movaps 0x391e(%rip),%xmm7 # 5620 <_sk_callback_sse41+0x55d>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,180,56,0,0 // movaps 0x38b4(%rip),%xmm3 # 55c0 <_sk_callback_sse41+0x567>
+ .byte 15,40,29,31,57,0,0 // movaps 0x391f(%rip),%xmm3 # 5630 <_sk_callback_sse41+0x56d>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -24185,7 +24332,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,147,56,0,0 // movaps 0x3893(%rip),%xmm12 # 55d0 <_sk_callback_sse41+0x577>
+ .byte 68,15,40,37,254,56,0,0 // movaps 0x38fe(%rip),%xmm12 # 5640 <_sk_callback_sse41+0x57d>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -24219,7 +24366,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,11,56,0,0 // addps 0x380b(%rip),%xmm10 # 55e0 <_sk_callback_sse41+0x587>
+ .byte 68,15,88,21,118,56,0,0 // addps 0x3876(%rip),%xmm10 # 5650 <_sk_callback_sse41+0x58d>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -24270,11 +24417,11 @@ _sk_scale_u8_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,52 // jne 1eae <_sk_scale_u8_sse41+0x3e>
+ .byte 117,52 // jne 1eb3 <_sk_scale_u8_sse41+0x3e>
.byte 102,69,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm8
- .byte 102,68,15,219,5,102,55,0,0 // pand 0x3766(%rip),%xmm8 # 55f0 <_sk_callback_sse41+0x597>
+ .byte 102,68,15,219,5,209,55,0,0 // pand 0x37d1(%rip),%xmm8 # 5660 <_sk_callback_sse41+0x59d>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,106,55,0,0 // mulps 0x376a(%rip),%xmm8 # 5600 <_sk_callback_sse41+0x5a7>
+ .byte 68,15,89,5,213,55,0,0 // mulps 0x37d5(%rip),%xmm8 # 5670 <_sk_callback_sse41+0x5ad>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -24284,21 +24431,24 @@ _sk_scale_u8_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,42 // je 1eea <_sk_scale_u8_sse41+0x7a>
+ .byte 116,59 // je 1efb <_sk_scale_u8_sse41+0x86>
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 1edd <_sk_scale_u8_sse41+0x6d>
+ .byte 116,23 // je 1ee2 <_sk_scale_u8_sse41+0x6d>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,181 // jne 1e81 <_sk_scale_u8_sse41+0x11>
+ .byte 117,181 // jne 1e86 <_sk_scale_u8_sse41+0x11>
.byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
- .byte 65,15,182,68,18,1 // movzbl 0x1(%r10,%rdx,1),%eax
- .byte 102,68,15,58,34,192,1 // pinsrd $0x1,%eax,%xmm8
+ .byte 65,15,183,4,18 // movzwl (%r10,%rdx,1),%eax
+ .byte 102,68,15,110,200 // movd %eax,%xmm9
+ .byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
+ .byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
+ .byte 235,139 // jmp 1e86 <_sk_scale_u8_sse41+0x11>
.byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax
- .byte 102,68,15,58,34,192,0 // pinsrd $0x0,%eax,%xmm8
- .byte 235,137 // jmp 1e81 <_sk_scale_u8_sse41+0x11>
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 233,124,255,255,255 // jmpq 1e86 <_sk_scale_u8_sse41+0x11>
HIDDEN _sk_lerp_1_float_sse41
.globl _sk_lerp_1_float_sse41
@@ -24329,11 +24479,11 @@ _sk_lerp_u8_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 1f82 <_sk_lerp_u8_sse41+0x52>
+ .byte 117,72 // jne 1f94 <_sk_lerp_u8_sse41+0x52>
.byte 102,69,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm8
- .byte 102,68,15,219,5,198,54,0,0 // pand 0x36c6(%rip),%xmm8 # 5610 <_sk_callback_sse41+0x5b7>
+ .byte 102,68,15,219,5,36,55,0,0 // pand 0x3724(%rip),%xmm8 # 5680 <_sk_callback_sse41+0x5bd>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,202,54,0,0 // mulps 0x36ca(%rip),%xmm8 # 5620 <_sk_callback_sse41+0x5c7>
+ .byte 68,15,89,5,40,55,0,0 // mulps 0x3728(%rip),%xmm8 # 5690 <_sk_callback_sse41+0x5cd>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -24350,21 +24500,24 @@ _sk_lerp_u8_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,42 // je 1fbe <_sk_lerp_u8_sse41+0x8e>
+ .byte 116,62 // je 1fdf <_sk_lerp_u8_sse41+0x9d>
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 1fb1 <_sk_lerp_u8_sse41+0x81>
+ .byte 116,23 // je 1fc3 <_sk_lerp_u8_sse41+0x81>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,161 // jne 1f41 <_sk_lerp_u8_sse41+0x11>
+ .byte 117,161 // jne 1f53 <_sk_lerp_u8_sse41+0x11>
.byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
- .byte 65,15,182,68,18,1 // movzbl 0x1(%r10,%rdx,1),%eax
- .byte 102,68,15,58,34,192,1 // pinsrd $0x1,%eax,%xmm8
+ .byte 65,15,183,4,18 // movzwl (%r10,%rdx,1),%eax
+ .byte 102,68,15,110,200 // movd %eax,%xmm9
+ .byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
+ .byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
+ .byte 233,116,255,255,255 // jmpq 1f53 <_sk_lerp_u8_sse41+0x11>
.byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax
- .byte 102,68,15,58,34,192,0 // pinsrd $0x0,%eax,%xmm8
- .byte 233,114,255,255,255 // jmpq 1f41 <_sk_lerp_u8_sse41+0x11>
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 233,101,255,255,255 // jmpq 1f53 <_sk_lerp_u8_sse41+0x11>
HIDDEN _sk_lerp_565_sse41
.globl _sk_lerp_565_sse41
@@ -24373,57 +24526,59 @@ _sk_lerp_565_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,152,0,0,0 // jne 2075 <_sk_lerp_565_sse41+0xa6>
- .byte 102,69,15,56,51,12,82 // pmovzxwd (%r10,%rdx,2),%xmm9
- .byte 102,68,15,111,5,67,54,0,0 // movdqa 0x3643(%rip),%xmm8 # 5630 <_sk_callback_sse41+0x5d7>
- .byte 102,69,15,219,193 // pand %xmm9,%xmm8
+ .byte 15,133,152,0,0,0 // jne 2094 <_sk_lerp_565_sse41+0xa6>
+ .byte 102,69,15,56,51,20,82 // pmovzxwd (%r10,%rdx,2),%xmm10
+ .byte 102,68,15,111,5,148,54,0,0 // movdqa 0x3694(%rip),%xmm8 # 56a0 <_sk_callback_sse41+0x5dd>
+ .byte 102,69,15,219,194 // pand %xmm10,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,66,54,0,0 // mulps 0x3642(%rip),%xmm8 # 5640 <_sk_callback_sse41+0x5e7>
- .byte 102,68,15,111,21,73,54,0,0 // movdqa 0x3649(%rip),%xmm10 # 5650 <_sk_callback_sse41+0x5f7>
- .byte 102,69,15,219,209 // pand %xmm9,%xmm10
- .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,72,54,0,0 // mulps 0x3648(%rip),%xmm10 # 5660 <_sk_callback_sse41+0x607>
- .byte 102,68,15,219,13,79,54,0,0 // pand 0x364f(%rip),%xmm9 # 5670 <_sk_callback_sse41+0x617>
+ .byte 68,15,89,5,147,54,0,0 // mulps 0x3693(%rip),%xmm8 # 56b0 <_sk_callback_sse41+0x5ed>
+ .byte 102,68,15,111,13,154,54,0,0 // movdqa 0x369a(%rip),%xmm9 # 56c0 <_sk_callback_sse41+0x5fd>
+ .byte 102,69,15,219,202 // pand %xmm10,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,83,54,0,0 // mulps 0x3653(%rip),%xmm9 # 5680 <_sk_callback_sse41+0x627>
+ .byte 68,15,89,13,153,54,0,0 // mulps 0x3699(%rip),%xmm9 # 56d0 <_sk_callback_sse41+0x60d>
+ .byte 102,68,15,219,21,160,54,0,0 // pand 0x36a0(%rip),%xmm10 # 56e0 <_sk_callback_sse41+0x61d>
+ .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
+ .byte 68,15,89,21,164,54,0,0 // mulps 0x36a4(%rip),%xmm10 # 56f0 <_sk_callback_sse41+0x62d>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
.byte 15,92,205 // subps %xmm5,%xmm1
- .byte 65,15,89,202 // mulps %xmm10,%xmm1
+ .byte 65,15,89,201 // mulps %xmm9,%xmm1
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 15,92,214 // subps %xmm6,%xmm2
- .byte 65,15,89,209 // mulps %xmm9,%xmm2
+ .byte 65,15,89,210 // mulps %xmm10,%xmm2
.byte 15,88,214 // addps %xmm6,%xmm2
.byte 15,92,223 // subps %xmm7,%xmm3
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 68,15,88,199 // addps %xmm7,%xmm8
- .byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,88,215 // addps %xmm7,%xmm10
- .byte 65,15,89,217 // mulps %xmm9,%xmm3
+ .byte 68,15,89,203 // mulps %xmm3,%xmm9
+ .byte 68,15,88,207 // addps %xmm7,%xmm9
+ .byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,95,211 // maxps %xmm3,%xmm10
- .byte 69,15,95,194 // maxps %xmm10,%xmm8
+ .byte 68,15,95,203 // maxps %xmm3,%xmm9
+ .byte 69,15,95,193 // maxps %xmm9,%xmm8
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,216 // movaps %xmm8,%xmm3
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,46 // je 20b5 <_sk_lerp_565_sse41+0xe6>
+ .byte 116,62 // je 20df <_sk_lerp_565_sse41+0xf1>
+ .byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,27 // je 20a8 <_sk_lerp_565_sse41+0xd9>
+ .byte 116,27 // je 20c7 <_sk_lerp_565_sse41+0xd9>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,77,255,255,255 // jne 1fe4 <_sk_lerp_565_sse41+0x15>
+ .byte 15,133,77,255,255,255 // jne 2003 <_sk_lerp_565_sse41+0x15>
.byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 102,69,15,112,200,69 // pshufd $0x45,%xmm8,%xmm9
- .byte 65,15,183,68,82,2 // movzwl 0x2(%r10,%rdx,2),%eax
- .byte 102,68,15,58,34,200,1 // pinsrd $0x1,%eax,%xmm9
+ .byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10
+ .byte 102,69,15,110,4,82 // movd (%r10,%rdx,2),%xmm8
+ .byte 102,69,15,56,51,192 // pmovzxwd %xmm8,%xmm8
+ .byte 102,69,15,58,14,208,15 // pblendw $0xf,%xmm8,%xmm10
+ .byte 233,36,255,255,255 // jmpq 2003 <_sk_lerp_565_sse41+0x15>
.byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax
- .byte 102,68,15,58,34,200,0 // pinsrd $0x0,%eax,%xmm9
- .byte 233,30,255,255,255 // jmpq 1fe4 <_sk_lerp_565_sse41+0x15>
+ .byte 102,68,15,110,208 // movd %eax,%xmm10
+ .byte 233,21,255,255,255 // jmpq 2003 <_sk_lerp_565_sse41+0x15>
HIDDEN _sk_load_tables_sse41
.globl _sk_load_tables_sse41
@@ -24432,12 +24587,12 @@ _sk_load_tables_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,24,1,0,0 // jne 21ec <_sk_load_tables_sse41+0x126>
+ .byte 15,133,24,1,0,0 // jne 2214 <_sk_load_tables_sse41+0x126>
.byte 243,69,15,111,4,145 // movdqu (%r9,%rdx,4),%xmm8
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,15,111,5,169,53,0,0 // movdqa 0x35a9(%rip),%xmm0 # 5690 <_sk_callback_sse41+0x637>
+ .byte 102,15,111,5,241,53,0,0 // movdqa 0x35f1(%rip),%xmm0 # 5700 <_sk_callback_sse41+0x63d>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -24452,7 +24607,7 @@ _sk_load_tables_sse41:
.byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0
.byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,100,53,0,0 // pshufb 0x3564(%rip),%xmm1 # 56a0 <_sk_callback_sse41+0x647>
+ .byte 102,15,56,0,13,172,53,0,0 // pshufb 0x35ac(%rip),%xmm1 # 5710 <_sk_callback_sse41+0x64d>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
.byte 68,15,182,211 // movzbl %bl,%r10d
@@ -24467,7 +24622,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,72,24 // mov 0x18(%rax),%r9
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,32,53,0,0 // pshufb 0x3520(%rip),%xmm2 # 56b0 <_sk_callback_sse41+0x657>
+ .byte 102,15,56,0,21,104,53,0,0 // pshufb 0x3568(%rip),%xmm2 # 5720 <_sk_callback_sse41+0x65d>
.byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,208 // movzbl %al,%r10d
@@ -24482,7 +24637,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,221,52,0,0 // mulps 0x34dd(%rip),%xmm3 # 56c0 <_sk_callback_sse41+0x667>
+ .byte 15,89,29,37,53,0,0 // mulps 0x3525(%rip),%xmm3 # 5730 <_sk_callback_sse41+0x66d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -24490,18 +24645,20 @@ _sk_load_tables_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
- .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 2224 <_sk_load_tables_sse41+0x15e>
+ .byte 116,52 // je 2255 <_sk_load_tables_sse41+0x167>
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 221b <_sk_load_tables_sse41+0x155>
+ .byte 116,23 // je 2243 <_sk_load_tables_sse41+0x155>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,204,254,255,255 // jne 20da <_sk_load_tables_sse41+0x14>
+ .byte 15,133,204,254,255,255 // jne 2102 <_sk_load_tables_sse41+0x14>
.byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0
.byte 102,68,15,112,192,69 // pshufd $0x45,%xmm0,%xmm8
- .byte 102,69,15,58,34,68,145,4,1 // pinsrd $0x1,0x4(%r9,%rdx,4),%xmm8
- .byte 102,69,15,58,34,4,145,0 // pinsrd $0x0,(%r9,%rdx,4),%xmm8
- .byte 233,169,254,255,255 // jmpq 20da <_sk_load_tables_sse41+0x14>
+ .byte 243,65,15,126,4,145 // movq (%r9,%rdx,4),%xmm0
+ .byte 102,68,15,58,14,192,15 // pblendw $0xf,%xmm0,%xmm8
+ .byte 233,173,254,255,255 // jmpq 2102 <_sk_load_tables_sse41+0x14>
+ .byte 102,69,15,110,4,145 // movd (%r9,%rdx,4),%xmm8
+ .byte 233,162,254,255,255 // jmpq 2102 <_sk_load_tables_sse41+0x14>
HIDDEN _sk_load_tables_u16_be_sse41
.globl _sk_load_tables_u16_be_sse41
@@ -24511,7 +24668,7 @@ _sk_load_tables_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,99,1,0,0 // jne 23aa <_sk_load_tables_u16_be_sse41+0x179>
+ .byte 15,133,99,1,0,0 // jne 23d9 <_sk_load_tables_u16_be_sse41+0x179>
.byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0
.byte 243,67,15,111,76,81,16 // movdqu 0x10(%r9,%r10,2),%xmm1
.byte 65,87 // push %r15
@@ -24523,7 +24680,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,82,52,0,0 // movdqa 0x3452(%rip),%xmm8 # 56d0 <_sk_callback_sse41+0x677>
+ .byte 102,68,15,111,5,147,52,0,0 // movdqa 0x3493(%rip),%xmm8 # 5740 <_sk_callback_sse41+0x67d>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -24541,7 +24698,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
.byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
- .byte 102,15,56,0,13,1,52,0,0 // pshufb 0x3401(%rip),%xmm1 # 56e0 <_sk_callback_sse41+0x687>
+ .byte 102,15,56,0,13,66,52,0,0 // pshufb 0x3442(%rip),%xmm1 # 5750 <_sk_callback_sse41+0x68d>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -24577,7 +24734,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,79,51,0,0 // mulps 0x334f(%rip),%xmm3 # 56f0 <_sk_callback_sse41+0x697>
+ .byte 15,89,29,144,51,0,0 // mulps 0x3390(%rip),%xmm3 # 5760 <_sk_callback_sse41+0x69d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -24585,16 +24742,16 @@ _sk_load_tables_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 23c3 <_sk_load_tables_u16_be_sse41+0x192>
+ .byte 117,13 // jne 23f2 <_sk_load_tables_u16_be_sse41+0x192>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,145,254,255,255 // jmpq 2254 <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,145,254,255,255 // jmpq 2283 <_sk_load_tables_u16_be_sse41+0x23>
.byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,124,254,255,255 // jb 2254 <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 15,130,124,254,255,255 // jb 2283 <_sk_load_tables_u16_be_sse41+0x23>
.byte 243,67,15,126,76,81,16 // movq 0x10(%r9,%r10,2),%xmm1
- .byte 233,112,254,255,255 // jmpq 2254 <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,112,254,255,255 // jmpq 2283 <_sk_load_tables_u16_be_sse41+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse41
.globl _sk_load_tables_rgb_u16_be_sse41
@@ -24604,7 +24761,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,83,1,0,0 // jne 2549 <_sk_load_tables_rgb_u16_be_sse41+0x165>
+ .byte 15,133,83,1,0,0 // jne 2578 <_sk_load_tables_rgb_u16_be_sse41+0x165>
.byte 243,67,15,111,20,81 // movdqu (%r9,%r10,2),%xmm2
.byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -24619,7 +24776,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,196,50,0,0 // movdqa 0x32c4(%rip),%xmm8 # 5700 <_sk_callback_sse41+0x6a7>
+ .byte 102,68,15,111,5,5,51,0,0 // movdqa 0x3305(%rip),%xmm8 # 5770 <_sk_callback_sse41+0x6ad>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -24637,7 +24794,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0
.byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
- .byte 102,15,56,0,13,115,50,0,0 // pshufb 0x3273(%rip),%xmm1 # 5710 <_sk_callback_sse41+0x6b7>
+ .byte 102,15,56,0,13,180,50,0,0 // pshufb 0x32b4(%rip),%xmm1 # 5780 <_sk_callback_sse41+0x6bd>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -24668,7 +24825,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,222,49,0,0 // movaps 0x31de(%rip),%xmm3 # 5720 <_sk_callback_sse41+0x6c7>
+ .byte 15,40,29,31,50,0,0 // movaps 0x321f(%rip),%xmm3 # 5790 <_sk_callback_sse41+0x6cd>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -24677,21 +24834,21 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,67,15,196,84,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,14 // jne 256f <_sk_load_tables_rgb_u16_be_sse41+0x18b>
+ .byte 117,14 // jne 259e <_sk_load_tables_rgb_u16_be_sse41+0x18b>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
- .byte 233,173,254,255,255 // jmpq 241c <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,173,254,255,255 // jmpq 244b <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,71,15,110,76,81,6 // movd 0x6(%r9,%r10,2),%xmm9
.byte 102,71,15,196,76,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm9
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 25a0 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
+ .byte 114,24 // jb 25cf <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
.byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1
.byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,124,254,255,255 // jmpq 241c <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,124,254,255,255 // jmpq 244b <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,115,254,255,255 // jmpq 241c <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,115,254,255,255 // jmpq 244b <_sk_load_tables_rgb_u16_be_sse41+0x38>
HIDDEN _sk_byte_tables_sse41
.globl _sk_byte_tables_sse41
@@ -24702,7 +24859,7 @@ _sk_byte_tables_sse41:
.byte 65,84 // push %r12
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,118,49,0,0 // movaps 0x3176(%rip),%xmm8 # 5730 <_sk_callback_sse41+0x6d7>
+ .byte 68,15,40,5,183,49,0,0 // movaps 0x31b7(%rip),%xmm8 # 57a0 <_sk_callback_sse41+0x6dd>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
@@ -24721,7 +24878,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,39,49,0,0 // movaps 0x3127(%rip),%xmm9 # 5740 <_sk_callback_sse41+0x6e7>
+ .byte 68,15,40,13,104,49,0,0 // movaps 0x3168(%rip),%xmm9 # 57b0 <_sk_callback_sse41+0x6ed>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -24817,7 +24974,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,159,47,0,0 // movaps 0x2f9f(%rip),%xmm9 # 5750 <_sk_callback_sse41+0x6f7>
+ .byte 68,15,40,13,224,47,0,0 // movaps 0x2fe0(%rip),%xmm9 # 57c0 <_sk_callback_sse41+0x6fd>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -25004,31 +25161,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,231,44,0,0 // mulps 0x2ce7(%rip),%xmm8 # 5760 <_sk_callback_sse41+0x707>
- .byte 68,15,84,21,239,44,0,0 // andps 0x2cef(%rip),%xmm10 # 5770 <_sk_callback_sse41+0x717>
- .byte 68,15,86,21,247,44,0,0 // orps 0x2cf7(%rip),%xmm10 # 5780 <_sk_callback_sse41+0x727>
- .byte 68,15,88,5,255,44,0,0 // addps 0x2cff(%rip),%xmm8 # 5790 <_sk_callback_sse41+0x737>
- .byte 68,15,40,37,7,45,0,0 // movaps 0x2d07(%rip),%xmm12 # 57a0 <_sk_callback_sse41+0x747>
+ .byte 68,15,89,5,40,45,0,0 // mulps 0x2d28(%rip),%xmm8 # 57d0 <_sk_callback_sse41+0x70d>
+ .byte 68,15,84,21,48,45,0,0 // andps 0x2d30(%rip),%xmm10 # 57e0 <_sk_callback_sse41+0x71d>
+ .byte 68,15,86,21,56,45,0,0 // orps 0x2d38(%rip),%xmm10 # 57f0 <_sk_callback_sse41+0x72d>
+ .byte 68,15,88,5,64,45,0,0 // addps 0x2d40(%rip),%xmm8 # 5800 <_sk_callback_sse41+0x73d>
+ .byte 68,15,40,37,72,45,0,0 // movaps 0x2d48(%rip),%xmm12 # 5810 <_sk_callback_sse41+0x74d>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,7,45,0,0 // addps 0x2d07(%rip),%xmm10 # 57b0 <_sk_callback_sse41+0x757>
- .byte 68,15,40,37,15,45,0,0 // movaps 0x2d0f(%rip),%xmm12 # 57c0 <_sk_callback_sse41+0x767>
+ .byte 68,15,88,21,72,45,0,0 // addps 0x2d48(%rip),%xmm10 # 5820 <_sk_callback_sse41+0x75d>
+ .byte 68,15,40,37,80,45,0,0 // movaps 0x2d50(%rip),%xmm12 # 5830 <_sk_callback_sse41+0x76d>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,252,44,0,0 // addps 0x2cfc(%rip),%xmm8 # 57d0 <_sk_callback_sse41+0x777>
- .byte 68,15,40,21,4,45,0,0 // movaps 0x2d04(%rip),%xmm10 # 57e0 <_sk_callback_sse41+0x787>
+ .byte 68,15,88,5,61,45,0,0 // addps 0x2d3d(%rip),%xmm8 # 5840 <_sk_callback_sse41+0x77d>
+ .byte 68,15,40,21,69,45,0,0 // movaps 0x2d45(%rip),%xmm10 # 5850 <_sk_callback_sse41+0x78d>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,4,45,0,0 // movaps 0x2d04(%rip),%xmm10 # 57f0 <_sk_callback_sse41+0x797>
+ .byte 68,15,40,21,69,45,0,0 // movaps 0x2d45(%rip),%xmm10 # 5860 <_sk_callback_sse41+0x79d>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,8,45,0,0 // movaps 0x2d08(%rip),%xmm11 # 5800 <_sk_callback_sse41+0x7a7>
+ .byte 68,15,40,29,73,45,0,0 // movaps 0x2d49(%rip),%xmm11 # 5870 <_sk_callback_sse41+0x7ad>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,8,45,0,0 // mulps 0x2d08(%rip),%xmm11 # 5810 <_sk_callback_sse41+0x7b7>
+ .byte 68,15,89,29,73,45,0,0 // mulps 0x2d49(%rip),%xmm11 # 5880 <_sk_callback_sse41+0x7bd>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -25036,7 +25193,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,239,44,0,0 // minps 0x2cef(%rip),%xmm8 # 5820 <_sk_callback_sse41+0x7c7>
+ .byte 68,15,93,5,48,45,0,0 // minps 0x2d30(%rip),%xmm8 # 5890 <_sk_callback_sse41+0x7cd>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -25066,31 +25223,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,144,44,0,0 // mulps 0x2c90(%rip),%xmm12 # 5830 <_sk_callback_sse41+0x7d7>
- .byte 68,15,84,29,152,44,0,0 // andps 0x2c98(%rip),%xmm11 # 5840 <_sk_callback_sse41+0x7e7>
- .byte 68,15,86,29,160,44,0,0 // orps 0x2ca0(%rip),%xmm11 # 5850 <_sk_callback_sse41+0x7f7>
- .byte 68,15,88,37,168,44,0,0 // addps 0x2ca8(%rip),%xmm12 # 5860 <_sk_callback_sse41+0x807>
- .byte 15,40,13,177,44,0,0 // movaps 0x2cb1(%rip),%xmm1 # 5870 <_sk_callback_sse41+0x817>
+ .byte 68,15,89,37,209,44,0,0 // mulps 0x2cd1(%rip),%xmm12 # 58a0 <_sk_callback_sse41+0x7dd>
+ .byte 68,15,84,29,217,44,0,0 // andps 0x2cd9(%rip),%xmm11 # 58b0 <_sk_callback_sse41+0x7ed>
+ .byte 68,15,86,29,225,44,0,0 // orps 0x2ce1(%rip),%xmm11 # 58c0 <_sk_callback_sse41+0x7fd>
+ .byte 68,15,88,37,233,44,0,0 // addps 0x2ce9(%rip),%xmm12 # 58d0 <_sk_callback_sse41+0x80d>
+ .byte 15,40,13,242,44,0,0 // movaps 0x2cf2(%rip),%xmm1 # 58e0 <_sk_callback_sse41+0x81d>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,177,44,0,0 // addps 0x2cb1(%rip),%xmm11 # 5880 <_sk_callback_sse41+0x827>
- .byte 15,40,13,186,44,0,0 // movaps 0x2cba(%rip),%xmm1 # 5890 <_sk_callback_sse41+0x837>
+ .byte 68,15,88,29,242,44,0,0 // addps 0x2cf2(%rip),%xmm11 # 58f0 <_sk_callback_sse41+0x82d>
+ .byte 15,40,13,251,44,0,0 // movaps 0x2cfb(%rip),%xmm1 # 5900 <_sk_callback_sse41+0x83d>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,167,44,0,0 // addps 0x2ca7(%rip),%xmm12 # 58a0 <_sk_callback_sse41+0x847>
- .byte 15,40,13,176,44,0,0 // movaps 0x2cb0(%rip),%xmm1 # 58b0 <_sk_callback_sse41+0x857>
+ .byte 68,15,88,37,232,44,0,0 // addps 0x2ce8(%rip),%xmm12 # 5910 <_sk_callback_sse41+0x84d>
+ .byte 15,40,13,241,44,0,0 // movaps 0x2cf1(%rip),%xmm1 # 5920 <_sk_callback_sse41+0x85d>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,176,44,0,0 // movaps 0x2cb0(%rip),%xmm10 # 58c0 <_sk_callback_sse41+0x867>
+ .byte 68,15,40,21,241,44,0,0 // movaps 0x2cf1(%rip),%xmm10 # 5930 <_sk_callback_sse41+0x86d>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,181,44,0,0 // movaps 0x2cb5(%rip),%xmm1 # 58d0 <_sk_callback_sse41+0x877>
+ .byte 15,40,13,246,44,0,0 // movaps 0x2cf6(%rip),%xmm1 # 5940 <_sk_callback_sse41+0x87d>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,182,44,0,0 // mulps 0x2cb6(%rip),%xmm1 # 58e0 <_sk_callback_sse41+0x887>
+ .byte 15,89,13,247,44,0,0 // mulps 0x2cf7(%rip),%xmm1 # 5950 <_sk_callback_sse41+0x88d>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -25098,7 +25255,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,161,44,0,0 // minps 0x2ca1(%rip),%xmm1 # 58f0 <_sk_callback_sse41+0x897>
+ .byte 15,93,13,226,44,0,0 // minps 0x2ce2(%rip),%xmm1 # 5960 <_sk_callback_sse41+0x89d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -25128,31 +25285,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,66,44,0,0 // mulps 0x2c42(%rip),%xmm12 # 5900 <_sk_callback_sse41+0x8a7>
- .byte 68,15,84,29,74,44,0,0 // andps 0x2c4a(%rip),%xmm11 # 5910 <_sk_callback_sse41+0x8b7>
- .byte 68,15,86,29,82,44,0,0 // orps 0x2c52(%rip),%xmm11 # 5920 <_sk_callback_sse41+0x8c7>
- .byte 68,15,88,37,90,44,0,0 // addps 0x2c5a(%rip),%xmm12 # 5930 <_sk_callback_sse41+0x8d7>
- .byte 15,40,21,99,44,0,0 // movaps 0x2c63(%rip),%xmm2 # 5940 <_sk_callback_sse41+0x8e7>
+ .byte 68,15,89,37,131,44,0,0 // mulps 0x2c83(%rip),%xmm12 # 5970 <_sk_callback_sse41+0x8ad>
+ .byte 68,15,84,29,139,44,0,0 // andps 0x2c8b(%rip),%xmm11 # 5980 <_sk_callback_sse41+0x8bd>
+ .byte 68,15,86,29,147,44,0,0 // orps 0x2c93(%rip),%xmm11 # 5990 <_sk_callback_sse41+0x8cd>
+ .byte 68,15,88,37,155,44,0,0 // addps 0x2c9b(%rip),%xmm12 # 59a0 <_sk_callback_sse41+0x8dd>
+ .byte 15,40,21,164,44,0,0 // movaps 0x2ca4(%rip),%xmm2 # 59b0 <_sk_callback_sse41+0x8ed>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,99,44,0,0 // addps 0x2c63(%rip),%xmm11 # 5950 <_sk_callback_sse41+0x8f7>
- .byte 15,40,21,108,44,0,0 // movaps 0x2c6c(%rip),%xmm2 # 5960 <_sk_callback_sse41+0x907>
+ .byte 68,15,88,29,164,44,0,0 // addps 0x2ca4(%rip),%xmm11 # 59c0 <_sk_callback_sse41+0x8fd>
+ .byte 15,40,21,173,44,0,0 // movaps 0x2cad(%rip),%xmm2 # 59d0 <_sk_callback_sse41+0x90d>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,89,44,0,0 // addps 0x2c59(%rip),%xmm12 # 5970 <_sk_callback_sse41+0x917>
- .byte 15,40,21,98,44,0,0 // movaps 0x2c62(%rip),%xmm2 # 5980 <_sk_callback_sse41+0x927>
+ .byte 68,15,88,37,154,44,0,0 // addps 0x2c9a(%rip),%xmm12 # 59e0 <_sk_callback_sse41+0x91d>
+ .byte 15,40,21,163,44,0,0 // movaps 0x2ca3(%rip),%xmm2 # 59f0 <_sk_callback_sse41+0x92d>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,98,44,0,0 // movaps 0x2c62(%rip),%xmm10 # 5990 <_sk_callback_sse41+0x937>
+ .byte 68,15,40,21,163,44,0,0 // movaps 0x2ca3(%rip),%xmm10 # 5a00 <_sk_callback_sse41+0x93d>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,103,44,0,0 // movaps 0x2c67(%rip),%xmm2 # 59a0 <_sk_callback_sse41+0x947>
+ .byte 15,40,21,168,44,0,0 // movaps 0x2ca8(%rip),%xmm2 # 5a10 <_sk_callback_sse41+0x94d>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,104,44,0,0 // mulps 0x2c68(%rip),%xmm2 # 59b0 <_sk_callback_sse41+0x957>
+ .byte 15,89,21,169,44,0,0 // mulps 0x2ca9(%rip),%xmm2 # 5a20 <_sk_callback_sse41+0x95d>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -25160,7 +25317,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,83,44,0,0 // minps 0x2c53(%rip),%xmm2 # 59c0 <_sk_callback_sse41+0x967>
+ .byte 15,93,21,148,44,0,0 // minps 0x2c94(%rip),%xmm2 # 5a30 <_sk_callback_sse41+0x96d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -25190,31 +25347,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,244,43,0,0 // mulps 0x2bf4(%rip),%xmm12 # 59d0 <_sk_callback_sse41+0x977>
- .byte 68,15,84,29,252,43,0,0 // andps 0x2bfc(%rip),%xmm11 # 59e0 <_sk_callback_sse41+0x987>
- .byte 68,15,86,29,4,44,0,0 // orps 0x2c04(%rip),%xmm11 # 59f0 <_sk_callback_sse41+0x997>
- .byte 68,15,88,37,12,44,0,0 // addps 0x2c0c(%rip),%xmm12 # 5a00 <_sk_callback_sse41+0x9a7>
- .byte 15,40,29,21,44,0,0 // movaps 0x2c15(%rip),%xmm3 # 5a10 <_sk_callback_sse41+0x9b7>
+ .byte 68,15,89,37,53,44,0,0 // mulps 0x2c35(%rip),%xmm12 # 5a40 <_sk_callback_sse41+0x97d>
+ .byte 68,15,84,29,61,44,0,0 // andps 0x2c3d(%rip),%xmm11 # 5a50 <_sk_callback_sse41+0x98d>
+ .byte 68,15,86,29,69,44,0,0 // orps 0x2c45(%rip),%xmm11 # 5a60 <_sk_callback_sse41+0x99d>
+ .byte 68,15,88,37,77,44,0,0 // addps 0x2c4d(%rip),%xmm12 # 5a70 <_sk_callback_sse41+0x9ad>
+ .byte 15,40,29,86,44,0,0 // movaps 0x2c56(%rip),%xmm3 # 5a80 <_sk_callback_sse41+0x9bd>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,21,44,0,0 // addps 0x2c15(%rip),%xmm11 # 5a20 <_sk_callback_sse41+0x9c7>
- .byte 15,40,29,30,44,0,0 // movaps 0x2c1e(%rip),%xmm3 # 5a30 <_sk_callback_sse41+0x9d7>
+ .byte 68,15,88,29,86,44,0,0 // addps 0x2c56(%rip),%xmm11 # 5a90 <_sk_callback_sse41+0x9cd>
+ .byte 15,40,29,95,44,0,0 // movaps 0x2c5f(%rip),%xmm3 # 5aa0 <_sk_callback_sse41+0x9dd>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,11,44,0,0 // addps 0x2c0b(%rip),%xmm12 # 5a40 <_sk_callback_sse41+0x9e7>
- .byte 15,40,29,20,44,0,0 // movaps 0x2c14(%rip),%xmm3 # 5a50 <_sk_callback_sse41+0x9f7>
+ .byte 68,15,88,37,76,44,0,0 // addps 0x2c4c(%rip),%xmm12 # 5ab0 <_sk_callback_sse41+0x9ed>
+ .byte 15,40,29,85,44,0,0 // movaps 0x2c55(%rip),%xmm3 # 5ac0 <_sk_callback_sse41+0x9fd>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,20,44,0,0 // movaps 0x2c14(%rip),%xmm10 # 5a60 <_sk_callback_sse41+0xa07>
+ .byte 68,15,40,21,85,44,0,0 // movaps 0x2c55(%rip),%xmm10 # 5ad0 <_sk_callback_sse41+0xa0d>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,25,44,0,0 // movaps 0x2c19(%rip),%xmm3 # 5a70 <_sk_callback_sse41+0xa17>
+ .byte 15,40,29,90,44,0,0 // movaps 0x2c5a(%rip),%xmm3 # 5ae0 <_sk_callback_sse41+0xa1d>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,26,44,0,0 // mulps 0x2c1a(%rip),%xmm3 # 5a80 <_sk_callback_sse41+0xa27>
+ .byte 15,89,29,91,44,0,0 // mulps 0x2c5b(%rip),%xmm3 # 5af0 <_sk_callback_sse41+0xa2d>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -25222,7 +25379,7 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,5,44,0,0 // minps 0x2c05(%rip),%xmm3 # 5a90 <_sk_callback_sse41+0xa37>
+ .byte 15,93,29,70,44,0,0 // minps 0x2c46(%rip),%xmm3 # 5b00 <_sk_callback_sse41+0xa3d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -25232,29 +25389,29 @@ HIDDEN _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,1,44,0,0 // mulps 0x2c01(%rip),%xmm8 # 5aa0 <_sk_callback_sse41+0xa47>
- .byte 68,15,40,13,9,44,0,0 // movaps 0x2c09(%rip),%xmm9 # 5ab0 <_sk_callback_sse41+0xa57>
+ .byte 68,15,89,5,66,44,0,0 // mulps 0x2c42(%rip),%xmm8 # 5b10 <_sk_callback_sse41+0xa4d>
+ .byte 68,15,40,13,74,44,0,0 // movaps 0x2c4a(%rip),%xmm9 # 5b20 <_sk_callback_sse41+0xa5d>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,14,44,0,0 // movaps 0x2c0e(%rip),%xmm0 # 5ac0 <_sk_callback_sse41+0xa67>
+ .byte 15,40,5,79,44,0,0 // movaps 0x2c4f(%rip),%xmm0 # 5b30 <_sk_callback_sse41+0xa6d>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,12,44,0,0 // addps 0x2c0c(%rip),%xmm8 # 5ad0 <_sk_callback_sse41+0xa77>
- .byte 68,15,89,5,20,44,0,0 // mulps 0x2c14(%rip),%xmm8 # 5ae0 <_sk_callback_sse41+0xa87>
- .byte 15,89,13,29,44,0,0 // mulps 0x2c1d(%rip),%xmm1 # 5af0 <_sk_callback_sse41+0xa97>
+ .byte 68,15,88,5,77,44,0,0 // addps 0x2c4d(%rip),%xmm8 # 5b40 <_sk_callback_sse41+0xa7d>
+ .byte 68,15,89,5,85,44,0,0 // mulps 0x2c55(%rip),%xmm8 # 5b50 <_sk_callback_sse41+0xa8d>
+ .byte 15,89,13,94,44,0,0 // mulps 0x2c5e(%rip),%xmm1 # 5b60 <_sk_callback_sse41+0xa9d>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,34,44,0,0 // mulps 0x2c22(%rip),%xmm2 # 5b00 <_sk_callback_sse41+0xaa7>
+ .byte 15,89,21,99,44,0,0 // mulps 0x2c63(%rip),%xmm2 # 5b70 <_sk_callback_sse41+0xaad>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,22,44,0,0 // movaps 0x2c16(%rip),%xmm9 # 5b10 <_sk_callback_sse41+0xab7>
+ .byte 68,15,40,13,87,44,0,0 // movaps 0x2c57(%rip),%xmm9 # 5b80 <_sk_callback_sse41+0xabd>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,22,44,0,0 // movaps 0x2c16(%rip),%xmm2 # 5b20 <_sk_callback_sse41+0xac7>
+ .byte 15,40,21,87,44,0,0 // movaps 0x2c57(%rip),%xmm2 # 5b90 <_sk_callback_sse41+0xacd>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,27,44,0,0 // movaps 0x2c1b(%rip),%xmm12 # 5b30 <_sk_callback_sse41+0xad7>
+ .byte 68,15,40,37,92,44,0,0 // movaps 0x2c5c(%rip),%xmm12 # 5ba0 <_sk_callback_sse41+0xadd>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -25273,8 +25430,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,212,43,0,0 // mulps 0x2bd4(%rip),%xmm1 # 5b40 <_sk_callback_sse41+0xae7>
- .byte 15,89,21,221,43,0,0 // mulps 0x2bdd(%rip),%xmm2 # 5b50 <_sk_callback_sse41+0xaf7>
+ .byte 15,89,13,21,44,0,0 // mulps 0x2c15(%rip),%xmm1 # 5bb0 <_sk_callback_sse41+0xaed>
+ .byte 15,89,21,30,44,0,0 // mulps 0x2c1e(%rip),%xmm2 # 5bc0 <_sk_callback_sse41+0xafd>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -25287,33 +25444,36 @@ _sk_load_a8_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,38 // jne 2fae <_sk_load_a8_sse41+0x30>
+ .byte 117,39 // jne 2fde <_sk_load_a8_sse41+0x31>
.byte 102,65,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm0
- .byte 102,15,219,5,201,43,0,0 // pand 0x2bc9(%rip),%xmm0 # 5b60 <_sk_callback_sse41+0xb07>
+ .byte 102,15,219,5,10,44,0,0 // pand 0x2c0a(%rip),%xmm0 # 5bd0 <_sk_callback_sse41+0xb0d>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,207,43,0,0 // mulps 0x2bcf(%rip),%xmm3 # 5b70 <_sk_callback_sse41+0xb17>
+ .byte 15,89,29,16,44,0,0 // mulps 0x2c10(%rip),%xmm3 # 5be0 <_sk_callback_sse41+0xb1d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 15,87,201 // xorps %xmm1,%xmm1
+ .byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,39 // je 2fe6 <_sk_load_a8_sse41+0x68>
+ .byte 116,53 // je 3020 <_sk_load_a8_sse41+0x73>
+ .byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 2fda <_sk_load_a8_sse41+0x5c>
+ .byte 116,21 // je 300a <_sk_load_a8_sse41+0x5d>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,196 // jne 2f8f <_sk_load_a8_sse41+0x11>
+ .byte 117,195 // jne 2fbe <_sk_load_a8_sse41+0x11>
.byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
- .byte 65,15,182,68,18,1 // movzbl 0x1(%r10,%rdx,1),%eax
- .byte 102,15,58,34,192,1 // pinsrd $0x1,%eax,%xmm0
+ .byte 65,15,183,4,18 // movzwl (%r10,%rdx,1),%eax
+ .byte 102,15,110,200 // movd %eax,%xmm1
+ .byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
+ .byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
+ .byte 235,158 // jmp 2fbe <_sk_load_a8_sse41+0x11>
.byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax
- .byte 102,15,58,34,192,0 // pinsrd $0x0,%eax,%xmm0
- .byte 235,156 // jmp 2f8f <_sk_load_a8_sse41+0x11>
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 235,147 // jmp 2fbe <_sk_load_a8_sse41+0x11>
HIDDEN _sk_gather_a8_sse41
.globl _sk_gather_a8_sse41
@@ -25342,7 +25502,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,29,43,0,0 // mulps 0x2b1d(%rip),%xmm3 # 5b80 <_sk_callback_sse41+0xb27>
+ .byte 15,89,29,85,43,0,0 // mulps 0x2b55(%rip),%xmm3 # 5bf0 <_sk_callback_sse41+0xb2d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -25356,13 +25516,13 @@ FUNCTION(_sk_store_a8_sse41)
_sk_store_a8_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 68,15,40,5,16,43,0,0 // movaps 0x2b10(%rip),%xmm8 # 5b90 <_sk_callback_sse41+0xb37>
+ .byte 68,15,40,5,72,43,0,0 // movaps 0x2b48(%rip),%xmm8 # 5c00 <_sk_callback_sse41+0xb3d>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 30a6 <_sk_store_a8_sse41+0x33>
+ .byte 117,13 // jne 30de <_sk_store_a8_sse41+0x33>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 65,137,4,18 // mov %eax,(%r10,%rdx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -25371,15 +25531,17 @@ _sk_store_a8_sse41:
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,30 // je 30d7 <_sk_store_a8_sse41+0x64>
+ .byte 116,41 // je 311a <_sk_store_a8_sse41+0x6f>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 30ce <_sk_store_a8_sse41+0x5b>
+ .byte 116,15 // je 3106 <_sk_store_a8_sse41+0x5b>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 30a2 <_sk_store_a8_sse41+0x2f>
+ .byte 117,221 // jne 30da <_sk_store_a8_sse41+0x2f>
.byte 102,69,15,58,20,68,18,2,8 // pextrb $0x8,%xmm8,0x2(%r10,%rdx,1)
- .byte 102,69,15,58,20,68,18,1,4 // pextrb $0x4,%xmm8,0x1(%r10,%rdx,1)
+ .byte 102,68,15,56,0,5,0,43,0,0 // pshufb 0x2b00(%rip),%xmm8 # 5c10 <_sk_callback_sse41+0xb4d>
+ .byte 102,69,15,58,21,4,18,0 // pextrw $0x0,%xmm8,(%r10,%rdx,1)
+ .byte 235,192 // jmp 30da <_sk_store_a8_sse41+0x2f>
.byte 102,69,15,58,20,4,18,0 // pextrb $0x0,%xmm8,(%r10,%rdx,1)
- .byte 235,193 // jmp 30a2 <_sk_store_a8_sse41+0x2f>
+ .byte 235,182 // jmp 30da <_sk_store_a8_sse41+0x2f>
HIDDEN _sk_load_g8_sse41
.globl _sk_load_g8_sse41
@@ -25388,33 +25550,36 @@ _sk_load_g8_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 3115 <_sk_load_g8_sse41+0x34>
+ .byte 117,42 // jne 3158 <_sk_load_g8_sse41+0x34>
.byte 102,65,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm0
- .byte 102,15,219,5,166,42,0,0 // pand 0x2aa6(%rip),%xmm0 # 5ba0 <_sk_callback_sse41+0xb47>
+ .byte 102,15,219,5,227,42,0,0 // pand 0x2ae3(%rip),%xmm0 # 5c20 <_sk_callback_sse41+0xb5d>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,172,42,0,0 // mulps 0x2aac(%rip),%xmm0 # 5bb0 <_sk_callback_sse41+0xb57>
+ .byte 15,89,5,233,42,0,0 // mulps 0x2ae9(%rip),%xmm0 # 5c30 <_sk_callback_sse41+0xb6d>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,179,42,0,0 // movaps 0x2ab3(%rip),%xmm3 # 5bc0 <_sk_callback_sse41+0xb67>
+ .byte 15,40,29,240,42,0,0 // movaps 0x2af0(%rip),%xmm3 # 5c40 <_sk_callback_sse41+0xb7d>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,39 // je 314d <_sk_load_g8_sse41+0x6c>
+ .byte 116,53 // je 319a <_sk_load_g8_sse41+0x76>
+ .byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 3141 <_sk_load_g8_sse41+0x60>
+ .byte 116,21 // je 3184 <_sk_load_g8_sse41+0x60>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,192 // jne 30f2 <_sk_load_g8_sse41+0x11>
+ .byte 117,192 // jne 3135 <_sk_load_g8_sse41+0x11>
.byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
- .byte 65,15,182,68,18,1 // movzbl 0x1(%r10,%rdx,1),%eax
- .byte 102,15,58,34,192,1 // pinsrd $0x1,%eax,%xmm0
+ .byte 65,15,183,4,18 // movzwl (%r10,%rdx,1),%eax
+ .byte 102,15,110,200 // movd %eax,%xmm1
+ .byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
+ .byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
+ .byte 235,155 // jmp 3135 <_sk_load_g8_sse41+0x11>
.byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax
- .byte 102,15,58,34,192,0 // pinsrd $0x0,%eax,%xmm0
- .byte 235,152 // jmp 30f2 <_sk_load_g8_sse41+0x11>
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 235,144 // jmp 3135 <_sk_load_g8_sse41+0x11>
HIDDEN _sk_gather_g8_sse41
.globl _sk_gather_g8_sse41
@@ -25443,9 +25608,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,6,42,0,0 // mulps 0x2a06(%rip),%xmm0 # 5bd0 <_sk_callback_sse41+0xb77>
+ .byte 15,89,5,59,42,0,0 // mulps 0x2a3b(%rip),%xmm0 # 5c50 <_sk_callback_sse41+0xb8d>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,13,42,0,0 // movaps 0x2a0d(%rip),%xmm3 # 5be0 <_sk_callback_sse41+0xb87>
+ .byte 15,40,29,66,42,0,0 // movaps 0x2a42(%rip),%xmm3 # 5c60 <_sk_callback_sse41+0xb9d>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -25458,9 +25623,9 @@ _sk_gather_i8_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,137,193 // mov %rax,%r9
.byte 77,133,201 // test %r9,%r9
- .byte 116,5 // je 31eb <_sk_gather_i8_sse41+0xf>
+ .byte 116,5 // je 3236 <_sk_gather_i8_sse41+0xf>
.byte 76,137,200 // mov %r9,%rax
- .byte 235,2 // jmp 31ed <_sk_gather_i8_sse41+0x11>
+ .byte 235,2 // jmp 3238 <_sk_gather_i8_sse41+0x11>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,86 // push %r14
.byte 83 // push %rbx
@@ -25493,17 +25658,17 @@ _sk_gather_i8_sse41:
.byte 102,15,58,34,28,24,1 // pinsrd $0x1,(%rax,%rbx,1),%xmm3
.byte 102,66,15,58,34,28,152,2 // pinsrd $0x2,(%rax,%r11,4),%xmm3
.byte 102,66,15,58,34,28,16,3 // pinsrd $0x3,(%rax,%r10,1),%xmm3
- .byte 102,15,111,5,96,41,0,0 // movdqa 0x2960(%rip),%xmm0 # 5bf0 <_sk_callback_sse41+0xb97>
+ .byte 102,15,111,5,149,41,0,0 // movdqa 0x2995(%rip),%xmm0 # 5c70 <_sk_callback_sse41+0xbad>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,97,41,0,0 // movaps 0x2961(%rip),%xmm8 # 5c00 <_sk_callback_sse41+0xba7>
+ .byte 68,15,40,5,150,41,0,0 // movaps 0x2996(%rip),%xmm8 # 5c80 <_sk_callback_sse41+0xbbd>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,96,41,0,0 // pshufb 0x2960(%rip),%xmm1 # 5c10 <_sk_callback_sse41+0xbb7>
+ .byte 102,15,56,0,13,149,41,0,0 // pshufb 0x2995(%rip),%xmm1 # 5c90 <_sk_callback_sse41+0xbcd>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,92,41,0,0 // pshufb 0x295c(%rip),%xmm2 # 5c20 <_sk_callback_sse41+0xbc7>
+ .byte 102,15,56,0,21,145,41,0,0 // pshufb 0x2991(%rip),%xmm2 # 5ca0 <_sk_callback_sse41+0xbdd>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -25521,39 +25686,41 @@ _sk_load_565_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 3338 <_sk_load_565_sse41+0x5a>
+ .byte 117,80 // jne 3383 <_sk_load_565_sse41+0x5a>
.byte 102,65,15,56,51,20,82 // pmovzxwd (%r10,%rdx,2),%xmm2
- .byte 102,15,111,5,57,41,0,0 // movdqa 0x2939(%rip),%xmm0 # 5c30 <_sk_callback_sse41+0xbd7>
+ .byte 102,15,111,5,110,41,0,0 // movdqa 0x296e(%rip),%xmm0 # 5cb0 <_sk_callback_sse41+0xbed>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,59,41,0,0 // mulps 0x293b(%rip),%xmm0 # 5c40 <_sk_callback_sse41+0xbe7>
- .byte 102,15,111,13,67,41,0,0 // movdqa 0x2943(%rip),%xmm1 # 5c50 <_sk_callback_sse41+0xbf7>
+ .byte 15,89,5,112,41,0,0 // mulps 0x2970(%rip),%xmm0 # 5cc0 <_sk_callback_sse41+0xbfd>
+ .byte 102,15,111,13,120,41,0,0 // movdqa 0x2978(%rip),%xmm1 # 5cd0 <_sk_callback_sse41+0xc0d>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,69,41,0,0 // mulps 0x2945(%rip),%xmm1 # 5c60 <_sk_callback_sse41+0xc07>
- .byte 102,15,219,21,77,41,0,0 // pand 0x294d(%rip),%xmm2 # 5c70 <_sk_callback_sse41+0xc17>
+ .byte 15,89,13,122,41,0,0 // mulps 0x297a(%rip),%xmm1 # 5ce0 <_sk_callback_sse41+0xc1d>
+ .byte 102,15,219,21,130,41,0,0 // pand 0x2982(%rip),%xmm2 # 5cf0 <_sk_callback_sse41+0xc2d>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,83,41,0,0 // mulps 0x2953(%rip),%xmm2 # 5c80 <_sk_callback_sse41+0xc27>
+ .byte 15,89,21,136,41,0,0 // mulps 0x2988(%rip),%xmm2 # 5d00 <_sk_callback_sse41+0xc3d>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,90,41,0,0 // movaps 0x295a(%rip),%xmm3 # 5c90 <_sk_callback_sse41+0xc37>
+ .byte 15,40,29,143,41,0,0 // movaps 0x298f(%rip),%xmm3 # 5d10 <_sk_callback_sse41+0xc4d>
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,39 // je 3370 <_sk_load_565_sse41+0x92>
+ .byte 116,53 // je 33c5 <_sk_load_565_sse41+0x9c>
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 3364 <_sk_load_565_sse41+0x86>
+ .byte 116,21 // je 33af <_sk_load_565_sse41+0x86>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,154 // jne 32ef <_sk_load_565_sse41+0x11>
+ .byte 117,154 // jne 333a <_sk_load_565_sse41+0x11>
.byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
- .byte 65,15,183,68,82,2 // movzwl 0x2(%r10,%rdx,2),%eax
- .byte 102,15,58,34,208,1 // pinsrd $0x1,%eax,%xmm2
+ .byte 102,65,15,110,4,82 // movd (%r10,%rdx,2),%xmm0
+ .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
+ .byte 102,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm2
+ .byte 233,117,255,255,255 // jmpq 333a <_sk_load_565_sse41+0x11>
.byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax
- .byte 102,15,58,34,208,0 // pinsrd $0x0,%eax,%xmm2
- .byte 233,111,255,255,255 // jmpq 32ef <_sk_load_565_sse41+0x11>
+ .byte 102,15,110,208 // movd %eax,%xmm2
+ .byte 233,103,255,255,255 // jmpq 333a <_sk_load_565_sse41+0x11>
HIDDEN _sk_gather_565_sse41
.globl _sk_gather_565_sse41
@@ -25581,19 +25748,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,182,40,0,0 // movdqa 0x28b6(%rip),%xmm0 # 5ca0 <_sk_callback_sse41+0xc47>
+ .byte 102,15,111,5,227,40,0,0 // movdqa 0x28e3(%rip),%xmm0 # 5d20 <_sk_callback_sse41+0xc5d>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,184,40,0,0 // mulps 0x28b8(%rip),%xmm0 # 5cb0 <_sk_callback_sse41+0xc57>
- .byte 102,15,111,13,192,40,0,0 // movdqa 0x28c0(%rip),%xmm1 # 5cc0 <_sk_callback_sse41+0xc67>
+ .byte 15,89,5,229,40,0,0 // mulps 0x28e5(%rip),%xmm0 # 5d30 <_sk_callback_sse41+0xc6d>
+ .byte 102,15,111,13,237,40,0,0 // movdqa 0x28ed(%rip),%xmm1 # 5d40 <_sk_callback_sse41+0xc7d>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,194,40,0,0 // mulps 0x28c2(%rip),%xmm1 # 5cd0 <_sk_callback_sse41+0xc77>
- .byte 102,15,219,21,202,40,0,0 // pand 0x28ca(%rip),%xmm2 # 5ce0 <_sk_callback_sse41+0xc87>
+ .byte 15,89,13,239,40,0,0 // mulps 0x28ef(%rip),%xmm1 # 5d50 <_sk_callback_sse41+0xc8d>
+ .byte 102,15,219,21,247,40,0,0 // pand 0x28f7(%rip),%xmm2 # 5d60 <_sk_callback_sse41+0xc9d>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,208,40,0,0 // mulps 0x28d0(%rip),%xmm2 # 5cf0 <_sk_callback_sse41+0xc97>
+ .byte 15,89,21,253,40,0,0 // mulps 0x28fd(%rip),%xmm2 # 5d70 <_sk_callback_sse41+0xcad>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,215,40,0,0 // movaps 0x28d7(%rip),%xmm3 # 5d00 <_sk_callback_sse41+0xca7>
+ .byte 15,40,29,4,41,0,0 // movaps 0x2904(%rip),%xmm3 # 5d80 <_sk_callback_sse41+0xcbd>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -25603,12 +25770,12 @@ FUNCTION(_sk_store_565_sse41)
_sk_store_565_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,215,40,0,0 // movaps 0x28d7(%rip),%xmm8 # 5d10 <_sk_callback_sse41+0xcb7>
+ .byte 68,15,40,5,4,41,0,0 // movaps 0x2904(%rip),%xmm8 # 5d90 <_sk_callback_sse41+0xccd>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,204,40,0,0 // movaps 0x28cc(%rip),%xmm10 # 5d20 <_sk_callback_sse41+0xcc7>
+ .byte 68,15,40,21,249,40,0,0 // movaps 0x28f9(%rip),%xmm10 # 5da0 <_sk_callback_sse41+0xcdd>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -25618,7 +25785,7 @@ _sk_store_565_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 348b <_sk_store_565_sse41+0x5f>
+ .byte 117,10 // jne 34de <_sk_store_565_sse41+0x5f>
.byte 242,68,15,17,4,80 // movsd %xmm8,(%rax,%rdx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -25626,15 +25793,17 @@ _sk_store_565_sse41:
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,30 // je 34bc <_sk_store_565_sse41+0x90>
+ .byte 116,35 // je 3514 <_sk_store_565_sse41+0x95>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 34b3 <_sk_store_565_sse41+0x87>
+ .byte 116,15 // je 3506 <_sk_store_565_sse41+0x87>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 3487 <_sk_store_565_sse41+0x5b>
+ .byte 117,221 // jne 34da <_sk_store_565_sse41+0x5b>
.byte 102,68,15,58,21,68,80,4,4 // pextrw $0x4,%xmm8,0x4(%rax,%rdx,2)
- .byte 102,68,15,58,21,68,80,2,2 // pextrw $0x2,%xmm8,0x2(%rax,%rdx,2)
+ .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
+ .byte 102,68,15,126,4,80 // movd %xmm8,(%rax,%rdx,2)
+ .byte 235,198 // jmp 34da <_sk_store_565_sse41+0x5b>
.byte 102,68,15,58,21,4,80,0 // pextrw $0x0,%xmm8,(%rax,%rdx,2)
- .byte 235,193 // jmp 3487 <_sk_store_565_sse41+0x5b>
+ .byte 235,188 // jmp 34da <_sk_store_565_sse41+0x5b>
HIDDEN _sk_load_4444_sse41
.globl _sk_load_4444_sse41
@@ -25643,42 +25812,44 @@ _sk_load_4444_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 352f <_sk_load_4444_sse41+0x69>
+ .byte 117,95 // jne 3587 <_sk_load_4444_sse41+0x69>
.byte 102,65,15,56,51,28,82 // pmovzxwd (%r10,%rdx,2),%xmm3
- .byte 102,15,111,5,81,40,0,0 // movdqa 0x2851(%rip),%xmm0 # 5d30 <_sk_callback_sse41+0xcd7>
+ .byte 102,15,111,5,121,40,0,0 // movdqa 0x2879(%rip),%xmm0 # 5db0 <_sk_callback_sse41+0xced>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,83,40,0,0 // mulps 0x2853(%rip),%xmm0 # 5d40 <_sk_callback_sse41+0xce7>
- .byte 102,15,111,13,91,40,0,0 // movdqa 0x285b(%rip),%xmm1 # 5d50 <_sk_callback_sse41+0xcf7>
+ .byte 15,89,5,123,40,0,0 // mulps 0x287b(%rip),%xmm0 # 5dc0 <_sk_callback_sse41+0xcfd>
+ .byte 102,15,111,13,131,40,0,0 // movdqa 0x2883(%rip),%xmm1 # 5dd0 <_sk_callback_sse41+0xd0d>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,93,40,0,0 // mulps 0x285d(%rip),%xmm1 # 5d60 <_sk_callback_sse41+0xd07>
- .byte 102,15,111,21,101,40,0,0 // movdqa 0x2865(%rip),%xmm2 # 5d70 <_sk_callback_sse41+0xd17>
+ .byte 15,89,13,133,40,0,0 // mulps 0x2885(%rip),%xmm1 # 5de0 <_sk_callback_sse41+0xd1d>
+ .byte 102,15,111,21,141,40,0,0 // movdqa 0x288d(%rip),%xmm2 # 5df0 <_sk_callback_sse41+0xd2d>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,103,40,0,0 // mulps 0x2867(%rip),%xmm2 # 5d80 <_sk_callback_sse41+0xd27>
- .byte 102,15,219,29,111,40,0,0 // pand 0x286f(%rip),%xmm3 # 5d90 <_sk_callback_sse41+0xd37>
+ .byte 15,89,21,143,40,0,0 // mulps 0x288f(%rip),%xmm2 # 5e00 <_sk_callback_sse41+0xd3d>
+ .byte 102,15,219,29,151,40,0,0 // pand 0x2897(%rip),%xmm3 # 5e10 <_sk_callback_sse41+0xd4d>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,117,40,0,0 // mulps 0x2875(%rip),%xmm3 # 5da0 <_sk_callback_sse41+0xd47>
+ .byte 15,89,29,157,40,0,0 // mulps 0x289d(%rip),%xmm3 # 5e20 <_sk_callback_sse41+0xd5d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,39 // je 3567 <_sk_load_4444_sse41+0xa1>
+ .byte 116,53 // je 35c9 <_sk_load_4444_sse41+0xab>
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 355b <_sk_load_4444_sse41+0x95>
+ .byte 116,21 // je 35b3 <_sk_load_4444_sse41+0x95>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,139 // jne 34d7 <_sk_load_4444_sse41+0x11>
+ .byte 117,139 // jne 352f <_sk_load_4444_sse41+0x11>
.byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
- .byte 65,15,183,68,82,2 // movzwl 0x2(%r10,%rdx,2),%eax
- .byte 102,15,58,34,216,1 // pinsrd $0x1,%eax,%xmm3
+ .byte 102,65,15,110,4,82 // movd (%r10,%rdx,2),%xmm0
+ .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
+ .byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
+ .byte 233,102,255,255,255 // jmpq 352f <_sk_load_4444_sse41+0x11>
.byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax
- .byte 102,15,58,34,216,0 // pinsrd $0x0,%eax,%xmm3
- .byte 233,96,255,255,255 // jmpq 34d7 <_sk_load_4444_sse41+0x11>
+ .byte 102,15,110,216 // movd %eax,%xmm3
+ .byte 233,88,255,255,255 // jmpq 352f <_sk_load_4444_sse41+0x11>
HIDDEN _sk_gather_4444_sse41
.globl _sk_gather_4444_sse41
@@ -25706,21 +25877,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,207,39,0,0 // movdqa 0x27cf(%rip),%xmm0 # 5db0 <_sk_callback_sse41+0xd57>
+ .byte 102,15,111,5,239,39,0,0 // movdqa 0x27ef(%rip),%xmm0 # 5e30 <_sk_callback_sse41+0xd6d>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,209,39,0,0 // mulps 0x27d1(%rip),%xmm0 # 5dc0 <_sk_callback_sse41+0xd67>
- .byte 102,15,111,13,217,39,0,0 // movdqa 0x27d9(%rip),%xmm1 # 5dd0 <_sk_callback_sse41+0xd77>
+ .byte 15,89,5,241,39,0,0 // mulps 0x27f1(%rip),%xmm0 # 5e40 <_sk_callback_sse41+0xd7d>
+ .byte 102,15,111,13,249,39,0,0 // movdqa 0x27f9(%rip),%xmm1 # 5e50 <_sk_callback_sse41+0xd8d>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,219,39,0,0 // mulps 0x27db(%rip),%xmm1 # 5de0 <_sk_callback_sse41+0xd87>
- .byte 102,15,111,21,227,39,0,0 // movdqa 0x27e3(%rip),%xmm2 # 5df0 <_sk_callback_sse41+0xd97>
+ .byte 15,89,13,251,39,0,0 // mulps 0x27fb(%rip),%xmm1 # 5e60 <_sk_callback_sse41+0xd9d>
+ .byte 102,15,111,21,3,40,0,0 // movdqa 0x2803(%rip),%xmm2 # 5e70 <_sk_callback_sse41+0xdad>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,229,39,0,0 // mulps 0x27e5(%rip),%xmm2 # 5e00 <_sk_callback_sse41+0xda7>
- .byte 102,15,219,29,237,39,0,0 // pand 0x27ed(%rip),%xmm3 # 5e10 <_sk_callback_sse41+0xdb7>
+ .byte 15,89,21,5,40,0,0 // mulps 0x2805(%rip),%xmm2 # 5e80 <_sk_callback_sse41+0xdbd>
+ .byte 102,15,219,29,13,40,0,0 // pand 0x280d(%rip),%xmm3 # 5e90 <_sk_callback_sse41+0xdcd>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,243,39,0,0 // mulps 0x27f3(%rip),%xmm3 # 5e20 <_sk_callback_sse41+0xdc7>
+ .byte 15,89,29,19,40,0,0 // mulps 0x2813(%rip),%xmm3 # 5ea0 <_sk_callback_sse41+0xddd>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -25731,7 +25902,7 @@ FUNCTION(_sk_store_4444_sse41)
_sk_store_4444_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,241,39,0,0 // movaps 0x27f1(%rip),%xmm8 # 5e30 <_sk_callback_sse41+0xdd7>
+ .byte 68,15,40,5,17,40,0,0 // movaps 0x2811(%rip),%xmm8 # 5eb0 <_sk_callback_sse41+0xded>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -25751,7 +25922,7 @@ _sk_store_4444_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 36a5 <_sk_store_4444_sse41+0x73>
+ .byte 117,10 // jne 3705 <_sk_store_4444_sse41+0x73>
.byte 242,68,15,17,4,80 // movsd %xmm8,(%rax,%rdx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -25759,15 +25930,17 @@ _sk_store_4444_sse41:
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,30 // je 36d6 <_sk_store_4444_sse41+0xa4>
+ .byte 116,35 // je 373b <_sk_store_4444_sse41+0xa9>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 36cd <_sk_store_4444_sse41+0x9b>
+ .byte 116,15 // je 372d <_sk_store_4444_sse41+0x9b>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,221 // jne 36a1 <_sk_store_4444_sse41+0x6f>
+ .byte 117,221 // jne 3701 <_sk_store_4444_sse41+0x6f>
.byte 102,68,15,58,21,68,80,4,4 // pextrw $0x4,%xmm8,0x4(%rax,%rdx,2)
- .byte 102,68,15,58,21,68,80,2,2 // pextrw $0x2,%xmm8,0x2(%rax,%rdx,2)
+ .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
+ .byte 102,68,15,126,4,80 // movd %xmm8,(%rax,%rdx,2)
+ .byte 235,198 // jmp 3701 <_sk_store_4444_sse41+0x6f>
.byte 102,68,15,58,21,4,80,0 // pextrw $0x0,%xmm8,(%rax,%rdx,2)
- .byte 235,193 // jmp 36a1 <_sk_store_4444_sse41+0x6f>
+ .byte 235,188 // jmp 3701 <_sk_store_4444_sse41+0x6f>
HIDDEN _sk_load_8888_sse41
.globl _sk_load_8888_sse41
@@ -25776,19 +25949,19 @@ _sk_load_8888_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,88 // jne 3742 <_sk_load_8888_sse41+0x62>
+ .byte 117,88 // jne 37a7 <_sk_load_8888_sse41+0x62>
.byte 243,15,111,28,144 // movdqu (%rax,%rdx,4),%xmm3
- .byte 102,15,111,5,73,39,0,0 // movdqa 0x2749(%rip),%xmm0 # 5e40 <_sk_callback_sse41+0xde7>
+ .byte 102,15,111,5,100,39,0,0 // movdqa 0x2764(%rip),%xmm0 # 5ec0 <_sk_callback_sse41+0xdfd>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,74,39,0,0 // movaps 0x274a(%rip),%xmm8 # 5e50 <_sk_callback_sse41+0xdf7>
+ .byte 68,15,40,5,101,39,0,0 // movaps 0x2765(%rip),%xmm8 # 5ed0 <_sk_callback_sse41+0xe0d>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,73,39,0,0 // pshufb 0x2749(%rip),%xmm1 # 5e60 <_sk_callback_sse41+0xe07>
+ .byte 102,15,56,0,13,100,39,0,0 // pshufb 0x2764(%rip),%xmm1 # 5ee0 <_sk_callback_sse41+0xe1d>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,69,39,0,0 // pshufb 0x2745(%rip),%xmm2 # 5e70 <_sk_callback_sse41+0xe17>
+ .byte 102,15,56,0,21,96,39,0,0 // pshufb 0x2760(%rip),%xmm2 # 5ef0 <_sk_callback_sse41+0xe2d>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -25798,18 +25971,20 @@ _sk_load_8888_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,31 // je 3772 <_sk_load_8888_sse41+0x92>
+ .byte 116,43 // je 37df <_sk_load_8888_sse41+0x9a>
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,17 // je 376a <_sk_load_8888_sse41+0x8a>
+ .byte 116,17 // je 37cf <_sk_load_8888_sse41+0x8a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,144 // jne 36ef <_sk_load_8888_sse41+0xf>
+ .byte 117,144 // jne 3754 <_sk_load_8888_sse41+0xf>
.byte 102,15,110,68,144,8 // movd 0x8(%rax,%rdx,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
- .byte 102,15,58,34,92,144,4,1 // pinsrd $0x1,0x4(%rax,%rdx,4),%xmm3
- .byte 102,15,58,34,28,144,0 // pinsrd $0x0,(%rax,%rdx,4),%xmm3
- .byte 233,113,255,255,255 // jmpq 36ef <_sk_load_8888_sse41+0xf>
+ .byte 243,15,126,4,144 // movq (%rax,%rdx,4),%xmm0
+ .byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
+ .byte 233,117,255,255,255 // jmpq 3754 <_sk_load_8888_sse41+0xf>
+ .byte 102,15,110,28,144 // movd (%rax,%rdx,4),%xmm3
+ .byte 233,107,255,255,255 // jmpq 3754 <_sk_load_8888_sse41+0xf>
HIDDEN _sk_gather_8888_sse41
.globl _sk_gather_8888_sse41
@@ -25834,17 +26009,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,161,38,0,0 // movdqa 0x26a1(%rip),%xmm0 # 5e80 <_sk_callback_sse41+0xe27>
+ .byte 102,15,111,5,182,38,0,0 // movdqa 0x26b6(%rip),%xmm0 # 5f00 <_sk_callback_sse41+0xe3d>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,162,38,0,0 // movaps 0x26a2(%rip),%xmm8 # 5e90 <_sk_callback_sse41+0xe37>
+ .byte 68,15,40,5,183,38,0,0 // movaps 0x26b7(%rip),%xmm8 # 5f10 <_sk_callback_sse41+0xe4d>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,161,38,0,0 // pshufb 0x26a1(%rip),%xmm1 # 5ea0 <_sk_callback_sse41+0xe47>
+ .byte 102,15,56,0,13,182,38,0,0 // pshufb 0x26b6(%rip),%xmm1 # 5f20 <_sk_callback_sse41+0xe5d>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,157,38,0,0 // pshufb 0x269d(%rip),%xmm2 # 5eb0 <_sk_callback_sse41+0xe57>
+ .byte 102,15,56,0,21,178,38,0,0 // pshufb 0x26b2(%rip),%xmm2 # 5f30 <_sk_callback_sse41+0xe6d>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -25860,7 +26035,7 @@ FUNCTION(_sk_store_8888_sse41)
_sk_store_8888_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,136,38,0,0 // movaps 0x2688(%rip),%xmm8 # 5ec0 <_sk_callback_sse41+0xe67>
+ .byte 68,15,40,5,157,38,0,0 // movaps 0x269d(%rip),%xmm8 # 5f40 <_sk_callback_sse41+0xe7d>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -25879,22 +26054,23 @@ _sk_store_8888_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3898 <_sk_store_8888_sse41+0x6d>
+ .byte 117,10 // jne 3903 <_sk_store_8888_sse41+0x6d>
.byte 243,68,15,127,4,144 // movdqu %xmm8,(%rax,%rdx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,30 // je 38c3 <_sk_store_8888_sse41+0x98>
+ .byte 116,29 // je 392d <_sk_store_8888_sse41+0x97>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,15 // je 38ba <_sk_store_8888_sse41+0x8f>
+ .byte 116,15 // je 3925 <_sk_store_8888_sse41+0x8f>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,227 // jne 3894 <_sk_store_8888_sse41+0x69>
+ .byte 117,227 // jne 38ff <_sk_store_8888_sse41+0x69>
.byte 102,68,15,58,22,68,144,8,2 // pextrd $0x2,%xmm8,0x8(%rax,%rdx,4)
- .byte 102,68,15,58,22,68,144,4,1 // pextrd $0x1,%xmm8,0x4(%rax,%rdx,4)
+ .byte 102,68,15,214,4,144 // movq %xmm8,(%rax,%rdx,4)
+ .byte 235,210 // jmp 38ff <_sk_store_8888_sse41+0x69>
.byte 102,68,15,126,4,144 // movd %xmm8,(%rax,%rdx,4)
- .byte 235,201 // jmp 3894 <_sk_store_8888_sse41+0x69>
+ .byte 235,202 // jmp 38ff <_sk_store_8888_sse41+0x69>
HIDDEN _sk_load_f16_sse41
.globl _sk_load_f16_sse41
@@ -25903,7 +26079,7 @@ _sk_load_f16_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,60,1,0,0 // jne 3a15 <_sk_load_f16_sse41+0x14a>
+ .byte 15,133,60,1,0,0 // jne 3a7f <_sk_load_f16_sse41+0x14a>
.byte 102,15,16,4,208 // movupd (%rax,%rdx,8),%xmm0
.byte 243,15,111,76,208,16 // movdqu 0x10(%rax,%rdx,8),%xmm1
.byte 102,68,15,40,200 // movapd %xmm0,%xmm9
@@ -25913,18 +26089,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,192,37,0,0 // movdqa 0x25c0(%rip),%xmm8 # 5ed0 <_sk_callback_sse41+0xe77>
+ .byte 102,68,15,111,5,214,37,0,0 // movdqa 0x25d6(%rip),%xmm8 # 5f50 <_sk_callback_sse41+0xe8d>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,187,37,0,0 // movdqa 0x25bb(%rip),%xmm3 # 5ee0 <_sk_callback_sse41+0xe87>
+ .byte 102,15,111,29,209,37,0,0 // movdqa 0x25d1(%rip),%xmm3 # 5f60 <_sk_callback_sse41+0xe9d>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,167,37,0,0 // movdqa 0x25a7(%rip),%xmm10 # 5ef0 <_sk_callback_sse41+0xe97>
+ .byte 102,68,15,111,21,189,37,0,0 // movdqa 0x25bd(%rip),%xmm10 # 5f70 <_sk_callback_sse41+0xead>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -25967,16 +26143,16 @@ _sk_load_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,15,16,4,208 // movsd (%rax,%rdx,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 3a2d <_sk_load_f16_sse41+0x162>
+ .byte 117,13 // jne 3a97 <_sk_load_f16_sse41+0x162>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,183,254,255,255 // jmpq 38e4 <_sk_load_f16_sse41+0x19>
+ .byte 233,183,254,255,255 // jmpq 394e <_sk_load_f16_sse41+0x19>
.byte 102,15,22,68,208,8 // movhpd 0x8(%rax,%rdx,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,163,254,255,255 // jb 38e4 <_sk_load_f16_sse41+0x19>
+ .byte 15,130,163,254,255,255 // jb 394e <_sk_load_f16_sse41+0x19>
.byte 243,15,126,76,208,16 // movq 0x10(%rax,%rdx,8),%xmm1
- .byte 233,152,254,255,255 // jmpq 38e4 <_sk_load_f16_sse41+0x19>
+ .byte 233,152,254,255,255 // jmpq 394e <_sk_load_f16_sse41+0x19>
HIDDEN _sk_gather_f16_sse41
.globl _sk_gather_f16_sse41
@@ -26010,18 +26186,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,45,36,0,0 // movdqa 0x242d(%rip),%xmm8 # 5f00 <_sk_callback_sse41+0xea7>
+ .byte 102,68,15,111,5,67,36,0,0 // movdqa 0x2443(%rip),%xmm8 # 5f80 <_sk_callback_sse41+0xebd>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,40,36,0,0 // movdqa 0x2428(%rip),%xmm3 # 5f10 <_sk_callback_sse41+0xeb7>
+ .byte 102,15,111,29,62,36,0,0 // movdqa 0x243e(%rip),%xmm3 # 5f90 <_sk_callback_sse41+0xecd>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,20,36,0,0 // movdqa 0x2414(%rip),%xmm10 # 5f20 <_sk_callback_sse41+0xec7>
+ .byte 102,68,15,111,21,42,36,0,0 // movdqa 0x242a(%rip),%xmm10 # 5fa0 <_sk_callback_sse41+0xedd>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -26070,17 +26246,17 @@ FUNCTION(_sk_store_f16_sse41)
_sk_store_f16_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 102,68,15,111,21,73,35,0,0 // movdqa 0x2349(%rip),%xmm10 # 5f30 <_sk_callback_sse41+0xed7>
+ .byte 102,68,15,111,21,95,35,0,0 // movdqa 0x235f(%rip),%xmm10 # 5fb0 <_sk_callback_sse41+0xeed>
.byte 102,68,15,111,216 // movdqa %xmm0,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,235 // pxor %xmm11,%xmm13
- .byte 102,68,15,111,13,60,35,0,0 // movdqa 0x233c(%rip),%xmm9 # 5f40 <_sk_callback_sse41+0xee7>
+ .byte 102,68,15,111,13,82,35,0,0 // movdqa 0x2352(%rip),%xmm9 # 5fc0 <_sk_callback_sse41+0xefd>
.byte 102,65,15,114,211,16 // psrld $0x10,%xmm11
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,37,45,35,0,0 // movdqa 0x232d(%rip),%xmm12 # 5f50 <_sk_callback_sse41+0xef7>
+ .byte 102,68,15,111,37,67,35,0,0 // movdqa 0x2343(%rip),%xmm12 # 5fd0 <_sk_callback_sse41+0xf0d>
.byte 102,69,15,235,220 // por %xmm12,%xmm11
.byte 102,69,15,254,221 // paddd %xmm13,%xmm11
.byte 102,69,15,223,195 // pandn %xmm11,%xmm8
@@ -26124,7 +26300,7 @@ _sk_store_f16_sse41:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,203 // punpckldq %xmm11,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 3d19 <_sk_store_f16_sse41+0x140>
+ .byte 117,21 // jne 3d83 <_sk_store_f16_sse41+0x140>
.byte 68,15,17,12,208 // movups %xmm9,(%rax,%rdx,8)
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 243,68,15,127,68,208,16 // movdqu %xmm8,0x10(%rax,%rdx,8)
@@ -26132,13 +26308,13 @@ _sk_store_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,68,15,214,12,208 // movq %xmm9,(%rax,%rdx,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 3d15 <_sk_store_f16_sse41+0x13c>
+ .byte 116,240 // je 3d7f <_sk_store_f16_sse41+0x13c>
.byte 102,68,15,23,76,208,8 // movhpd %xmm9,0x8(%rax,%rdx,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 3d15 <_sk_store_f16_sse41+0x13c>
+ .byte 114,227 // jb 3d7f <_sk_store_f16_sse41+0x13c>
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 102,68,15,214,68,208,16 // movq %xmm8,0x10(%rax,%rdx,8)
- .byte 235,213 // jmp 3d15 <_sk_store_f16_sse41+0x13c>
+ .byte 235,213 // jmp 3d7f <_sk_store_f16_sse41+0x13c>
HIDDEN _sk_load_u16_be_sse41
.globl _sk_load_u16_be_sse41
@@ -26148,7 +26324,7 @@ _sk_load_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,185,0,0,0 // jne 3e0f <_sk_load_u16_be_sse41+0xcf>
+ .byte 15,133,185,0,0,0 // jne 3e79 <_sk_load_u16_be_sse41+0xcf>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 243,65,15,111,76,65,16 // movdqu 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -26164,7 +26340,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,190,33,0,0 // movaps 0x21be(%rip),%xmm8 # 5f60 <_sk_callback_sse41+0xf07>
+ .byte 68,15,40,5,212,33,0,0 // movaps 0x21d4(%rip),%xmm8 # 5fe0 <_sk_callback_sse41+0xf1d>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -26192,16 +26368,16 @@ _sk_load_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 3e28 <_sk_load_u16_be_sse41+0xe8>
+ .byte 117,13 // jne 3e92 <_sk_load_u16_be_sse41+0xe8>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,59,255,255,255 // jmpq 3d63 <_sk_load_u16_be_sse41+0x23>
+ .byte 233,59,255,255,255 // jmpq 3dcd <_sk_load_u16_be_sse41+0x23>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,38,255,255,255 // jb 3d63 <_sk_load_u16_be_sse41+0x23>
+ .byte 15,130,38,255,255,255 // jb 3dcd <_sk_load_u16_be_sse41+0x23>
.byte 243,65,15,126,76,65,16 // movq 0x10(%r9,%rax,2),%xmm1
- .byte 233,26,255,255,255 // jmpq 3d63 <_sk_load_u16_be_sse41+0x23>
+ .byte 233,26,255,255,255 // jmpq 3dcd <_sk_load_u16_be_sse41+0x23>
HIDDEN _sk_load_rgb_u16_be_sse41
.globl _sk_load_rgb_u16_be_sse41
@@ -26211,7 +26387,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,82 // lea (%rdx,%rdx,2),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,170,0,0,0 // jne 3f05 <_sk_load_rgb_u16_be_sse41+0xbc>
+ .byte 15,133,170,0,0,0 // jne 3f6f <_sk_load_rgb_u16_be_sse41+0xbc>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -26231,7 +26407,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,182,32,0,0 // movaps 0x20b6(%rip),%xmm8 # 5f70 <_sk_callback_sse41+0xf17>
+ .byte 68,15,40,5,204,32,0,0 // movaps 0x20cc(%rip),%xmm8 # 5ff0 <_sk_callback_sse41+0xf2d>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -26248,27 +26424,27 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,125,32,0,0 // movaps 0x207d(%rip),%xmm3 # 5f80 <_sk_callback_sse41+0xf27>
+ .byte 15,40,29,147,32,0,0 // movaps 0x2093(%rip),%xmm3 # 6000 <_sk_callback_sse41+0xf3d>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 3f2a <_sk_load_rgb_u16_be_sse41+0xe1>
+ .byte 117,13 // jne 3f94 <_sk_load_rgb_u16_be_sse41+0xe1>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,85,255,255,255 // jmpq 3e7f <_sk_load_rgb_u16_be_sse41+0x36>
+ .byte 233,85,255,255,255 // jmpq 3ee9 <_sk_load_rgb_u16_be_sse41+0x36>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 3f5b <_sk_load_rgb_u16_be_sse41+0x112>
+ .byte 114,24 // jb 3fc5 <_sk_load_rgb_u16_be_sse41+0x112>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,36,255,255,255 // jmpq 3e7f <_sk_load_rgb_u16_be_sse41+0x36>
+ .byte 233,36,255,255,255 // jmpq 3ee9 <_sk_load_rgb_u16_be_sse41+0x36>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,27,255,255,255 // jmpq 3e7f <_sk_load_rgb_u16_be_sse41+0x36>
+ .byte 233,27,255,255,255 // jmpq 3ee9 <_sk_load_rgb_u16_be_sse41+0x36>
HIDDEN _sk_store_u16_be_sse41
.globl _sk_store_u16_be_sse41
@@ -26277,7 +26453,7 @@ _sk_store_u16_be_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax
- .byte 68,15,40,21,23,32,0,0 // movaps 0x2017(%rip),%xmm10 # 5f90 <_sk_callback_sse41+0xf37>
+ .byte 68,15,40,21,45,32,0,0 // movaps 0x202d(%rip),%xmm10 # 6010 <_sk_callback_sse41+0xf4d>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -26314,7 +26490,7 @@ _sk_store_u16_be_sse41:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 4047 <_sk_store_u16_be_sse41+0xe3>
+ .byte 117,21 // jne 40b1 <_sk_store_u16_be_sse41+0xe3>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -26322,13 +26498,13 @@ _sk_store_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4043 <_sk_store_u16_be_sse41+0xdf>
+ .byte 116,240 // je 40ad <_sk_store_u16_be_sse41+0xdf>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4043 <_sk_store_u16_be_sse41+0xdf>
+ .byte 114,227 // jb 40ad <_sk_store_u16_be_sse41+0xdf>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 4043 <_sk_store_u16_be_sse41+0xdf>
+ .byte 235,213 // jmp 40ad <_sk_store_u16_be_sse41+0xdf>
HIDDEN _sk_load_f32_sse41
.globl _sk_load_f32_sse41
@@ -26341,7 +26517,7 @@ _sk_load_f32_sse41:
.byte 72,193,224,4 // shl $0x4,%rax
.byte 69,15,16,4,2 // movups (%r10,%rax,1),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 40ce <_sk_load_f32_sse41+0x60>
+ .byte 117,66 // jne 4138 <_sk_load_f32_sse41+0x60>
.byte 67,15,16,68,138,16 // movups 0x10(%r10,%r9,4),%xmm0
.byte 67,15,16,92,138,32 // movups 0x20(%r10,%r9,4),%xmm3
.byte 71,15,16,76,138,48 // movups 0x30(%r10,%r9,4),%xmm9
@@ -26361,17 +26537,17 @@ _sk_load_f32_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 40e0 <_sk_load_f32_sse41+0x72>
+ .byte 117,8 // jne 414a <_sk_load_f32_sse41+0x72>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 409e <_sk_load_f32_sse41+0x30>
+ .byte 235,190 // jmp 4108 <_sk_load_f32_sse41+0x30>
.byte 67,15,16,68,138,16 // movups 0x10(%r10,%r9,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 40f4 <_sk_load_f32_sse41+0x86>
+ .byte 114,8 // jb 415e <_sk_load_f32_sse41+0x86>
.byte 67,15,16,92,138,32 // movups 0x20(%r10,%r9,4),%xmm3
- .byte 235,170 // jmp 409e <_sk_load_f32_sse41+0x30>
+ .byte 235,170 // jmp 4108 <_sk_load_f32_sse41+0x30>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 409e <_sk_load_f32_sse41+0x30>
+ .byte 235,165 // jmp 4108 <_sk_load_f32_sse41+0x30>
HIDDEN _sk_store_f32_sse41
.globl _sk_store_f32_sse41
@@ -26397,7 +26573,7 @@ _sk_store_f32_sse41:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,2 // movupd %xmm12,(%r10,%rax,1)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 416b <_sk_store_f32_sse41+0x72>
+ .byte 117,29 // jne 41d5 <_sk_store_f32_sse41+0x72>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 71,15,17,68,138,16 // movups %xmm8,0x10(%r10,%r9,4)
.byte 102,71,15,17,76,138,32 // movupd %xmm9,0x20(%r10,%r9,4)
@@ -26405,12 +26581,12 @@ _sk_store_f32_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 4167 <_sk_store_f32_sse41+0x6e>
+ .byte 116,246 // je 41d1 <_sk_store_f32_sse41+0x6e>
.byte 71,15,17,68,138,16 // movups %xmm8,0x10(%r10,%r9,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 4167 <_sk_store_f32_sse41+0x6e>
+ .byte 114,234 // jb 41d1 <_sk_store_f32_sse41+0x6e>
.byte 102,71,15,17,76,138,32 // movupd %xmm9,0x20(%r10,%r9,4)
- .byte 235,225 // jmp 4167 <_sk_store_f32_sse41+0x6e>
+ .byte 235,225 // jmp 41d1 <_sk_store_f32_sse41+0x6e>
HIDDEN _sk_clamp_x_sse41
.globl _sk_clamp_x_sse41
@@ -26494,7 +26670,7 @@ _sk_mirror_x_sse41:
.byte 65,15,92,194 // subps %xmm10,%xmm0
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,227,32,0,0 // mulss 0x20e3(%rip),%xmm9 # 6360 <_sk_callback_sse41+0x1307>
+ .byte 243,68,15,89,13,249,32,0,0 // mulss 0x20f9(%rip),%xmm9 # 63e0 <_sk_callback_sse41+0x131d>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -26522,7 +26698,7 @@ _sk_mirror_y_sse41:
.byte 65,15,92,202 // subps %xmm10,%xmm1
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,128,32,0,0 // mulss 0x2080(%rip),%xmm9 # 6364 <_sk_callback_sse41+0x130b>
+ .byte 243,68,15,89,13,150,32,0,0 // mulss 0x2096(%rip),%xmm9 # 63e4 <_sk_callback_sse41+0x1321>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,201 // mulps %xmm1,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -26544,7 +26720,7 @@ FUNCTION(_sk_clamp_x_1_sse41)
_sk_clamp_x_1_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,114,28,0,0 // minps 0x1c72(%rip),%xmm8 # 5fa0 <_sk_callback_sse41+0xf47>
+ .byte 68,15,93,5,136,28,0,0 // minps 0x1c88(%rip),%xmm8 # 6020 <_sk_callback_sse41+0xf5d>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -26562,9 +26738,9 @@ HIDDEN _sk_mirror_x_1_sse41
.globl _sk_mirror_x_1_sse41
FUNCTION(_sk_mirror_x_1_sse41)
_sk_mirror_x_1_sse41:
- .byte 68,15,40,5,99,28,0,0 // movaps 0x1c63(%rip),%xmm8 # 5fb0 <_sk_callback_sse41+0xf57>
+ .byte 68,15,40,5,121,28,0,0 // movaps 0x1c79(%rip),%xmm8 # 6030 <_sk_callback_sse41+0xf6d>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,103,28,0,0 // movaps 0x1c67(%rip),%xmm9 # 5fc0 <_sk_callback_sse41+0xf67>
+ .byte 68,15,40,13,125,28,0,0 // movaps 0x1c7d(%rip),%xmm9 # 6040 <_sk_callback_sse41+0xf7d>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
.byte 69,15,88,201 // addps %xmm9,%xmm9
@@ -26581,10 +26757,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,70,28,0,0 // mulps 0x1c46(%rip),%xmm0 # 5fd0 <_sk_callback_sse41+0xf77>
- .byte 15,89,13,79,28,0,0 // mulps 0x1c4f(%rip),%xmm1 # 5fe0 <_sk_callback_sse41+0xf87>
+ .byte 15,89,5,92,28,0,0 // mulps 0x1c5c(%rip),%xmm0 # 6050 <_sk_callback_sse41+0xf8d>
+ .byte 15,89,13,101,28,0,0 // mulps 0x1c65(%rip),%xmm1 # 6060 <_sk_callback_sse41+0xf9d>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,85,28,0,0 // mulps 0x1c55(%rip),%xmm3 # 5ff0 <_sk_callback_sse41+0xf97>
+ .byte 15,89,29,107,28,0,0 // mulps 0x1c6b(%rip),%xmm3 # 6070 <_sk_callback_sse41+0xfad>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -26863,9 +27039,9 @@ _sk_evenly_spaced_gradient_sse41:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 47d9 <_sk_evenly_spaced_gradient_sse41+0x1a>
+ .byte 120,7 // js 4843 <_sk_evenly_spaced_gradient_sse41+0x1a>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 47ee <_sk_evenly_spaced_gradient_sse41+0x2f>
+ .byte 235,21 // jmp 4858 <_sk_evenly_spaced_gradient_sse41+0x2f>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -26955,15 +27131,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41
.globl _sk_gauss_a_to_rgba_sse41
FUNCTION(_sk_gauss_a_to_rgba_sse41)
_sk_gauss_a_to_rgba_sse41:
- .byte 15,40,5,100,22,0,0 // movaps 0x1664(%rip),%xmm0 # 6000 <_sk_callback_sse41+0xfa7>
+ .byte 15,40,5,122,22,0,0 // movaps 0x167a(%rip),%xmm0 # 6080 <_sk_callback_sse41+0xfbd>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,106,22,0,0 // addps 0x166a(%rip),%xmm0 # 6010 <_sk_callback_sse41+0xfb7>
+ .byte 15,88,5,128,22,0,0 // addps 0x1680(%rip),%xmm0 # 6090 <_sk_callback_sse41+0xfcd>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,112,22,0,0 // addps 0x1670(%rip),%xmm0 # 6020 <_sk_callback_sse41+0xfc7>
+ .byte 15,88,5,134,22,0,0 // addps 0x1686(%rip),%xmm0 # 60a0 <_sk_callback_sse41+0xfdd>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,118,22,0,0 // addps 0x1676(%rip),%xmm0 # 6030 <_sk_callback_sse41+0xfd7>
+ .byte 15,88,5,140,22,0,0 // addps 0x168c(%rip),%xmm0 # 60b0 <_sk_callback_sse41+0xfed>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,124,22,0,0 // addps 0x167c(%rip),%xmm0 # 6040 <_sk_callback_sse41+0xfe7>
+ .byte 15,88,5,146,22,0,0 // addps 0x1692(%rip),%xmm0 # 60c0 <_sk_callback_sse41+0xffd>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -26981,12 +27157,12 @@ _sk_gradient_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 4a17 <_sk_gradient_sse41+0x46>
+ .byte 114,50 // jb 4a81 <_sk_gradient_sse41+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,85,22,0,0 // movaps 0x1655(%rip),%xmm2 # 6050 <_sk_callback_sse41+0xff7>
+ .byte 15,40,21,107,22,0,0 // movaps 0x166b(%rip),%xmm2 # 60d0 <_sk_callback_sse41+0x100d>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -26994,7 +27170,7 @@ _sk_gradient_sse41:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 49fb <_sk_gradient_sse41+0x2a>
+ .byte 117,228 // jne 4a65 <_sk_gradient_sse41+0x2a>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -27124,26 +27300,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,246,19,0,0 // movaps 0x13f6(%rip),%xmm10 # 6060 <_sk_callback_sse41+0x1007>
+ .byte 68,15,40,21,12,20,0,0 // movaps 0x140c(%rip),%xmm10 # 60e0 <_sk_callback_sse41+0x101d>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,250,19,0,0 // addps 0x13fa(%rip),%xmm10 # 6070 <_sk_callback_sse41+0x1017>
+ .byte 68,15,88,21,16,20,0,0 // addps 0x1410(%rip),%xmm10 # 60f0 <_sk_callback_sse41+0x102d>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,254,19,0,0 // addps 0x13fe(%rip),%xmm10 # 6080 <_sk_callback_sse41+0x1027>
+ .byte 68,15,88,21,20,20,0,0 // addps 0x1414(%rip),%xmm10 # 6100 <_sk_callback_sse41+0x103d>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,2,20,0,0 // addps 0x1402(%rip),%xmm10 # 6090 <_sk_callback_sse41+0x1037>
+ .byte 68,15,88,21,24,20,0,0 // addps 0x1418(%rip),%xmm10 # 6110 <_sk_callback_sse41+0x104d>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,1,20,0,0 // movaps 0x1401(%rip),%xmm11 # 60a0 <_sk_callback_sse41+0x1047>
+ .byte 68,15,40,29,23,20,0,0 // movaps 0x1417(%rip),%xmm11 # 6120 <_sk_callback_sse41+0x105d>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,250,19,0,0 // movaps 0x13fa(%rip),%xmm11 # 60b0 <_sk_callback_sse41+0x1057>
+ .byte 68,15,40,29,16,20,0,0 // movaps 0x1410(%rip),%xmm11 # 6130 <_sk_callback_sse41+0x106d>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,236,19,0,0 // movaps 0x13ec(%rip),%xmm9 # 60c0 <_sk_callback_sse41+0x1067>
+ .byte 68,15,40,13,2,20,0,0 // movaps 0x1402(%rip),%xmm9 # 6140 <_sk_callback_sse41+0x107d>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -27169,7 +27345,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,192,19,0,0 // movaps 0x13c0(%rip),%xmm8 # 60d0 <_sk_callback_sse41+0x1077>
+ .byte 68,15,40,5,214,19,0,0 // movaps 0x13d6(%rip),%xmm8 # 6150 <_sk_callback_sse41+0x108d>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -27213,8 +27389,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,66,19,0,0 // addps 0x1342(%rip),%xmm0 # 60e0 <_sk_callback_sse41+0x1087>
- .byte 68,15,40,13,74,19,0,0 // movaps 0x134a(%rip),%xmm9 # 60f0 <_sk_callback_sse41+0x1097>
+ .byte 15,88,5,88,19,0,0 // addps 0x1358(%rip),%xmm0 # 6160 <_sk_callback_sse41+0x109d>
+ .byte 68,15,40,13,96,19,0,0 // movaps 0x1360(%rip),%xmm9 # 6170 <_sk_callback_sse41+0x10ad>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27227,7 +27403,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,57,19,0,0 // addps 0x1339(%rip),%xmm0 # 6100 <_sk_callback_sse41+0x10a7>
+ .byte 15,88,5,79,19,0,0 // addps 0x134f(%rip),%xmm0 # 6180 <_sk_callback_sse41+0x10bd>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -27239,8 +27415,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,43,19,0,0 // addps 0x132b(%rip),%xmm1 # 6110 <_sk_callback_sse41+0x10b7>
- .byte 68,15,40,13,51,19,0,0 // movaps 0x1333(%rip),%xmm9 # 6120 <_sk_callback_sse41+0x10c7>
+ .byte 15,88,13,65,19,0,0 // addps 0x1341(%rip),%xmm1 # 6190 <_sk_callback_sse41+0x10cd>
+ .byte 68,15,40,13,73,19,0,0 // movaps 0x1349(%rip),%xmm9 # 61a0 <_sk_callback_sse41+0x10dd>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27253,7 +27429,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,33,19,0,0 // addps 0x1321(%rip),%xmm1 # 6130 <_sk_callback_sse41+0x10d7>
+ .byte 15,88,13,55,19,0,0 // addps 0x1337(%rip),%xmm1 # 61b0 <_sk_callback_sse41+0x10ed>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -27265,13 +27441,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,20,19,0,0 // addps 0x1314(%rip),%xmm0 # 6140 <_sk_callback_sse41+0x10e7>
- .byte 68,15,40,13,28,19,0,0 // movaps 0x131c(%rip),%xmm9 # 6150 <_sk_callback_sse41+0x10f7>
+ .byte 15,88,5,42,19,0,0 // addps 0x132a(%rip),%xmm0 # 61c0 <_sk_callback_sse41+0x10fd>
+ .byte 68,15,40,13,50,19,0,0 // movaps 0x1332(%rip),%xmm9 # 61d0 <_sk_callback_sse41+0x110d>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,24,19,0,0 // mulps 0x1318(%rip),%xmm9 # 6160 <_sk_callback_sse41+0x1107>
- .byte 68,15,88,13,32,19,0,0 // addps 0x1320(%rip),%xmm9 # 6170 <_sk_callback_sse41+0x1117>
+ .byte 68,15,89,13,46,19,0,0 // mulps 0x132e(%rip),%xmm9 # 61e0 <_sk_callback_sse41+0x111d>
+ .byte 68,15,88,13,54,19,0,0 // addps 0x1336(%rip),%xmm9 # 61f0 <_sk_callback_sse41+0x112d>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27284,16 +27460,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,15,19,0,0 // addps 0x130f(%rip),%xmm0 # 6180 <_sk_callback_sse41+0x1127>
- .byte 68,15,40,13,23,19,0,0 // movaps 0x1317(%rip),%xmm9 # 6190 <_sk_callback_sse41+0x1137>
+ .byte 15,88,5,37,19,0,0 // addps 0x1325(%rip),%xmm0 # 6200 <_sk_callback_sse41+0x113d>
+ .byte 68,15,40,13,45,19,0,0 // movaps 0x132d(%rip),%xmm9 # 6210 <_sk_callback_sse41+0x114d>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,27,19,0,0 // movaps 0x131b(%rip),%xmm8 # 61a0 <_sk_callback_sse41+0x1147>
+ .byte 68,15,40,5,49,19,0,0 // movaps 0x1331(%rip),%xmm8 # 6220 <_sk_callback_sse41+0x115d>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,31,19,0,0 // addps 0x131f(%rip),%xmm8 # 61b0 <_sk_callback_sse41+0x1157>
+ .byte 68,15,88,5,53,19,0,0 // addps 0x1335(%rip),%xmm8 # 6230 <_sk_callback_sse41+0x116d>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,35,19,0,0 // addps 0x1323(%rip),%xmm8 # 61c0 <_sk_callback_sse41+0x1167>
+ .byte 68,15,88,5,57,19,0,0 // addps 0x1339(%rip),%xmm8 # 6240 <_sk_callback_sse41+0x117d>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,39,19,0,0 // addps 0x1327(%rip),%xmm8 # 61d0 <_sk_callback_sse41+0x1177>
+ .byte 68,15,88,5,61,19,0,0 // addps 0x133d(%rip),%xmm8 # 6250 <_sk_callback_sse41+0x118d>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -27303,17 +27479,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,33,19,0,0 // movaps 0x1321(%rip),%xmm8 # 61e0 <_sk_callback_sse41+0x1187>
+ .byte 68,15,40,5,55,19,0,0 // movaps 0x1337(%rip),%xmm8 # 6260 <_sk_callback_sse41+0x119d>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,29,19,0,0 // movaps 0x131d(%rip),%xmm10 # 61f0 <_sk_callback_sse41+0x1197>
+ .byte 68,15,40,21,51,19,0,0 // movaps 0x1333(%rip),%xmm10 # 6270 <_sk_callback_sse41+0x11ad>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,33,19,0,0 // addps 0x1321(%rip),%xmm10 # 6200 <_sk_callback_sse41+0x11a7>
+ .byte 68,15,88,21,55,19,0,0 // addps 0x1337(%rip),%xmm10 # 6280 <_sk_callback_sse41+0x11bd>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,29,19,0,0 // addps 0x131d(%rip),%xmm10 # 6210 <_sk_callback_sse41+0x11b7>
+ .byte 68,15,88,21,51,19,0,0 // addps 0x1333(%rip),%xmm10 # 6290 <_sk_callback_sse41+0x11cd>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -27325,11 +27501,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,16,19,0,0 // addps 0x1310(%rip),%xmm0 # 6220 <_sk_callback_sse41+0x11c7>
+ .byte 15,88,5,38,19,0,0 // addps 0x1326(%rip),%xmm0 # 62a0 <_sk_callback_sse41+0x11dd>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,16,19,0,0 // mulps 0x1310(%rip),%xmm8 # 6230 <_sk_callback_sse41+0x11d7>
- .byte 68,15,88,5,24,19,0,0 // addps 0x1318(%rip),%xmm8 # 6240 <_sk_callback_sse41+0x11e7>
+ .byte 68,15,89,5,38,19,0,0 // mulps 0x1326(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x11ed>
+ .byte 68,15,88,5,46,19,0,0 // addps 0x132e(%rip),%xmm8 # 62c0 <_sk_callback_sse41+0x11fd>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27342,13 +27518,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,6,19,0,0 // addps 0x1306(%rip),%xmm1 # 6250 <_sk_callback_sse41+0x11f7>
- .byte 68,15,40,13,14,19,0,0 // movaps 0x130e(%rip),%xmm9 # 6260 <_sk_callback_sse41+0x1207>
+ .byte 15,88,13,28,19,0,0 // addps 0x131c(%rip),%xmm1 # 62d0 <_sk_callback_sse41+0x120d>
+ .byte 68,15,40,13,36,19,0,0 // movaps 0x1324(%rip),%xmm9 # 62e0 <_sk_callback_sse41+0x121d>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,10,19,0,0 // mulps 0x130a(%rip),%xmm9 # 6270 <_sk_callback_sse41+0x1217>
- .byte 68,15,88,13,18,19,0,0 // addps 0x1312(%rip),%xmm9 # 6280 <_sk_callback_sse41+0x1227>
+ .byte 68,15,89,13,32,19,0,0 // mulps 0x1320(%rip),%xmm9 # 62f0 <_sk_callback_sse41+0x122d>
+ .byte 68,15,88,13,40,19,0,0 // addps 0x1328(%rip),%xmm9 # 6300 <_sk_callback_sse41+0x123d>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27361,16 +27537,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,0,19,0,0 // addps 0x1300(%rip),%xmm1 # 6290 <_sk_callback_sse41+0x1237>
- .byte 68,15,40,13,8,19,0,0 // movaps 0x1308(%rip),%xmm9 # 62a0 <_sk_callback_sse41+0x1247>
+ .byte 15,88,13,22,19,0,0 // addps 0x1316(%rip),%xmm1 # 6310 <_sk_callback_sse41+0x124d>
+ .byte 68,15,40,13,30,19,0,0 // movaps 0x131e(%rip),%xmm9 # 6320 <_sk_callback_sse41+0x125d>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,12,19,0,0 // movaps 0x130c(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x1257>
+ .byte 68,15,40,5,34,19,0,0 // movaps 0x1322(%rip),%xmm8 # 6330 <_sk_callback_sse41+0x126d>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,16,19,0,0 // addps 0x1310(%rip),%xmm8 # 62c0 <_sk_callback_sse41+0x1267>
+ .byte 68,15,88,5,38,19,0,0 // addps 0x1326(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x127d>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,20,19,0,0 // addps 0x1314(%rip),%xmm8 # 62d0 <_sk_callback_sse41+0x1277>
+ .byte 68,15,88,5,42,19,0,0 // addps 0x132a(%rip),%xmm8 # 6350 <_sk_callback_sse41+0x128d>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,24,19,0,0 // addps 0x1318(%rip),%xmm8 # 62e0 <_sk_callback_sse41+0x1287>
+ .byte 68,15,88,5,46,19,0,0 // addps 0x132e(%rip),%xmm8 # 6360 <_sk_callback_sse41+0x129d>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -27380,17 +27556,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,18,19,0,0 // movaps 0x1312(%rip),%xmm8 # 62f0 <_sk_callback_sse41+0x1297>
+ .byte 68,15,40,5,40,19,0,0 // movaps 0x1328(%rip),%xmm8 # 6370 <_sk_callback_sse41+0x12ad>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,13,19,0,0 // movaps 0x130d(%rip),%xmm10 # 6300 <_sk_callback_sse41+0x12a7>
+ .byte 68,15,40,21,35,19,0,0 // movaps 0x1323(%rip),%xmm10 # 6380 <_sk_callback_sse41+0x12bd>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,17,19,0,0 // addps 0x1311(%rip),%xmm10 # 6310 <_sk_callback_sse41+0x12b7>
+ .byte 68,15,88,21,39,19,0,0 // addps 0x1327(%rip),%xmm10 # 6390 <_sk_callback_sse41+0x12cd>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,13,19,0,0 // addps 0x130d(%rip),%xmm10 # 6320 <_sk_callback_sse41+0x12c7>
+ .byte 68,15,88,21,35,19,0,0 // addps 0x1323(%rip),%xmm10 # 63a0 <_sk_callback_sse41+0x12dd>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -27402,11 +27578,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,255,18,0,0 // addps 0x12ff(%rip),%xmm1 # 6330 <_sk_callback_sse41+0x12d7>
+ .byte 15,88,13,21,19,0,0 // addps 0x1315(%rip),%xmm1 # 63b0 <_sk_callback_sse41+0x12ed>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,255,18,0,0 // mulps 0x12ff(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x12e7>
- .byte 68,15,88,5,7,19,0,0 // addps 0x1307(%rip),%xmm8 # 6350 <_sk_callback_sse41+0x12f7>
+ .byte 68,15,89,5,21,19,0,0 // mulps 0x1315(%rip),%xmm8 # 63c0 <_sk_callback_sse41+0x12fd>
+ .byte 68,15,88,5,29,19,0,0 // addps 0x131d(%rip),%xmm8 # 63d0 <_sk_callback_sse41+0x130d>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -27636,11 +27812,11 @@ BALIGN16
.byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 5328 <.literal16+0x1d8>
+ .byte 224,64 // loopne 5398 <.literal16+0x1d8>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 532c <.literal16+0x1dc>
+ .byte 224,64 // loopne 539c <.literal16+0x1dc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 5330 <.literal16+0x1e0>
+ .byte 224,64 // loopne 53a0 <.literal16+0x1e0>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -27660,13 +27836,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5351 <.literal16+0x201>
+ .byte 71,225,61 // rex.RXB loope 53c1 <.literal16+0x201>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5355 <.literal16+0x205>
+ .byte 71,225,61 // rex.RXB loope 53c5 <.literal16+0x205>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5359 <.literal16+0x209>
+ .byte 71,225,61 // rex.RXB loope 53c9 <.literal16+0x209>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 535d <.literal16+0x20d>
+ .byte 71,225,61 // rex.RXB loope 53cd <.literal16+0x20d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -27691,13 +27867,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5391 <.literal16+0x241>
+ .byte 71,225,61 // rex.RXB loope 5401 <.literal16+0x241>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5395 <.literal16+0x245>
+ .byte 71,225,61 // rex.RXB loope 5405 <.literal16+0x245>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5399 <.literal16+0x249>
+ .byte 71,225,61 // rex.RXB loope 5409 <.literal16+0x249>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 539d <.literal16+0x24d>
+ .byte 71,225,61 // rex.RXB loope 540d <.literal16+0x24d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -27722,13 +27898,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 53d1 <.literal16+0x281>
+ .byte 71,225,61 // rex.RXB loope 5441 <.literal16+0x281>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 53d5 <.literal16+0x285>
+ .byte 71,225,61 // rex.RXB loope 5445 <.literal16+0x285>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 53d9 <.literal16+0x289>
+ .byte 71,225,61 // rex.RXB loope 5449 <.literal16+0x289>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 53dd <.literal16+0x28d>
+ .byte 71,225,61 // rex.RXB loope 544d <.literal16+0x28d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -27753,13 +27929,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5411 <.literal16+0x2c1>
+ .byte 71,225,61 // rex.RXB loope 5481 <.literal16+0x2c1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5415 <.literal16+0x2c5>
+ .byte 71,225,61 // rex.RXB loope 5485 <.literal16+0x2c5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5419 <.literal16+0x2c9>
+ .byte 71,225,61 // rex.RXB loope 5489 <.literal16+0x2c9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 541d <.literal16+0x2cd>
+ .byte 71,225,61 // rex.RXB loope 548d <.literal16+0x2cd>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -27776,10 +27952,10 @@ BALIGN16
.byte 0,1 // add %al,(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005408 <_sk_callback_sse41+0xa0003af>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005478 <_sk_callback_sse41+0xa0003b5>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005410 <_sk_callback_sse41+0x30003b7>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005480 <_sk_callback_sse41+0x30003bd>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -27798,11 +27974,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
.byte 67,0,0 // rex.XB add %al,(%r8)
- .byte 127,67 // jg 547b <.literal16+0x32b>
+ .byte 127,67 // jg 54eb <.literal16+0x32b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 547f <.literal16+0x32f>
+ .byte 127,67 // jg 54ef <.literal16+0x32f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5483 <.literal16+0x333>
+ .byte 127,67 // jg 54f3 <.literal16+0x333>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -28037,13 +28213,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5659 <.literal16+0x509>
+ .byte 224,7 // loopne 56c9 <.literal16+0x509>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 565d <.literal16+0x50d>
+ .byte 224,7 // loopne 56cd <.literal16+0x50d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5661 <.literal16+0x511>
+ .byte 224,7 // loopne 56d1 <.literal16+0x511>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5665 <.literal16+0x515>
+ .byte 224,7 // loopne 56d5 <.literal16+0x515>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -28077,10 +28253,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0056a8 <_sk_callback_sse41+0xa00064f>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005718 <_sk_callback_sse41+0xa000655>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30056b0 <_sk_callback_sse41+0x3000657>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005720 <_sk_callback_sse41+0x300065d>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -28135,11 +28311,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 577b <.literal16+0x62b>
+ .byte 127,67 // jg 57eb <.literal16+0x62b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 577f <.literal16+0x62f>
+ .byte 127,67 // jg 57ef <.literal16+0x62f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5783 <.literal16+0x633>
+ .byte 127,67 // jg 57f3 <.literal16+0x633>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -28154,16 +28330,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5774 <.literal16+0x624>
+ .byte 127,0 // jg 57e4 <.literal16+0x624>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5778 <.literal16+0x628>
+ .byte 127,0 // jg 57e8 <.literal16+0x628>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 577c <.literal16+0x62c>
+ .byte 127,0 // jg 57ec <.literal16+0x62c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5780 <.literal16+0x630>
+ .byte 127,0 // jg 57f0 <.literal16+0x630>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -28172,7 +28348,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5805 <.literal16+0x6b5>
+ .byte 119,115 // ja 5875 <.literal16+0x6b5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -28183,7 +28359,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 5769 <.literal16+0x619>
+ .byte 117,191 // jne 57d9 <.literal16+0x619>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -28195,7 +28371,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a397aa <_sk_callback_sse41+0xffffffffe9a34751>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a3981a <_sk_callback_sse41+0xffffffffe9a34757>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -28250,16 +28426,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5844 <.literal16+0x6f4>
+ .byte 127,0 // jg 58b4 <.literal16+0x6f4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5848 <.literal16+0x6f8>
+ .byte 127,0 // jg 58b8 <.literal16+0x6f8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 584c <.literal16+0x6fc>
+ .byte 127,0 // jg 58bc <.literal16+0x6fc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5850 <.literal16+0x700>
+ .byte 127,0 // jg 58c0 <.literal16+0x700>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -28268,7 +28444,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 58d5 <.literal16+0x785>
+ .byte 119,115 // ja 5945 <.literal16+0x785>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -28279,7 +28455,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 5839 <.literal16+0x6e9>
+ .byte 117,191 // jne 58a9 <.literal16+0x6e9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -28291,7 +28467,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3987a <_sk_callback_sse41+0xffffffffe9a34821>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a398ea <_sk_callback_sse41+0xffffffffe9a34827>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -28346,16 +28522,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5914 <.literal16+0x7c4>
+ .byte 127,0 // jg 5984 <.literal16+0x7c4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5918 <.literal16+0x7c8>
+ .byte 127,0 // jg 5988 <.literal16+0x7c8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 591c <.literal16+0x7cc>
+ .byte 127,0 // jg 598c <.literal16+0x7cc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5920 <.literal16+0x7d0>
+ .byte 127,0 // jg 5990 <.literal16+0x7d0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -28364,7 +28540,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 59a5 <.literal16+0x855>
+ .byte 119,115 // ja 5a15 <.literal16+0x855>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -28375,7 +28551,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 5909 <.literal16+0x7b9>
+ .byte 117,191 // jne 5979 <.literal16+0x7b9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -28387,7 +28563,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a3994a <_sk_callback_sse41+0xffffffffe9a348f1>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a399ba <_sk_callback_sse41+0xffffffffe9a348f7>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -28442,16 +28618,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 59e4 <.literal16+0x894>
+ .byte 127,0 // jg 5a54 <.literal16+0x894>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 59e8 <.literal16+0x898>
+ .byte 127,0 // jg 5a58 <.literal16+0x898>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 59ec <.literal16+0x89c>
+ .byte 127,0 // jg 5a5c <.literal16+0x89c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 59f0 <.literal16+0x8a0>
+ .byte 127,0 // jg 5a60 <.literal16+0x8a0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -28460,7 +28636,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5a75 <.literal16+0x925>
+ .byte 119,115 // ja 5ae5 <.literal16+0x925>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -28471,7 +28647,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 59d9 <.literal16+0x889>
+ .byte 117,191 // jne 5a49 <.literal16+0x889>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -28483,7 +28659,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a39a1a <_sk_callback_sse41+0xffffffffe9a349c1>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a39a8a <_sk_callback_sse41+0xffffffffe9a349c7>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -28534,13 +28710,13 @@ BALIGN16
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 5af7 <.literal16+0x9a7>
+ .byte 127,67 // jg 5b67 <.literal16+0x9a7>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5afb <.literal16+0x9ab>
+ .byte 127,67 // jg 5b6b <.literal16+0x9ab>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5aff <.literal16+0x9af>
+ .byte 127,67 // jg 5b6f <.literal16+0x9af>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5b03 <.literal16+0x9b3>
+ .byte 127,67 // jg 5b73 <.literal16+0x9b3>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -28587,16 +28763,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 5b83 <.literal16+0xa33>
+ .byte 118,63 // jbe 5bf3 <.literal16+0xa33>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 5b87 <.literal16+0xa37>
+ .byte 118,63 // jbe 5bf7 <.literal16+0xa37>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 5b8b <.literal16+0xa3b>
+ .byte 118,63 // jbe 5bfb <.literal16+0xa3b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 5b8f <.literal16+0xa3f>
+ .byte 118,63 // jbe 5bff <.literal16+0xa3f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -28616,23 +28792,29 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5bdb <.literal16+0xa8b>
+ .byte 127,67 // jg 5c4b <.literal16+0xa8b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5bdf <.literal16+0xa8f>
+ .byte 127,67 // jg 5c4f <.literal16+0xa8f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5be3 <.literal16+0xa93>
- .byte 255,0 // incl (%rax)
+ .byte 127,67 // jg 5c53 <.literal16+0xa93>
+ .byte 0,4,0 // add %al,(%rax,%rax,1)
.byte 0,0 // add %al,(%rax)
- .byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
- .byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
- .byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
- .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
- .byte 128,59,129 // cmpb $0x81,(%rbx)
- .byte 128,128,59,0,0,128,63 // addb $0x3f,-0x7fffffc5(%rax)
.byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,255 // add %bh,%bh
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,255 // add %bh,%bh
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,255 // add %bh,%bh
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,255 // add %bh,%bh
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,129,128,128,59,129 // add %al,-0x7ec47f80(%rcx)
+ .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
+ .byte 129,128,128,59,0,0,128,63,0,0 // addl $0x3f80,0x3b80(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
.byte 63 // (bad)
@@ -28657,7 +28839,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005c20 <_sk_callback_sse41+0x3000bc7>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005ca0 <_sk_callback_sse41+0x3000bdd>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -28686,13 +28868,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5c59 <.literal16+0xb09>
+ .byte 224,7 // loopne 5cd9 <.literal16+0xb19>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5c5d <.literal16+0xb0d>
+ .byte 224,7 // loopne 5cdd <.literal16+0xb1d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5c61 <.literal16+0xb11>
+ .byte 224,7 // loopne 5ce1 <.literal16+0xb21>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5c65 <.literal16+0xb15>
+ .byte 224,7 // loopne 5ce5 <.literal16+0xb25>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -28738,13 +28920,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5cc9 <.literal16+0xb79>
+ .byte 224,7 // loopne 5d49 <.literal16+0xb89>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5ccd <.literal16+0xb7d>
+ .byte 224,7 // loopne 5d4d <.literal16+0xb8d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5cd1 <.literal16+0xb81>
+ .byte 224,7 // loopne 5d51 <.literal16+0xb91>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5cd5 <.literal16+0xb85>
+ .byte 224,7 // loopne 5d55 <.literal16+0xb95>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -28782,13 +28964,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 5d66 <.literal16+0xc16>
+ .byte 124,66 // jl 5de6 <.literal16+0xc26>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 5d6a <.literal16+0xc1a>
+ .byte 124,66 // jl 5dea <.literal16+0xc2a>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 5d6e <.literal16+0xc1e>
+ .byte 124,66 // jl 5dee <.literal16+0xc2e>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 5d72 <.literal16+0xc22>
+ .byte 124,66 // jl 5df2 <.literal16+0xc32>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -28878,13 +29060,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 5e75 <.literal16+0xd25>
+ .byte 112,65 // jo 5ef5 <.literal16+0xd35>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 5e79 <.literal16+0xd29>
+ .byte 112,65 // jo 5ef9 <.literal16+0xd39>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 5e7d <.literal16+0xd2d>
+ .byte 112,65 // jo 5efd <.literal16+0xd3d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 5e81 <.literal16+0xd31>
+ .byte 112,65 // jo 5f01 <.literal16+0xd41>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -28899,7 +29081,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005e70 <_sk_callback_sse41+0x3000e17>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005ef0 <_sk_callback_sse41+0x3000e2d>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -28926,7 +29108,7 @@ BALIGN16
.byte 5,255,255,255,9 // add $0x9ffffff,%eax
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005eb0 <_sk_callback_sse41+0x3000e57>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005f30 <_sk_callback_sse41+0x3000e6d>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -28941,11 +29123,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5f0b <.literal16+0xdbb>
+ .byte 127,67 // jg 5f8b <.literal16+0xdcb>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5f0f <.literal16+0xdbf>
+ .byte 127,67 // jg 5f8f <.literal16+0xdcf>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5f13 <.literal16+0xdc3>
+ .byte 127,67 // jg 5f93 <.literal16+0xdd3>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -29021,13 +29203,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 5fdb <.literal16+0xe8b>
+ .byte 127,71 // jg 605b <.literal16+0xe9b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 5fdf <.literal16+0xe8f>
+ .byte 127,71 // jg 605f <.literal16+0xe9f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 5fe3 <.literal16+0xe93>
+ .byte 127,71 // jg 6063 <.literal16+0xea3>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 5fe7 <.literal16+0xe97>
+ .byte 127,71 // jg 6067 <.literal16+0xea7>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -29073,10 +29255,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0711a <_sk_callback_sse41+0x2dc020c1>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0719a <_sk_callback_sse41+0x2dc020d7>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 604c <.literal16+0xefc>
+ .byte 120,57 // js 60cc <.literal16+0xf0c>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -29198,11 +29380,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 6182 <.literal16+0x1032>
+ .byte 62,114,28 // jb,pt 6202 <.literal16+0x1042>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 6186 <.literal16+0x1036>
+ .byte 62,114,28 // jb,pt 6206 <.literal16+0x1046>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 618a <.literal16+0x103a>
+ .byte 62,114,28 // jb,pt 620a <.literal16+0x104a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -29246,7 +29428,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f015 <_sk_callback_sse41+0x3d639fbc>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f095 <_sk_callback_sse41+0x3d639fd2>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -29272,7 +29454,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f055 <_sk_callback_sse41+0x3d639ffc>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f0d5 <_sk_callback_sse41+0x3d63a012>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -29281,13 +29463,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 624e <.literal16+0x10fe>
+ .byte 114,28 // jb 62ce <.literal16+0x110e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 6252 <.literal16+0x1102>
+ .byte 62,114,28 // jb,pt 62d2 <.literal16+0x1112>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 6256 <.literal16+0x1106>
+ .byte 62,114,28 // jb,pt 62d6 <.literal16+0x1116>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 625a <.literal16+0x110a>
+ .byte 62,114,28 // jb,pt 62da <.literal16+0x111a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -29308,11 +29490,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 6292 <.literal16+0x1142>
+ .byte 62,114,28 // jb,pt 6312 <.literal16+0x1152>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 6296 <.literal16+0x1146>
+ .byte 62,114,28 // jb,pt 6316 <.literal16+0x1156>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 629a <.literal16+0x114a>
+ .byte 62,114,28 // jb,pt 631a <.literal16+0x115a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -29356,7 +29538,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f125 <_sk_callback_sse41+0x3d63a0cc>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f1a5 <_sk_callback_sse41+0x3d63a0e2>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -29382,7 +29564,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f165 <_sk_callback_sse41+0x3d63a10c>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f1e5 <_sk_callback_sse41+0x3d63a122>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -29391,13 +29573,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 635e <.literal16+0x120e>
+ .byte 114,28 // jb 63de <.literal16+0x121e>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 6362 <_sk_callback_sse41+0x1309>
+ .byte 62,114,28 // jb,pt 63e2 <_sk_callback_sse41+0x131f>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 6366 <_sk_callback_sse41+0x130d>
+ .byte 62,114,28 // jb,pt 63e6 <_sk_callback_sse41+0x1323>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 636a <_sk_callback_sse41+0x1311>
+ .byte 62,114,28 // jb,pt 63ea <_sk_callback_sse41+0x1327>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -29505,7 +29687,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,220,85,0,0 // movaps 0x55dc(%rip),%xmm2 # 56b0 <_sk_callback_sse2+0x100>
+ .byte 15,40,21,156,85,0,0 // movaps 0x559c(%rip),%xmm2 # 5670 <_sk_callback_sse2+0xfa>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -29514,7 +29696,7 @@ _sk_seed_shader_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,203,85,0,0 // movaps 0x55cb(%rip),%xmm2 # 56c0 <_sk_callback_sse2+0x110>
+ .byte 15,40,21,139,85,0,0 // movaps 0x558b(%rip),%xmm2 # 5680 <_sk_callback_sse2+0x10a>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -29534,14 +29716,14 @@ _sk_dither_sse2:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,153,85,0,0 // movdqa 0x5599(%rip),%xmm10 # 56d0 <_sk_callback_sse2+0x120>
+ .byte 102,68,15,111,21,89,85,0,0 // movdqa 0x5559(%rip),%xmm10 # 5690 <_sk_callback_sse2+0x11a>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,133,85,0,0 // movdqa 0x5585(%rip),%xmm12 # 56e0 <_sk_callback_sse2+0x130>
- .byte 102,68,15,111,45,140,85,0,0 // movdqa 0x558c(%rip),%xmm13 # 56f0 <_sk_callback_sse2+0x140>
+ .byte 102,68,15,111,37,69,85,0,0 // movdqa 0x5545(%rip),%xmm12 # 56a0 <_sk_callback_sse2+0x12a>
+ .byte 102,68,15,111,45,76,85,0,0 // movdqa 0x554c(%rip),%xmm13 # 56b0 <_sk_callback_sse2+0x13a>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -29557,8 +29739,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,71,85,0,0 // mulps 0x5547(%rip),%xmm8 # 5700 <_sk_callback_sse2+0x150>
- .byte 68,15,88,5,79,85,0,0 // addps 0x554f(%rip),%xmm8 # 5710 <_sk_callback_sse2+0x160>
+ .byte 68,15,89,5,7,85,0,0 // mulps 0x5507(%rip),%xmm8 # 56c0 <_sk_callback_sse2+0x14a>
+ .byte 68,15,88,5,15,85,0,0 // addps 0x550f(%rip),%xmm8 # 56d0 <_sk_callback_sse2+0x15a>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -29635,7 +29817,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,169,84,0,0 // movaps 0x54a9(%rip),%xmm8 # 5720 <_sk_callback_sse2+0x170>
+ .byte 68,15,40,5,105,84,0,0 // movaps 0x5469(%rip),%xmm8 # 56e0 <_sk_callback_sse2+0x16a>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -29660,7 +29842,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,108,84,0,0 // movaps 0x546c(%rip),%xmm9 # 5730 <_sk_callback_sse2+0x180>
+ .byte 68,15,40,13,44,84,0,0 // movaps 0x542c(%rip),%xmm9 # 56f0 <_sk_callback_sse2+0x17a>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -29707,7 +29889,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,16,84,0,0 // movaps 0x5410(%rip),%xmm8 # 5740 <_sk_callback_sse2+0x190>
+ .byte 68,15,40,5,208,83,0,0 // movaps 0x53d0(%rip),%xmm8 # 5700 <_sk_callback_sse2+0x18a>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -29720,7 +29902,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,0,84,0,0 // movaps 0x5400(%rip),%xmm8 # 5750 <_sk_callback_sse2+0x1a0>
+ .byte 68,15,40,5,192,83,0,0 // movaps 0x53c0(%rip),%xmm8 # 5710 <_sk_callback_sse2+0x19a>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -29737,7 +29919,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,227,83,0,0 // movaps 0x53e3(%rip),%xmm8 # 5760 <_sk_callback_sse2+0x1b0>
+ .byte 68,15,40,5,163,83,0,0 // movaps 0x53a3(%rip),%xmm8 # 5720 <_sk_callback_sse2+0x1aa>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -29757,7 +29939,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,183,83,0,0 // movaps 0x53b7(%rip),%xmm8 # 5770 <_sk_callback_sse2+0x1c0>
+ .byte 68,15,40,5,119,83,0,0 // movaps 0x5377(%rip),%xmm8 # 5730 <_sk_callback_sse2+0x1ba>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -29785,7 +29967,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,139,83,0,0 // movaps 0x538b(%rip),%xmm8 # 5780 <_sk_callback_sse2+0x1d0>
+ .byte 68,15,40,5,75,83,0,0 // movaps 0x534b(%rip),%xmm8 # 5740 <_sk_callback_sse2+0x1ca>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -29860,7 +30042,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,192,82,0,0 // movaps 0x52c0(%rip),%xmm3 # 5790 <_sk_callback_sse2+0x1e0>
+ .byte 15,40,29,128,82,0,0 // movaps 0x5280(%rip),%xmm3 # 5750 <_sk_callback_sse2+0x1da>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -29908,7 +30090,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,43,82,0,0 // movaps 0x522b(%rip),%xmm2 # 57a0 <_sk_callback_sse2+0x1f0>
+ .byte 15,40,21,235,81,0,0 // movaps 0x51eb(%rip),%xmm2 # 5760 <_sk_callback_sse2+0x1ea>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -29942,7 +30124,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,208,81,0,0 // movaps 0x51d0(%rip),%xmm2 # 57b0 <_sk_callback_sse2+0x200>
+ .byte 15,40,21,144,81,0,0 // movaps 0x5190(%rip),%xmm2 # 5770 <_sk_callback_sse2+0x1fa>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -29979,7 +30161,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,106,81,0,0 // movaps 0x516a(%rip),%xmm2 # 57c0 <_sk_callback_sse2+0x210>
+ .byte 15,40,21,42,81,0,0 // movaps 0x512a(%rip),%xmm2 # 5780 <_sk_callback_sse2+0x20a>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -30007,7 +30189,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,42,81,0,0 // movaps 0x512a(%rip),%xmm2 # 57d0 <_sk_callback_sse2+0x220>
+ .byte 15,40,21,234,80,0,0 // movaps 0x50ea(%rip),%xmm2 # 5790 <_sk_callback_sse2+0x21a>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -30020,7 +30202,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,29,81,0,0 // movaps 0x511d(%rip),%xmm10 # 57e0 <_sk_callback_sse2+0x230>
+ .byte 68,15,40,21,221,80,0,0 // movaps 0x50dd(%rip),%xmm10 # 57a0 <_sk_callback_sse2+0x22a>
.byte 69,15,40,202 // movaps %xmm10,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,217 // movaps %xmm9,%xmm11
@@ -30114,7 +30296,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,211,79,0,0 // movaps 0x4fd3(%rip),%xmm10 # 57f0 <_sk_callback_sse2+0x240>
+ .byte 68,15,40,21,147,79,0,0 // movaps 0x4f93(%rip),%xmm10 # 57b0 <_sk_callback_sse2+0x23a>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -30208,7 +30390,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,136,78,0,0 // movaps 0x4e88(%rip),%xmm11 # 5800 <_sk_callback_sse2+0x250>
+ .byte 68,15,40,29,72,78,0,0 // movaps 0x4e48(%rip),%xmm11 # 57c0 <_sk_callback_sse2+0x24a>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -30296,7 +30478,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,86,77,0,0 // movaps 0x4d56(%rip),%xmm9 # 5810 <_sk_callback_sse2+0x260>
+ .byte 68,15,40,13,22,77,0,0 // movaps 0x4d16(%rip),%xmm9 # 57d0 <_sk_callback_sse2+0x25a>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -30387,7 +30569,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,19,76,0,0 // movaps 0x4c13(%rip),%xmm9 # 5820 <_sk_callback_sse2+0x270>
+ .byte 68,15,40,13,211,75,0,0 // movaps 0x4bd3(%rip),%xmm9 # 57e0 <_sk_callback_sse2+0x26a>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -30400,10 +30582,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,237,75,0,0 // movaps 0x4bed(%rip),%xmm14 # 5830 <_sk_callback_sse2+0x280>
+ .byte 68,15,40,53,173,75,0,0 // movaps 0x4bad(%rip),%xmm14 # 57f0 <_sk_callback_sse2+0x27a>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,237,75,0,0 // movaps 0x4bed(%rip),%xmm10 # 5840 <_sk_callback_sse2+0x290>
+ .byte 68,15,40,21,173,75,0,0 // movaps 0x4bad(%rip),%xmm10 # 5800 <_sk_callback_sse2+0x28a>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -30548,7 +30730,7 @@ _sk_hue_sse2:
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,40,5,48,74,0,0 // movaps 0x4a30(%rip),%xmm8 # 5880 <_sk_callback_sse2+0x2d0>
+ .byte 68,15,40,5,240,73,0,0 // movaps 0x49f0(%rip),%xmm8 # 5840 <_sk_callback_sse2+0x2ca>
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 15,40,207 // movaps %xmm7,%xmm1
.byte 68,15,92,217 // subps %xmm1,%xmm11
@@ -30596,12 +30778,12 @@ _sk_hue_sse2:
.byte 69,15,84,206 // andps %xmm14,%xmm9
.byte 69,15,84,214 // andps %xmm14,%xmm10
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,61,61,73,0,0 // movaps 0x493d(%rip),%xmm15 # 5850 <_sk_callback_sse2+0x2a0>
+ .byte 68,15,40,61,253,72,0,0 // movaps 0x48fd(%rip),%xmm15 # 5810 <_sk_callback_sse2+0x29a>
.byte 65,15,89,231 // mulps %xmm15,%xmm4
- .byte 15,40,5,66,73,0,0 // movaps 0x4942(%rip),%xmm0 # 5860 <_sk_callback_sse2+0x2b0>
+ .byte 15,40,5,2,73,0,0 // movaps 0x4902(%rip),%xmm0 # 5820 <_sk_callback_sse2+0x2aa>
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
- .byte 68,15,40,53,68,73,0,0 // movaps 0x4944(%rip),%xmm14 # 5870 <_sk_callback_sse2+0x2c0>
+ .byte 68,15,40,53,4,73,0,0 // movaps 0x4904(%rip),%xmm14 # 5830 <_sk_callback_sse2+0x2ba>
.byte 68,15,40,239 // movaps %xmm7,%xmm13
.byte 69,15,89,238 // mulps %xmm14,%xmm13
.byte 68,15,88,238 // addps %xmm6,%xmm13
@@ -30779,14 +30961,14 @@ _sk_saturation_sse2:
.byte 68,15,84,211 // andps %xmm3,%xmm10
.byte 68,15,84,203 // andps %xmm3,%xmm9
.byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,40,5,214,70,0,0 // movaps 0x46d6(%rip),%xmm8 # 5890 <_sk_callback_sse2+0x2e0>
+ .byte 68,15,40,5,150,70,0,0 // movaps 0x4696(%rip),%xmm8 # 5850 <_sk_callback_sse2+0x2da>
.byte 15,40,214 // movaps %xmm6,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,40,13,216,70,0,0 // movaps 0x46d8(%rip),%xmm1 # 58a0 <_sk_callback_sse2+0x2f0>
+ .byte 15,40,13,152,70,0,0 // movaps 0x4698(%rip),%xmm1 # 5860 <_sk_callback_sse2+0x2ea>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,217 // mulps %xmm1,%xmm3
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,37,215,70,0,0 // movaps 0x46d7(%rip),%xmm12 # 58b0 <_sk_callback_sse2+0x300>
+ .byte 68,15,40,37,151,70,0,0 // movaps 0x4697(%rip),%xmm12 # 5870 <_sk_callback_sse2+0x2fa>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
.byte 65,15,40,210 // movaps %xmm10,%xmm2
@@ -30831,7 +31013,7 @@ _sk_saturation_sse2:
.byte 15,40,223 // movaps %xmm7,%xmm3
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 68,15,40,5,60,70,0,0 // movaps 0x463c(%rip),%xmm8 # 58c0 <_sk_callback_sse2+0x310>
+ .byte 68,15,40,5,252,69,0,0 // movaps 0x45fc(%rip),%xmm8 # 5880 <_sk_callback_sse2+0x30a>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 15,88,253 // addps %xmm5,%xmm7
@@ -30932,14 +31114,14 @@ _sk_color_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 68,15,40,45,218,68,0,0 // movaps 0x44da(%rip),%xmm13 # 58d0 <_sk_callback_sse2+0x320>
+ .byte 68,15,40,45,154,68,0,0 // movaps 0x449a(%rip),%xmm13 # 5890 <_sk_callback_sse2+0x31a>
.byte 68,15,40,198 // movaps %xmm6,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,218,68,0,0 // movaps 0x44da(%rip),%xmm14 # 58e0 <_sk_callback_sse2+0x330>
+ .byte 68,15,40,53,154,68,0,0 // movaps 0x449a(%rip),%xmm14 # 58a0 <_sk_callback_sse2+0x32a>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,29,214,68,0,0 // movaps 0x44d6(%rip),%xmm11 # 58f0 <_sk_callback_sse2+0x340>
+ .byte 68,15,40,29,150,68,0,0 // movaps 0x4496(%rip),%xmm11 # 58b0 <_sk_callback_sse2+0x33a>
.byte 69,15,89,227 // mulps %xmm11,%xmm12
.byte 68,15,88,224 // addps %xmm0,%xmm12
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -30947,7 +31129,7 @@ _sk_color_sse2:
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 68,15,40,5,194,68,0,0 // movaps 0x44c2(%rip),%xmm8 # 5900 <_sk_callback_sse2+0x350>
+ .byte 68,15,40,5,130,68,0,0 // movaps 0x4482(%rip),%xmm8 # 58c0 <_sk_callback_sse2+0x34a>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,89,252 // mulps %xmm4,%xmm7
@@ -31083,15 +31265,15 @@ _sk_luminosity_sse2:
.byte 68,15,40,205 // movaps %xmm5,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 68,15,40,37,217,66,0,0 // movaps 0x42d9(%rip),%xmm12 # 5910 <_sk_callback_sse2+0x360>
+ .byte 68,15,40,37,153,66,0,0 // movaps 0x4299(%rip),%xmm12 # 58d0 <_sk_callback_sse2+0x35a>
.byte 68,15,40,199 // movaps %xmm7,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,217,66,0,0 // movaps 0x42d9(%rip),%xmm13 # 5920 <_sk_callback_sse2+0x370>
+ .byte 68,15,40,45,153,66,0,0 // movaps 0x4299(%rip),%xmm13 # 58e0 <_sk_callback_sse2+0x36a>
.byte 68,15,40,241 // movaps %xmm1,%xmm14
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 69,15,88,240 // addps %xmm8,%xmm14
- .byte 68,15,40,29,213,66,0,0 // movaps 0x42d5(%rip),%xmm11 # 5930 <_sk_callback_sse2+0x380>
- .byte 68,15,40,5,221,66,0,0 // movaps 0x42dd(%rip),%xmm8 # 5940 <_sk_callback_sse2+0x390>
+ .byte 68,15,40,29,149,66,0,0 // movaps 0x4295(%rip),%xmm11 # 58f0 <_sk_callback_sse2+0x37a>
+ .byte 68,15,40,5,157,66,0,0 // movaps 0x429d(%rip),%xmm8 # 5900 <_sk_callback_sse2+0x38a>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 68,15,92,248 // subps %xmm0,%xmm15
@@ -31230,7 +31412,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,133,227,0,0,0 // jne 193b <_sk_srcover_rgba_8888_sse2+0xf1>
.byte 243,68,15,111,4,144 // movdqu (%rax,%rdx,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,53,231,64,0,0 // movdqa 0x40e7(%rip),%xmm6 # 5950 <_sk_callback_sse2+0x3a0>
+ .byte 102,15,111,53,167,64,0,0 // movdqa 0x40a7(%rip),%xmm6 # 5910 <_sk_callback_sse2+0x39a>
.byte 102,65,15,111,224 // movdqa %xmm8,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
@@ -31244,9 +31426,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,91,247 // cvtdq2ps %xmm7,%xmm6
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7
- .byte 68,15,40,5,183,64,0,0 // movaps 0x40b7(%rip),%xmm8 # 5960 <_sk_callback_sse2+0x3b0>
+ .byte 68,15,40,5,119,64,0,0 // movaps 0x4077(%rip),%xmm8 # 5920 <_sk_callback_sse2+0x3aa>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,187,64,0,0 // movaps 0x40bb(%rip),%xmm12 # 5970 <_sk_callback_sse2+0x3c0>
+ .byte 68,15,40,37,123,64,0,0 // movaps 0x407b(%rip),%xmm12 # 5930 <_sk_callback_sse2+0x3ba>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -31272,7 +31454,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,106 // jne 198c <_sk_srcover_rgba_8888_sse2+0x142>
+ .byte 117,82 // jne 1974 <_sk_srcover_rgba_8888_sse2+0x12a>
.byte 243,15,127,4,144 // movdqu %xmm0,(%rax,%rdx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -31282,36 +31464,33 @@ _sk_srcover_rgba_8888_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,48 // je 197d <_sk_srcover_rgba_8888_sse2+0x133>
+ .byte 116,87 // je 199f <_sk_srcover_rgba_8888_sse2+0x155>
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
.byte 116,22 // je 1969 <_sk_srcover_rgba_8888_sse2+0x11f>
.byte 65,128,249,3 // cmp $0x3,%r9b
.byte 15,133,1,255,255,255 // jne 185e <_sk_srcover_rgba_8888_sse2+0x14>
.byte 102,15,110,100,144,8 // movd 0x8(%rax,%rdx,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
- .byte 243,15,16,100,144,4 // movss 0x4(%rax,%rdx,4),%xmm4
- .byte 65,15,198,224,0 // shufps $0x0,%xmm8,%xmm4
- .byte 65,15,198,224,226 // shufps $0xe2,%xmm8,%xmm4
- .byte 68,15,40,196 // movaps %xmm4,%xmm8
- .byte 243,15,16,36,144 // movss (%rax,%rdx,4),%xmm4
- .byte 243,68,15,16,196 // movss %xmm4,%xmm8
- .byte 233,210,254,255,255 // jmpq 185e <_sk_srcover_rgba_8888_sse2+0x14>
+ .byte 102,68,15,18,4,144 // movlpd (%rax,%rdx,4),%xmm8
+ .byte 233,234,254,255,255 // jmpq 185e <_sk_srcover_rgba_8888_sse2+0x14>
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,34 // je 19bb <_sk_srcover_rgba_8888_sse2+0x171>
+ .byte 116,41 // je 19aa <_sk_srcover_rgba_8888_sse2+0x160>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,17 // je 19b0 <_sk_srcover_rgba_8888_sse2+0x166>
+ .byte 116,17 // je 1998 <_sk_srcover_rgba_8888_sse2+0x14e>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,130 // jne 1927 <_sk_srcover_rgba_8888_sse2+0xdd>
+ .byte 117,154 // jne 1927 <_sk_srcover_rgba_8888_sse2+0xdd>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,15,126,76,144,8 // movd %xmm1,0x8(%rax,%rdx,4)
- .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
- .byte 102,15,126,76,144,4 // movd %xmm1,0x4(%rax,%rdx,4)
+ .byte 102,15,214,4,144 // movq %xmm0,(%rax,%rdx,4)
+ .byte 235,136 // jmp 1927 <_sk_srcover_rgba_8888_sse2+0xdd>
+ .byte 102,68,15,110,4,144 // movd (%rax,%rdx,4),%xmm8
+ .byte 233,180,254,255,255 // jmpq 185e <_sk_srcover_rgba_8888_sse2+0x14>
.byte 102,15,126,4,144 // movd %xmm0,(%rax,%rdx,4)
- .byte 233,98,255,255,255 // jmpq 1927 <_sk_srcover_rgba_8888_sse2+0xdd>
+ .byte 233,115,255,255,255 // jmpq 1927 <_sk_srcover_rgba_8888_sse2+0xdd>
HIDDEN _sk_clamp_0_sse2
.globl _sk_clamp_0_sse2
@@ -31329,7 +31508,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,155,63,0,0 // movaps 0x3f9b(%rip),%xmm8 # 5980 <_sk_callback_sse2+0x3d0>
+ .byte 68,15,40,5,108,63,0,0 // movaps 0x3f6c(%rip),%xmm8 # 5940 <_sk_callback_sse2+0x3ca>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -31341,7 +31520,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,144,63,0,0 // minps 0x3f90(%rip),%xmm3 # 5990 <_sk_callback_sse2+0x3e0>
+ .byte 15,93,29,97,63,0,0 // minps 0x3f61(%rip),%xmm3 # 5950 <_sk_callback_sse2+0x3da>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -31428,7 +31607,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,251,62,0,0 // movaps 0x3efb(%rip),%xmm9 # 59a0 <_sk_callback_sse2+0x3f0>
+ .byte 68,15,40,13,204,62,0,0 // movaps 0x3ecc(%rip),%xmm9 # 5960 <_sk_callback_sse2+0x3ea>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -31442,20 +31621,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,230,62,0,0 // movaps 0x3ee6(%rip),%xmm8 # 59b0 <_sk_callback_sse2+0x400>
+ .byte 68,15,40,5,183,62,0,0 // movaps 0x3eb7(%rip),%xmm8 # 5970 <_sk_callback_sse2+0x3fa>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,222,62,0,0 // movaps 0x3ede(%rip),%xmm9 # 59c0 <_sk_callback_sse2+0x410>
+ .byte 68,15,40,13,175,62,0,0 // movaps 0x3eaf(%rip),%xmm9 # 5980 <_sk_callback_sse2+0x40a>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,222,62,0,0 // movaps 0x3ede(%rip),%xmm10 # 59d0 <_sk_callback_sse2+0x420>
+ .byte 68,15,40,21,175,62,0,0 // movaps 0x3eaf(%rip),%xmm10 # 5990 <_sk_callback_sse2+0x41a>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,222,62,0,0 // movaps 0x3ede(%rip),%xmm11 # 59e0 <_sk_callback_sse2+0x430>
+ .byte 68,15,40,29,175,62,0,0 // movaps 0x3eaf(%rip),%xmm11 # 59a0 <_sk_callback_sse2+0x42a>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,226,62,0,0 // movaps 0x3ee2(%rip),%xmm12 # 59f0 <_sk_callback_sse2+0x440>
+ .byte 68,15,40,37,179,62,0,0 // movaps 0x3eb3(%rip),%xmm12 # 59b0 <_sk_callback_sse2+0x43a>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -31492,22 +31671,22 @@ HIDDEN _sk_to_srgb_sse2
FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 68,15,82,232 // rsqrtps %xmm0,%xmm13
- .byte 68,15,40,5,111,62,0,0 // movaps 0x3e6f(%rip),%xmm8 # 5a00 <_sk_callback_sse2+0x450>
+ .byte 68,15,40,5,64,62,0,0 // movaps 0x3e40(%rip),%xmm8 # 59c0 <_sk_callback_sse2+0x44a>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,13,111,62,0,0 // movaps 0x3e6f(%rip),%xmm9 # 5a10 <_sk_callback_sse2+0x460>
+ .byte 68,15,40,13,64,62,0,0 // movaps 0x3e40(%rip),%xmm9 # 59d0 <_sk_callback_sse2+0x45a>
.byte 69,15,40,253 // movaps %xmm13,%xmm15
.byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,40,21,111,62,0,0 // movaps 0x3e6f(%rip),%xmm10 # 5a20 <_sk_callback_sse2+0x470>
+ .byte 68,15,40,21,64,62,0,0 // movaps 0x3e40(%rip),%xmm10 # 59e0 <_sk_callback_sse2+0x46a>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,40,29,111,62,0,0 // movaps 0x3e6f(%rip),%xmm11 # 5a30 <_sk_callback_sse2+0x480>
+ .byte 68,15,40,29,64,62,0,0 // movaps 0x3e40(%rip),%xmm11 # 59f0 <_sk_callback_sse2+0x47a>
.byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 68,15,40,37,115,62,0,0 // movaps 0x3e73(%rip),%xmm12 # 5a40 <_sk_callback_sse2+0x490>
+ .byte 68,15,40,37,68,62,0,0 // movaps 0x3e44(%rip),%xmm12 # 5a00 <_sk_callback_sse2+0x48a>
.byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 69,15,83,237 // rcpps %xmm13,%xmm13
.byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,61,111,62,0,0 // movaps 0x3e6f(%rip),%xmm15 # 5a50 <_sk_callback_sse2+0x4a0>
+ .byte 68,15,40,61,64,62,0,0 // movaps 0x3e40(%rip),%xmm15 # 5a10 <_sk_callback_sse2+0x49a>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,197 // andnps %xmm13,%xmm0
@@ -31557,7 +31736,7 @@ _sk_rgb_to_hsl_sse2:
.byte 68,15,93,218 // minps %xmm2,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,200,61,0,0 // movaps 0x3dc8(%rip),%xmm13 # 5a60 <_sk_callback_sse2+0x4b0>
+ .byte 68,15,40,45,153,61,0,0 // movaps 0x3d99(%rip),%xmm13 # 5a20 <_sk_callback_sse2+0x4aa>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -31566,30 +31745,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,174,61,0,0 // andps 0x3dae(%rip),%xmm14 # 5a70 <_sk_callback_sse2+0x4c0>
+ .byte 68,15,84,53,127,61,0,0 // andps 0x3d7f(%rip),%xmm14 # 5a30 <_sk_callback_sse2+0x4ba>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,161,61,0,0 // movaps 0x3da1(%rip),%xmm12 # 5a80 <_sk_callback_sse2+0x4d0>
+ .byte 68,15,40,37,114,61,0,0 // movaps 0x3d72(%rip),%xmm12 # 5a40 <_sk_callback_sse2+0x4ca>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,157,61,0,0 // addps 0x3d9d(%rip),%xmm8 # 5a90 <_sk_callback_sse2+0x4e0>
+ .byte 68,15,88,5,110,61,0,0 // addps 0x3d6e(%rip),%xmm8 # 5a50 <_sk_callback_sse2+0x4da>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,142,61,0,0 // mulps 0x3d8e(%rip),%xmm0 # 5aa0 <_sk_callback_sse2+0x4f0>
+ .byte 15,89,5,95,61,0,0 // mulps 0x3d5f(%rip),%xmm0 # 5a60 <_sk_callback_sse2+0x4ea>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,129,61,0,0 // movaps 0x3d81(%rip),%xmm9 # 5ab0 <_sk_callback_sse2+0x500>
+ .byte 68,15,40,13,82,61,0,0 // movaps 0x3d52(%rip),%xmm9 # 5a70 <_sk_callback_sse2+0x4fa>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -31613,7 +31792,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,64,61,0,0 // movaps 0x3d40(%rip),%xmm9 # 5ac0 <_sk_callback_sse2+0x510>
+ .byte 68,15,40,13,17,61,0,0 // movaps 0x3d11(%rip),%xmm9 # 5a80 <_sk_callback_sse2+0x50a>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -31630,28 +31809,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,9,61,0,0 // movaps 0x3d09(%rip),%xmm0 # 5ad0 <_sk_callback_sse2+0x520>
+ .byte 15,40,5,218,60,0,0 // movaps 0x3cda(%rip),%xmm0 # 5a90 <_sk_callback_sse2+0x51a>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,1,61,0,0 // andps 0x3d01(%rip),%xmm3 # 5ae0 <_sk_callback_sse2+0x530>
+ .byte 15,84,29,210,60,0,0 // andps 0x3cd2(%rip),%xmm3 # 5aa0 <_sk_callback_sse2+0x52a>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,3,61,0,0 // movaps 0x3d03(%rip),%xmm13 # 5af0 <_sk_callback_sse2+0x540>
+ .byte 68,15,40,45,212,60,0,0 // movaps 0x3cd4(%rip),%xmm13 # 5ab0 <_sk_callback_sse2+0x53a>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,19,61,0,0 // movaps 0x3d13(%rip),%xmm2 # 5b20 <_sk_callback_sse2+0x570>
+ .byte 15,40,21,228,60,0,0 // movaps 0x3ce4(%rip),%xmm2 # 5ae0 <_sk_callback_sse2+0x56a>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,227,60,0,0 // movaps 0x3ce3(%rip),%xmm1 # 5b00 <_sk_callback_sse2+0x550>
+ .byte 15,40,13,180,60,0,0 // movaps 0x3cb4(%rip),%xmm1 # 5ac0 <_sk_callback_sse2+0x54a>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,233,60,0,0 // movaps 0x3ce9(%rip),%xmm5 # 5b10 <_sk_callback_sse2+0x560>
+ .byte 15,40,45,186,60,0,0 // movaps 0x3cba(%rip),%xmm5 # 5ad0 <_sk_callback_sse2+0x55a>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -31674,7 +31853,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,94,60,0,0 // andps 0x3c5e(%rip),%xmm3 # 5ae0 <_sk_callback_sse2+0x530>
+ .byte 15,84,29,47,60,0,0 // andps 0x3c2f(%rip),%xmm3 # 5aa0 <_sk_callback_sse2+0x52a>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -31704,12 +31883,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,54,60,0,0 // addps 0x3c36(%rip),%xmm6 # 5b30 <_sk_callback_sse2+0x580>
+ .byte 15,88,53,7,60,0,0 // addps 0x3c07(%rip),%xmm6 # 5af0 <_sk_callback_sse2+0x57a>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,209,59,0,0 // andps 0x3bd1(%rip),%xmm3 # 5ae0 <_sk_callback_sse2+0x530>
+ .byte 15,84,29,162,59,0,0 // andps 0x3ba2(%rip),%xmm3 # 5aa0 <_sk_callback_sse2+0x52a>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -31769,13 +31948,13 @@ _sk_scale_u8_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,61 // jne 2002 <_sk_scale_u8_sse2+0x47>
+ .byte 117,61 // jne 1ff1 <_sk_scale_u8_sse2+0x47>
.byte 102,69,15,110,4,18 // movd (%r10,%rdx,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,98,59,0,0 // pand 0x3b62(%rip),%xmm8 # 5b40 <_sk_callback_sse2+0x590>
+ .byte 102,68,15,219,5,51,59,0,0 // pand 0x3b33(%rip),%xmm8 # 5b00 <_sk_callback_sse2+0x58a>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,102,59,0,0 // mulps 0x3b66(%rip),%xmm8 # 5b50 <_sk_callback_sse2+0x5a0>
+ .byte 68,15,89,5,55,59,0,0 // mulps 0x3b37(%rip),%xmm8 # 5b10 <_sk_callback_sse2+0x59a>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -31785,25 +31964,25 @@ _sk_scale_u8_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 204a <_sk_scale_u8_sse2+0x8f>
+ .byte 116,61 // je 203b <_sk_scale_u8_sse2+0x91>
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 2031 <_sk_scale_u8_sse2+0x76>
+ .byte 116,23 // je 2020 <_sk_scale_u8_sse2+0x76>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,181 // jne 1fd5 <_sk_scale_u8_sse2+0x1a>
+ .byte 117,181 // jne 1fc4 <_sk_scale_u8_sse2+0x1a>
.byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
- .byte 65,15,182,68,18,1 // movzbl 0x1(%r10,%rdx,1),%eax
+ .byte 65,15,183,4,18 // movzwl (%r10,%rdx,1),%eax
.byte 102,68,15,110,200 // movd %eax,%xmm9
- .byte 69,15,198,200,0 // shufps $0x0,%xmm8,%xmm9
- .byte 69,15,198,200,226 // shufps $0xe2,%xmm8,%xmm9
- .byte 69,15,40,193 // movaps %xmm9,%xmm8
+ .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
+ .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
+ .byte 242,69,15,16,193 // movsd %xmm9,%xmm8
+ .byte 235,137 // jmp 1fc4 <_sk_scale_u8_sse2+0x1a>
.byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax
- .byte 102,68,15,110,200 // movd %eax,%xmm9
- .byte 243,69,15,16,193 // movss %xmm9,%xmm8
- .byte 233,119,255,255,255 // jmpq 1fd5 <_sk_scale_u8_sse2+0x1a>
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 233,122,255,255,255 // jmpq 1fc4 <_sk_scale_u8_sse2+0x1a>
HIDDEN _sk_lerp_1_float_sse2
.globl _sk_lerp_1_float_sse2
@@ -31834,13 +32013,13 @@ _sk_lerp_u8_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,81 // jne 20f1 <_sk_lerp_u8_sse2+0x5b>
+ .byte 117,81 // jne 20dd <_sk_lerp_u8_sse2+0x5b>
.byte 102,69,15,110,4,18 // movd (%r10,%rdx,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,167,58,0,0 // pand 0x3aa7(%rip),%xmm8 # 5b60 <_sk_callback_sse2+0x5b0>
+ .byte 102,68,15,219,5,123,58,0,0 // pand 0x3a7b(%rip),%xmm8 # 5b20 <_sk_callback_sse2+0x5aa>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,171,58,0,0 // mulps 0x3aab(%rip),%xmm8 # 5b70 <_sk_callback_sse2+0x5c0>
+ .byte 68,15,89,5,127,58,0,0 // mulps 0x3a7f(%rip),%xmm8 # 5b30 <_sk_callback_sse2+0x5ba>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -31857,25 +32036,25 @@ _sk_lerp_u8_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,54 // je 2139 <_sk_lerp_u8_sse2+0xa3>
+ .byte 116,64 // je 212a <_sk_lerp_u8_sse2+0xa8>
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,23 // je 2120 <_sk_lerp_u8_sse2+0x8a>
+ .byte 116,23 // je 210c <_sk_lerp_u8_sse2+0x8a>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,161 // jne 20b0 <_sk_lerp_u8_sse2+0x1a>
+ .byte 117,161 // jne 209c <_sk_lerp_u8_sse2+0x1a>
.byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
- .byte 65,15,182,68,18,1 // movzbl 0x1(%r10,%rdx,1),%eax
+ .byte 65,15,183,4,18 // movzwl (%r10,%rdx,1),%eax
.byte 102,68,15,110,200 // movd %eax,%xmm9
- .byte 69,15,198,200,0 // shufps $0x0,%xmm8,%xmm9
- .byte 69,15,198,200,226 // shufps $0xe2,%xmm8,%xmm9
- .byte 69,15,40,193 // movaps %xmm9,%xmm8
+ .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
+ .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
+ .byte 242,69,15,16,193 // movsd %xmm9,%xmm8
+ .byte 233,114,255,255,255 // jmpq 209c <_sk_lerp_u8_sse2+0x1a>
.byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax
- .byte 102,68,15,110,200 // movd %eax,%xmm9
- .byte 243,69,15,16,193 // movss %xmm9,%xmm8
- .byte 233,99,255,255,255 // jmpq 20b0 <_sk_lerp_u8_sse2+0x1a>
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 233,99,255,255,255 // jmpq 209c <_sk_lerp_u8_sse2+0x1a>
HIDDEN _sk_lerp_565_sse2
.globl _sk_lerp_565_sse2
@@ -31884,20 +32063,20 @@ _sk_lerp_565_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,156,0,0,0 // jne 21f7 <_sk_lerp_565_sse2+0xaa>
+ .byte 15,133,156,0,0,0 // jne 21e3 <_sk_lerp_565_sse2+0xaa>
.byte 243,69,15,126,12,82 // movq (%r10,%rdx,2),%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
- .byte 102,68,15,111,5,17,58,0,0 // movdqa 0x3a11(%rip),%xmm8 # 5b80 <_sk_callback_sse2+0x5d0>
+ .byte 102,68,15,111,5,229,57,0,0 // movdqa 0x39e5(%rip),%xmm8 # 5b40 <_sk_callback_sse2+0x5ca>
.byte 102,69,15,219,193 // pand %xmm9,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,16,58,0,0 // mulps 0x3a10(%rip),%xmm8 # 5b90 <_sk_callback_sse2+0x5e0>
- .byte 102,68,15,111,21,23,58,0,0 // movdqa 0x3a17(%rip),%xmm10 # 5ba0 <_sk_callback_sse2+0x5f0>
+ .byte 68,15,89,5,228,57,0,0 // mulps 0x39e4(%rip),%xmm8 # 5b50 <_sk_callback_sse2+0x5da>
+ .byte 102,68,15,111,21,235,57,0,0 // movdqa 0x39eb(%rip),%xmm10 # 5b60 <_sk_callback_sse2+0x5ea>
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,22,58,0,0 // mulps 0x3a16(%rip),%xmm10 # 5bb0 <_sk_callback_sse2+0x600>
- .byte 102,68,15,219,13,29,58,0,0 // pand 0x3a1d(%rip),%xmm9 # 5bc0 <_sk_callback_sse2+0x610>
+ .byte 68,15,89,21,234,57,0,0 // mulps 0x39ea(%rip),%xmm10 # 5b70 <_sk_callback_sse2+0x5fa>
+ .byte 102,68,15,219,13,241,57,0,0 // pand 0x39f1(%rip),%xmm9 # 5b80 <_sk_callback_sse2+0x60a>
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,33,58,0,0 // mulps 0x3a21(%rip),%xmm9 # 5bd0 <_sk_callback_sse2+0x620>
+ .byte 68,15,89,13,245,57,0,0 // mulps 0x39f5(%rip),%xmm9 # 5b90 <_sk_callback_sse2+0x61a>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -31921,25 +32100,23 @@ _sk_lerp_565_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,58 // je 2243 <_sk_lerp_565_sse2+0xf6>
+ .byte 116,59 // je 222b <_sk_lerp_565_sse2+0xf2>
+ .byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,27 // je 222a <_sk_lerp_565_sse2+0xdd>
+ .byte 116,27 // je 2216 <_sk_lerp_565_sse2+0xdd>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 15,133,77,255,255,255 // jne 2166 <_sk_lerp_565_sse2+0x19>
+ .byte 15,133,77,255,255,255 // jne 2152 <_sk_lerp_565_sse2+0x19>
.byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,200,69 // pshufd $0x45,%xmm8,%xmm9
- .byte 65,15,183,68,82,2 // movzwl 0x2(%r10,%rdx,2),%eax
- .byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 69,15,198,193,0 // shufps $0x0,%xmm9,%xmm8
- .byte 69,15,198,193,226 // shufps $0xe2,%xmm9,%xmm8
- .byte 69,15,40,200 // movaps %xmm8,%xmm9
+ .byte 102,69,15,110,4,82 // movd (%r10,%rdx,2),%xmm8
+ .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
+ .byte 242,69,15,16,200 // movsd %xmm8,%xmm9
+ .byte 233,39,255,255,255 // jmpq 2152 <_sk_lerp_565_sse2+0x19>
.byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax
- .byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 243,69,15,16,200 // movss %xmm8,%xmm9
- .byte 233,15,255,255,255 // jmpq 2166 <_sk_lerp_565_sse2+0x19>
+ .byte 102,68,15,110,200 // movd %eax,%xmm9
+ .byte 233,24,255,255,255 // jmpq 2152 <_sk_lerp_565_sse2+0x19>
HIDDEN _sk_load_tables_sse2
.globl _sk_load_tables_sse2
@@ -31948,12 +32125,12 @@ _sk_load_tables_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,36,1,0,0 // jne 2389 <_sk_load_tables_sse2+0x132>
+ .byte 15,133,36,1,0,0 // jne 236c <_sk_load_tables_sse2+0x132>
.byte 243,69,15,111,12,145 // movdqu (%r9,%rdx,4),%xmm9
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,68,15,111,5,103,57,0,0 // movdqa 0x3967(%rip),%xmm8 # 5be0 <_sk_callback_sse2+0x630>
+ .byte 102,68,15,111,5,68,57,0,0 // movdqa 0x3944(%rip),%xmm8 # 5ba0 <_sk_callback_sse2+0x62a>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -32009,7 +32186,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,112,56,0,0 // mulps 0x3870(%rip),%xmm3 # 5bf0 <_sk_callback_sse2+0x640>
+ .byte 15,89,29,77,56,0,0 // mulps 0x384d(%rip),%xmm3 # 5bb0 <_sk_callback_sse2+0x63a>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -32017,22 +32194,19 @@ _sk_load_tables_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
- .byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 23cd <_sk_load_tables_sse2+0x176>
+ .byte 116,45 // je 23a6 <_sk_load_tables_sse2+0x16c>
+ .byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 23b8 <_sk_load_tables_sse2+0x161>
+ .byte 116,23 // je 239b <_sk_load_tables_sse2+0x161>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,192,254,255,255 // jne 226b <_sk_load_tables_sse2+0x14>
+ .byte 15,133,192,254,255,255 // jne 224e <_sk_load_tables_sse2+0x14>
.byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
- .byte 243,65,15,16,68,145,4 // movss 0x4(%r9,%rdx,4),%xmm0
- .byte 65,15,198,193,0 // shufps $0x0,%xmm9,%xmm0
- .byte 65,15,198,193,226 // shufps $0xe2,%xmm9,%xmm0
- .byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 243,65,15,16,4,145 // movss (%r9,%rdx,4),%xmm0
- .byte 243,68,15,16,200 // movss %xmm0,%xmm9
- .byte 233,142,254,255,255 // jmpq 226b <_sk_load_tables_sse2+0x14>
+ .byte 102,69,15,18,12,145 // movlpd (%r9,%rdx,4),%xmm9
+ .byte 233,168,254,255,255 // jmpq 224e <_sk_load_tables_sse2+0x14>
+ .byte 102,69,15,110,12,145 // movd (%r9,%rdx,4),%xmm9
+ .byte 233,157,254,255,255 // jmpq 224e <_sk_load_tables_sse2+0x14>
HIDDEN _sk_load_tables_u16_be_sse2
.globl _sk_load_tables_u16_be_sse2
@@ -32042,7 +32216,7 @@ _sk_load_tables_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,101,1,0,0 // jne 2558 <_sk_load_tables_u16_be_sse2+0x17b>
+ .byte 15,133,101,1,0,0 // jne 252c <_sk_load_tables_u16_be_sse2+0x17b>
.byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0
.byte 102,67,15,16,76,81,16 // movupd 0x10(%r9,%r10,2),%xmm1
.byte 65,87 // push %r15
@@ -32054,7 +32228,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,214,55,0,0 // movdqa 0x37d6(%rip),%xmm10 # 5c00 <_sk_callback_sse2+0x650>
+ .byte 102,68,15,111,21,194,55,0,0 // movdqa 0x37c2(%rip),%xmm10 # 5bc0 <_sk_callback_sse2+0x64a>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -32116,7 +32290,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,193,54,0,0 // mulps 0x36c1(%rip),%xmm3 # 5c10 <_sk_callback_sse2+0x660>
+ .byte 15,89,29,173,54,0,0 // mulps 0x36ad(%rip),%xmm3 # 5bd0 <_sk_callback_sse2+0x65a>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -32124,17 +32298,17 @@ _sk_load_tables_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 2575 <_sk_load_tables_u16_be_sse2+0x198>
+ .byte 117,17 // jne 2549 <_sk_load_tables_u16_be_sse2+0x198>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,139,254,255,255 // jmpq 2400 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,139,254,255,255 // jmpq 23d4 <_sk_load_tables_u16_be_sse2+0x23>
.byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,118,254,255,255 // jb 2400 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 15,130,118,254,255,255 // jb 23d4 <_sk_load_tables_u16_be_sse2+0x23>
.byte 242,67,15,16,76,81,16 // movsd 0x10(%r9,%r10,2),%xmm1
- .byte 233,106,254,255,255 // jmpq 2400 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,106,254,255,255 // jmpq 23d4 <_sk_load_tables_u16_be_sse2+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse2
.globl _sk_load_tables_rgb_u16_be_sse2
@@ -32144,7 +32318,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,84,1,0,0 // jne 26fc <_sk_load_tables_rgb_u16_be_sse2+0x166>
+ .byte 15,133,84,1,0,0 // jne 26d0 <_sk_load_tables_rgb_u16_be_sse2+0x166>
.byte 243,71,15,111,28,81 // movdqu (%r9,%r10,2),%xmm11
.byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -32159,7 +32333,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,48,54,0,0 // movdqa 0x3630(%rip),%xmm8 # 5c20 <_sk_callback_sse2+0x670>
+ .byte 102,68,15,111,5,28,54,0,0 // movdqa 0x361c(%rip),%xmm8 # 5be0 <_sk_callback_sse2+0x66a>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -32215,7 +32389,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,59,53,0,0 // movaps 0x353b(%rip),%xmm3 # 5c30 <_sk_callback_sse2+0x680>
+ .byte 15,40,29,39,53,0,0 // movaps 0x3527(%rip),%xmm3 # 5bf0 <_sk_callback_sse2+0x67a>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -32224,21 +32398,21 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,71,15,196,92,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm11
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,14 // jne 2722 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
+ .byte 117,14 // jne 26f6 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
- .byte 233,172,254,255,255 // jmpq 25ce <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,172,254,255,255 // jmpq 25a2 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,71,15,110,84,81,6 // movd 0x6(%r9,%r10,2),%xmm10
.byte 102,71,15,196,84,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm10
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 2753 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
+ .byte 114,24 // jb 2727 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
.byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1
.byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,123,254,255,255 // jmpq 25ce <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,123,254,255,255 // jmpq 25a2 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,114,254,255,255 // jmpq 25ce <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,114,254,255,255 // jmpq 25a2 <_sk_load_tables_rgb_u16_be_sse2+0x38>
HIDDEN _sk_byte_tables_sse2
.globl _sk_byte_tables_sse2
@@ -32249,7 +32423,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,212,52,0,0 // movaps 0x34d4(%rip),%xmm8 # 5c40 <_sk_callback_sse2+0x690>
+ .byte 68,15,40,5,192,52,0,0 // movaps 0x34c0(%rip),%xmm8 # 5c00 <_sk_callback_sse2+0x68a>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -32277,7 +32451,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,110,52,0,0 // movaps 0x346e(%rip),%xmm10 # 5c50 <_sk_callback_sse2+0x6a0>
+ .byte 68,15,40,21,90,52,0,0 // movaps 0x345a(%rip),%xmm10 # 5c10 <_sk_callback_sse2+0x69a>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -32398,7 +32572,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,182,50,0,0 // movaps 0x32b6(%rip),%xmm10 # 5c60 <_sk_callback_sse2+0x6b0>
+ .byte 68,15,40,21,162,50,0,0 // movaps 0x32a2(%rip),%xmm10 # 5c20 <_sk_callback_sse2+0x6aa>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -32605,15 +32779,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,234,47,0,0 // mulps 0x2fea(%rip),%xmm9 # 5c70 <_sk_callback_sse2+0x6c0>
- .byte 68,15,84,21,242,47,0,0 // andps 0x2ff2(%rip),%xmm10 # 5c80 <_sk_callback_sse2+0x6d0>
- .byte 68,15,86,21,250,47,0,0 // orps 0x2ffa(%rip),%xmm10 # 5c90 <_sk_callback_sse2+0x6e0>
- .byte 68,15,88,13,2,48,0,0 // addps 0x3002(%rip),%xmm9 # 5ca0 <_sk_callback_sse2+0x6f0>
- .byte 68,15,40,37,10,48,0,0 // movaps 0x300a(%rip),%xmm12 # 5cb0 <_sk_callback_sse2+0x700>
+ .byte 68,15,89,13,214,47,0,0 // mulps 0x2fd6(%rip),%xmm9 # 5c30 <_sk_callback_sse2+0x6ba>
+ .byte 68,15,84,21,222,47,0,0 // andps 0x2fde(%rip),%xmm10 # 5c40 <_sk_callback_sse2+0x6ca>
+ .byte 68,15,86,21,230,47,0,0 // orps 0x2fe6(%rip),%xmm10 # 5c50 <_sk_callback_sse2+0x6da>
+ .byte 68,15,88,13,238,47,0,0 // addps 0x2fee(%rip),%xmm9 # 5c60 <_sk_callback_sse2+0x6ea>
+ .byte 68,15,40,37,246,47,0,0 // movaps 0x2ff6(%rip),%xmm12 # 5c70 <_sk_callback_sse2+0x6fa>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,10,48,0,0 // addps 0x300a(%rip),%xmm10 # 5cc0 <_sk_callback_sse2+0x710>
- .byte 68,15,40,37,18,48,0,0 // movaps 0x3012(%rip),%xmm12 # 5cd0 <_sk_callback_sse2+0x720>
+ .byte 68,15,88,21,246,47,0,0 // addps 0x2ff6(%rip),%xmm10 # 5c80 <_sk_callback_sse2+0x70a>
+ .byte 68,15,40,37,254,47,0,0 // movaps 0x2ffe(%rip),%xmm12 # 5c90 <_sk_callback_sse2+0x71a>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -32621,22 +32795,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,252,47,0,0 // movaps 0x2ffc(%rip),%xmm10 # 5ce0 <_sk_callback_sse2+0x730>
+ .byte 68,15,40,21,232,47,0,0 // movaps 0x2fe8(%rip),%xmm10 # 5ca0 <_sk_callback_sse2+0x72a>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,240,47,0,0 // addps 0x2ff0(%rip),%xmm9 # 5cf0 <_sk_callback_sse2+0x740>
- .byte 68,15,40,37,248,47,0,0 // movaps 0x2ff8(%rip),%xmm12 # 5d00 <_sk_callback_sse2+0x750>
+ .byte 68,15,88,13,220,47,0,0 // addps 0x2fdc(%rip),%xmm9 # 5cb0 <_sk_callback_sse2+0x73a>
+ .byte 68,15,40,37,228,47,0,0 // movaps 0x2fe4(%rip),%xmm12 # 5cc0 <_sk_callback_sse2+0x74a>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,248,47,0,0 // movaps 0x2ff8(%rip),%xmm12 # 5d10 <_sk_callback_sse2+0x760>
+ .byte 68,15,40,37,228,47,0,0 // movaps 0x2fe4(%rip),%xmm12 # 5cd0 <_sk_callback_sse2+0x75a>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,252,47,0,0 // movaps 0x2ffc(%rip),%xmm13 # 5d20 <_sk_callback_sse2+0x770>
+ .byte 68,15,40,45,232,47,0,0 // movaps 0x2fe8(%rip),%xmm13 # 5ce0 <_sk_callback_sse2+0x76a>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,252,47,0,0 // mulps 0x2ffc(%rip),%xmm13 # 5d30 <_sk_callback_sse2+0x780>
+ .byte 68,15,89,45,232,47,0,0 // mulps 0x2fe8(%rip),%xmm13 # 5cf0 <_sk_callback_sse2+0x77a>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -32672,15 +32846,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,124,47,0,0 // mulps 0x2f7c(%rip),%xmm9 # 5d40 <_sk_callback_sse2+0x790>
- .byte 68,15,84,21,132,47,0,0 // andps 0x2f84(%rip),%xmm10 # 5d50 <_sk_callback_sse2+0x7a0>
- .byte 68,15,86,21,140,47,0,0 // orps 0x2f8c(%rip),%xmm10 # 5d60 <_sk_callback_sse2+0x7b0>
- .byte 68,15,88,13,148,47,0,0 // addps 0x2f94(%rip),%xmm9 # 5d70 <_sk_callback_sse2+0x7c0>
- .byte 68,15,40,37,156,47,0,0 // movaps 0x2f9c(%rip),%xmm12 # 5d80 <_sk_callback_sse2+0x7d0>
+ .byte 68,15,89,13,104,47,0,0 // mulps 0x2f68(%rip),%xmm9 # 5d00 <_sk_callback_sse2+0x78a>
+ .byte 68,15,84,21,112,47,0,0 // andps 0x2f70(%rip),%xmm10 # 5d10 <_sk_callback_sse2+0x79a>
+ .byte 68,15,86,21,120,47,0,0 // orps 0x2f78(%rip),%xmm10 # 5d20 <_sk_callback_sse2+0x7aa>
+ .byte 68,15,88,13,128,47,0,0 // addps 0x2f80(%rip),%xmm9 # 5d30 <_sk_callback_sse2+0x7ba>
+ .byte 68,15,40,37,136,47,0,0 // movaps 0x2f88(%rip),%xmm12 # 5d40 <_sk_callback_sse2+0x7ca>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,156,47,0,0 // addps 0x2f9c(%rip),%xmm10 # 5d90 <_sk_callback_sse2+0x7e0>
- .byte 68,15,40,37,164,47,0,0 // movaps 0x2fa4(%rip),%xmm12 # 5da0 <_sk_callback_sse2+0x7f0>
+ .byte 68,15,88,21,136,47,0,0 // addps 0x2f88(%rip),%xmm10 # 5d50 <_sk_callback_sse2+0x7da>
+ .byte 68,15,40,37,144,47,0,0 // movaps 0x2f90(%rip),%xmm12 # 5d60 <_sk_callback_sse2+0x7ea>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -32688,22 +32862,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,142,47,0,0 // movaps 0x2f8e(%rip),%xmm10 # 5db0 <_sk_callback_sse2+0x800>
+ .byte 68,15,40,21,122,47,0,0 // movaps 0x2f7a(%rip),%xmm10 # 5d70 <_sk_callback_sse2+0x7fa>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,130,47,0,0 // addps 0x2f82(%rip),%xmm9 # 5dc0 <_sk_callback_sse2+0x810>
- .byte 68,15,40,37,138,47,0,0 // movaps 0x2f8a(%rip),%xmm12 # 5dd0 <_sk_callback_sse2+0x820>
+ .byte 68,15,88,13,110,47,0,0 // addps 0x2f6e(%rip),%xmm9 # 5d80 <_sk_callback_sse2+0x80a>
+ .byte 68,15,40,37,118,47,0,0 // movaps 0x2f76(%rip),%xmm12 # 5d90 <_sk_callback_sse2+0x81a>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,138,47,0,0 // movaps 0x2f8a(%rip),%xmm12 # 5de0 <_sk_callback_sse2+0x830>
+ .byte 68,15,40,37,118,47,0,0 // movaps 0x2f76(%rip),%xmm12 # 5da0 <_sk_callback_sse2+0x82a>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,142,47,0,0 // movaps 0x2f8e(%rip),%xmm13 # 5df0 <_sk_callback_sse2+0x840>
+ .byte 68,15,40,45,122,47,0,0 // movaps 0x2f7a(%rip),%xmm13 # 5db0 <_sk_callback_sse2+0x83a>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,142,47,0,0 // mulps 0x2f8e(%rip),%xmm13 # 5e00 <_sk_callback_sse2+0x850>
+ .byte 68,15,89,45,122,47,0,0 // mulps 0x2f7a(%rip),%xmm13 # 5dc0 <_sk_callback_sse2+0x84a>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -32739,15 +32913,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,14,47,0,0 // mulps 0x2f0e(%rip),%xmm9 # 5e10 <_sk_callback_sse2+0x860>
- .byte 68,15,84,21,22,47,0,0 // andps 0x2f16(%rip),%xmm10 # 5e20 <_sk_callback_sse2+0x870>
- .byte 68,15,86,21,30,47,0,0 // orps 0x2f1e(%rip),%xmm10 # 5e30 <_sk_callback_sse2+0x880>
- .byte 68,15,88,13,38,47,0,0 // addps 0x2f26(%rip),%xmm9 # 5e40 <_sk_callback_sse2+0x890>
- .byte 68,15,40,37,46,47,0,0 // movaps 0x2f2e(%rip),%xmm12 # 5e50 <_sk_callback_sse2+0x8a0>
+ .byte 68,15,89,13,250,46,0,0 // mulps 0x2efa(%rip),%xmm9 # 5dd0 <_sk_callback_sse2+0x85a>
+ .byte 68,15,84,21,2,47,0,0 // andps 0x2f02(%rip),%xmm10 # 5de0 <_sk_callback_sse2+0x86a>
+ .byte 68,15,86,21,10,47,0,0 // orps 0x2f0a(%rip),%xmm10 # 5df0 <_sk_callback_sse2+0x87a>
+ .byte 68,15,88,13,18,47,0,0 // addps 0x2f12(%rip),%xmm9 # 5e00 <_sk_callback_sse2+0x88a>
+ .byte 68,15,40,37,26,47,0,0 // movaps 0x2f1a(%rip),%xmm12 # 5e10 <_sk_callback_sse2+0x89a>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,46,47,0,0 // addps 0x2f2e(%rip),%xmm10 # 5e60 <_sk_callback_sse2+0x8b0>
- .byte 68,15,40,37,54,47,0,0 // movaps 0x2f36(%rip),%xmm12 # 5e70 <_sk_callback_sse2+0x8c0>
+ .byte 68,15,88,21,26,47,0,0 // addps 0x2f1a(%rip),%xmm10 # 5e20 <_sk_callback_sse2+0x8aa>
+ .byte 68,15,40,37,34,47,0,0 // movaps 0x2f22(%rip),%xmm12 # 5e30 <_sk_callback_sse2+0x8ba>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -32755,22 +32929,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,32,47,0,0 // movaps 0x2f20(%rip),%xmm10 # 5e80 <_sk_callback_sse2+0x8d0>
+ .byte 68,15,40,21,12,47,0,0 // movaps 0x2f0c(%rip),%xmm10 # 5e40 <_sk_callback_sse2+0x8ca>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,20,47,0,0 // addps 0x2f14(%rip),%xmm9 # 5e90 <_sk_callback_sse2+0x8e0>
- .byte 68,15,40,37,28,47,0,0 // movaps 0x2f1c(%rip),%xmm12 # 5ea0 <_sk_callback_sse2+0x8f0>
+ .byte 68,15,88,13,0,47,0,0 // addps 0x2f00(%rip),%xmm9 # 5e50 <_sk_callback_sse2+0x8da>
+ .byte 68,15,40,37,8,47,0,0 // movaps 0x2f08(%rip),%xmm12 # 5e60 <_sk_callback_sse2+0x8ea>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,28,47,0,0 // movaps 0x2f1c(%rip),%xmm12 # 5eb0 <_sk_callback_sse2+0x900>
+ .byte 68,15,40,37,8,47,0,0 // movaps 0x2f08(%rip),%xmm12 # 5e70 <_sk_callback_sse2+0x8fa>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,32,47,0,0 // movaps 0x2f20(%rip),%xmm13 # 5ec0 <_sk_callback_sse2+0x910>
+ .byte 68,15,40,45,12,47,0,0 // movaps 0x2f0c(%rip),%xmm13 # 5e80 <_sk_callback_sse2+0x90a>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,32,47,0,0 // mulps 0x2f20(%rip),%xmm13 # 5ed0 <_sk_callback_sse2+0x920>
+ .byte 68,15,89,45,12,47,0,0 // mulps 0x2f0c(%rip),%xmm13 # 5e90 <_sk_callback_sse2+0x91a>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -32806,15 +32980,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,160,46,0,0 // mulps 0x2ea0(%rip),%xmm9 # 5ee0 <_sk_callback_sse2+0x930>
- .byte 68,15,84,21,168,46,0,0 // andps 0x2ea8(%rip),%xmm10 # 5ef0 <_sk_callback_sse2+0x940>
- .byte 68,15,86,21,176,46,0,0 // orps 0x2eb0(%rip),%xmm10 # 5f00 <_sk_callback_sse2+0x950>
- .byte 68,15,88,13,184,46,0,0 // addps 0x2eb8(%rip),%xmm9 # 5f10 <_sk_callback_sse2+0x960>
- .byte 68,15,40,37,192,46,0,0 // movaps 0x2ec0(%rip),%xmm12 # 5f20 <_sk_callback_sse2+0x970>
+ .byte 68,15,89,13,140,46,0,0 // mulps 0x2e8c(%rip),%xmm9 # 5ea0 <_sk_callback_sse2+0x92a>
+ .byte 68,15,84,21,148,46,0,0 // andps 0x2e94(%rip),%xmm10 # 5eb0 <_sk_callback_sse2+0x93a>
+ .byte 68,15,86,21,156,46,0,0 // orps 0x2e9c(%rip),%xmm10 # 5ec0 <_sk_callback_sse2+0x94a>
+ .byte 68,15,88,13,164,46,0,0 // addps 0x2ea4(%rip),%xmm9 # 5ed0 <_sk_callback_sse2+0x95a>
+ .byte 68,15,40,37,172,46,0,0 // movaps 0x2eac(%rip),%xmm12 # 5ee0 <_sk_callback_sse2+0x96a>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,192,46,0,0 // addps 0x2ec0(%rip),%xmm10 # 5f30 <_sk_callback_sse2+0x980>
- .byte 68,15,40,37,200,46,0,0 // movaps 0x2ec8(%rip),%xmm12 # 5f40 <_sk_callback_sse2+0x990>
+ .byte 68,15,88,21,172,46,0,0 // addps 0x2eac(%rip),%xmm10 # 5ef0 <_sk_callback_sse2+0x97a>
+ .byte 68,15,40,37,180,46,0,0 // movaps 0x2eb4(%rip),%xmm12 # 5f00 <_sk_callback_sse2+0x98a>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -32822,22 +32996,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,178,46,0,0 // movaps 0x2eb2(%rip),%xmm10 # 5f50 <_sk_callback_sse2+0x9a0>
+ .byte 68,15,40,21,158,46,0,0 // movaps 0x2e9e(%rip),%xmm10 # 5f10 <_sk_callback_sse2+0x99a>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,166,46,0,0 // addps 0x2ea6(%rip),%xmm9 # 5f60 <_sk_callback_sse2+0x9b0>
- .byte 68,15,40,37,174,46,0,0 // movaps 0x2eae(%rip),%xmm12 # 5f70 <_sk_callback_sse2+0x9c0>
+ .byte 68,15,88,13,146,46,0,0 // addps 0x2e92(%rip),%xmm9 # 5f20 <_sk_callback_sse2+0x9aa>
+ .byte 68,15,40,37,154,46,0,0 // movaps 0x2e9a(%rip),%xmm12 # 5f30 <_sk_callback_sse2+0x9ba>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,174,46,0,0 // movaps 0x2eae(%rip),%xmm12 # 5f80 <_sk_callback_sse2+0x9d0>
+ .byte 68,15,40,37,154,46,0,0 // movaps 0x2e9a(%rip),%xmm12 # 5f40 <_sk_callback_sse2+0x9ca>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,178,46,0,0 // movaps 0x2eb2(%rip),%xmm13 # 5f90 <_sk_callback_sse2+0x9e0>
+ .byte 68,15,40,45,158,46,0,0 // movaps 0x2e9e(%rip),%xmm13 # 5f50 <_sk_callback_sse2+0x9da>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,178,46,0,0 // mulps 0x2eb2(%rip),%xmm13 # 5fa0 <_sk_callback_sse2+0x9f0>
+ .byte 68,15,89,45,158,46,0,0 // mulps 0x2e9e(%rip),%xmm13 # 5f60 <_sk_callback_sse2+0x9ea>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -32854,29 +33028,29 @@ HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,143,46,0,0 // mulps 0x2e8f(%rip),%xmm0 # 5fb0 <_sk_callback_sse2+0xa00>
- .byte 68,15,40,5,151,46,0,0 // movaps 0x2e97(%rip),%xmm8 # 5fc0 <_sk_callback_sse2+0xa10>
+ .byte 15,89,5,123,46,0,0 // mulps 0x2e7b(%rip),%xmm0 # 5f70 <_sk_callback_sse2+0x9fa>
+ .byte 68,15,40,5,131,46,0,0 // movaps 0x2e83(%rip),%xmm8 # 5f80 <_sk_callback_sse2+0xa0a>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,155,46,0,0 // movaps 0x2e9b(%rip),%xmm9 # 5fd0 <_sk_callback_sse2+0xa20>
+ .byte 68,15,40,13,135,46,0,0 // movaps 0x2e87(%rip),%xmm9 # 5f90 <_sk_callback_sse2+0xa1a>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,152,46,0,0 // addps 0x2e98(%rip),%xmm0 # 5fe0 <_sk_callback_sse2+0xa30>
- .byte 15,89,5,161,46,0,0 // mulps 0x2ea1(%rip),%xmm0 # 5ff0 <_sk_callback_sse2+0xa40>
- .byte 15,89,13,170,46,0,0 // mulps 0x2eaa(%rip),%xmm1 # 6000 <_sk_callback_sse2+0xa50>
+ .byte 15,88,5,132,46,0,0 // addps 0x2e84(%rip),%xmm0 # 5fa0 <_sk_callback_sse2+0xa2a>
+ .byte 15,89,5,141,46,0,0 // mulps 0x2e8d(%rip),%xmm0 # 5fb0 <_sk_callback_sse2+0xa3a>
+ .byte 15,89,13,150,46,0,0 // mulps 0x2e96(%rip),%xmm1 # 5fc0 <_sk_callback_sse2+0xa4a>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,176,46,0,0 // mulps 0x2eb0(%rip),%xmm2 # 6010 <_sk_callback_sse2+0xa60>
+ .byte 15,89,21,156,46,0,0 // mulps 0x2e9c(%rip),%xmm2 # 5fd0 <_sk_callback_sse2+0xa5a>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,165,46,0,0 // movaps 0x2ea5(%rip),%xmm2 # 6020 <_sk_callback_sse2+0xa70>
+ .byte 15,40,21,145,46,0,0 // movaps 0x2e91(%rip),%xmm2 # 5fe0 <_sk_callback_sse2+0xa6a>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,164,46,0,0 // movaps 0x2ea4(%rip),%xmm10 # 6030 <_sk_callback_sse2+0xa80>
+ .byte 68,15,40,21,144,46,0,0 // movaps 0x2e90(%rip),%xmm10 # 5ff0 <_sk_callback_sse2+0xa7a>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,168,46,0,0 // movaps 0x2ea8(%rip),%xmm11 # 6040 <_sk_callback_sse2+0xa90>
+ .byte 68,15,40,29,148,46,0,0 // movaps 0x2e94(%rip),%xmm11 # 6000 <_sk_callback_sse2+0xa8a>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -32900,8 +33074,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,88,46,0,0 // mulps 0x2e58(%rip),%xmm8 # 6050 <_sk_callback_sse2+0xaa0>
- .byte 15,89,21,97,46,0,0 // mulps 0x2e61(%rip),%xmm2 # 6060 <_sk_callback_sse2+0xab0>
+ .byte 68,15,89,5,68,46,0,0 // mulps 0x2e44(%rip),%xmm8 # 6010 <_sk_callback_sse2+0xa9a>
+ .byte 15,89,21,77,46,0,0 // mulps 0x2e4d(%rip),%xmm2 # 6020 <_sk_callback_sse2+0xaaa>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -32913,39 +33087,39 @@ _sk_load_a8_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,45 // jne 323e <_sk_load_a8_sse2+0x37>
+ .byte 117,46 // jne 3213 <_sk_load_a8_sse2+0x38>
.byte 102,65,15,110,4,18 // movd (%r10,%rdx,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,73,46,0,0 // pand 0x2e49(%rip),%xmm0 # 6070 <_sk_callback_sse2+0xac0>
+ .byte 102,15,219,5,53,46,0,0 // pand 0x2e35(%rip),%xmm0 # 6030 <_sk_callback_sse2+0xaba>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,79,46,0,0 // mulps 0x2e4f(%rip),%xmm3 # 6080 <_sk_callback_sse2+0xad0>
+ .byte 15,89,29,59,46,0,0 // mulps 0x2e3b(%rip),%xmm3 # 6040 <_sk_callback_sse2+0xaca>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 15,87,201 // xorps %xmm1,%xmm1
+ .byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,48 // je 327f <_sk_load_a8_sse2+0x78>
+ .byte 116,54 // je 3256 <_sk_load_a8_sse2+0x7b>
+ .byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 326a <_sk_load_a8_sse2+0x63>
+ .byte 116,21 // je 323f <_sk_load_a8_sse2+0x64>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,196 // jne 321f <_sk_load_a8_sse2+0x18>
+ .byte 117,195 // jne 31f3 <_sk_load_a8_sse2+0x18>
.byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
- .byte 65,15,182,68,18,1 // movzbl 0x1(%r10,%rdx,1),%eax
+ .byte 65,15,183,4,18 // movzwl (%r10,%rdx,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 15,198,200,0 // shufps $0x0,%xmm0,%xmm1
- .byte 15,198,200,226 // shufps $0xe2,%xmm0,%xmm1
- .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
+ .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
+ .byte 242,15,16,193 // movsd %xmm1,%xmm0
+ .byte 235,157 // jmp 31f3 <_sk_load_a8_sse2+0x18>
.byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax
- .byte 102,15,110,200 // movd %eax,%xmm1
- .byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 235,145 // jmp 321f <_sk_load_a8_sse2+0x18>
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 235,146 // jmp 31f3 <_sk_load_a8_sse2+0x18>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -32987,7 +33161,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,111,45,0,0 // mulps 0x2d6f(%rip),%xmm3 # 6090 <_sk_callback_sse2+0xae0>
+ .byte 15,89,29,92,45,0,0 // mulps 0x2d5c(%rip),%xmm3 # 6050 <_sk_callback_sse2+0xada>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -33002,7 +33176,7 @@ FUNCTION(_sk_store_a8_sse2)
_sk_store_a8_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 68,15,40,5,97,45,0,0 // movaps 0x2d61(%rip),%xmm8 # 60a0 <_sk_callback_sse2+0xaf0>
+ .byte 68,15,40,5,78,45,0,0 // movaps 0x2d4e(%rip),%xmm8 # 6060 <_sk_callback_sse2+0xaea>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -33010,7 +33184,7 @@ _sk_store_a8_sse2:
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 3370 <_sk_store_a8_sse2+0x3e>
+ .byte 117,13 // jne 3343 <_sk_store_a8_sse2+0x3e>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 65,137,4,18 // mov %eax,(%r10,%rdx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33020,21 +33194,24 @@ _sk_store_a8_sse2:
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,44 // je 33b3 <_sk_store_a8_sse2+0x81>
+ .byte 116,59 // je 3395 <_sk_store_a8_sse2+0x90>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,22 // je 33a3 <_sk_store_a8_sse2+0x71>
+ .byte 116,22 // je 3376 <_sk_store_a8_sse2+0x71>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,217 // jne 336c <_sk_store_a8_sse2+0x3a>
+ .byte 117,217 // jne 333f <_sk_store_a8_sse2+0x3a>
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 65,136,68,18,2 // mov %al,0x2(%r10,%rdx,1)
+ .byte 102,68,15,219,5,241,44,0,0 // pand 0x2cf1(%rip),%xmm8 # 6070 <_sk_callback_sse2+0xafa>
+ .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
+ .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
+ .byte 102,68,15,126,192 // movd %xmm8,%eax
+ .byte 102,65,137,4,18 // mov %ax,(%r10,%rdx,1)
+ .byte 235,170 // jmp 333f <_sk_store_a8_sse2+0x3a>
.byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp)
- .byte 138,68,36,220 // mov -0x24(%rsp),%al
- .byte 65,136,68,18,1 // mov %al,0x1(%r10,%rdx,1)
- .byte 102,68,15,127,68,36,200 // movdqa %xmm8,-0x38(%rsp)
- .byte 138,68,36,200 // mov -0x38(%rsp),%al
+ .byte 138,68,36,216 // mov -0x28(%rsp),%al
.byte 65,136,4,18 // mov %al,(%r10,%rdx,1)
- .byte 235,168 // jmp 336c <_sk_store_a8_sse2+0x3a>
+ .byte 235,153 // jmp 333f <_sk_store_a8_sse2+0x3a>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -33043,39 +33220,39 @@ _sk_load_g8_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 33ff <_sk_load_g8_sse2+0x3b>
+ .byte 117,49 // jne 33e1 <_sk_load_g8_sse2+0x3b>
.byte 102,65,15,110,4,18 // movd (%r10,%rdx,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,204,44,0,0 // pand 0x2ccc(%rip),%xmm0 # 60b0 <_sk_callback_sse2+0xb00>
+ .byte 102,15,219,5,186,44,0,0 // pand 0x2cba(%rip),%xmm0 # 6080 <_sk_callback_sse2+0xb0a>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,210,44,0,0 // mulps 0x2cd2(%rip),%xmm0 # 60c0 <_sk_callback_sse2+0xb10>
+ .byte 15,89,5,192,44,0,0 // mulps 0x2cc0(%rip),%xmm0 # 6090 <_sk_callback_sse2+0xb1a>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,217,44,0,0 // movaps 0x2cd9(%rip),%xmm3 # 60d0 <_sk_callback_sse2+0xb20>
+ .byte 15,40,29,199,44,0,0 // movaps 0x2cc7(%rip),%xmm3 # 60a0 <_sk_callback_sse2+0xb2a>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,48 // je 3440 <_sk_load_g8_sse2+0x7c>
+ .byte 116,54 // je 3424 <_sk_load_g8_sse2+0x7e>
+ .byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 342b <_sk_load_g8_sse2+0x67>
+ .byte 116,21 // je 340d <_sk_load_g8_sse2+0x67>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,192 // jne 33dc <_sk_load_g8_sse2+0x18>
+ .byte 117,192 // jne 33be <_sk_load_g8_sse2+0x18>
.byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
- .byte 65,15,182,68,18,1 // movzbl 0x1(%r10,%rdx,1),%eax
+ .byte 65,15,183,4,18 // movzwl (%r10,%rdx,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 15,198,200,0 // shufps $0x0,%xmm0,%xmm1
- .byte 15,198,200,226 // shufps $0xe2,%xmm0,%xmm1
- .byte 15,40,193 // movaps %xmm1,%xmm0
+ .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
+ .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
+ .byte 242,15,16,193 // movsd %xmm1,%xmm0
+ .byte 235,154 // jmp 33be <_sk_load_g8_sse2+0x18>
.byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax
- .byte 102,15,110,200 // movd %eax,%xmm1
- .byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 235,141 // jmp 33dc <_sk_load_g8_sse2+0x18>
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 235,143 // jmp 33be <_sk_load_g8_sse2+0x18>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -33117,9 +33294,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,254,43,0,0 // mulps 0x2bfe(%rip),%xmm0 # 60e0 <_sk_callback_sse2+0xb30>
+ .byte 15,89,5,238,43,0,0 // mulps 0x2bee(%rip),%xmm0 # 60b0 <_sk_callback_sse2+0xb3a>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,5,44,0,0 // movaps 0x2c05(%rip),%xmm3 # 60f0 <_sk_callback_sse2+0xb40>
+ .byte 15,40,29,245,43,0,0 // movaps 0x2bf5(%rip),%xmm3 # 60c0 <_sk_callback_sse2+0xb4a>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -33133,9 +33310,9 @@ _sk_gather_i8_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 73,137,193 // mov %rax,%r9
.byte 77,133,201 // test %r9,%r9
- .byte 116,5 // je 3504 <_sk_gather_i8_sse2+0xf>
+ .byte 116,5 // je 34e4 <_sk_gather_i8_sse2+0xf>
.byte 76,137,200 // mov %r9,%rax
- .byte 235,2 // jmp 3506 <_sk_gather_i8_sse2+0x11>
+ .byte 235,2 // jmp 34e6 <_sk_gather_i8_sse2+0x11>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 85 // push %rbp
.byte 65,86 // push %r14
@@ -33187,11 +33364,11 @@ _sk_gather_i8_sse2:
.byte 102,66,15,110,76,149,0 // movd 0x0(%rbp,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,30,43,0,0 // movdqa 0x2b1e(%rip),%xmm2 # 6100 <_sk_callback_sse2+0xb50>
+ .byte 102,15,111,21,14,43,0,0 // movdqa 0x2b0e(%rip),%xmm2 # 60d0 <_sk_callback_sse2+0xb5a>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,26,43,0,0 // movaps 0x2b1a(%rip),%xmm8 # 6110 <_sk_callback_sse2+0xb60>
+ .byte 68,15,40,5,10,43,0,0 // movaps 0x2b0a(%rip),%xmm8 # 60e0 <_sk_callback_sse2+0xb6a>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -33219,44 +33396,42 @@ _sk_load_565_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 3697 <_sk_load_565_sse2+0x5d>
+ .byte 117,83 // jne 3677 <_sk_load_565_sse2+0x5d>
.byte 243,65,15,126,20,82 // movq (%r10,%rdx,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,202,42,0,0 // movdqa 0x2aca(%rip),%xmm0 # 6120 <_sk_callback_sse2+0xb70>
+ .byte 102,15,111,5,186,42,0,0 // movdqa 0x2aba(%rip),%xmm0 # 60f0 <_sk_callback_sse2+0xb7a>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,204,42,0,0 // mulps 0x2acc(%rip),%xmm0 # 6130 <_sk_callback_sse2+0xb80>
- .byte 102,15,111,13,212,42,0,0 // movdqa 0x2ad4(%rip),%xmm1 # 6140 <_sk_callback_sse2+0xb90>
+ .byte 15,89,5,188,42,0,0 // mulps 0x2abc(%rip),%xmm0 # 6100 <_sk_callback_sse2+0xb8a>
+ .byte 102,15,111,13,196,42,0,0 // movdqa 0x2ac4(%rip),%xmm1 # 6110 <_sk_callback_sse2+0xb9a>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,214,42,0,0 // mulps 0x2ad6(%rip),%xmm1 # 6150 <_sk_callback_sse2+0xba0>
- .byte 102,15,219,21,222,42,0,0 // pand 0x2ade(%rip),%xmm2 # 6160 <_sk_callback_sse2+0xbb0>
+ .byte 15,89,13,198,42,0,0 // mulps 0x2ac6(%rip),%xmm1 # 6120 <_sk_callback_sse2+0xbaa>
+ .byte 102,15,219,21,206,42,0,0 // pand 0x2ace(%rip),%xmm2 # 6130 <_sk_callback_sse2+0xbba>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,228,42,0,0 // mulps 0x2ae4(%rip),%xmm2 # 6170 <_sk_callback_sse2+0xbc0>
+ .byte 15,89,21,212,42,0,0 // mulps 0x2ad4(%rip),%xmm2 # 6140 <_sk_callback_sse2+0xbca>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,235,42,0,0 // movaps 0x2aeb(%rip),%xmm3 # 6180 <_sk_callback_sse2+0xbd0>
+ .byte 15,40,29,219,42,0,0 // movaps 0x2adb(%rip),%xmm3 # 6150 <_sk_callback_sse2+0xbda>
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,48 // je 36d8 <_sk_load_565_sse2+0x9e>
+ .byte 116,50 // je 36b6 <_sk_load_565_sse2+0x9c>
+ .byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 36c3 <_sk_load_565_sse2+0x89>
+ .byte 116,21 // je 36a3 <_sk_load_565_sse2+0x89>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,154 // jne 364e <_sk_load_565_sse2+0x14>
+ .byte 117,154 // jne 362e <_sk_load_565_sse2+0x14>
.byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
- .byte 65,15,183,68,82,2 // movzwl 0x2(%r10,%rdx,2),%eax
- .byte 102,15,110,192 // movd %eax,%xmm0
- .byte 15,198,194,0 // shufps $0x0,%xmm2,%xmm0
- .byte 15,198,194,226 // shufps $0xe2,%xmm2,%xmm0
- .byte 15,40,208 // movaps %xmm0,%xmm2
+ .byte 102,65,15,110,4,82 // movd (%r10,%rdx,2),%xmm0
+ .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
+ .byte 242,15,16,208 // movsd %xmm0,%xmm2
+ .byte 233,120,255,255,255 // jmpq 362e <_sk_load_565_sse2+0x14>
.byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax
- .byte 102,15,110,192 // movd %eax,%xmm0
- .byte 243,15,16,208 // movss %xmm0,%xmm2
- .byte 233,100,255,255,255 // jmpq 364e <_sk_load_565_sse2+0x14>
+ .byte 102,15,110,208 // movd %eax,%xmm2
+ .byte 233,106,255,255,255 // jmpq 362e <_sk_load_565_sse2+0x14>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -33291,19 +33466,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,32,42,0,0 // movdqa 0x2a20(%rip),%xmm0 # 6190 <_sk_callback_sse2+0xbe0>
+ .byte 102,15,111,5,22,42,0,0 // movdqa 0x2a16(%rip),%xmm0 # 6160 <_sk_callback_sse2+0xbea>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,34,42,0,0 // mulps 0x2a22(%rip),%xmm0 # 61a0 <_sk_callback_sse2+0xbf0>
- .byte 102,15,111,13,42,42,0,0 // movdqa 0x2a2a(%rip),%xmm1 # 61b0 <_sk_callback_sse2+0xc00>
+ .byte 15,89,5,24,42,0,0 // mulps 0x2a18(%rip),%xmm0 # 6170 <_sk_callback_sse2+0xbfa>
+ .byte 102,15,111,13,32,42,0,0 // movdqa 0x2a20(%rip),%xmm1 # 6180 <_sk_callback_sse2+0xc0a>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,44,42,0,0 // mulps 0x2a2c(%rip),%xmm1 # 61c0 <_sk_callback_sse2+0xc10>
- .byte 102,15,219,21,52,42,0,0 // pand 0x2a34(%rip),%xmm2 # 61d0 <_sk_callback_sse2+0xc20>
+ .byte 15,89,13,34,42,0,0 // mulps 0x2a22(%rip),%xmm1 # 6190 <_sk_callback_sse2+0xc1a>
+ .byte 102,15,219,21,42,42,0,0 // pand 0x2a2a(%rip),%xmm2 # 61a0 <_sk_callback_sse2+0xc2a>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,58,42,0,0 // mulps 0x2a3a(%rip),%xmm2 # 61e0 <_sk_callback_sse2+0xc30>
+ .byte 15,89,21,48,42,0,0 // mulps 0x2a30(%rip),%xmm2 # 61b0 <_sk_callback_sse2+0xc3a>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,65,42,0,0 // movaps 0x2a41(%rip),%xmm3 # 61f0 <_sk_callback_sse2+0xc40>
+ .byte 15,40,29,55,42,0,0 // movaps 0x2a37(%rip),%xmm3 # 61c0 <_sk_callback_sse2+0xc4a>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -33313,12 +33488,12 @@ FUNCTION(_sk_store_565_sse2)
_sk_store_565_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 68,15,40,5,65,42,0,0 // movaps 0x2a41(%rip),%xmm8 # 6200 <_sk_callback_sse2+0xc50>
+ .byte 68,15,40,5,55,42,0,0 // movaps 0x2a37(%rip),%xmm8 # 61d0 <_sk_callback_sse2+0xc5a>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,54,42,0,0 // movaps 0x2a36(%rip),%xmm10 # 6210 <_sk_callback_sse2+0xc60>
+ .byte 68,15,40,21,44,42,0,0 // movaps 0x2a2c(%rip),%xmm10 # 61e0 <_sk_callback_sse2+0xc6a>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -33330,7 +33505,7 @@ _sk_store_565_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 381c <_sk_store_565_sse2+0x6a>
+ .byte 117,10 // jne 37f6 <_sk_store_565_sse2+0x6a>
.byte 242,69,15,17,4,82 // movsd %xmm8,(%r10,%rdx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33338,18 +33513,19 @@ _sk_store_565_sse2:
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,36 // je 3852 <_sk_store_565_sse2+0xa0>
+ .byte 116,38 // je 382e <_sk_store_565_sse2+0xa2>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 3846 <_sk_store_565_sse2+0x94>
+ .byte 116,18 // je 3820 <_sk_store_565_sse2+0x94>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,222 // jne 3818 <_sk_store_565_sse2+0x66>
+ .byte 117,222 // jne 37f2 <_sk_store_565_sse2+0x66>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,65,137,68,82,4 // mov %ax,0x4(%r10,%rdx,2)
- .byte 102,65,15,197,192,2 // pextrw $0x2,%xmm8,%eax
- .byte 102,65,137,68,82,2 // mov %ax,0x2(%r10,%rdx,2)
+ .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
+ .byte 102,69,15,126,4,82 // movd %xmm8,(%r10,%rdx,2)
+ .byte 235,196 // jmp 37f2 <_sk_store_565_sse2+0x66>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,65,137,4,82 // mov %ax,(%r10,%rdx,2)
- .byte 235,186 // jmp 3818 <_sk_store_565_sse2+0x66>
+ .byte 235,184 // jmp 37f2 <_sk_store_565_sse2+0x66>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -33358,47 +33534,45 @@ _sk_load_4444_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 38ca <_sk_load_4444_sse2+0x6c>
+ .byte 117,98 // jne 38a6 <_sk_load_4444_sse2+0x6c>
.byte 243,65,15,126,28,82 // movq (%r10,%rdx,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,166,41,0,0 // movdqa 0x29a6(%rip),%xmm0 # 6220 <_sk_callback_sse2+0xc70>
+ .byte 102,15,111,5,154,41,0,0 // movdqa 0x299a(%rip),%xmm0 # 61f0 <_sk_callback_sse2+0xc7a>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,168,41,0,0 // mulps 0x29a8(%rip),%xmm0 # 6230 <_sk_callback_sse2+0xc80>
- .byte 102,15,111,13,176,41,0,0 // movdqa 0x29b0(%rip),%xmm1 # 6240 <_sk_callback_sse2+0xc90>
+ .byte 15,89,5,156,41,0,0 // mulps 0x299c(%rip),%xmm0 # 6200 <_sk_callback_sse2+0xc8a>
+ .byte 102,15,111,13,164,41,0,0 // movdqa 0x29a4(%rip),%xmm1 # 6210 <_sk_callback_sse2+0xc9a>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,178,41,0,0 // mulps 0x29b2(%rip),%xmm1 # 6250 <_sk_callback_sse2+0xca0>
- .byte 102,15,111,21,186,41,0,0 // movdqa 0x29ba(%rip),%xmm2 # 6260 <_sk_callback_sse2+0xcb0>
+ .byte 15,89,13,166,41,0,0 // mulps 0x29a6(%rip),%xmm1 # 6220 <_sk_callback_sse2+0xcaa>
+ .byte 102,15,111,21,174,41,0,0 // movdqa 0x29ae(%rip),%xmm2 # 6230 <_sk_callback_sse2+0xcba>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,188,41,0,0 // mulps 0x29bc(%rip),%xmm2 # 6270 <_sk_callback_sse2+0xcc0>
- .byte 102,15,219,29,196,41,0,0 // pand 0x29c4(%rip),%xmm3 # 6280 <_sk_callback_sse2+0xcd0>
+ .byte 15,89,21,176,41,0,0 // mulps 0x29b0(%rip),%xmm2 # 6240 <_sk_callback_sse2+0xcca>
+ .byte 102,15,219,29,184,41,0,0 // pand 0x29b8(%rip),%xmm3 # 6250 <_sk_callback_sse2+0xcda>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,202,41,0,0 // mulps 0x29ca(%rip),%xmm3 # 6290 <_sk_callback_sse2+0xce0>
+ .byte 15,89,29,190,41,0,0 // mulps 0x29be(%rip),%xmm3 # 6260 <_sk_callback_sse2+0xcea>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,48 // je 390b <_sk_load_4444_sse2+0xad>
+ .byte 116,50 // je 38e5 <_sk_load_4444_sse2+0xab>
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,21 // je 38f6 <_sk_load_4444_sse2+0x98>
+ .byte 116,21 // je 38d2 <_sk_load_4444_sse2+0x98>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,139 // jne 3872 <_sk_load_4444_sse2+0x14>
+ .byte 117,139 // jne 384e <_sk_load_4444_sse2+0x14>
.byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
- .byte 65,15,183,68,82,2 // movzwl 0x2(%r10,%rdx,2),%eax
- .byte 102,15,110,192 // movd %eax,%xmm0
- .byte 15,198,195,0 // shufps $0x0,%xmm3,%xmm0
- .byte 15,198,195,226 // shufps $0xe2,%xmm3,%xmm0
- .byte 15,40,216 // movaps %xmm0,%xmm3
+ .byte 102,65,15,110,4,82 // movd (%r10,%rdx,2),%xmm0
+ .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
+ .byte 242,15,16,216 // movsd %xmm0,%xmm3
+ .byte 233,105,255,255,255 // jmpq 384e <_sk_load_4444_sse2+0x14>
.byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax
- .byte 102,15,110,192 // movd %eax,%xmm0
- .byte 243,15,16,216 // movss %xmm0,%xmm3
- .byte 233,85,255,255,255 // jmpq 3872 <_sk_load_4444_sse2+0x14>
+ .byte 102,15,110,216 // movd %eax,%xmm3
+ .byte 233,91,255,255,255 // jmpq 384e <_sk_load_4444_sse2+0x14>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -33433,21 +33607,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,253,40,0,0 // movdqa 0x28fd(%rip),%xmm0 # 62a0 <_sk_callback_sse2+0xcf0>
+ .byte 102,15,111,5,247,40,0,0 // movdqa 0x28f7(%rip),%xmm0 # 6270 <_sk_callback_sse2+0xcfa>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,255,40,0,0 // mulps 0x28ff(%rip),%xmm0 # 62b0 <_sk_callback_sse2+0xd00>
- .byte 102,15,111,13,7,41,0,0 // movdqa 0x2907(%rip),%xmm1 # 62c0 <_sk_callback_sse2+0xd10>
+ .byte 15,89,5,249,40,0,0 // mulps 0x28f9(%rip),%xmm0 # 6280 <_sk_callback_sse2+0xd0a>
+ .byte 102,15,111,13,1,41,0,0 // movdqa 0x2901(%rip),%xmm1 # 6290 <_sk_callback_sse2+0xd1a>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,9,41,0,0 // mulps 0x2909(%rip),%xmm1 # 62d0 <_sk_callback_sse2+0xd20>
- .byte 102,15,111,21,17,41,0,0 // movdqa 0x2911(%rip),%xmm2 # 62e0 <_sk_callback_sse2+0xd30>
+ .byte 15,89,13,3,41,0,0 // mulps 0x2903(%rip),%xmm1 # 62a0 <_sk_callback_sse2+0xd2a>
+ .byte 102,15,111,21,11,41,0,0 // movdqa 0x290b(%rip),%xmm2 # 62b0 <_sk_callback_sse2+0xd3a>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,19,41,0,0 // mulps 0x2913(%rip),%xmm2 # 62f0 <_sk_callback_sse2+0xd40>
- .byte 102,15,219,29,27,41,0,0 // pand 0x291b(%rip),%xmm3 # 6300 <_sk_callback_sse2+0xd50>
+ .byte 15,89,21,13,41,0,0 // mulps 0x290d(%rip),%xmm2 # 62c0 <_sk_callback_sse2+0xd4a>
+ .byte 102,15,219,29,21,41,0,0 // pand 0x2915(%rip),%xmm3 # 62d0 <_sk_callback_sse2+0xd5a>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,33,41,0,0 // mulps 0x2921(%rip),%xmm3 # 6310 <_sk_callback_sse2+0xd60>
+ .byte 15,89,29,27,41,0,0 // mulps 0x291b(%rip),%xmm3 # 62e0 <_sk_callback_sse2+0xd6a>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -33458,7 +33632,7 @@ FUNCTION(_sk_store_4444_sse2)
_sk_store_4444_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,16 // mov (%rax),%r10
- .byte 68,15,40,5,31,41,0,0 // movaps 0x291f(%rip),%xmm8 # 6320 <_sk_callback_sse2+0xd70>
+ .byte 68,15,40,5,25,41,0,0 // movaps 0x2919(%rip),%xmm8 # 62f0 <_sk_callback_sse2+0xd7a>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -33480,7 +33654,7 @@ _sk_store_4444_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3a72 <_sk_store_4444_sse2+0x7e>
+ .byte 117,10 // jne 3a48 <_sk_store_4444_sse2+0x7e>
.byte 242,69,15,17,4,82 // movsd %xmm8,(%r10,%rdx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -33488,18 +33662,19 @@ _sk_store_4444_sse2:
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,36 // je 3aa8 <_sk_store_4444_sse2+0xb4>
+ .byte 116,38 // je 3a80 <_sk_store_4444_sse2+0xb6>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 3a9c <_sk_store_4444_sse2+0xa8>
+ .byte 116,18 // je 3a72 <_sk_store_4444_sse2+0xa8>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,222 // jne 3a6e <_sk_store_4444_sse2+0x7a>
+ .byte 117,222 // jne 3a44 <_sk_store_4444_sse2+0x7a>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,65,137,68,82,4 // mov %ax,0x4(%r10,%rdx,2)
- .byte 102,65,15,197,192,2 // pextrw $0x2,%xmm8,%eax
- .byte 102,65,137,68,82,2 // mov %ax,0x2(%r10,%rdx,2)
+ .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
+ .byte 102,69,15,126,4,82 // movd %xmm8,(%r10,%rdx,2)
+ .byte 235,196 // jmp 3a44 <_sk_store_4444_sse2+0x7a>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,65,137,4,82 // mov %ax,(%r10,%rdx,2)
- .byte 235,186 // jmp 3a6e <_sk_store_4444_sse2+0x7a>
+ .byte 235,184 // jmp 3a44 <_sk_store_4444_sse2+0x7a>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -33508,13 +33683,13 @@ _sk_load_8888_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 3b20 <_sk_load_8888_sse2+0x6c>
+ .byte 117,98 // jne 3af8 <_sk_load_8888_sse2+0x6c>
.byte 243,68,15,111,12,144 // movdqu (%rax,%rdx,4),%xmm9
- .byte 102,15,111,21,100,40,0,0 // movdqa 0x2864(%rip),%xmm2 # 6330 <_sk_callback_sse2+0xd80>
+ .byte 102,15,111,21,92,40,0,0 // movdqa 0x285c(%rip),%xmm2 # 6300 <_sk_callback_sse2+0xd8a>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,96,40,0,0 // movaps 0x2860(%rip),%xmm8 # 6340 <_sk_callback_sse2+0xd90>
+ .byte 68,15,40,5,88,40,0,0 // movaps 0x2858(%rip),%xmm8 # 6310 <_sk_callback_sse2+0xd9a>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -33533,22 +33708,19 @@ _sk_load_8888_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
- .byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,44 // je 3b5e <_sk_load_8888_sse2+0xaa>
+ .byte 116,40 // je 3b2d <_sk_load_8888_sse2+0xa1>
+ .byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,18 // je 3b4a <_sk_load_8888_sse2+0x96>
+ .byte 116,18 // je 3b22 <_sk_load_8888_sse2+0x96>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,134 // jne 3ac4 <_sk_load_8888_sse2+0x10>
+ .byte 117,134 // jne 3a9c <_sk_load_8888_sse2+0x10>
.byte 102,15,110,68,144,8 // movd 0x8(%rax,%rdx,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
- .byte 243,15,16,68,144,4 // movss 0x4(%rax,%rdx,4),%xmm0
- .byte 65,15,198,193,0 // shufps $0x0,%xmm9,%xmm0
- .byte 65,15,198,193,226 // shufps $0xe2,%xmm9,%xmm0
- .byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 243,15,16,4,144 // movss (%rax,%rdx,4),%xmm0
- .byte 243,68,15,16,200 // movss %xmm0,%xmm9
- .byte 233,87,255,255,255 // jmpq 3ac4 <_sk_load_8888_sse2+0x10>
+ .byte 102,68,15,18,12,144 // movlpd (%rax,%rdx,4),%xmm9
+ .byte 233,111,255,255,255 // jmpq 3a9c <_sk_load_8888_sse2+0x10>
+ .byte 102,68,15,110,12,144 // movd (%rax,%rdx,4),%xmm9
+ .byte 233,100,255,255,255 // jmpq 3a9c <_sk_load_8888_sse2+0x10>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -33582,11 +33754,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,97,39,0,0 // movdqa 0x2761(%rip),%xmm2 # 6350 <_sk_callback_sse2+0xda0>
+ .byte 102,15,111,21,102,39,0,0 // movdqa 0x2766(%rip),%xmm2 # 6320 <_sk_callback_sse2+0xdaa>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,93,39,0,0 // movaps 0x275d(%rip),%xmm8 # 6360 <_sk_callback_sse2+0xdb0>
+ .byte 68,15,40,5,98,39,0,0 // movaps 0x2762(%rip),%xmm8 # 6330 <_sk_callback_sse2+0xdba>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -33611,7 +33783,7 @@ FUNCTION(_sk_store_8888_sse2)
_sk_store_8888_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 68,15,40,5,31,39,0,0 // movaps 0x271f(%rip),%xmm8 # 6370 <_sk_callback_sse2+0xdc0>
+ .byte 68,15,40,5,36,39,0,0 // movaps 0x2724(%rip),%xmm8 # 6340 <_sk_callback_sse2+0xdca>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -33630,24 +33802,24 @@ _sk_store_8888_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 3cb1 <_sk_store_8888_sse2+0x6d>
+ .byte 117,10 // jne 3c7c <_sk_store_8888_sse2+0x6d>
.byte 243,68,15,127,4,144 // movdqu %xmm8,(%rax,%rdx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,3 // and $0x3,%r9b
.byte 65,128,249,1 // cmp $0x1,%r9b
- .byte 116,38 // je 3ce4 <_sk_store_8888_sse2+0xa0>
+ .byte 116,33 // je 3caa <_sk_store_8888_sse2+0x9b>
.byte 65,128,249,2 // cmp $0x2,%r9b
- .byte 116,19 // je 3cd7 <_sk_store_8888_sse2+0x93>
+ .byte 116,19 // je 3ca2 <_sk_store_8888_sse2+0x93>
.byte 65,128,249,3 // cmp $0x3,%r9b
- .byte 117,227 // jne 3cad <_sk_store_8888_sse2+0x69>
+ .byte 117,227 // jne 3c78 <_sk_store_8888_sse2+0x69>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,68,15,126,76,144,8 // movd %xmm9,0x8(%rax,%rdx,4)
- .byte 102,69,15,112,200,229 // pshufd $0xe5,%xmm8,%xmm9
- .byte 102,68,15,126,76,144,4 // movd %xmm9,0x4(%rax,%rdx,4)
+ .byte 102,68,15,214,4,144 // movq %xmm8,(%rax,%rdx,4)
+ .byte 235,206 // jmp 3c78 <_sk_store_8888_sse2+0x69>
.byte 102,68,15,126,4,144 // movd %xmm8,(%rax,%rdx,4)
- .byte 235,193 // jmp 3cad <_sk_store_8888_sse2+0x69>
+ .byte 235,198 // jmp 3c78 <_sk_store_8888_sse2+0x69>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -33656,7 +33828,7 @@ _sk_load_f16_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,96,1,0,0 // jne 3e5a <_sk_load_f16_sse2+0x16e>
+ .byte 15,133,96,1,0,0 // jne 3e20 <_sk_load_f16_sse2+0x16e>
.byte 102,15,16,4,208 // movupd (%rax,%rdx,8),%xmm0
.byte 102,15,16,76,208,16 // movupd 0x10(%rax,%rdx,8),%xmm1
.byte 102,68,15,40,192 // movapd %xmm0,%xmm8
@@ -33668,7 +33840,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,70,38,0,0 // movdqa 0x2646(%rip),%xmm9 # 6380 <_sk_callback_sse2+0xdd0>
+ .byte 102,68,15,111,13,80,38,0,0 // movdqa 0x2650(%rip),%xmm9 # 6350 <_sk_callback_sse2+0xdda>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -33676,11 +33848,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,43,38,0,0 // movdqa 0x262b(%rip),%xmm11 # 6390 <_sk_callback_sse2+0xde0>
+ .byte 102,68,15,111,29,53,38,0,0 // movdqa 0x2635(%rip),%xmm11 # 6360 <_sk_callback_sse2+0xdea>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,45,38,0,0 // movdqa 0x262d(%rip),%xmm12 # 63a0 <_sk_callback_sse2+0xdf0>
+ .byte 102,68,15,111,37,55,38,0,0 // movdqa 0x2637(%rip),%xmm12 # 6370 <_sk_callback_sse2+0xdfa>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,48,38,0,0 // movdqa 0x2630(%rip),%xmm3 # 63b0 <_sk_callback_sse2+0xe00>
+ .byte 102,15,111,29,58,38,0,0 // movdqa 0x263a(%rip),%xmm3 # 6380 <_sk_callback_sse2+0xe0a>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -33728,17 +33900,17 @@ _sk_load_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,15,16,4,208 // movsd (%rax,%rdx,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 3e76 <_sk_load_f16_sse2+0x18a>
+ .byte 117,17 // jne 3e3c <_sk_load_f16_sse2+0x18a>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,143,254,255,255 // jmpq 3d05 <_sk_load_f16_sse2+0x19>
+ .byte 233,143,254,255,255 // jmpq 3ccb <_sk_load_f16_sse2+0x19>
.byte 102,15,22,68,208,8 // movhpd 0x8(%rax,%rdx,8),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,123,254,255,255 // jb 3d05 <_sk_load_f16_sse2+0x19>
+ .byte 15,130,123,254,255,255 // jb 3ccb <_sk_load_f16_sse2+0x19>
.byte 242,15,16,76,208,16 // movsd 0x10(%rax,%rdx,8),%xmm1
- .byte 233,112,254,255,255 // jmpq 3d05 <_sk_load_f16_sse2+0x19>
+ .byte 233,112,254,255,255 // jmpq 3ccb <_sk_load_f16_sse2+0x19>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -33780,7 +33952,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,130,36,0,0 // movdqa 0x2482(%rip),%xmm9 # 63c0 <_sk_callback_sse2+0xe10>
+ .byte 102,68,15,111,13,140,36,0,0 // movdqa 0x248c(%rip),%xmm9 # 6390 <_sk_callback_sse2+0xe1a>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -33788,11 +33960,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,103,36,0,0 // movdqa 0x2467(%rip),%xmm11 # 63d0 <_sk_callback_sse2+0xe20>
+ .byte 102,68,15,111,29,113,36,0,0 // movdqa 0x2471(%rip),%xmm11 # 63a0 <_sk_callback_sse2+0xe2a>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,105,36,0,0 // movdqa 0x2469(%rip),%xmm12 # 63e0 <_sk_callback_sse2+0xe30>
+ .byte 102,68,15,111,37,115,36,0,0 // movdqa 0x2473(%rip),%xmm12 # 63b0 <_sk_callback_sse2+0xe3a>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,108,36,0,0 // movdqa 0x246c(%rip),%xmm3 # 63f0 <_sk_callback_sse2+0xe40>
+ .byte 102,15,111,29,118,36,0,0 // movdqa 0x2476(%rip),%xmm3 # 63c0 <_sk_callback_sse2+0xe4a>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -33846,17 +34018,17 @@ FUNCTION(_sk_store_f16_sse2)
_sk_store_f16_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 72,139,0 // mov (%rax),%rax
- .byte 102,68,15,111,21,147,35,0,0 // movdqa 0x2393(%rip),%xmm10 # 6400 <_sk_callback_sse2+0xe50>
+ .byte 102,68,15,111,21,157,35,0,0 // movdqa 0x239d(%rip),%xmm10 # 63d0 <_sk_callback_sse2+0xe5a>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,69,15,219,226 // pand %xmm10,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,236 // pxor %xmm12,%xmm13
- .byte 102,68,15,111,13,134,35,0,0 // movdqa 0x2386(%rip),%xmm9 # 6410 <_sk_callback_sse2+0xe60>
+ .byte 102,68,15,111,13,144,35,0,0 // movdqa 0x2390(%rip),%xmm9 # 63e0 <_sk_callback_sse2+0xe6a>
.byte 102,65,15,114,212,16 // psrld $0x10,%xmm12
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,29,119,35,0,0 // movdqa 0x2377(%rip),%xmm11 # 6420 <_sk_callback_sse2+0xe70>
+ .byte 102,68,15,111,29,129,35,0,0 // movdqa 0x2381(%rip),%xmm11 # 63f0 <_sk_callback_sse2+0xe7a>
.byte 102,69,15,235,227 // por %xmm11,%xmm12
.byte 102,69,15,254,229 // paddd %xmm13,%xmm12
.byte 102,65,15,114,244,16 // pslld $0x10,%xmm12
@@ -33908,7 +34080,7 @@ _sk_store_f16_sse2:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,204 // punpckldq %xmm12,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 41cb <_sk_store_f16_sse2+0x16c>
+ .byte 117,21 // jne 4191 <_sk_store_f16_sse2+0x16c>
.byte 68,15,17,12,208 // movups %xmm9,(%rax,%rdx,8)
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 243,68,15,127,68,208,16 // movdqu %xmm8,0x10(%rax,%rdx,8)
@@ -33916,13 +34088,13 @@ _sk_store_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,68,15,214,12,208 // movq %xmm9,(%rax,%rdx,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 41c7 <_sk_store_f16_sse2+0x168>
+ .byte 116,240 // je 418d <_sk_store_f16_sse2+0x168>
.byte 102,68,15,23,76,208,8 // movhpd %xmm9,0x8(%rax,%rdx,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 41c7 <_sk_store_f16_sse2+0x168>
+ .byte 114,227 // jb 418d <_sk_store_f16_sse2+0x168>
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 102,68,15,214,68,208,16 // movq %xmm8,0x10(%rax,%rdx,8)
- .byte 235,213 // jmp 41c7 <_sk_store_f16_sse2+0x168>
+ .byte 235,213 // jmp 418d <_sk_store_f16_sse2+0x168>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -33932,7 +34104,7 @@ _sk_load_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,190,0,0,0 // jne 42c6 <_sk_load_u16_be_sse2+0xd4>
+ .byte 15,133,190,0,0,0 // jne 428c <_sk_load_u16_be_sse2+0xd4>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 102,65,15,16,76,65,16 // movupd 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -33949,7 +34121,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,215,33,0,0 // movaps 0x21d7(%rip),%xmm8 # 6430 <_sk_callback_sse2+0xe80>
+ .byte 68,15,40,5,225,33,0,0 // movaps 0x21e1(%rip),%xmm8 # 6400 <_sk_callback_sse2+0xe8a>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -33977,17 +34149,17 @@ _sk_load_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 42e3 <_sk_load_u16_be_sse2+0xf1>
+ .byte 117,17 // jne 42a9 <_sk_load_u16_be_sse2+0xf1>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,50,255,255,255 // jmpq 4215 <_sk_load_u16_be_sse2+0x23>
+ .byte 233,50,255,255,255 // jmpq 41db <_sk_load_u16_be_sse2+0x23>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,29,255,255,255 // jb 4215 <_sk_load_u16_be_sse2+0x23>
+ .byte 15,130,29,255,255,255 // jb 41db <_sk_load_u16_be_sse2+0x23>
.byte 242,65,15,16,76,65,16 // movsd 0x10(%r9,%rax,2),%xmm1
- .byte 233,17,255,255,255 // jmpq 4215 <_sk_load_u16_be_sse2+0x23>
+ .byte 233,17,255,255,255 // jmpq 41db <_sk_load_u16_be_sse2+0x23>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -33997,7 +34169,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,82 // lea (%rdx,%rdx,2),%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,175,0,0,0 // jne 43c5 <_sk_load_rgb_u16_be_sse2+0xc1>
+ .byte 15,133,175,0,0,0 // jne 438b <_sk_load_rgb_u16_be_sse2+0xc1>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -34018,7 +34190,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,13,198,32,0,0 // movaps 0x20c6(%rip),%xmm9 # 6440 <_sk_callback_sse2+0xe90>
+ .byte 68,15,40,13,208,32,0,0 // movaps 0x20d0(%rip),%xmm9 # 6410 <_sk_callback_sse2+0xe9a>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -34035,27 +34207,27 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,141,32,0,0 // movaps 0x208d(%rip),%xmm3 # 6450 <_sk_callback_sse2+0xea0>
+ .byte 15,40,29,151,32,0,0 // movaps 0x2097(%rip),%xmm3 # 6420 <_sk_callback_sse2+0xeaa>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 43ea <_sk_load_rgb_u16_be_sse2+0xe6>
+ .byte 117,13 // jne 43b0 <_sk_load_rgb_u16_be_sse2+0xe6>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,80,255,255,255 // jmpq 433a <_sk_load_rgb_u16_be_sse2+0x36>
+ .byte 233,80,255,255,255 // jmpq 4300 <_sk_load_rgb_u16_be_sse2+0x36>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 441b <_sk_load_rgb_u16_be_sse2+0x117>
+ .byte 114,24 // jb 43e1 <_sk_load_rgb_u16_be_sse2+0x117>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,31,255,255,255 // jmpq 433a <_sk_load_rgb_u16_be_sse2+0x36>
+ .byte 233,31,255,255,255 // jmpq 4300 <_sk_load_rgb_u16_be_sse2+0x36>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,22,255,255,255 // jmpq 433a <_sk_load_rgb_u16_be_sse2+0x36>
+ .byte 233,22,255,255,255 // jmpq 4300 <_sk_load_rgb_u16_be_sse2+0x36>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -34064,7 +34236,7 @@ _sk_store_u16_be_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax
- .byte 68,15,40,21,39,32,0,0 // movaps 0x2027(%rip),%xmm10 # 6460 <_sk_callback_sse2+0xeb0>
+ .byte 68,15,40,21,49,32,0,0 // movaps 0x2031(%rip),%xmm10 # 6430 <_sk_callback_sse2+0xeba>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -34109,7 +34281,7 @@ _sk_store_u16_be_sse2:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 4533 <_sk_store_u16_be_sse2+0x10f>
+ .byte 117,21 // jne 44f9 <_sk_store_u16_be_sse2+0x10f>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -34117,13 +34289,13 @@ _sk_store_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 452f <_sk_store_u16_be_sse2+0x10b>
+ .byte 116,240 // je 44f5 <_sk_store_u16_be_sse2+0x10b>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 452f <_sk_store_u16_be_sse2+0x10b>
+ .byte 114,227 // jb 44f5 <_sk_store_u16_be_sse2+0x10b>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 452f <_sk_store_u16_be_sse2+0x10b>
+ .byte 235,213 // jmp 44f5 <_sk_store_u16_be_sse2+0x10b>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -34136,7 +34308,7 @@ _sk_load_f32_sse2:
.byte 72,193,224,4 // shl $0x4,%rax
.byte 69,15,16,4,2 // movups (%r10,%rax,1),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 45ba <_sk_load_f32_sse2+0x60>
+ .byte 117,66 // jne 4580 <_sk_load_f32_sse2+0x60>
.byte 67,15,16,68,138,16 // movups 0x10(%r10,%r9,4),%xmm0
.byte 67,15,16,92,138,32 // movups 0x20(%r10,%r9,4),%xmm3
.byte 71,15,16,76,138,48 // movups 0x30(%r10,%r9,4),%xmm9
@@ -34156,17 +34328,17 @@ _sk_load_f32_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 45cc <_sk_load_f32_sse2+0x72>
+ .byte 117,8 // jne 4592 <_sk_load_f32_sse2+0x72>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 458a <_sk_load_f32_sse2+0x30>
+ .byte 235,190 // jmp 4550 <_sk_load_f32_sse2+0x30>
.byte 67,15,16,68,138,16 // movups 0x10(%r10,%r9,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 45e0 <_sk_load_f32_sse2+0x86>
+ .byte 114,8 // jb 45a6 <_sk_load_f32_sse2+0x86>
.byte 67,15,16,92,138,32 // movups 0x20(%r10,%r9,4),%xmm3
- .byte 235,170 // jmp 458a <_sk_load_f32_sse2+0x30>
+ .byte 235,170 // jmp 4550 <_sk_load_f32_sse2+0x30>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 458a <_sk_load_f32_sse2+0x30>
+ .byte 235,165 // jmp 4550 <_sk_load_f32_sse2+0x30>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -34192,7 +34364,7 @@ _sk_store_f32_sse2:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,2 // movupd %xmm12,(%r10,%rax,1)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 4657 <_sk_store_f32_sse2+0x72>
+ .byte 117,29 // jne 461d <_sk_store_f32_sse2+0x72>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 71,15,17,68,138,16 // movups %xmm8,0x10(%r10,%r9,4)
.byte 102,71,15,17,76,138,32 // movupd %xmm9,0x20(%r10,%r9,4)
@@ -34200,12 +34372,12 @@ _sk_store_f32_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 4653 <_sk_store_f32_sse2+0x6e>
+ .byte 116,246 // je 4619 <_sk_store_f32_sse2+0x6e>
.byte 71,15,17,68,138,16 // movups %xmm8,0x10(%r10,%r9,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 4653 <_sk_store_f32_sse2+0x6e>
+ .byte 114,234 // jb 4619 <_sk_store_f32_sse2+0x6e>
.byte 102,71,15,17,76,138,32 // movupd %xmm9,0x20(%r10,%r9,4)
- .byte 235,225 // jmp 4653 <_sk_store_f32_sse2+0x6e>
+ .byte 235,225 // jmp 4619 <_sk_store_f32_sse2+0x6e>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -34251,7 +34423,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,128,29,0,0 // andps 0x1d80(%rip),%xmm9 # 6470 <_sk_callback_sse2+0xec0>
+ .byte 68,15,84,13,138,29,0,0 // andps 0x1d8a(%rip),%xmm9 # 6440 <_sk_callback_sse2+0xeca>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -34274,7 +34446,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,65,29,0,0 // andps 0x1d41(%rip),%xmm9 # 6480 <_sk_callback_sse2+0xed0>
+ .byte 68,15,84,13,75,29,0,0 // andps 0x1d4b(%rip),%xmm9 # 6450 <_sk_callback_sse2+0xeda>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -34297,13 +34469,13 @@ _sk_mirror_x_sse2:
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 243,69,15,88,201 // addss %xmm9,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
- .byte 243,68,15,89,21,17,33,0,0 // mulss 0x2111(%rip),%xmm10 # 68a0 <_sk_callback_sse2+0x12f0>
+ .byte 243,68,15,89,21,27,33,0,0 // mulss 0x211b(%rip),%xmm10 # 6870 <_sk_callback_sse2+0x12fa>
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 68,15,89,208 // mulps %xmm0,%xmm10
.byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11
.byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,226,28,0,0 // andps 0x1ce2(%rip),%xmm10 # 6490 <_sk_callback_sse2+0xee0>
+ .byte 68,15,84,21,236,28,0,0 // andps 0x1cec(%rip),%xmm10 # 6460 <_sk_callback_sse2+0xeea>
.byte 69,15,87,228 // xorps %xmm12,%xmm12
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,89,217 // mulps %xmm9,%xmm11
@@ -34329,13 +34501,13 @@ _sk_mirror_y_sse2:
.byte 65,15,92,200 // subps %xmm8,%xmm1
.byte 243,69,15,88,201 // addss %xmm9,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
- .byte 243,68,15,89,21,155,32,0,0 // mulss 0x209b(%rip),%xmm10 # 68a4 <_sk_callback_sse2+0x12f4>
+ .byte 243,68,15,89,21,165,32,0,0 // mulss 0x20a5(%rip),%xmm10 # 6874 <_sk_callback_sse2+0x12fe>
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11
.byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,120,28,0,0 // andps 0x1c78(%rip),%xmm10 # 64a0 <_sk_callback_sse2+0xef0>
+ .byte 68,15,84,21,130,28,0,0 // andps 0x1c82(%rip),%xmm10 # 6470 <_sk_callback_sse2+0xefa>
.byte 69,15,87,228 // xorps %xmm12,%xmm12
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,89,217 // mulps %xmm9,%xmm11
@@ -34355,7 +34527,7 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,74,28,0,0 // minps 0x1c4a(%rip),%xmm8 # 64b0 <_sk_callback_sse2+0xf00>
+ .byte 68,15,93,5,84,28,0,0 // minps 0x1c54(%rip),%xmm8 # 6480 <_sk_callback_sse2+0xf0a>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -34368,7 +34540,7 @@ _sk_repeat_x_1_sse2:
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,84,13,56,28,0,0 // andps 0x1c38(%rip),%xmm9 # 64c0 <_sk_callback_sse2+0xf10>
+ .byte 68,15,84,13,66,28,0,0 // andps 0x1c42(%rip),%xmm9 # 6490 <_sk_callback_sse2+0xf1a>
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -34378,14 +34550,14 @@ HIDDEN _sk_mirror_x_1_sse2
.globl _sk_mirror_x_1_sse2
FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
- .byte 68,15,40,5,52,28,0,0 // movaps 0x1c34(%rip),%xmm8 # 64d0 <_sk_callback_sse2+0xf20>
+ .byte 68,15,40,5,62,28,0,0 // movaps 0x1c3e(%rip),%xmm8 # 64a0 <_sk_callback_sse2+0xf2a>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,56,28,0,0 // movaps 0x1c38(%rip),%xmm9 # 64e0 <_sk_callback_sse2+0xf30>
+ .byte 68,15,40,13,66,28,0,0 // movaps 0x1c42(%rip),%xmm9 # 64b0 <_sk_callback_sse2+0xf3a>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,46,28,0,0 // andps 0x1c2e(%rip),%xmm9 # 64f0 <_sk_callback_sse2+0xf40>
+ .byte 68,15,84,13,56,28,0,0 // andps 0x1c38(%rip),%xmm9 # 64c0 <_sk_callback_sse2+0xf4a>
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,88,210 // addps %xmm10,%xmm10
@@ -34401,10 +34573,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,20,28,0,0 // mulps 0x1c14(%rip),%xmm0 # 6500 <_sk_callback_sse2+0xf50>
- .byte 15,89,13,29,28,0,0 // mulps 0x1c1d(%rip),%xmm1 # 6510 <_sk_callback_sse2+0xf60>
+ .byte 15,89,5,30,28,0,0 // mulps 0x1c1e(%rip),%xmm0 # 64d0 <_sk_callback_sse2+0xf5a>
+ .byte 15,89,13,39,28,0,0 // mulps 0x1c27(%rip),%xmm1 # 64e0 <_sk_callback_sse2+0xf6a>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,35,28,0,0 // mulps 0x1c23(%rip),%xmm3 # 6520 <_sk_callback_sse2+0xf70>
+ .byte 15,89,29,45,28,0,0 // mulps 0x1c2d(%rip),%xmm3 # 64f0 <_sk_callback_sse2+0xf7a>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -34682,9 +34854,9 @@ _sk_evenly_spaced_gradient_sse2:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 4d39 <_sk_evenly_spaced_gradient_sse2+0x18>
+ .byte 120,7 // js 4cff <_sk_evenly_spaced_gradient_sse2+0x18>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 4d4e <_sk_evenly_spaced_gradient_sse2+0x2d>
+ .byte 235,21 // jmp 4d14 <_sk_evenly_spaced_gradient_sse2+0x2d>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -34782,15 +34954,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2
.globl _sk_gauss_a_to_rgba_sse2
FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
- .byte 15,40,5,86,22,0,0 // movaps 0x1656(%rip),%xmm0 # 6530 <_sk_callback_sse2+0xf80>
+ .byte 15,40,5,96,22,0,0 // movaps 0x1660(%rip),%xmm0 # 6500 <_sk_callback_sse2+0xf8a>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,92,22,0,0 // addps 0x165c(%rip),%xmm0 # 6540 <_sk_callback_sse2+0xf90>
+ .byte 15,88,5,102,22,0,0 // addps 0x1666(%rip),%xmm0 # 6510 <_sk_callback_sse2+0xf9a>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,98,22,0,0 // addps 0x1662(%rip),%xmm0 # 6550 <_sk_callback_sse2+0xfa0>
+ .byte 15,88,5,108,22,0,0 // addps 0x166c(%rip),%xmm0 # 6520 <_sk_callback_sse2+0xfaa>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,104,22,0,0 // addps 0x1668(%rip),%xmm0 # 6560 <_sk_callback_sse2+0xfb0>
+ .byte 15,88,5,114,22,0,0 // addps 0x1672(%rip),%xmm0 # 6530 <_sk_callback_sse2+0xfba>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,110,22,0,0 // addps 0x166e(%rip),%xmm0 # 6570 <_sk_callback_sse2+0xfc0>
+ .byte 15,88,5,120,22,0,0 // addps 0x1678(%rip),%xmm0 # 6540 <_sk_callback_sse2+0xfca>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -34808,12 +34980,12 @@ _sk_gradient_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 4f55 <_sk_gradient_sse2+0x46>
+ .byte 114,50 // jb 4f1b <_sk_gradient_sse2+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,71,22,0,0 // movaps 0x1647(%rip),%xmm2 # 6580 <_sk_callback_sse2+0xfd0>
+ .byte 15,40,21,81,22,0,0 // movaps 0x1651(%rip),%xmm2 # 6550 <_sk_callback_sse2+0xfda>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -34821,7 +34993,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 4f39 <_sk_gradient_sse2+0x2a>
+ .byte 117,228 // jne 4eff <_sk_gradient_sse2+0x2a>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,211 // movq %xmm2,%r11
.byte 69,137,217 // mov %r11d,%r9d
@@ -34960,29 +35132,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,8,20,0,0 // movaps 0x1408(%rip),%xmm13 # 6590 <_sk_callback_sse2+0xfe0>
+ .byte 68,15,40,45,18,20,0,0 // movaps 0x1412(%rip),%xmm13 # 6560 <_sk_callback_sse2+0xfea>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,12,20,0,0 // addps 0x140c(%rip),%xmm13 # 65a0 <_sk_callback_sse2+0xff0>
+ .byte 68,15,88,45,22,20,0,0 // addps 0x1416(%rip),%xmm13 # 6570 <_sk_callback_sse2+0xffa>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,16,20,0,0 // addps 0x1410(%rip),%xmm13 # 65b0 <_sk_callback_sse2+0x1000>
+ .byte 68,15,88,45,26,20,0,0 // addps 0x141a(%rip),%xmm13 # 6580 <_sk_callback_sse2+0x100a>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,20,20,0,0 // addps 0x1414(%rip),%xmm13 # 65c0 <_sk_callback_sse2+0x1010>
+ .byte 68,15,88,45,30,20,0,0 // addps 0x141e(%rip),%xmm13 # 6590 <_sk_callback_sse2+0x101a>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,19,20,0,0 // movaps 0x1413(%rip),%xmm10 # 65d0 <_sk_callback_sse2+0x1020>
+ .byte 68,15,40,21,29,20,0,0 // movaps 0x141d(%rip),%xmm10 # 65a0 <_sk_callback_sse2+0x102a>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,6,20,0,0 // movaps 0x1406(%rip),%xmm10 # 65e0 <_sk_callback_sse2+0x1030>
+ .byte 68,15,40,21,16,20,0,0 // movaps 0x1410(%rip),%xmm10 # 65b0 <_sk_callback_sse2+0x103a>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,245,19,0,0 // movaps 0x13f5(%rip),%xmm10 # 65f0 <_sk_callback_sse2+0x1040>
+ .byte 68,15,40,21,255,19,0,0 // movaps 0x13ff(%rip),%xmm10 # 65c0 <_sk_callback_sse2+0x104a>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -35009,7 +35181,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,199,19,0,0 // movaps 0x13c7(%rip),%xmm8 # 6600 <_sk_callback_sse2+0x1050>
+ .byte 68,15,40,5,209,19,0,0 // movaps 0x13d1(%rip),%xmm8 # 65d0 <_sk_callback_sse2+0x105a>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -35017,7 +35189,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,178,19,0,0 // movaps 0x13b2(%rip),%xmm12 # 6610 <_sk_callback_sse2+0x1060>
+ .byte 68,15,40,37,188,19,0,0 // movaps 0x13bc(%rip),%xmm12 # 65e0 <_sk_callback_sse2+0x106a>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -35064,8 +35236,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,43,19,0,0 // addps 0x132b(%rip),%xmm0 # 6620 <_sk_callback_sse2+0x1070>
- .byte 68,15,40,13,51,19,0,0 // movaps 0x1333(%rip),%xmm9 # 6630 <_sk_callback_sse2+0x1080>
+ .byte 15,88,5,53,19,0,0 // addps 0x1335(%rip),%xmm0 # 65f0 <_sk_callback_sse2+0x107a>
+ .byte 68,15,40,13,61,19,0,0 // movaps 0x133d(%rip),%xmm9 # 6600 <_sk_callback_sse2+0x108a>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -35078,7 +35250,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,34,19,0,0 // addps 0x1322(%rip),%xmm0 # 6640 <_sk_callback_sse2+0x1090>
+ .byte 15,88,5,44,19,0,0 // addps 0x132c(%rip),%xmm0 # 6610 <_sk_callback_sse2+0x109a>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -35090,8 +35262,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,20,19,0,0 // addps 0x1314(%rip),%xmm1 # 6650 <_sk_callback_sse2+0x10a0>
- .byte 68,15,40,13,28,19,0,0 // movaps 0x131c(%rip),%xmm9 # 6660 <_sk_callback_sse2+0x10b0>
+ .byte 15,88,13,30,19,0,0 // addps 0x131e(%rip),%xmm1 # 6620 <_sk_callback_sse2+0x10aa>
+ .byte 68,15,40,13,38,19,0,0 // movaps 0x1326(%rip),%xmm9 # 6630 <_sk_callback_sse2+0x10ba>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -35104,7 +35276,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,10,19,0,0 // addps 0x130a(%rip),%xmm1 # 6670 <_sk_callback_sse2+0x10c0>
+ .byte 15,88,13,20,19,0,0 // addps 0x1314(%rip),%xmm1 # 6640 <_sk_callback_sse2+0x10ca>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -35116,13 +35288,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,253,18,0,0 // addps 0x12fd(%rip),%xmm0 # 6680 <_sk_callback_sse2+0x10d0>
- .byte 68,15,40,13,5,19,0,0 // movaps 0x1305(%rip),%xmm9 # 6690 <_sk_callback_sse2+0x10e0>
+ .byte 15,88,5,7,19,0,0 // addps 0x1307(%rip),%xmm0 # 6650 <_sk_callback_sse2+0x10da>
+ .byte 68,15,40,13,15,19,0,0 // movaps 0x130f(%rip),%xmm9 # 6660 <_sk_callback_sse2+0x10ea>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,1,19,0,0 // mulps 0x1301(%rip),%xmm9 # 66a0 <_sk_callback_sse2+0x10f0>
- .byte 68,15,88,13,9,19,0,0 // addps 0x1309(%rip),%xmm9 # 66b0 <_sk_callback_sse2+0x1100>
+ .byte 68,15,89,13,11,19,0,0 // mulps 0x130b(%rip),%xmm9 # 6670 <_sk_callback_sse2+0x10fa>
+ .byte 68,15,88,13,19,19,0,0 // addps 0x1313(%rip),%xmm9 # 6680 <_sk_callback_sse2+0x110a>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -35135,16 +35307,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,248,18,0,0 // addps 0x12f8(%rip),%xmm0 # 66c0 <_sk_callback_sse2+0x1110>
- .byte 68,15,40,13,0,19,0,0 // movaps 0x1300(%rip),%xmm9 # 66d0 <_sk_callback_sse2+0x1120>
+ .byte 15,88,5,2,19,0,0 // addps 0x1302(%rip),%xmm0 # 6690 <_sk_callback_sse2+0x111a>
+ .byte 68,15,40,13,10,19,0,0 // movaps 0x130a(%rip),%xmm9 # 66a0 <_sk_callback_sse2+0x112a>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,4,19,0,0 // movaps 0x1304(%rip),%xmm8 # 66e0 <_sk_callback_sse2+0x1130>
+ .byte 68,15,40,5,14,19,0,0 // movaps 0x130e(%rip),%xmm8 # 66b0 <_sk_callback_sse2+0x113a>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,8,19,0,0 // addps 0x1308(%rip),%xmm8 # 66f0 <_sk_callback_sse2+0x1140>
+ .byte 68,15,88,5,18,19,0,0 // addps 0x1312(%rip),%xmm8 # 66c0 <_sk_callback_sse2+0x114a>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,12,19,0,0 // addps 0x130c(%rip),%xmm8 # 6700 <_sk_callback_sse2+0x1150>
+ .byte 68,15,88,5,22,19,0,0 // addps 0x1316(%rip),%xmm8 # 66d0 <_sk_callback_sse2+0x115a>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,16,19,0,0 // addps 0x1310(%rip),%xmm8 # 6710 <_sk_callback_sse2+0x1160>
+ .byte 68,15,88,5,26,19,0,0 // addps 0x131a(%rip),%xmm8 # 66e0 <_sk_callback_sse2+0x116a>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -35154,17 +35326,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,10,19,0,0 // movaps 0x130a(%rip),%xmm8 # 6720 <_sk_callback_sse2+0x1170>
+ .byte 68,15,40,5,20,19,0,0 // movaps 0x1314(%rip),%xmm8 # 66f0 <_sk_callback_sse2+0x117a>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,6,19,0,0 // movaps 0x1306(%rip),%xmm10 # 6730 <_sk_callback_sse2+0x1180>
+ .byte 68,15,40,21,16,19,0,0 // movaps 0x1310(%rip),%xmm10 # 6700 <_sk_callback_sse2+0x118a>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,10,19,0,0 // addps 0x130a(%rip),%xmm10 # 6740 <_sk_callback_sse2+0x1190>
+ .byte 68,15,88,21,20,19,0,0 // addps 0x1314(%rip),%xmm10 # 6710 <_sk_callback_sse2+0x119a>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,6,19,0,0 // addps 0x1306(%rip),%xmm10 # 6750 <_sk_callback_sse2+0x11a0>
+ .byte 68,15,88,21,16,19,0,0 // addps 0x1310(%rip),%xmm10 # 6720 <_sk_callback_sse2+0x11aa>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -35176,11 +35348,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,249,18,0,0 // addps 0x12f9(%rip),%xmm0 # 6760 <_sk_callback_sse2+0x11b0>
+ .byte 15,88,5,3,19,0,0 // addps 0x1303(%rip),%xmm0 # 6730 <_sk_callback_sse2+0x11ba>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,249,18,0,0 // mulps 0x12f9(%rip),%xmm8 # 6770 <_sk_callback_sse2+0x11c0>
- .byte 68,15,88,5,1,19,0,0 // addps 0x1301(%rip),%xmm8 # 6780 <_sk_callback_sse2+0x11d0>
+ .byte 68,15,89,5,3,19,0,0 // mulps 0x1303(%rip),%xmm8 # 6740 <_sk_callback_sse2+0x11ca>
+ .byte 68,15,88,5,11,19,0,0 // addps 0x130b(%rip),%xmm8 # 6750 <_sk_callback_sse2+0x11da>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -35193,13 +35365,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,239,18,0,0 // addps 0x12ef(%rip),%xmm1 # 6790 <_sk_callback_sse2+0x11e0>
- .byte 68,15,40,13,247,18,0,0 // movaps 0x12f7(%rip),%xmm9 # 67a0 <_sk_callback_sse2+0x11f0>
+ .byte 15,88,13,249,18,0,0 // addps 0x12f9(%rip),%xmm1 # 6760 <_sk_callback_sse2+0x11ea>
+ .byte 68,15,40,13,1,19,0,0 // movaps 0x1301(%rip),%xmm9 # 6770 <_sk_callback_sse2+0x11fa>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,243,18,0,0 // mulps 0x12f3(%rip),%xmm9 # 67b0 <_sk_callback_sse2+0x1200>
- .byte 68,15,88,13,251,18,0,0 // addps 0x12fb(%rip),%xmm9 # 67c0 <_sk_callback_sse2+0x1210>
+ .byte 68,15,89,13,253,18,0,0 // mulps 0x12fd(%rip),%xmm9 # 6780 <_sk_callback_sse2+0x120a>
+ .byte 68,15,88,13,5,19,0,0 // addps 0x1305(%rip),%xmm9 # 6790 <_sk_callback_sse2+0x121a>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -35212,16 +35384,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,233,18,0,0 // addps 0x12e9(%rip),%xmm1 # 67d0 <_sk_callback_sse2+0x1220>
- .byte 68,15,40,13,241,18,0,0 // movaps 0x12f1(%rip),%xmm9 # 67e0 <_sk_callback_sse2+0x1230>
+ .byte 15,88,13,243,18,0,0 // addps 0x12f3(%rip),%xmm1 # 67a0 <_sk_callback_sse2+0x122a>
+ .byte 68,15,40,13,251,18,0,0 // movaps 0x12fb(%rip),%xmm9 # 67b0 <_sk_callback_sse2+0x123a>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,245,18,0,0 // movaps 0x12f5(%rip),%xmm8 # 67f0 <_sk_callback_sse2+0x1240>
+ .byte 68,15,40,5,255,18,0,0 // movaps 0x12ff(%rip),%xmm8 # 67c0 <_sk_callback_sse2+0x124a>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,249,18,0,0 // addps 0x12f9(%rip),%xmm8 # 6800 <_sk_callback_sse2+0x1250>
+ .byte 68,15,88,5,3,19,0,0 // addps 0x1303(%rip),%xmm8 # 67d0 <_sk_callback_sse2+0x125a>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,253,18,0,0 // addps 0x12fd(%rip),%xmm8 # 6810 <_sk_callback_sse2+0x1260>
+ .byte 68,15,88,5,7,19,0,0 // addps 0x1307(%rip),%xmm8 # 67e0 <_sk_callback_sse2+0x126a>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,1,19,0,0 // addps 0x1301(%rip),%xmm8 # 6820 <_sk_callback_sse2+0x1270>
+ .byte 68,15,88,5,11,19,0,0 // addps 0x130b(%rip),%xmm8 # 67f0 <_sk_callback_sse2+0x127a>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -35231,17 +35403,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,251,18,0,0 // movaps 0x12fb(%rip),%xmm8 # 6830 <_sk_callback_sse2+0x1280>
+ .byte 68,15,40,5,5,19,0,0 // movaps 0x1305(%rip),%xmm8 # 6800 <_sk_callback_sse2+0x128a>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,246,18,0,0 // movaps 0x12f6(%rip),%xmm10 # 6840 <_sk_callback_sse2+0x1290>
+ .byte 68,15,40,21,0,19,0,0 // movaps 0x1300(%rip),%xmm10 # 6810 <_sk_callback_sse2+0x129a>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,250,18,0,0 // addps 0x12fa(%rip),%xmm10 # 6850 <_sk_callback_sse2+0x12a0>
+ .byte 68,15,88,21,4,19,0,0 // addps 0x1304(%rip),%xmm10 # 6820 <_sk_callback_sse2+0x12aa>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,246,18,0,0 // addps 0x12f6(%rip),%xmm10 # 6860 <_sk_callback_sse2+0x12b0>
+ .byte 68,15,88,21,0,19,0,0 // addps 0x1300(%rip),%xmm10 # 6830 <_sk_callback_sse2+0x12ba>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -35253,11 +35425,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,232,18,0,0 // addps 0x12e8(%rip),%xmm1 # 6870 <_sk_callback_sse2+0x12c0>
+ .byte 15,88,13,242,18,0,0 // addps 0x12f2(%rip),%xmm1 # 6840 <_sk_callback_sse2+0x12ca>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,232,18,0,0 // mulps 0x12e8(%rip),%xmm8 # 6880 <_sk_callback_sse2+0x12d0>
- .byte 68,15,88,5,240,18,0,0 // addps 0x12f0(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x12e0>
+ .byte 68,15,89,5,242,18,0,0 // mulps 0x12f2(%rip),%xmm8 # 6850 <_sk_callback_sse2+0x12da>
+ .byte 68,15,88,5,250,18,0,0 // addps 0x12fa(%rip),%xmm8 # 6860 <_sk_callback_sse2+0x12ea>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -35487,11 +35659,11 @@ BALIGN16
.byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi)
.byte 0,224 // add %ah,%al
.byte 64,0,0 // add %al,(%rax)
- .byte 224,64 // loopne 5888 <.literal16+0x1d8>
+ .byte 224,64 // loopne 5848 <.literal16+0x1d8>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 588c <.literal16+0x1dc>
+ .byte 224,64 // loopne 584c <.literal16+0x1dc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 5890 <.literal16+0x1e0>
+ .byte 224,64 // loopne 5850 <.literal16+0x1e0>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -35511,13 +35683,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 58b1 <.literal16+0x201>
+ .byte 71,225,61 // rex.RXB loope 5871 <.literal16+0x201>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 58b5 <.literal16+0x205>
+ .byte 71,225,61 // rex.RXB loope 5875 <.literal16+0x205>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 58b9 <.literal16+0x209>
+ .byte 71,225,61 // rex.RXB loope 5879 <.literal16+0x209>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 58bd <.literal16+0x20d>
+ .byte 71,225,61 // rex.RXB loope 587d <.literal16+0x20d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35542,13 +35714,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 58f1 <.literal16+0x241>
+ .byte 71,225,61 // rex.RXB loope 58b1 <.literal16+0x241>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 58f5 <.literal16+0x245>
+ .byte 71,225,61 // rex.RXB loope 58b5 <.literal16+0x245>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 58f9 <.literal16+0x249>
+ .byte 71,225,61 // rex.RXB loope 58b9 <.literal16+0x249>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 58fd <.literal16+0x24d>
+ .byte 71,225,61 // rex.RXB loope 58bd <.literal16+0x24d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35573,13 +35745,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5931 <.literal16+0x281>
+ .byte 71,225,61 // rex.RXB loope 58f1 <.literal16+0x281>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5935 <.literal16+0x285>
+ .byte 71,225,61 // rex.RXB loope 58f5 <.literal16+0x285>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5939 <.literal16+0x289>
+ .byte 71,225,61 // rex.RXB loope 58f9 <.literal16+0x289>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 593d <.literal16+0x28d>
+ .byte 71,225,61 // rex.RXB loope 58fd <.literal16+0x28d>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35604,13 +35776,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5971 <.literal16+0x2c1>
+ .byte 71,225,61 // rex.RXB loope 5931 <.literal16+0x2c1>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5975 <.literal16+0x2c5>
+ .byte 71,225,61 // rex.RXB loope 5935 <.literal16+0x2c5>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 5979 <.literal16+0x2c9>
+ .byte 71,225,61 // rex.RXB loope 5939 <.literal16+0x2c9>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 597d <.literal16+0x2cd>
+ .byte 71,225,61 // rex.RXB loope 593d <.literal16+0x2cd>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35631,11 +35803,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax)
.byte 67,0,0 // rex.XB add %al,(%r8)
- .byte 127,67 // jg 59bb <.literal16+0x30b>
+ .byte 127,67 // jg 597b <.literal16+0x30b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 59bf <.literal16+0x30f>
+ .byte 127,67 // jg 597f <.literal16+0x30f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 59c3 <.literal16+0x313>
+ .byte 127,67 // jg 5983 <.literal16+0x313>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -35875,13 +36047,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 5ba9 <.literal16+0x4f9>
+ .byte 224,7 // loopne 5b69 <.literal16+0x4f9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5bad <.literal16+0x4fd>
+ .byte 224,7 // loopne 5b6d <.literal16+0x4fd>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5bb1 <.literal16+0x501>
+ .byte 224,7 // loopne 5b71 <.literal16+0x501>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 5bb5 <.literal16+0x505>
+ .byte 224,7 // loopne 5b75 <.literal16+0x505>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -35946,11 +36118,11 @@ BALIGN16
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5c8b <.literal16+0x5db>
+ .byte 127,67 // jg 5c4b <.literal16+0x5db>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5c8f <.literal16+0x5df>
+ .byte 127,67 // jg 5c4f <.literal16+0x5df>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 5c93 <.literal16+0x5e3>
+ .byte 127,67 // jg 5c53 <.literal16+0x5e3>
.byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax)
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax)
@@ -35965,16 +36137,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5c84 <.literal16+0x5d4>
+ .byte 127,0 // jg 5c44 <.literal16+0x5d4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5c88 <.literal16+0x5d8>
+ .byte 127,0 // jg 5c48 <.literal16+0x5d8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5c8c <.literal16+0x5dc>
+ .byte 127,0 // jg 5c4c <.literal16+0x5dc>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5c90 <.literal16+0x5e0>
+ .byte 127,0 // jg 5c50 <.literal16+0x5e0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -35983,7 +36155,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5d15 <.literal16+0x665>
+ .byte 119,115 // ja 5cd5 <.literal16+0x665>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -35994,7 +36166,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 5c79 <.literal16+0x5c9>
+ .byte 117,191 // jne 5c39 <.literal16+0x5c9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -36006,7 +36178,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a39cba <_sk_callback_sse2+0xffffffffe9a3470a>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a39c7a <_sk_callback_sse2+0xffffffffe9a34704>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -36060,16 +36232,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5d54 <.literal16+0x6a4>
+ .byte 127,0 // jg 5d14 <.literal16+0x6a4>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5d58 <.literal16+0x6a8>
+ .byte 127,0 // jg 5d18 <.literal16+0x6a8>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5d5c <.literal16+0x6ac>
+ .byte 127,0 // jg 5d1c <.literal16+0x6ac>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5d60 <.literal16+0x6b0>
+ .byte 127,0 // jg 5d20 <.literal16+0x6b0>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -36078,7 +36250,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5de5 <.literal16+0x735>
+ .byte 119,115 // ja 5da5 <.literal16+0x735>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -36089,7 +36261,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 5d49 <.literal16+0x699>
+ .byte 117,191 // jne 5d09 <.literal16+0x699>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -36101,7 +36273,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a39d8a <_sk_callback_sse2+0xffffffffe9a347da>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a39d4a <_sk_callback_sse2+0xffffffffe9a347d4>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -36155,16 +36327,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5e24 <.literal16+0x774>
+ .byte 127,0 // jg 5de4 <.literal16+0x774>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5e28 <.literal16+0x778>
+ .byte 127,0 // jg 5de8 <.literal16+0x778>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5e2c <.literal16+0x77c>
+ .byte 127,0 // jg 5dec <.literal16+0x77c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5e30 <.literal16+0x780>
+ .byte 127,0 // jg 5df0 <.literal16+0x780>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -36173,7 +36345,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5eb5 <.literal16+0x805>
+ .byte 119,115 // ja 5e75 <.literal16+0x805>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -36184,7 +36356,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 5e19 <.literal16+0x769>
+ .byte 117,191 // jne 5dd9 <.literal16+0x769>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -36196,7 +36368,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a39e5a <_sk_callback_sse2+0xffffffffe9a348aa>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a39e1a <_sk_callback_sse2+0xffffffffe9a348a4>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -36250,16 +36422,16 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 5ef4 <.literal16+0x844>
+ .byte 127,0 // jg 5eb4 <.literal16+0x844>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5ef8 <.literal16+0x848>
+ .byte 127,0 // jg 5eb8 <.literal16+0x848>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5efc <.literal16+0x84c>
+ .byte 127,0 // jg 5ebc <.literal16+0x84c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 5f00 <.literal16+0x850>
+ .byte 127,0 // jg 5ec0 <.literal16+0x850>
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -36268,7 +36440,7 @@ BALIGN16
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
- .byte 119,115 // ja 5f85 <.literal16+0x8d5>
+ .byte 119,115 // ja 5f45 <.literal16+0x8d5>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -36279,7 +36451,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 5ee9 <.literal16+0x839>
+ .byte 117,191 // jne 5ea9 <.literal16+0x839>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -36291,7 +36463,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a39f2a <_sk_callback_sse2+0xffffffffe9a3497a>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a39eea <_sk_callback_sse2+0xffffffffe9a34974>
.byte 220,63 // fdivrl (%rdi)
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
@@ -36341,13 +36513,13 @@ BALIGN16
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
.byte 200,66,0,0 // enterq $0x42,$0x0
- .byte 127,67 // jg 6007 <.literal16+0x957>
+ .byte 127,67 // jg 5fc7 <.literal16+0x957>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 600b <.literal16+0x95b>
+ .byte 127,67 // jg 5fcb <.literal16+0x95b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 600f <.literal16+0x95f>
+ .byte 127,67 // jg 5fcf <.literal16+0x95f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 6013 <.literal16+0x963>
+ .byte 127,67 // jg 5fd3 <.literal16+0x963>
.byte 0,0 // add %al,(%rax)
.byte 0,195 // add %al,%bl
.byte 0,0 // add %al,(%rax)
@@ -36394,16 +36566,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6093 <.literal16+0x9e3>
+ .byte 118,63 // jbe 6053 <.literal16+0x9e3>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 6097 <.literal16+0x9e7>
+ .byte 118,63 // jbe 6057 <.literal16+0x9e7>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 609b <.literal16+0x9eb>
+ .byte 118,63 // jbe 605b <.literal16+0x9eb>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 609f <.literal16+0x9ef>
+ .byte 118,63 // jbe 605f <.literal16+0x9ef>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -36423,11 +36595,19 @@ BALIGN16
.byte 128,59,0 // cmpb $0x0,(%rbx)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 60eb <.literal16+0xa3b>
+ .byte 127,67 // jg 60ab <.literal16+0xa3b>
+ .byte 0,0 // add %al,(%rax)
+ .byte 127,67 // jg 60af <.literal16+0xa3f>
+ .byte 0,0 // add %al,(%rax)
+ .byte 127,67 // jg 60b3 <.literal16+0xa43>
+ .byte 255,0 // incl (%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 255,0 // incl (%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 60ef <.literal16+0xa3f>
+ .byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 60f3 <.literal16+0xa43>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -36475,13 +36655,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 6149 <.literal16+0xa99>
+ .byte 224,7 // loopne 6119 <.literal16+0xaa9>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 614d <.literal16+0xa9d>
+ .byte 224,7 // loopne 611d <.literal16+0xaad>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6151 <.literal16+0xaa1>
+ .byte 224,7 // loopne 6121 <.literal16+0xab1>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 6155 <.literal16+0xaa5>
+ .byte 224,7 // loopne 6125 <.literal16+0xab5>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -36527,13 +36707,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 61b9 <.literal16+0xb09>
+ .byte 224,7 // loopne 6189 <.literal16+0xb19>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 61bd <.literal16+0xb0d>
+ .byte 224,7 // loopne 618d <.literal16+0xb1d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 61c1 <.literal16+0xb11>
+ .byte 224,7 // loopne 6191 <.literal16+0xb21>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 61c5 <.literal16+0xb15>
+ .byte 224,7 // loopne 6195 <.literal16+0xb25>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -36571,13 +36751,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 6256 <.literal16+0xba6>
+ .byte 124,66 // jl 6226 <.literal16+0xbb6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 625a <.literal16+0xbaa>
+ .byte 124,66 // jl 622a <.literal16+0xbba>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 625e <.literal16+0xbae>
+ .byte 124,66 // jl 622e <.literal16+0xbbe>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 6262 <.literal16+0xbb2>
+ .byte 124,66 // jl 6232 <.literal16+0xbc2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -36667,13 +36847,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6365 <.literal16+0xcb5>
+ .byte 112,65 // jo 6335 <.literal16+0xcc5>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6369 <.literal16+0xcb9>
+ .byte 112,65 // jo 6339 <.literal16+0xcc9>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 636d <.literal16+0xcbd>
+ .byte 112,65 // jo 633d <.literal16+0xccd>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 6371 <.literal16+0xcc1>
+ .byte 112,65 // jo 6341 <.literal16+0xcd1>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -36695,11 +36875,11 @@ BALIGN16
.byte 128,59,129 // cmpb $0x81,(%rbx)
.byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 63bb <.literal16+0xd0b>
+ .byte 127,67 // jg 638b <.literal16+0xd1b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 63bf <.literal16+0xd0f>
+ .byte 127,67 // jg 638f <.literal16+0xd1f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 63c3 <.literal16+0xd13>
+ .byte 127,67 // jg 6393 <.literal16+0xd23>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -36775,13 +36955,13 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 255 // (bad)
- .byte 127,71 // jg 64ab <.literal16+0xdfb>
+ .byte 127,71 // jg 647b <.literal16+0xe0b>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 64af <.literal16+0xdff>
+ .byte 127,71 // jg 647f <.literal16+0xe0f>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 64b3 <.literal16+0xe03>
+ .byte 127,71 // jg 6483 <.literal16+0xe13>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 64b7 <.literal16+0xe07>
+ .byte 127,71 // jg 6487 <.literal16+0xe17>
.byte 0,0 // add %al,(%rax)
.byte 128,63,0 // cmpb $0x0,(%rdi)
.byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax)
@@ -36858,10 +37038,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0764a <_sk_callback_sse2+0x2dc0209a>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0761a <_sk_callback_sse2+0x2dc020a4>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 657c <.literal16+0xecc>
+ .byte 120,57 // js 654c <.literal16+0xedc>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -36989,11 +37169,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 66c2 <.literal16+0x1012>
+ .byte 62,114,28 // jb,pt 6692 <.literal16+0x1022>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 66c6 <.literal16+0x1016>
+ .byte 62,114,28 // jb,pt 6696 <.literal16+0x1026>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 66ca <.literal16+0x101a>
+ .byte 62,114,28 // jb,pt 669a <.literal16+0x102a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -37037,7 +37217,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f555 <_sk_callback_sse2+0x3d639fa5>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f525 <_sk_callback_sse2+0x3d639faf>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -37063,7 +37243,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f595 <_sk_callback_sse2+0x3d639fe5>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f565 <_sk_callback_sse2+0x3d639fef>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -37072,13 +37252,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 678e <.literal16+0x10de>
+ .byte 114,28 // jb 675e <.literal16+0x10ee>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 6792 <.literal16+0x10e2>
+ .byte 62,114,28 // jb,pt 6762 <.literal16+0x10f2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 6796 <.literal16+0x10e6>
+ .byte 62,114,28 // jb,pt 6766 <.literal16+0x10f6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 679a <.literal16+0x10ea>
+ .byte 62,114,28 // jb,pt 676a <.literal16+0x10fa>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -37099,11 +37279,11 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 128,63,114 // cmpb $0x72,(%rdi)
.byte 28,199 // sbb $0xc7,%al
- .byte 62,114,28 // jb,pt 67d2 <.literal16+0x1122>
+ .byte 62,114,28 // jb,pt 67a2 <.literal16+0x1132>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 67d6 <.literal16+0x1126>
+ .byte 62,114,28 // jb,pt 67a6 <.literal16+0x1136>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 67da <.literal16+0x112a>
+ .byte 62,114,28 // jb,pt 67aa <.literal16+0x113a>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -37147,7 +37327,7 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 0,63 // add %bh,(%rdi)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f665 <_sk_callback_sse2+0x3d63a0b5>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f635 <_sk_callback_sse2+0x3d63a0bf>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 0,63 // add %bh,(%rdi)
.byte 0,0 // add %al,(%rax)
@@ -37173,7 +37353,7 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f6a5 <_sk_callback_sse2+0x3d63a0f5>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f675 <_sk_callback_sse2+0x3d63a0ff>
.byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi)
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
@@ -37182,13 +37362,13 @@ BALIGN16
.byte 192,63,0 // sarb $0x0,(%rdi)
.byte 0,192 // add %al,%al
.byte 63 // (bad)
- .byte 114,28 // jb 689e <.literal16+0x11ee>
+ .byte 114,28 // jb 686e <.literal16+0x11fe>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 68a2 <_sk_callback_sse2+0x12f2>
+ .byte 62,114,28 // jb,pt 6872 <_sk_callback_sse2+0x12fc>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 68a6 <_sk_callback_sse2+0x12f6>
+ .byte 62,114,28 // jb,pt 6876 <_sk_callback_sse2+0x1300>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 68aa <_sk_callback_sse2+0x12fa>
+ .byte 62,114,28 // jb,pt 687a <_sk_callback_sse2+0x1304>
.byte 199 // (bad)
.byte 62,171 // ds stos %eax,%es:(%rdi)
.byte 170 // stos %al,%es:(%rdi)
@@ -37288,7 +37468,7 @@ FUNCTION(_sk_constant_color_ssse3_lowp)
_sk_constant_color_ssse3_lowp:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,24 // movups (%rax),%xmm3
- .byte 15,88,29,80,18,0,0 // addps 0x1250(%rip),%xmm3 # 1310 <_sk_xor__ssse3_lowp+0xa3>
+ .byte 15,88,29,96,18,0,0 // addps 0x1260(%rip),%xmm3 # 1320 <_sk_xor__ssse3_lowp+0x9b>
.byte 242,15,112,195,0 // pshuflw $0x0,%xmm3,%xmm0
.byte 102,15,112,192,80 // pshufd $0x50,%xmm0,%xmm0
.byte 242,15,112,203,170 // pshuflw $0xaa,%xmm3,%xmm1
@@ -37305,7 +37485,7 @@ HIDDEN _sk_set_rgb_ssse3_lowp
FUNCTION(_sk_set_rgb_ssse3_lowp)
_sk_set_rgb_ssse3_lowp:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,21,250,19,0,0 // movss 0x13fa(%rip),%xmm2 # 14f0 <_sk_xor__ssse3_lowp+0x283>
+ .byte 243,15,16,21,42,20,0,0 // movss 0x142a(%rip),%xmm2 # 1520 <_sk_xor__ssse3_lowp+0x29b>
.byte 243,15,16,0 // movss (%rax),%xmm0
.byte 243,15,88,194 // addss %xmm2,%xmm0
.byte 102,65,15,126,193 // movd %xmm0,%r9d
@@ -37346,35 +37526,35 @@ _sk_load_8888_ssse3_lowp:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,187,0,0,0 // jne 235 <_sk_load_8888_ssse3_lowp+0xc9>
+ .byte 15,133,191,0,0,0 // jne 239 <_sk_load_8888_ssse3_lowp+0xcd>
.byte 69,15,16,68,147,16 // movups 0x10(%r11,%rdx,4),%xmm8
- .byte 65,15,16,28,147 // movups (%r11,%rdx,4),%xmm3
- .byte 102,15,111,13,147,17,0,0 // movdqa 0x1193(%rip),%xmm1 # 1320 <_sk_xor__ssse3_lowp+0xb3>
- .byte 15,40,195 // movaps %xmm3,%xmm0
+ .byte 102,65,15,16,28,147 // movupd (%r11,%rdx,4),%xmm3
+ .byte 102,15,111,13,162,17,0,0 // movdqa 0x11a2(%rip),%xmm1 # 1330 <_sk_xor__ssse3_lowp+0xab>
+ .byte 102,15,40,195 // movapd %xmm3,%xmm0
.byte 102,15,56,0,193 // pshufb %xmm1,%xmm0
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
.byte 102,15,56,0,209 // pshufb %xmm1,%xmm2
.byte 102,15,108,194 // punpcklqdq %xmm2,%xmm0
.byte 102,15,113,240,8 // psllw $0x8,%xmm0
- .byte 102,68,15,111,13,127,17,0,0 // movdqa 0x117f(%rip),%xmm9 # 1330 <_sk_xor__ssse3_lowp+0xc3>
+ .byte 102,68,15,111,13,141,17,0,0 // movdqa 0x118d(%rip),%xmm9 # 1340 <_sk_xor__ssse3_lowp+0xbb>
.byte 102,65,15,228,193 // pmulhuw %xmm9,%xmm0
- .byte 102,68,15,111,21,129,17,0,0 // movdqa 0x1181(%rip),%xmm10 # 1340 <_sk_xor__ssse3_lowp+0xd3>
- .byte 15,40,203 // movaps %xmm3,%xmm1
+ .byte 102,68,15,111,21,143,17,0,0 // movdqa 0x118f(%rip),%xmm10 # 1350 <_sk_xor__ssse3_lowp+0xcb>
+ .byte 102,15,40,203 // movapd %xmm3,%xmm1
.byte 102,65,15,56,0,202 // pshufb %xmm10,%xmm1
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
.byte 102,65,15,56,0,210 // pshufb %xmm10,%xmm2
.byte 102,15,108,202 // punpcklqdq %xmm2,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
.byte 102,65,15,228,201 // pmulhuw %xmm9,%xmm1
- .byte 102,68,15,111,21,102,17,0,0 // movdqa 0x1166(%rip),%xmm10 # 1350 <_sk_xor__ssse3_lowp+0xe3>
- .byte 15,40,211 // movaps %xmm3,%xmm2
+ .byte 102,68,15,111,21,115,17,0,0 // movdqa 0x1173(%rip),%xmm10 # 1360 <_sk_xor__ssse3_lowp+0xdb>
+ .byte 102,15,40,211 // movapd %xmm3,%xmm2
.byte 102,65,15,56,0,210 // pshufb %xmm10,%xmm2
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,56,0,218 // pshufb %xmm10,%xmm11
.byte 102,65,15,108,211 // punpcklqdq %xmm11,%xmm2
.byte 102,15,113,242,8 // psllw $0x8,%xmm2
.byte 102,65,15,228,209 // pmulhuw %xmm9,%xmm2
- .byte 102,68,15,111,21,74,17,0,0 // movdqa 0x114a(%rip),%xmm10 # 1360 <_sk_xor__ssse3_lowp+0xf3>
+ .byte 102,68,15,111,21,86,17,0,0 // movdqa 0x1156(%rip),%xmm10 # 1370 <_sk_xor__ssse3_lowp+0xeb>
.byte 102,65,15,56,0,218 // pshufb %xmm10,%xmm3
.byte 102,69,15,56,0,194 // pshufb %xmm10,%xmm8
.byte 102,65,15,108,216 // punpcklqdq %xmm8,%xmm3
@@ -37385,52 +37565,48 @@ _sk_load_8888_ssse3_lowp:
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
- .byte 15,87,219 // xorps %xmm3,%xmm3
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,52,255,255,255 // ja 185 <_sk_load_8888_ssse3_lowp+0x19>
+ .byte 15,135,48,255,255,255 // ja 186 <_sk_load_8888_ssse3_lowp+0x1a>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,124,0,0,0 // lea 0x7c(%rip),%r10 # 2d8 <_sk_load_8888_ssse3_lowp+0x16c>
+ .byte 76,141,21,95,0,0,0 // lea 0x5f(%rip),%r10 # 2c0 <_sk_load_8888_ssse3_lowp+0x154>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 243,65,15,16,28,147 // movss (%r11,%rdx,4),%xmm3
+ .byte 233,17,255,255,255 // jmpq 186 <_sk_load_8888_ssse3_lowp+0x1a>
+ .byte 102,65,15,110,68,147,8 // movd 0x8(%r11,%rdx,4),%xmm0
+ .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
+ .byte 102,65,15,18,28,147 // movlpd (%r11,%rdx,4),%xmm3
+ .byte 233,250,254,255,255 // jmpq 186 <_sk_load_8888_ssse3_lowp+0x1a>
.byte 102,65,15,110,68,147,24 // movd 0x18(%r11,%rdx,4),%xmm0
.byte 102,68,15,112,192,69 // pshufd $0x45,%xmm0,%xmm8
- .byte 15,87,219 // xorps %xmm3,%xmm3
.byte 243,65,15,16,68,147,20 // movss 0x14(%r11,%rdx,4),%xmm0
.byte 65,15,198,192,0 // shufps $0x0,%xmm8,%xmm0
.byte 65,15,198,192,226 // shufps $0xe2,%xmm8,%xmm0
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 243,65,15,16,68,147,16 // movss 0x10(%r11,%rdx,4),%xmm0
.byte 243,68,15,16,192 // movss %xmm0,%xmm8
- .byte 243,65,15,16,68,147,12 // movss 0xc(%r11,%rdx,4),%xmm0
- .byte 15,198,195,32 // shufps $0x20,%xmm3,%xmm0
- .byte 15,198,216,36 // shufps $0x24,%xmm0,%xmm3
- .byte 243,65,15,16,68,147,8 // movss 0x8(%r11,%rdx,4),%xmm0
- .byte 15,198,195,48 // shufps $0x30,%xmm3,%xmm0
- .byte 15,198,216,132 // shufps $0x84,%xmm0,%xmm3
- .byte 243,65,15,16,68,147,4 // movss 0x4(%r11,%rdx,4),%xmm0
- .byte 15,198,195,0 // shufps $0x0,%xmm3,%xmm0
- .byte 15,198,195,226 // shufps $0xe2,%xmm3,%xmm0
- .byte 15,40,216 // movaps %xmm0,%xmm3
- .byte 243,65,15,16,4,147 // movss (%r11,%rdx,4),%xmm0
- .byte 243,15,16,216 // movss %xmm0,%xmm3
- .byte 233,176,254,255,255 // jmpq 185 <_sk_load_8888_ssse3_lowp+0x19>
- .byte 15,31,0 // nopl (%rax)
- .byte 238 // out %al,(%dx)
+ .byte 233,193,254,255,255 // jmpq 180 <_sk_load_8888_ssse3_lowp+0x14>
+ .byte 144 // nop
+ .byte 170 // stos %al,%es:(%rdi)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 255,193 // inc %ecx
.byte 255 // (bad)
- .byte 220,255 // fdivr %st,%st(7)
.byte 255 // (bad)
- .byte 255,205 // dec %ebp
+ .byte 255,181,255,255,255,192 // pushq -0x3f000001(%rbp)
+ .byte 254 // (bad)
+ .byte 255 // (bad)
.byte 255 // (bad)
+ .byte 238 // out %al,(%dx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 190,255,255,255,178 // mov $0xb2ffffff,%esi
.byte 255 // (bad)
+ .byte 217,255 // fcos
.byte 255 // (bad)
- .byte 255,157,255,255,255,141 // lcall *-0x72000001(%rbp)
+ .byte 255,204 // dec %esp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -37443,7 +37619,7 @@ _sk_store_8888_ssse3_lowp:
.byte 76,139,24 // mov (%rax),%r11
.byte 102,68,15,111,192 // movdqa %xmm0,%xmm8
.byte 102,65,15,113,208,7 // psrlw $0x7,%xmm8
- .byte 102,68,15,111,21,99,16,0,0 // movdqa 0x1063(%rip),%xmm10 # 1370 <_sk_xor__ssse3_lowp+0x103>
+ .byte 102,68,15,111,21,139,16,0,0 // movdqa 0x108b(%rip),%xmm10 # 1380 <_sk_xor__ssse3_lowp+0xfb>
.byte 102,69,15,234,194 // pminsw %xmm10,%xmm8
.byte 102,69,15,239,219 // pxor %xmm11,%xmm11
.byte 102,69,15,111,232 // movdqa %xmm8,%xmm13
@@ -37480,7 +37656,7 @@ _sk_store_8888_ssse3_lowp:
.byte 102,69,15,235,198 // por %xmm14,%xmm8
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 3db <_sk_store_8888_ssse3_lowp+0xe7>
+ .byte 117,17 // jne 3c3 <_sk_store_8888_ssse3_lowp+0xe7>
.byte 243,69,15,127,4,147 // movdqu %xmm8,(%r11,%rdx,4)
.byte 243,69,15,127,84,147,16 // movdqu %xmm10,0x10(%r11,%rdx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -37489,43 +37665,43 @@ _sk_store_8888_ssse3_lowp:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 3d7 <_sk_store_8888_ssse3_lowp+0xe3>
+ .byte 119,236 // ja 3bf <_sk_store_8888_ssse3_lowp+0xe3>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,90,0,0,0 // lea 0x5a(%rip),%r10 # 450 <_sk_store_8888_ssse3_lowp+0x15c>
+ .byte 76,141,21,82,0,0,0 // lea 0x52(%rip),%r10 # 430 <_sk_store_8888_ssse3_lowp+0x154>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 102,69,15,126,4,147 // movd %xmm8,(%r11,%rdx,4)
+ .byte 235,208 // jmp 3bf <_sk_store_8888_ssse3_lowp+0xe3>
+ .byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
+ .byte 102,69,15,126,76,147,8 // movd %xmm9,0x8(%r11,%rdx,4)
+ .byte 102,69,15,214,4,147 // movq %xmm8,(%r11,%rdx,4)
+ .byte 235,187 // jmp 3bf <_sk_store_8888_ssse3_lowp+0xe3>
.byte 102,69,15,112,202,78 // pshufd $0x4e,%xmm10,%xmm9
.byte 102,69,15,126,76,147,24 // movd %xmm9,0x18(%r11,%rdx,4)
.byte 102,69,15,112,202,229 // pshufd $0xe5,%xmm10,%xmm9
.byte 102,69,15,126,76,147,20 // movd %xmm9,0x14(%r11,%rdx,4)
.byte 102,69,15,126,84,147,16 // movd %xmm10,0x10(%r11,%rdx,4)
- .byte 102,69,15,112,200,231 // pshufd $0xe7,%xmm8,%xmm9
- .byte 102,69,15,126,76,147,12 // movd %xmm9,0xc(%r11,%rdx,4)
- .byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
- .byte 102,69,15,126,76,147,8 // movd %xmm9,0x8(%r11,%rdx,4)
- .byte 102,69,15,112,200,229 // pshufd $0xe5,%xmm8,%xmm9
- .byte 102,69,15,126,76,147,4 // movd %xmm9,0x4(%r11,%rdx,4)
- .byte 102,69,15,126,4,147 // movd %xmm8,(%r11,%rdx,4)
- .byte 235,136 // jmp 3d7 <_sk_store_8888_ssse3_lowp+0xe3>
- .byte 144 // nop
- .byte 247,255 // idiv %edi
+ .byte 243,69,15,127,4,147 // movdqu %xmm8,(%r11,%rdx,4)
+ .byte 235,146 // jmp 3bf <_sk_store_8888_ssse3_lowp+0xe3>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 183,255 // mov $0xff,%bh
.byte 255 // (bad)
+ .byte 255,204 // dec %esp
.byte 255 // (bad)
- .byte 234 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 191,255,255,255,245 // mov $0xf5ffffff,%edi
.byte 255 // (bad)
- .byte 221,255 // (bad)
.byte 255 // (bad)
- .byte 255,208 // callq *%rax
.byte 255 // (bad)
+ .byte 238 // out %al,(%dx)
.byte 255 // (bad)
- .byte 255,201 // dec %ecx
.byte 255 // (bad)
+ .byte 255,225 // jmpq *%rcx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 188,255,255,255,175 // mov $0xafffffff,%esp
+ .byte 255,212 // callq *%rsp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -37537,13 +37713,13 @@ _sk_load_a8_ssse3_lowp:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,37 // jne 49b <_sk_load_a8_ssse3_lowp+0x2f>
+ .byte 117,36 // jne 47a <_sk_load_a8_ssse3_lowp+0x2e>
.byte 243,65,15,126,28,19 // movq (%r11,%rdx,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 102,15,113,243,8 // psllw $0x8,%xmm3
- .byte 102,15,228,29,243,14,0,0 // pmulhuw 0xef3(%rip),%xmm3 # 1380 <_sk_xor__ssse3_lowp+0x113>
+ .byte 102,15,228,29,35,15,0,0 // pmulhuw 0xf23(%rip),%xmm3 # 1390 <_sk_xor__ssse3_lowp+0x10b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 102,15,239,192 // pxor %xmm0,%xmm0
+ .byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
.byte 255,224 // jmpq *%rax
@@ -37552,12 +37728,23 @@ _sk_load_a8_ssse3_lowp:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,209 // ja 480 <_sk_load_a8_ssse3_lowp+0x14>
+ .byte 119,210 // ja 460 <_sk_load_a8_ssse3_lowp+0x14>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,94,0,0,0 // lea 0x5e(%rip),%r10 # 518 <_sk_load_a8_ssse3_lowp+0xac>
+ .byte 76,141,21,111,0,0,0 // lea 0x6f(%rip),%r10 # 508 <_sk_load_a8_ssse3_lowp+0xbc>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 102,15,110,216 // movd %eax,%xmm3
+ .byte 235,179 // jmp 460 <_sk_load_a8_ssse3_lowp+0x14>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 102,15,239,219 // pxor %xmm3,%xmm3
+ .byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
+ .byte 243,15,16,216 // movss %xmm0,%xmm3
+ .byte 235,145 // jmp 460 <_sk_load_a8_ssse3_lowp+0x14>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -37565,32 +37752,27 @@ _sk_load_a8_ssse3_lowp:
.byte 102,15,196,216,5 // pinsrw $0x5,%eax,%xmm3
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 102,15,196,216,4 // pinsrw $0x4,%eax,%xmm3
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 102,15,196,216,1 // pinsrw $0x1,%eax,%xmm3
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 102,15,196,216,0 // pinsrw $0x0,%eax,%xmm3
- .byte 233,104,255,255,255 // jmpq 480 <_sk_load_a8_ssse3_lowp+0x14>
- .byte 241 // icebp
- .byte 255 // (bad)
+ .byte 102,65,15,110,4,19 // movd (%r11,%rdx,1),%xmm0
+ .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
+ .byte 242,15,16,216 // movsd %xmm0,%xmm3
+ .byte 233,89,255,255,255 // jmpq 460 <_sk_load_a8_ssse3_lowp+0x14>
+ .byte 144 // nop
+ .byte 154 // (bad)
.byte 255 // (bad)
- .byte 255,230 // jmpq *%rsi
.byte 255 // (bad)
+ .byte 255,180,255,255,255,165,255 // pushq -0x5a0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 219,255 // (bad)
+ .byte 236 // in (%dx),%al
.byte 255 // (bad)
- .byte 255,208 // callq *%rax
.byte 255 // (bad)
+ .byte 255,225 // jmpq *%rcx
.byte 255 // (bad)
- .byte 255,197 // inc %ebp
.byte 255 // (bad)
+ .byte 255,214 // callq *%rsi
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 186,255,255,255,171 // mov $0xabffffff,%edx
+ .byte 255,199 // inc %edi
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -37605,7 +37787,7 @@ _sk_store_a8_ssse3_lowp:
.byte 102,65,15,113,208,7 // psrlw $0x7,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 558 <_sk_store_a8_ssse3_lowp+0x24>
+ .byte 117,10 // jne 548 <_sk_store_a8_ssse3_lowp+0x24>
.byte 242,69,15,17,4,19 // movsd %xmm8,(%r11,%rdx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -37613,47 +37795,50 @@ _sk_store_a8_ssse3_lowp:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,236 // ja 554 <_sk_store_a8_ssse3_lowp+0x20>
+ .byte 119,236 // ja 544 <_sk_store_a8_ssse3_lowp+0x20>
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,128,0,0,0 // lea 0x80(%rip),%r10 # 5f8 <_sk_store_a8_ssse3_lowp+0xc4>
+ .byte 76,141,21,136,0,0,0 // lea 0x88(%rip),%r10 # 5f0 <_sk_store_a8_ssse3_lowp+0xcc>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
- .byte 138,68,36,244 // mov -0xc(%rsp),%al
- .byte 65,136,68,19,6 // mov %al,0x6(%r11,%rdx,1)
+ .byte 138,68,36,232 // mov -0x18(%rsp),%al
+ .byte 65,136,4,19 // mov %al,(%r11,%rdx,1)
+ .byte 235,194 // jmp 544 <_sk_store_a8_ssse3_lowp+0x20>
.byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp)
- .byte 138,68,36,226 // mov -0x1e(%rsp),%al
- .byte 65,136,68,19,5 // mov %al,0x5(%r11,%rdx,1)
+ .byte 138,68,36,220 // mov -0x24(%rsp),%al
+ .byte 65,136,68,19,2 // mov %al,0x2(%r11,%rdx,1)
+ .byte 102,68,15,56,0,5,4,14,0,0 // pshufb 0xe04(%rip),%xmm8 # 13a0 <_sk_xor__ssse3_lowp+0x11b>
+ .byte 102,68,15,126,192 // movd %xmm8,%eax
+ .byte 102,65,137,4,19 // mov %ax,(%r11,%rdx,1)
+ .byte 235,156 // jmp 544 <_sk_store_a8_ssse3_lowp+0x20>
.byte 102,68,15,127,68,36,200 // movdqa %xmm8,-0x38(%rsp)
- .byte 138,68,36,208 // mov -0x30(%rsp),%al
- .byte 65,136,68,19,4 // mov %al,0x4(%r11,%rdx,1)
+ .byte 138,68,36,212 // mov -0x2c(%rsp),%al
+ .byte 65,136,68,19,6 // mov %al,0x6(%r11,%rdx,1)
.byte 102,68,15,127,68,36,184 // movdqa %xmm8,-0x48(%rsp)
- .byte 138,68,36,190 // mov -0x42(%rsp),%al
- .byte 65,136,68,19,3 // mov %al,0x3(%r11,%rdx,1)
+ .byte 138,68,36,194 // mov -0x3e(%rsp),%al
+ .byte 65,136,68,19,5 // mov %al,0x5(%r11,%rdx,1)
.byte 102,68,15,127,68,36,168 // movdqa %xmm8,-0x58(%rsp)
- .byte 138,68,36,172 // mov -0x54(%rsp),%al
- .byte 65,136,68,19,2 // mov %al,0x2(%r11,%rdx,1)
- .byte 102,68,15,127,68,36,152 // movdqa %xmm8,-0x68(%rsp)
- .byte 138,68,36,154 // mov -0x66(%rsp),%al
- .byte 65,136,68,19,1 // mov %al,0x1(%r11,%rdx,1)
- .byte 102,68,15,127,68,36,136 // movdqa %xmm8,-0x78(%rsp)
- .byte 138,68,36,136 // mov -0x78(%rsp),%al
- .byte 65,136,4,19 // mov %al,(%r11,%rdx,1)
- .byte 233,95,255,255,255 // jmpq 554 <_sk_store_a8_ssse3_lowp+0x20>
+ .byte 138,68,36,176 // mov -0x50(%rsp),%al
+ .byte 65,136,68,19,4 // mov %al,0x4(%r11,%rdx,1)
+ .byte 102,68,15,56,0,5,206,13,0,0 // pshufb 0xdce(%rip),%xmm8 # 13b0 <_sk_xor__ssse3_lowp+0x12b>
+ .byte 102,69,15,126,4,19 // movd %xmm8,(%r11,%rdx,1)
+ .byte 233,87,255,255,255 // jmpq 544 <_sk_store_a8_ssse3_lowp+0x20>
.byte 15,31,0 // nopl (%rax)
- .byte 233,255,255,255,217 // jmpq ffffffffda0005fc <_sk_xor__ssse3_lowp+0xffffffffd9fff38f>
+ .byte 129,255,255,255,162,255 // cmp $0xffa2ffff,%edi
+ .byte 255 // (bad)
+ .byte 255,146,255,255,255,232 // callq *-0x17000001(%rdx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,201 // dec %ecx
.byte 255 // (bad)
+ .byte 216,255 // fdivr %st(7),%st
.byte 255 // (bad)
+ .byte 255,200 // dec %eax
.byte 255 // (bad)
- .byte 185,255,255,255,169 // mov $0xa9ffffff,%ecx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,153,255,255,255,137 // lcall *-0x76000001(%rcx)
+ .byte 184 // .byte 0xb8
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -37665,13 +37850,13 @@ _sk_load_g8_ssse3_lowp:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 648 <_sk_load_g8_ssse3_lowp+0x34>
+ .byte 117,42 // jne 640 <_sk_load_g8_ssse3_lowp+0x34>
.byte 243,65,15,126,4,19 // movq (%r11,%rdx,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,113,240,8 // psllw $0x8,%xmm0
- .byte 102,15,228,5,91,13,0,0 // pmulhuw 0xd5b(%rip),%xmm0 # 1390 <_sk_xor__ssse3_lowp+0x123>
+ .byte 102,15,228,5,147,13,0,0 // pmulhuw 0xd93(%rip),%xmm0 # 13c0 <_sk_xor__ssse3_lowp+0x13b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,98,13,0,0 // movaps 0xd62(%rip),%xmm3 # 13a0 <_sk_xor__ssse3_lowp+0x133>
+ .byte 15,40,29,154,13,0,0 // movaps 0xd9a(%rip),%xmm3 # 13d0 <_sk_xor__ssse3_lowp+0x14b>
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
@@ -37680,12 +37865,23 @@ _sk_load_g8_ssse3_lowp:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,204 // ja 628 <_sk_load_g8_ssse3_lowp+0x14>
+ .byte 119,204 // ja 620 <_sk_load_g8_ssse3_lowp+0x14>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,97,0,0,0 // lea 0x61(%rip),%r10 # 6c8 <_sk_load_g8_ssse3_lowp+0xb4>
+ .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 6d0 <_sk_load_g8_ssse3_lowp+0xc4>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 102,15,110,192 // movd %eax,%xmm0
+ .byte 235,173 // jmp 620 <_sk_load_g8_ssse3_lowp+0x14>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 102,15,239,192 // pxor %xmm0,%xmm0
+ .byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 102,15,110,200 // movd %eax,%xmm1
+ .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
+ .byte 243,15,16,193 // movss %xmm1,%xmm0
+ .byte 235,139 // jmp 620 <_sk_load_g8_ssse3_lowp+0x14>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -37693,32 +37889,28 @@ _sk_load_g8_ssse3_lowp:
.byte 102,15,196,192,5 // pinsrw $0x5,%eax,%xmm0
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 102,15,196,192,4 // pinsrw $0x4,%eax,%xmm0
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 102,15,196,192,1 // pinsrw $0x1,%eax,%xmm0
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0
- .byte 233,99,255,255,255 // jmpq 628 <_sk_load_g8_ssse3_lowp+0x14>
+ .byte 102,65,15,110,12,19 // movd (%r11,%rdx,1),%xmm1
+ .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
+ .byte 242,15,16,193 // movsd %xmm1,%xmm0
+ .byte 233,83,255,255,255 // jmpq 620 <_sk_load_g8_ssse3_lowp+0x14>
.byte 15,31,0 // nopl (%rax)
- .byte 238 // out %al,(%dx)
+ .byte 152 // cwtl
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,227 // jmpq *%rbx
+ .byte 255,178,255,255,255,163 // pushq -0x5c000001(%rdx)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 216,255 // fdivr %st(7),%st
+ .byte 234 // (bad)
.byte 255 // (bad)
- .byte 255,205 // dec %ebp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,194 // inc %edx
+ .byte 223,255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,212 // callq *%rsp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,183,255,255,255,168 // pushq -0x57000001(%rdi)
+ .byte 255,197 // inc %ebp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -37731,42 +37923,42 @@ _sk_srcover_rgba_8888_ssse3_lowp:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,11,2,0,0 // jne 902 <_sk_srcover_rgba_8888_ssse3_lowp+0x21e>
+ .byte 15,133,11,2,0,0 // jne 90a <_sk_srcover_rgba_8888_ssse3_lowp+0x21e>
.byte 69,15,16,68,147,16 // movups 0x10(%r11,%rdx,4),%xmm8
- .byte 65,15,16,60,147 // movups (%r11,%rdx,4),%xmm7
- .byte 102,15,111,45,166,12,0,0 // movdqa 0xca6(%rip),%xmm5 # 13b0 <_sk_xor__ssse3_lowp+0x143>
- .byte 15,40,231 // movaps %xmm7,%xmm4
+ .byte 102,65,15,16,60,147 // movupd (%r11,%rdx,4),%xmm7
+ .byte 102,15,111,45,205,12,0,0 // movdqa 0xccd(%rip),%xmm5 # 13e0 <_sk_xor__ssse3_lowp+0x15b>
+ .byte 102,15,40,231 // movapd %xmm7,%xmm4
.byte 102,15,56,0,229 // pshufb %xmm5,%xmm4
.byte 102,65,15,111,240 // movdqa %xmm8,%xmm6
.byte 102,15,56,0,245 // pshufb %xmm5,%xmm6
.byte 102,15,108,230 // punpcklqdq %xmm6,%xmm4
- .byte 102,15,111,13,152,12,0,0 // movdqa 0xc98(%rip),%xmm1 # 13c0 <_sk_xor__ssse3_lowp+0x153>
+ .byte 102,15,111,13,190,12,0,0 // movdqa 0xcbe(%rip),%xmm1 # 13f0 <_sk_xor__ssse3_lowp+0x16b>
.byte 102,15,113,244,8 // psllw $0x8,%xmm4
- .byte 102,68,15,111,13,154,12,0,0 // movdqa 0xc9a(%rip),%xmm9 # 13d0 <_sk_xor__ssse3_lowp+0x163>
+ .byte 102,68,15,111,13,192,12,0,0 // movdqa 0xcc0(%rip),%xmm9 # 1400 <_sk_xor__ssse3_lowp+0x17b>
.byte 102,65,15,228,225 // pmulhuw %xmm9,%xmm4
- .byte 102,68,15,111,21,156,12,0,0 // movdqa 0xc9c(%rip),%xmm10 # 13e0 <_sk_xor__ssse3_lowp+0x173>
- .byte 15,40,239 // movaps %xmm7,%xmm5
+ .byte 102,68,15,111,21,194,12,0,0 // movdqa 0xcc2(%rip),%xmm10 # 1410 <_sk_xor__ssse3_lowp+0x18b>
+ .byte 102,15,40,239 // movapd %xmm7,%xmm5
.byte 102,65,15,56,0,234 // pshufb %xmm10,%xmm5
.byte 102,65,15,111,240 // movdqa %xmm8,%xmm6
.byte 102,65,15,56,0,242 // pshufb %xmm10,%xmm6
.byte 102,15,108,238 // punpcklqdq %xmm6,%xmm5
.byte 102,15,113,245,8 // psllw $0x8,%xmm5
.byte 102,65,15,228,233 // pmulhuw %xmm9,%xmm5
- .byte 102,68,15,111,21,129,12,0,0 // movdqa 0xc81(%rip),%xmm10 # 13f0 <_sk_xor__ssse3_lowp+0x183>
- .byte 15,40,247 // movaps %xmm7,%xmm6
+ .byte 102,68,15,111,21,166,12,0,0 // movdqa 0xca6(%rip),%xmm10 # 1420 <_sk_xor__ssse3_lowp+0x19b>
+ .byte 102,15,40,247 // movapd %xmm7,%xmm6
.byte 102,65,15,56,0,242 // pshufb %xmm10,%xmm6
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,56,0,218 // pshufb %xmm10,%xmm11
.byte 102,65,15,108,243 // punpcklqdq %xmm11,%xmm6
.byte 102,15,113,246,8 // psllw $0x8,%xmm6
.byte 102,65,15,228,241 // pmulhuw %xmm9,%xmm6
- .byte 102,68,15,111,21,101,12,0,0 // movdqa 0xc65(%rip),%xmm10 # 1400 <_sk_xor__ssse3_lowp+0x193>
+ .byte 102,68,15,111,21,137,12,0,0 // movdqa 0xc89(%rip),%xmm10 # 1430 <_sk_xor__ssse3_lowp+0x1ab>
.byte 102,65,15,56,0,250 // pshufb %xmm10,%xmm7
.byte 102,69,15,56,0,194 // pshufb %xmm10,%xmm8
.byte 102,65,15,108,248 // punpcklqdq %xmm8,%xmm7
.byte 102,15,113,247,8 // psllw $0x8,%xmm7
.byte 102,65,15,228,249 // pmulhuw %xmm9,%xmm7
- .byte 102,68,15,111,29,81,12,0,0 // movdqa 0xc51(%rip),%xmm11 # 1410 <_sk_xor__ssse3_lowp+0x1a3>
+ .byte 102,68,15,111,29,117,12,0,0 // movdqa 0xc75(%rip),%xmm11 # 1440 <_sk_xor__ssse3_lowp+0x1bb>
.byte 102,68,15,249,219 // psubw %xmm3,%xmm11
.byte 102,68,15,111,196 // movdqa %xmm4,%xmm8
.byte 102,69,15,56,11,195 // pmulhrsw %xmm11,%xmm8
@@ -37822,7 +38014,7 @@ _sk_srcover_rgba_8888_ssse3_lowp:
.byte 102,65,15,235,192 // por %xmm8,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,197,0,0,0 // jne 9a2 <_sk_srcover_rgba_8888_ssse3_lowp+0x2be>
+ .byte 117,97 // jne 946 <_sk_srcover_rgba_8888_ssse3_lowp+0x25a>
.byte 243,65,15,127,4,147 // movdqu %xmm0,(%r11,%rdx,4)
.byte 243,65,15,127,76,147,16 // movdqu %xmm1,0x10(%r11,%rdx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -37834,92 +38026,82 @@ _sk_srcover_rgba_8888_ssse3_lowp:
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
- .byte 15,87,255 // xorps %xmm7,%xmm7
+ .byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,228,253,255,255 // ja 702 <_sk_srcover_rgba_8888_ssse3_lowp+0x1e>
+ .byte 15,135,228,253,255,255 // ja 70b <_sk_srcover_rgba_8888_ssse3_lowp+0x1f>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,239,0,0,0 // lea 0xef(%rip),%r10 # a18 <_sk_srcover_rgba_8888_ssse3_lowp+0x334>
+ .byte 76,141,21,206,0,0,0 // lea 0xce(%rip),%r10 # a00 <_sk_srcover_rgba_8888_ssse3_lowp+0x314>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
- .byte 102,65,15,110,100,147,24 // movd 0x18(%r11,%rdx,4),%xmm4
- .byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
- .byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 243,65,15,16,100,147,20 // movss 0x14(%r11,%rdx,4),%xmm4
- .byte 65,15,198,224,0 // shufps $0x0,%xmm8,%xmm4
- .byte 65,15,198,224,226 // shufps $0xe2,%xmm8,%xmm4
- .byte 68,15,40,196 // movaps %xmm4,%xmm8
- .byte 243,65,15,16,100,147,16 // movss 0x10(%r11,%rdx,4),%xmm4
- .byte 243,68,15,16,196 // movss %xmm4,%xmm8
- .byte 243,65,15,16,100,147,12 // movss 0xc(%r11,%rdx,4),%xmm4
- .byte 15,198,231,32 // shufps $0x20,%xmm7,%xmm4
- .byte 15,198,252,36 // shufps $0x24,%xmm4,%xmm7
- .byte 243,65,15,16,100,147,8 // movss 0x8(%r11,%rdx,4),%xmm4
- .byte 15,198,231,48 // shufps $0x30,%xmm7,%xmm4
- .byte 15,198,252,132 // shufps $0x84,%xmm4,%xmm7
- .byte 243,65,15,16,100,147,4 // movss 0x4(%r11,%rdx,4),%xmm4
- .byte 15,198,231,0 // shufps $0x0,%xmm7,%xmm4
- .byte 15,198,231,226 // shufps $0xe2,%xmm7,%xmm4
- .byte 15,40,252 // movaps %xmm4,%xmm7
- .byte 243,65,15,16,36,147 // movss (%r11,%rdx,4),%xmm4
- .byte 243,15,16,252 // movss %xmm4,%xmm7
- .byte 233,96,253,255,255 // jmpq 702 <_sk_srcover_rgba_8888_ssse3_lowp+0x1e>
+ .byte 243,65,15,16,60,147 // movss (%r11,%rdx,4),%xmm7
+ .byte 233,197,253,255,255 // jmpq 70b <_sk_srcover_rgba_8888_ssse3_lowp+0x1f>
.byte 69,137,193 // mov %r8d,%r9d
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,52,255,255,255 // ja 8ea <_sk_srcover_rgba_8888_ssse3_lowp+0x206>
+ .byte 119,156 // ja 8f2 <_sk_srcover_rgba_8888_ssse3_lowp+0x206>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 76,141,13,115,0,0,0 // lea 0x73(%rip),%r9 # a34 <_sk_srcover_rgba_8888_ssse3_lowp+0x350>
+ .byte 76,141,13,187,0,0,0 // lea 0xbb(%rip),%r9 # a1c <_sk_srcover_rgba_8888_ssse3_lowp+0x330>
.byte 73,99,4,129 // movslq (%r9,%rax,4),%rax
.byte 76,1,200 // add %r9,%rax
.byte 255,224 // jmpq *%rax
+ .byte 102,65,15,126,4,147 // movd %xmm0,(%r11,%rdx,4)
+ .byte 235,128 // jmp 8f2 <_sk_srcover_rgba_8888_ssse3_lowp+0x206>
+ .byte 102,65,15,110,100,147,8 // movd 0x8(%r11,%rdx,4),%xmm4
+ .byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
+ .byte 102,65,15,18,60,147 // movlpd (%r11,%rdx,4),%xmm7
+ .byte 233,130,253,255,255 // jmpq 70b <_sk_srcover_rgba_8888_ssse3_lowp+0x1f>
+ .byte 102,65,15,110,100,147,24 // movd 0x18(%r11,%rdx,4),%xmm4
+ .byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
+ .byte 243,65,15,16,100,147,20 // movss 0x14(%r11,%rdx,4),%xmm4
+ .byte 65,15,198,224,0 // shufps $0x0,%xmm8,%xmm4
+ .byte 65,15,198,224,226 // shufps $0xe2,%xmm8,%xmm4
+ .byte 68,15,40,196 // movaps %xmm4,%xmm8
+ .byte 243,65,15,16,100,147,16 // movss 0x10(%r11,%rdx,4),%xmm4
+ .byte 243,68,15,16,196 // movss %xmm4,%xmm8
+ .byte 233,73,253,255,255 // jmpq 705 <_sk_srcover_rgba_8888_ssse3_lowp+0x19>
+ .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
+ .byte 102,65,15,126,76,147,8 // movd %xmm1,0x8(%r11,%rdx,4)
+ .byte 102,65,15,214,4,147 // movq %xmm0,(%r11,%rdx,4)
+ .byte 233,31,255,255,255 // jmpq 8f2 <_sk_srcover_rgba_8888_ssse3_lowp+0x206>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,65,15,126,84,147,24 // movd %xmm2,0x18(%r11,%rdx,4)
.byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2
.byte 102,65,15,126,84,147,20 // movd %xmm2,0x14(%r11,%rdx,4)
.byte 102,65,15,126,76,147,16 // movd %xmm1,0x10(%r11,%rdx,4)
- .byte 102,15,112,200,231 // pshufd $0xe7,%xmm0,%xmm1
- .byte 102,65,15,126,76,147,12 // movd %xmm1,0xc(%r11,%rdx,4)
- .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
- .byte 102,65,15,126,76,147,8 // movd %xmm1,0x8(%r11,%rdx,4)
- .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1
- .byte 102,65,15,126,76,147,4 // movd %xmm1,0x4(%r11,%rdx,4)
- .byte 102,65,15,126,4,147 // movd %xmm0,(%r11,%rdx,4)
- .byte 233,210,254,255,255 // jmpq 8ea <_sk_srcover_rgba_8888_ssse3_lowp+0x206>
- .byte 123,255 // jnp a19 <_sk_srcover_rgba_8888_ssse3_lowp+0x335>
- .byte 255 // (bad)
- .byte 255,105,255 // ljmp *-0x1(%rcx)
- .byte 255 // (bad)
- .byte 255,90,255 // lcall *-0x1(%rdx)
- .byte 255 // (bad)
- .byte 255,75,255 // decl -0x1(%rbx)
- .byte 255 // (bad)
+ .byte 243,65,15,127,4,147 // movdqu %xmm0,(%r11,%rdx,4)
+ .byte 233,245,254,255,255 // jmpq 8f2 <_sk_srcover_rgba_8888_ssse3_lowp+0x206>
+ .byte 15,31,0 // nopl (%rax)
+ .byte 59,255 // cmp %edi,%edi
.byte 255 // (bad)
- .byte 63 // (bad)
.byte 255 // (bad)
+ .byte 126,255 // jle a05 <_sk_srcover_rgba_8888_ssse3_lowp+0x319>
.byte 255 // (bad)
- .byte 255,42 // ljmp *(%rdx)
+ .byte 255,114,255 // pushq -0x1(%rdx)
.byte 255 // (bad)
+ .byte 255,5,253,255,255,171 // incl -0x54000003(%rip) # ffffffffac000a0e <_sk_xor__ssse3_lowp+0xffffffffabfff789>
.byte 255 // (bad)
- .byte 255,26 // lcall *(%rdx)
.byte 255 // (bad)
+ .byte 255,150,255,255,255,137 // callq *-0x76000001(%rsi)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 217,255 // fcos
+ .byte 255,78,255 // decl -0x1(%rsi)
.byte 255 // (bad)
- .byte 255,205 // dec %ebp
+ .byte 255,172,255,255,255,160,255 // ljmp *-0x5f0001(%rdi,%rdi,8)
.byte 255 // (bad)
+ .byte 255,214 // callq *%rsi
.byte 255 // (bad)
- .byte 255,193 // inc %ecx
.byte 255 // (bad)
+ .byte 255,207 // dec %edi
.byte 255 // (bad)
- .byte 255,181,255,255,255,174 // pushq -0x51000001(%rbp)
.byte 255 // (bad)
+ .byte 255,195 // inc %ebx
.byte 255 // (bad)
- .byte 255,162,255,255,255,150 // jmpq *-0x69000001(%rdx)
.byte 255 // (bad)
+ .byte 255 // .byte 0xff
+ .byte 183,255 // mov $0xff,%bh
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -37929,7 +38111,7 @@ FUNCTION(_sk_scale_1_float_ssse3_lowp)
_sk_scale_1_float_ssse3_lowp:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,68,15,16,0 // movss (%rax),%xmm8
- .byte 243,68,15,88,5,148,10,0,0 // addss 0xa94(%rip),%xmm8 # 14f4 <_sk_xor__ssse3_lowp+0x287>
+ .byte 243,68,15,88,5,220,10,0,0 // addss 0xadc(%rip),%xmm8 # 1524 <_sk_xor__ssse3_lowp+0x29f>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 242,69,15,112,192,0 // pshuflw $0x0,%xmm8,%xmm8
@@ -37952,11 +38134,11 @@ _sk_scale_u8_ssse3_lowp:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,24 // mov (%rax),%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,74 // jne afa <_sk_scale_u8_ssse3_lowp+0x54>
+ .byte 117,74 // jne ae2 <_sk_scale_u8_ssse3_lowp+0x54>
.byte 243,69,15,126,4,19 // movq (%r11,%rdx,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,65,15,113,240,8 // psllw $0x8,%xmm8
- .byte 102,68,15,228,5,86,9,0,0 // pmulhuw 0x956(%rip),%xmm8 # 1420 <_sk_xor__ssse3_lowp+0x1b3>
+ .byte 102,68,15,228,5,158,9,0,0 // pmulhuw 0x99e(%rip),%xmm8 # 1450 <_sk_xor__ssse3_lowp+0x1cb>
.byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0
.byte 102,15,56,29,192 // pabsw %xmm0,%xmm0
.byte 102,65,15,56,11,200 // pmulhrsw %xmm8,%xmm1
@@ -37972,12 +38154,23 @@ _sk_scale_u8_ssse3_lowp:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,172 // ja abb <_sk_scale_u8_ssse3_lowp+0x15>
+ .byte 119,172 // ja aa3 <_sk_scale_u8_ssse3_lowp+0x15>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,102,0,0,0 // lea 0x66(%rip),%r10 # b80 <_sk_scale_u8_ssse3_lowp+0xda>
+ .byte 76,141,21,126,0,0,0 // lea 0x7e(%rip),%r10 # b80 <_sk_scale_u8_ssse3_lowp+0xf2>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 235,140 // jmp aa3 <_sk_scale_u8_ssse3_lowp+0x15>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
+ .byte 102,68,15,196,192,2 // pinsrw $0x2,%eax,%xmm8
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 102,68,15,110,200 // movd %eax,%xmm9
+ .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
+ .byte 243,69,15,16,193 // movss %xmm9,%xmm8
+ .byte 233,98,255,255,255 // jmpq aa3 <_sk_scale_u8_ssse3_lowp+0x15>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,68,15,196,192,6 // pinsrw $0x6,%eax,%xmm8
@@ -37985,30 +38178,28 @@ _sk_scale_u8_ssse3_lowp:
.byte 102,68,15,196,192,5 // pinsrw $0x5,%eax,%xmm8
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 102,68,15,196,192,4 // pinsrw $0x4,%eax,%xmm8
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 102,68,15,196,192,3 // pinsrw $0x3,%eax,%xmm8
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 102,68,15,196,192,2 // pinsrw $0x2,%eax,%xmm8
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 102,68,15,196,192,1 // pinsrw $0x1,%eax,%xmm8
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 102,68,15,196,192,0 // pinsrw $0x0,%eax,%xmm8
- .byte 233,59,255,255,255 // jmpq abb <_sk_scale_u8_ssse3_lowp+0x15>
- .byte 240,255 // lock (bad)
+ .byte 102,69,15,110,12,19 // movd (%r11,%rdx,1),%xmm9
+ .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
+ .byte 242,69,15,16,193 // movsd %xmm9,%xmm8
+ .byte 233,36,255,255,255 // jmpq aa3 <_sk_scale_u8_ssse3_lowp+0x15>
+ .byte 144 // nop
+ .byte 139,255 // mov %edi,%edi
.byte 255 // (bad)
- .byte 255,228 // jmpq *%rsp
+ .byte 255,168,255,255,255,151 // ljmp *-0x68000001(%rax)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 216,255 // fdivr %st(7),%st
+ .byte 234 // (bad)
.byte 255 // (bad)
- .byte 255,204 // dec %esp
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,192 // inc %eax
+ .byte 222,255 // fdivrp %st,%st(7)
.byte 255 // (bad)
+ .byte 255,210 // callq *%rdx
+ .byte 255 // (bad)
+ .byte 255 // (bad)
+ .byte 255,193 // inc %ecx
.byte 255 // (bad)
- .byte 255,180,255,255,255,163,255 // pushq -0x5c0001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -38018,14 +38209,14 @@ FUNCTION(_sk_lerp_1_float_ssse3_lowp)
_sk_lerp_1_float_ssse3_lowp:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,68,15,16,0 // movss (%rax),%xmm8
- .byte 243,68,15,88,5,76,9,0,0 // addss 0x94c(%rip),%xmm8 # 14f8 <_sk_xor__ssse3_lowp+0x28b>
+ .byte 243,68,15,88,5,124,9,0,0 // addss 0x97c(%rip),%xmm8 # 1528 <_sk_xor__ssse3_lowp+0x2a3>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 242,69,15,112,192,0 // pshuflw $0x0,%xmm8,%xmm8
.byte 102,69,15,112,192,80 // pshufd $0x50,%xmm8,%xmm8
.byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0
.byte 102,68,15,56,29,200 // pabsw %xmm0,%xmm9
- .byte 102,68,15,111,21,89,8,0,0 // movdqa 0x859(%rip),%xmm10 # 1430 <_sk_xor__ssse3_lowp+0x1c3>
+ .byte 102,68,15,111,21,137,8,0,0 // movdqa 0x889(%rip),%xmm10 # 1460 <_sk_xor__ssse3_lowp+0x1db>
.byte 102,69,15,249,208 // psubw %xmm8,%xmm10
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,65,15,56,11,194 // pmulhrsw %xmm10,%xmm0
@@ -38062,10 +38253,10 @@ _sk_lerp_u8_ssse3_lowp:
.byte 243,69,15,126,4,19 // movq (%r11,%rdx,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,65,15,113,240,8 // psllw $0x8,%xmm8
- .byte 102,68,15,228,5,199,7,0,0 // pmulhuw 0x7c7(%rip),%xmm8 # 1440 <_sk_xor__ssse3_lowp+0x1d3>
+ .byte 102,68,15,228,5,247,7,0,0 // pmulhuw 0x7f7(%rip),%xmm8 # 1470 <_sk_xor__ssse3_lowp+0x1eb>
.byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0
.byte 102,68,15,56,29,200 // pabsw %xmm0,%xmm9
- .byte 102,68,15,111,21,194,7,0,0 // movdqa 0x7c2(%rip),%xmm10 # 1450 <_sk_xor__ssse3_lowp+0x1e3>
+ .byte 102,68,15,111,21,242,7,0,0 // movdqa 0x7f2(%rip),%xmm10 # 1480 <_sk_xor__ssse3_lowp+0x1fb>
.byte 102,69,15,249,208 // psubw %xmm8,%xmm10
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,65,15,56,11,194 // pmulhrsw %xmm10,%xmm0
@@ -38097,10 +38288,21 @@ _sk_lerp_u8_ssse3_lowp:
.byte 65,128,249,6 // cmp $0x6,%r9b
.byte 15,135,73,255,255,255 // ja c6a <_sk_lerp_u8_ssse3_lowp+0x19>
.byte 69,15,182,201 // movzbl %r9b,%r9d
- .byte 76,141,21,104,0,0,0 // lea 0x68(%rip),%r10 # d94 <_sk_lerp_u8_ssse3_lowp+0x143>
+ .byte 76,141,21,128,0,0,0 // lea 0x80(%rip),%r10 # dac <_sk_lerp_u8_ssse3_lowp+0x15b>
.byte 75,99,4,138 // movslq (%r10,%r9,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
+ .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
+ .byte 102,68,15,110,192 // movd %eax,%xmm8
+ .byte 233,38,255,255,255 // jmpq c6a <_sk_lerp_u8_ssse3_lowp+0x19>
+ .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
+ .byte 102,69,15,239,192 // pxor %xmm8,%xmm8
+ .byte 102,68,15,196,192,2 // pinsrw $0x2,%eax,%xmm8
+ .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax
+ .byte 102,68,15,110,200 // movd %eax,%xmm9
+ .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
+ .byte 243,69,15,16,193 // movss %xmm9,%xmm8
+ .byte 233,252,254,255,255 // jmpq c6a <_sk_lerp_u8_ssse3_lowp+0x19>
.byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,68,15,196,192,6 // pinsrw $0x6,%eax,%xmm8
@@ -38108,34 +38310,25 @@ _sk_lerp_u8_ssse3_lowp:
.byte 102,68,15,196,192,5 // pinsrw $0x5,%eax,%xmm8
.byte 65,15,182,68,19,4 // movzbl 0x4(%r11,%rdx,1),%eax
.byte 102,68,15,196,192,4 // pinsrw $0x4,%eax,%xmm8
- .byte 65,15,182,68,19,3 // movzbl 0x3(%r11,%rdx,1),%eax
- .byte 102,68,15,196,192,3 // pinsrw $0x3,%eax,%xmm8
- .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax
- .byte 102,68,15,196,192,2 // pinsrw $0x2,%eax,%xmm8
- .byte 65,15,182,68,19,1 // movzbl 0x1(%r11,%rdx,1),%eax
- .byte 102,68,15,196,192,1 // pinsrw $0x1,%eax,%xmm8
- .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax
- .byte 102,68,15,196,192,0 // pinsrw $0x0,%eax,%xmm8
- .byte 233,216,254,255,255 // jmpq c6a <_sk_lerp_u8_ssse3_lowp+0x19>
- .byte 102,144 // xchg %ax,%ax
- .byte 238 // out %al,(%dx)
- .byte 255 // (bad)
+ .byte 102,69,15,110,12,19 // movd (%r11,%rdx,1),%xmm9
+ .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
+ .byte 242,69,15,16,193 // movsd %xmm9,%xmm8
+ .byte 233,190,254,255,255 // jmpq c6a <_sk_lerp_u8_ssse3_lowp+0x19>
+ .byte 137,255 // mov %edi,%edi
.byte 255 // (bad)
- .byte 255,226 // jmpq *%rdx
+ .byte 255,169,255,255,255,152 // ljmp *-0x67000001(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,214 // callq *%rsi
.byte 255 // (bad)
- .byte 255 // (bad)
- .byte 255,202 // dec %edx
+ .byte 235,255 // jmp db9 <_sk_lerp_u8_ssse3_lowp+0x168>
.byte 255 // (bad)
.byte 255 // (bad)
+ .byte 223,255 // (bad)
.byte 255 // (bad)
- .byte 190,255,255,255,178 // mov $0xb2ffffff,%esi
+ .byte 255,211 // callq *%rbx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255 // .byte 0xff
- .byte 161 // .byte 0xa1
+ .byte 255,194 // inc %edx
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -38208,7 +38401,7 @@ FUNCTION(_sk_srcatop_ssse3_lowp)
_sk_srcatop_ssse3_lowp:
.byte 102,15,56,11,199 // pmulhrsw %xmm7,%xmm0
.byte 102,68,15,56,29,192 // pabsw %xmm0,%xmm8
- .byte 102,68,15,111,13,45,6,0,0 // movdqa 0x62d(%rip),%xmm9 # 1460 <_sk_xor__ssse3_lowp+0x1f3>
+ .byte 102,68,15,111,13,69,6,0,0 // movdqa 0x645(%rip),%xmm9 # 1490 <_sk_xor__ssse3_lowp+0x20b>
.byte 102,68,15,249,203 // psubw %xmm3,%xmm9
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,65,15,56,11,193 // pmulhrsw %xmm9,%xmm0
@@ -38241,7 +38434,7 @@ _sk_dstatop_ssse3_lowp:
.byte 102,68,15,111,196 // movdqa %xmm4,%xmm8
.byte 102,68,15,56,11,195 // pmulhrsw %xmm3,%xmm8
.byte 102,69,15,56,29,192 // pabsw %xmm8,%xmm8
- .byte 102,68,15,111,13,172,5,0,0 // movdqa 0x5ac(%rip),%xmm9 # 1470 <_sk_xor__ssse3_lowp+0x203>
+ .byte 102,68,15,111,13,196,5,0,0 // movdqa 0x5c4(%rip),%xmm9 # 14a0 <_sk_xor__ssse3_lowp+0x21b>
.byte 102,68,15,249,207 // psubw %xmm7,%xmm9
.byte 102,65,15,56,11,193 // pmulhrsw %xmm9,%xmm0
.byte 102,15,56,29,192 // pabsw %xmm0,%xmm0
@@ -38304,7 +38497,7 @@ HIDDEN _sk_srcout_ssse3_lowp
.globl _sk_srcout_ssse3_lowp
FUNCTION(_sk_srcout_ssse3_lowp)
_sk_srcout_ssse3_lowp:
- .byte 102,68,15,111,5,210,4,0,0 // movdqa 0x4d2(%rip),%xmm8 # 1480 <_sk_xor__ssse3_lowp+0x213>
+ .byte 102,68,15,111,5,234,4,0,0 // movdqa 0x4ea(%rip),%xmm8 # 14b0 <_sk_xor__ssse3_lowp+0x22b>
.byte 102,68,15,249,199 // psubw %xmm7,%xmm8
.byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0
.byte 102,15,56,29,192 // pabsw %xmm0,%xmm0
@@ -38321,7 +38514,7 @@ HIDDEN _sk_dstout_ssse3_lowp
.globl _sk_dstout_ssse3_lowp
FUNCTION(_sk_dstout_ssse3_lowp)
_sk_dstout_ssse3_lowp:
- .byte 102,68,15,111,5,163,4,0,0 // movdqa 0x4a3(%rip),%xmm8 # 1490 <_sk_xor__ssse3_lowp+0x223>
+ .byte 102,68,15,111,5,187,4,0,0 // movdqa 0x4bb(%rip),%xmm8 # 14c0 <_sk_xor__ssse3_lowp+0x23b>
.byte 102,68,15,249,195 // psubw %xmm3,%xmm8
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0
@@ -38341,7 +38534,7 @@ HIDDEN _sk_srcover_ssse3_lowp
.globl _sk_srcover_ssse3_lowp
FUNCTION(_sk_srcover_ssse3_lowp)
_sk_srcover_ssse3_lowp:
- .byte 102,68,15,111,5,104,4,0,0 // movdqa 0x468(%rip),%xmm8 # 14a0 <_sk_xor__ssse3_lowp+0x233>
+ .byte 102,68,15,111,5,128,4,0,0 // movdqa 0x480(%rip),%xmm8 # 14d0 <_sk_xor__ssse3_lowp+0x24b>
.byte 102,68,15,249,195 // psubw %xmm3,%xmm8
.byte 102,68,15,111,204 // movdqa %xmm4,%xmm9
.byte 102,69,15,56,11,200 // pmulhrsw %xmm8,%xmm9
@@ -38365,7 +38558,7 @@ HIDDEN _sk_dstover_ssse3_lowp
.globl _sk_dstover_ssse3_lowp
FUNCTION(_sk_dstover_ssse3_lowp)
_sk_dstover_ssse3_lowp:
- .byte 102,68,15,111,5,19,4,0,0 // movdqa 0x413(%rip),%xmm8 # 14b0 <_sk_xor__ssse3_lowp+0x243>
+ .byte 102,68,15,111,5,43,4,0,0 // movdqa 0x42b(%rip),%xmm8 # 14e0 <_sk_xor__ssse3_lowp+0x25b>
.byte 102,68,15,249,199 // psubw %xmm7,%xmm8
.byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0
.byte 102,15,56,29,192 // pabsw %xmm0,%xmm0
@@ -38401,7 +38594,7 @@ HIDDEN _sk_multiply_ssse3_lowp
.globl _sk_multiply_ssse3_lowp
FUNCTION(_sk_multiply_ssse3_lowp)
_sk_multiply_ssse3_lowp:
- .byte 102,68,15,111,5,168,3,0,0 // movdqa 0x3a8(%rip),%xmm8 # 14c0 <_sk_xor__ssse3_lowp+0x253>
+ .byte 102,68,15,111,5,192,3,0,0 // movdqa 0x3c0(%rip),%xmm8 # 14f0 <_sk_xor__ssse3_lowp+0x26b>
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,68,15,249,207 // psubw %xmm7,%xmm9
.byte 102,68,15,111,208 // movdqa %xmm0,%xmm10
@@ -38450,7 +38643,7 @@ HIDDEN _sk_screen_ssse3_lowp
.globl _sk_screen_ssse3_lowp
FUNCTION(_sk_screen_ssse3_lowp)
_sk_screen_ssse3_lowp:
- .byte 102,68,15,111,5,206,2,0,0 // movdqa 0x2ce(%rip),%xmm8 # 14d0 <_sk_xor__ssse3_lowp+0x263>
+ .byte 102,68,15,111,5,230,2,0,0 // movdqa 0x2e6(%rip),%xmm8 # 1500 <_sk_xor__ssse3_lowp+0x27b>
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,68,15,249,200 // psubw %xmm0,%xmm9
.byte 102,68,15,56,11,204 // pmulhrsw %xmm4,%xmm9
@@ -38477,7 +38670,7 @@ HIDDEN _sk_xor__ssse3_lowp
.globl _sk_xor__ssse3_lowp
FUNCTION(_sk_xor__ssse3_lowp)
_sk_xor__ssse3_lowp:
- .byte 102,68,15,111,5,106,2,0,0 // movdqa 0x26a(%rip),%xmm8 # 14e0 <_sk_xor__ssse3_lowp+0x273>
+ .byte 102,68,15,111,5,130,2,0,0 // movdqa 0x282(%rip),%xmm8 # 1510 <_sk_xor__ssse3_lowp+0x28b>
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,68,15,249,207 // psubw %xmm7,%xmm9
.byte 102,65,15,56,11,193 // pmulhrsw %xmm9,%xmm0
@@ -38520,7 +38713,7 @@ BALIGN16
.byte 12,13 // or $0xd,%al
.byte 12,13 // or $0xd,%al
.byte 14 // (bad)
- .byte 15,129,128,129,128,129 // jno ffffffff818094b5 <_sk_xor__ssse3_lowp+0xffffffff81808248>
+ .byte 15,129,128,129,128,129 // jno ffffffff818094c5 <_sk_xor__ssse3_lowp+0xffffffff81808240>
.byte 128,129,128,129,128,129,128 // addb $0x80,-0x7e7f7e80(%rcx)
.byte 129,128,129,128,1,2,5,6,9,10 // addl $0xa090605,0x2018081(%rax)
.byte 13,14,9,10,13 // or $0xd0a090e,%eax
@@ -38553,11 +38746,27 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 255,0 // incl (%rax)
.byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%rax)
+ .byte 129,128,129,128,129,128,0,2,0,0 // addl $0x200,-0x7f7e7f7f(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,2 // add %al,(%rdx)
+ .byte 4,6 // add $0x6,%al
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
+ .byte 0,0 // add %al,(%rax)
.byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%rax)
- .byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%rax)
- .byte 129,128,0,128,0,128,0,128,0,128 // addl $0x80008000,-0x7fff8000(%rax)
+ .byte 129,128,129,128,129,128,0,128,0,128 // addl $0x80008000,-0x7f7e7f7f(%rax)
+ .byte 0,128,0,128,0,128 // add %al,-0x7fff8000(%rax)
.byte 0,128,0,128,0,128 // add %al,-0x7fff8000(%rax)
- .byte 0,128,0,1,4,5 // add %al,0x5040100(%rax)
+ .byte 0,1 // add %al,(%rcx)
+ .byte 4,5 // add $0x5,%al
.byte 8,9 // or %cl,(%rcx)
.byte 12,13 // or $0xd,%al
.byte 8,9 // or %cl,(%rcx)
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index 51de93dcd5..d64d125590 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -110,7 +110,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,249,110,194 ; vmovd %edx,%xmm0
DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,29,75,0,0 ; vbroadcastss 0x4b1d(%rip),%ymm1 # 4c90 <_sk_callback_hsw+0x12c>
+ DB 196,226,125,24,13,225,75,0,0 ; vbroadcastss 0x4be1(%rip),%ymm1 # 4d54 <_sk_callback_hsw+0x12c>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -118,7 +118,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,253,74,0,0 ; vbroadcastss 0x4afd(%rip),%ymm2 # 4c94 <_sk_callback_hsw+0x130>
+ DB 196,226,125,24,21,193,75,0,0 ; vbroadcastss 0x4bc1(%rip),%ymm2 # 4d58 <_sk_callback_hsw+0x130>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -135,13 +135,13 @@ _sk_dither_hsw LABEL PROC
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9
DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9
- DB 196,98,125,88,21,196,74,0,0 ; vpbroadcastd 0x4ac4(%rip),%ymm10 # 4c98 <_sk_callback_hsw+0x134>
+ DB 196,98,125,88,21,136,75,0,0 ; vpbroadcastd 0x4b88(%rip),%ymm10 # 4d5c <_sk_callback_hsw+0x134>
DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11
DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10
- DB 196,98,125,88,37,169,74,0,0 ; vpbroadcastd 0x4aa9(%rip),%ymm12 # 4c9c <_sk_callback_hsw+0x138>
- DB 196,98,125,88,45,164,74,0,0 ; vpbroadcastd 0x4aa4(%rip),%ymm13 # 4ca0 <_sk_callback_hsw+0x13c>
+ DB 196,98,125,88,37,109,75,0,0 ; vpbroadcastd 0x4b6d(%rip),%ymm12 # 4d60 <_sk_callback_hsw+0x138>
+ DB 196,98,125,88,45,104,75,0,0 ; vpbroadcastd 0x4b68(%rip),%ymm13 # 4d64 <_sk_callback_hsw+0x13c>
DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14
DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14
DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13
@@ -156,8 +156,8 @@ _sk_dither_hsw LABEL PROC
DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,86,74,0,0 ; vbroadcastss 0x4a56(%rip),%ymm9 # 4ca4 <_sk_callback_hsw+0x140>
- DB 196,98,125,24,21,81,74,0,0 ; vbroadcastss 0x4a51(%rip),%ymm10 # 4ca8 <_sk_callback_hsw+0x144>
+ DB 196,98,125,24,13,26,75,0,0 ; vbroadcastss 0x4b1a(%rip),%ymm9 # 4d68 <_sk_callback_hsw+0x140>
+ DB 196,98,125,24,21,21,75,0,0 ; vbroadcastss 0x4b15(%rip),%ymm10 # 4d6c <_sk_callback_hsw+0x144>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
@@ -216,7 +216,7 @@ _sk_clear_hsw LABEL PROC
PUBLIC _sk_srcatop_hsw
_sk_srcatop_hsw LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,169,73,0,0 ; vbroadcastss 0x49a9(%rip),%ymm8 # 4cac <_sk_callback_hsw+0x148>
+ DB 196,98,125,24,5,109,74,0,0 ; vbroadcastss 0x4a6d(%rip),%ymm8 # 4d70 <_sk_callback_hsw+0x148>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0
DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1
@@ -230,7 +230,7 @@ _sk_srcatop_hsw LABEL PROC
PUBLIC _sk_dstatop_hsw
_sk_dstatop_hsw LABEL PROC
- DB 196,98,125,24,5,124,73,0,0 ; vbroadcastss 0x497c(%rip),%ymm8 # 4cb0 <_sk_callback_hsw+0x14c>
+ DB 196,98,125,24,5,64,74,0,0 ; vbroadcastss 0x4a40(%rip),%ymm8 # 4d74 <_sk_callback_hsw+0x14c>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -263,7 +263,7 @@ _sk_dstin_hsw LABEL PROC
PUBLIC _sk_srcout_hsw
_sk_srcout_hsw LABEL PROC
- DB 196,98,125,24,5,35,73,0,0 ; vbroadcastss 0x4923(%rip),%ymm8 # 4cb4 <_sk_callback_hsw+0x150>
+ DB 196,98,125,24,5,231,73,0,0 ; vbroadcastss 0x49e7(%rip),%ymm8 # 4d78 <_sk_callback_hsw+0x150>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -274,7 +274,7 @@ _sk_srcout_hsw LABEL PROC
PUBLIC _sk_dstout_hsw
_sk_dstout_hsw LABEL PROC
- DB 196,226,125,24,5,6,73,0,0 ; vbroadcastss 0x4906(%rip),%ymm0 # 4cb8 <_sk_callback_hsw+0x154>
+ DB 196,226,125,24,5,202,73,0,0 ; vbroadcastss 0x49ca(%rip),%ymm0 # 4d7c <_sk_callback_hsw+0x154>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -285,7 +285,7 @@ _sk_dstout_hsw LABEL PROC
PUBLIC _sk_srcover_hsw
_sk_srcover_hsw LABEL PROC
- DB 196,98,125,24,5,233,72,0,0 ; vbroadcastss 0x48e9(%rip),%ymm8 # 4cbc <_sk_callback_hsw+0x158>
+ DB 196,98,125,24,5,173,73,0,0 ; vbroadcastss 0x49ad(%rip),%ymm8 # 4d80 <_sk_callback_hsw+0x158>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -296,7 +296,7 @@ _sk_srcover_hsw LABEL PROC
PUBLIC _sk_dstover_hsw
_sk_dstover_hsw LABEL PROC
- DB 196,98,125,24,5,200,72,0,0 ; vbroadcastss 0x48c8(%rip),%ymm8 # 4cc0 <_sk_callback_hsw+0x15c>
+ DB 196,98,125,24,5,140,73,0,0 ; vbroadcastss 0x498c(%rip),%ymm8 # 4d84 <_sk_callback_hsw+0x15c>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -316,7 +316,7 @@ _sk_modulate_hsw LABEL PROC
PUBLIC _sk_multiply_hsw
_sk_multiply_hsw LABEL PROC
- DB 196,98,125,24,5,147,72,0,0 ; vbroadcastss 0x4893(%rip),%ymm8 # 4cc4 <_sk_callback_hsw+0x160>
+ DB 196,98,125,24,5,87,73,0,0 ; vbroadcastss 0x4957(%rip),%ymm8 # 4d88 <_sk_callback_hsw+0x160>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -358,7 +358,7 @@ _sk_screen_hsw LABEL PROC
PUBLIC _sk_xor__hsw
_sk_xor__hsw LABEL PROC
- DB 196,98,125,24,5,14,72,0,0 ; vbroadcastss 0x480e(%rip),%ymm8 # 4cc8 <_sk_callback_hsw+0x164>
+ DB 196,98,125,24,5,210,72,0,0 ; vbroadcastss 0x48d2(%rip),%ymm8 # 4d8c <_sk_callback_hsw+0x164>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -390,7 +390,7 @@ _sk_darken_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,150,71,0,0 ; vbroadcastss 0x4796(%rip),%ymm8 # 4ccc <_sk_callback_hsw+0x168>
+ DB 196,98,125,24,5,90,72,0,0 ; vbroadcastss 0x485a(%rip),%ymm8 # 4d90 <_sk_callback_hsw+0x168>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -413,7 +413,7 @@ _sk_lighten_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,69,71,0,0 ; vbroadcastss 0x4745(%rip),%ymm8 # 4cd0 <_sk_callback_hsw+0x16c>
+ DB 196,98,125,24,5,9,72,0,0 ; vbroadcastss 0x4809(%rip),%ymm8 # 4d94 <_sk_callback_hsw+0x16c>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -439,7 +439,7 @@ _sk_difference_hsw LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,232,70,0,0 ; vbroadcastss 0x46e8(%rip),%ymm8 # 4cd4 <_sk_callback_hsw+0x170>
+ DB 196,98,125,24,5,172,71,0,0 ; vbroadcastss 0x47ac(%rip),%ymm8 # 4d98 <_sk_callback_hsw+0x170>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -459,7 +459,7 @@ _sk_exclusion_hsw LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,166,70,0,0 ; vbroadcastss 0x46a6(%rip),%ymm8 # 4cd8 <_sk_callback_hsw+0x174>
+ DB 196,98,125,24,5,106,71,0,0 ; vbroadcastss 0x476a(%rip),%ymm8 # 4d9c <_sk_callback_hsw+0x174>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -467,7 +467,7 @@ _sk_exclusion_hsw LABEL PROC
PUBLIC _sk_colorburn_hsw
_sk_colorburn_hsw LABEL PROC
- DB 196,98,125,24,5,148,70,0,0 ; vbroadcastss 0x4694(%rip),%ymm8 # 4cdc <_sk_callback_hsw+0x178>
+ DB 196,98,125,24,5,88,71,0,0 ; vbroadcastss 0x4758(%rip),%ymm8 # 4da0 <_sk_callback_hsw+0x178>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -523,7 +523,7 @@ _sk_colorburn_hsw LABEL PROC
PUBLIC _sk_colordodge_hsw
_sk_colordodge_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,159,69,0,0 ; vbroadcastss 0x459f(%rip),%ymm9 # 4ce0 <_sk_callback_hsw+0x17c>
+ DB 196,98,125,24,13,99,70,0,0 ; vbroadcastss 0x4663(%rip),%ymm9 # 4da4 <_sk_callback_hsw+0x17c>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -574,7 +574,7 @@ _sk_colordodge_hsw LABEL PROC
PUBLIC _sk_hardlight_hsw
_sk_hardlight_hsw LABEL PROC
- DB 196,98,125,24,5,192,68,0,0 ; vbroadcastss 0x44c0(%rip),%ymm8 # 4ce4 <_sk_callback_hsw+0x180>
+ DB 196,98,125,24,5,132,69,0,0 ; vbroadcastss 0x4584(%rip),%ymm8 # 4da8 <_sk_callback_hsw+0x180>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -623,7 +623,7 @@ _sk_hardlight_hsw LABEL PROC
PUBLIC _sk_overlay_hsw
_sk_overlay_hsw LABEL PROC
- DB 196,98,125,24,5,248,67,0,0 ; vbroadcastss 0x43f8(%rip),%ymm8 # 4ce8 <_sk_callback_hsw+0x184>
+ DB 196,98,125,24,5,188,68,0,0 ; vbroadcastss 0x44bc(%rip),%ymm8 # 4dac <_sk_callback_hsw+0x184>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -683,10 +683,10 @@ _sk_softlight_hsw LABEL PROC
DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,29,255,66,0,0 ; vbroadcastss 0x42ff(%rip),%ymm11 # 4cf0 <_sk_callback_hsw+0x18c>
+ DB 196,98,125,24,29,195,67,0,0 ; vbroadcastss 0x43c3(%rip),%ymm11 # 4db4 <_sk_callback_hsw+0x18c>
DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12
DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8
- DB 196,98,125,24,37,240,66,0,0 ; vbroadcastss 0x42f0(%rip),%ymm12 # 4cf4 <_sk_callback_hsw+0x190>
+ DB 196,98,125,24,37,180,67,0,0 ; vbroadcastss 0x43b4(%rip),%ymm12 # 4db8 <_sk_callback_hsw+0x190>
DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8
DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14
DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14
@@ -696,7 +696,7 @@ _sk_softlight_hsw LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,179,66,0,0 ; vbroadcastss 0x42b3(%rip),%ymm8 # 4cec <_sk_callback_hsw+0x188>
+ DB 196,98,125,24,5,119,67,0,0 ; vbroadcastss 0x4377(%rip),%ymm8 # 4db0 <_sk_callback_hsw+0x188>
DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -809,11 +809,11 @@ _sk_hue_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,178,64,0,0 ; vbroadcastss 0x40b2(%rip),%ymm14 # 4cf8 <_sk_callback_hsw+0x194>
- DB 196,98,125,24,61,173,64,0,0 ; vbroadcastss 0x40ad(%rip),%ymm15 # 4cfc <_sk_callback_hsw+0x198>
+ DB 196,98,125,24,53,118,65,0,0 ; vbroadcastss 0x4176(%rip),%ymm14 # 4dbc <_sk_callback_hsw+0x194>
+ DB 196,98,125,24,61,113,65,0,0 ; vbroadcastss 0x4171(%rip),%ymm15 # 4dc0 <_sk_callback_hsw+0x198>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,158,64,0,0 ; vbroadcastss 0x409e(%rip),%ymm0 # 4d00 <_sk_callback_hsw+0x19c>
+ DB 196,226,125,24,5,98,65,0,0 ; vbroadcastss 0x4162(%rip),%ymm0 # 4dc4 <_sk_callback_hsw+0x19c>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -868,7 +868,7 @@ _sk_hue_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,139,63,0,0 ; vbroadcastss 0x3f8b(%rip),%ymm1 # 4d04 <_sk_callback_hsw+0x1a0>
+ DB 196,226,125,24,13,79,64,0,0 ; vbroadcastss 0x404f(%rip),%ymm1 # 4dc8 <_sk_callback_hsw+0x1a0>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -922,11 +922,11 @@ _sk_saturation_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,156,62,0,0 ; vbroadcastss 0x3e9c(%rip),%ymm14 # 4d08 <_sk_callback_hsw+0x1a4>
- DB 196,98,125,24,61,151,62,0,0 ; vbroadcastss 0x3e97(%rip),%ymm15 # 4d0c <_sk_callback_hsw+0x1a8>
+ DB 196,98,125,24,53,96,63,0,0 ; vbroadcastss 0x3f60(%rip),%ymm14 # 4dcc <_sk_callback_hsw+0x1a4>
+ DB 196,98,125,24,61,91,63,0,0 ; vbroadcastss 0x3f5b(%rip),%ymm15 # 4dd0 <_sk_callback_hsw+0x1a8>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,136,62,0,0 ; vbroadcastss 0x3e88(%rip),%ymm0 # 4d10 <_sk_callback_hsw+0x1ac>
+ DB 196,226,125,24,5,76,63,0,0 ; vbroadcastss 0x3f4c(%rip),%ymm0 # 4dd4 <_sk_callback_hsw+0x1ac>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -981,7 +981,7 @@ _sk_saturation_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,117,61,0,0 ; vbroadcastss 0x3d75(%rip),%ymm1 # 4d14 <_sk_callback_hsw+0x1b0>
+ DB 196,226,125,24,13,57,62,0,0 ; vbroadcastss 0x3e39(%rip),%ymm1 # 4dd8 <_sk_callback_hsw+0x1b0>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -1009,11 +1009,11 @@ _sk_color_hsw LABEL PROC
DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8
DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10
DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11
- DB 196,98,125,24,45,8,61,0,0 ; vbroadcastss 0x3d08(%rip),%ymm13 # 4d18 <_sk_callback_hsw+0x1b4>
- DB 196,98,125,24,53,3,61,0,0 ; vbroadcastss 0x3d03(%rip),%ymm14 # 4d1c <_sk_callback_hsw+0x1b8>
+ DB 196,98,125,24,45,204,61,0,0 ; vbroadcastss 0x3dcc(%rip),%ymm13 # 4ddc <_sk_callback_hsw+0x1b4>
+ DB 196,98,125,24,53,199,61,0,0 ; vbroadcastss 0x3dc7(%rip),%ymm14 # 4de0 <_sk_callback_hsw+0x1b8>
DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12
DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12
- DB 196,98,125,24,61,244,60,0,0 ; vbroadcastss 0x3cf4(%rip),%ymm15 # 4d20 <_sk_callback_hsw+0x1bc>
+ DB 196,98,125,24,61,184,61,0,0 ; vbroadcastss 0x3db8(%rip),%ymm15 # 4de4 <_sk_callback_hsw+0x1bc>
DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1069,7 +1069,7 @@ _sk_color_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,214,59,0,0 ; vbroadcastss 0x3bd6(%rip),%ymm0 # 4d24 <_sk_callback_hsw+0x1c0>
+ DB 196,226,125,24,5,154,60,0,0 ; vbroadcastss 0x3c9a(%rip),%ymm0 # 4de8 <_sk_callback_hsw+0x1c0>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1097,11 +1097,11 @@ _sk_luminosity_hsw LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
- DB 196,98,125,24,45,105,59,0,0 ; vbroadcastss 0x3b69(%rip),%ymm13 # 4d28 <_sk_callback_hsw+0x1c4>
- DB 196,98,125,24,53,100,59,0,0 ; vbroadcastss 0x3b64(%rip),%ymm14 # 4d2c <_sk_callback_hsw+0x1c8>
+ DB 196,98,125,24,45,45,60,0,0 ; vbroadcastss 0x3c2d(%rip),%ymm13 # 4dec <_sk_callback_hsw+0x1c4>
+ DB 196,98,125,24,53,40,60,0,0 ; vbroadcastss 0x3c28(%rip),%ymm14 # 4df0 <_sk_callback_hsw+0x1c8>
DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12
DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12
- DB 196,98,125,24,61,85,59,0,0 ; vbroadcastss 0x3b55(%rip),%ymm15 # 4d30 <_sk_callback_hsw+0x1cc>
+ DB 196,98,125,24,61,25,60,0,0 ; vbroadcastss 0x3c19(%rip),%ymm15 # 4df4 <_sk_callback_hsw+0x1cc>
DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1157,7 +1157,7 @@ _sk_luminosity_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,55,58,0,0 ; vbroadcastss 0x3a37(%rip),%ymm0 # 4d34 <_sk_callback_hsw+0x1d0>
+ DB 196,226,125,24,5,251,58,0,0 ; vbroadcastss 0x3afb(%rip),%ymm0 # 4df8 <_sk_callback_hsw+0x1d0>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1184,17 +1184,17 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,180,0,0,0 ; jne 140f <_sk_srcover_rgba_8888_hsw+0xcd>
DB 196,193,124,16,58 ; vmovups (%r10),%ymm7
- DB 197,196,84,37,56,61,0,0 ; vandps 0x3d38(%rip),%ymm7,%ymm4 # 50a0 <_sk_callback_hsw+0x53c>
+ DB 197,196,84,37,24,62,0,0 ; vandps 0x3e18(%rip),%ymm7,%ymm4 # 5180 <_sk_callback_hsw+0x558>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,69,0,45,75,61,0,0 ; vpshufb 0x3d4b(%rip),%ymm7,%ymm5 # 50c0 <_sk_callback_hsw+0x55c>
+ DB 196,226,69,0,45,43,62,0,0 ; vpshufb 0x3e2b(%rip),%ymm7,%ymm5 # 51a0 <_sk_callback_hsw+0x578>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,69,0,53,94,61,0,0 ; vpshufb 0x3d5e(%rip),%ymm7,%ymm6 # 50e0 <_sk_callback_hsw+0x57c>
+ DB 196,226,69,0,53,62,62,0,0 ; vpshufb 0x3e3e(%rip),%ymm7,%ymm6 # 51c0 <_sk_callback_hsw+0x598>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,160,57,0,0 ; vbroadcastss 0x39a0(%rip),%ymm8 # 4d38 <_sk_callback_hsw+0x1d4>
+ DB 196,98,125,24,5,100,58,0,0 ; vbroadcastss 0x3a64(%rip),%ymm8 # 4dfc <_sk_callback_hsw+0x1d4>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,151,57,0,0 ; vbroadcastss 0x3997(%rip),%ymm9 # 4d3c <_sk_callback_hsw+0x1d8>
+ DB 196,98,125,24,13,91,58,0,0 ; vbroadcastss 0x3a5b(%rip),%ymm9 # 4e00 <_sk_callback_hsw+0x1d8>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -1250,7 +1250,7 @@ _sk_clamp_0_hsw LABEL PROC
PUBLIC _sk_clamp_1_hsw
_sk_clamp_1_hsw LABEL PROC
- DB 196,98,125,24,5,188,56,0,0 ; vbroadcastss 0x38bc(%rip),%ymm8 # 4d40 <_sk_callback_hsw+0x1dc>
+ DB 196,98,125,24,5,128,57,0,0 ; vbroadcastss 0x3980(%rip),%ymm8 # 4e04 <_sk_callback_hsw+0x1dc>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -1260,7 +1260,7 @@ _sk_clamp_1_hsw LABEL PROC
PUBLIC _sk_clamp_a_hsw
_sk_clamp_a_hsw LABEL PROC
- DB 196,98,125,24,5,159,56,0,0 ; vbroadcastss 0x389f(%rip),%ymm8 # 4d44 <_sk_callback_hsw+0x1e0>
+ DB 196,98,125,24,5,99,57,0,0 ; vbroadcastss 0x3963(%rip),%ymm8 # 4e08 <_sk_callback_hsw+0x1e0>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -1332,7 +1332,7 @@ PUBLIC _sk_unpremul_hsw
_sk_unpremul_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,231,55,0,0 ; vbroadcastss 0x37e7(%rip),%ymm10 # 4d48 <_sk_callback_hsw+0x1e4>
+ DB 196,98,125,24,21,171,56,0,0 ; vbroadcastss 0x38ab(%rip),%ymm10 # 4e0c <_sk_callback_hsw+0x1e4>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -1343,16 +1343,16 @@ _sk_unpremul_hsw LABEL PROC
PUBLIC _sk_from_srgb_hsw
_sk_from_srgb_hsw LABEL PROC
- DB 196,98,125,24,5,200,55,0,0 ; vbroadcastss 0x37c8(%rip),%ymm8 # 4d4c <_sk_callback_hsw+0x1e8>
+ DB 196,98,125,24,5,140,56,0,0 ; vbroadcastss 0x388c(%rip),%ymm8 # 4e10 <_sk_callback_hsw+0x1e8>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,186,55,0,0 ; vbroadcastss 0x37ba(%rip),%ymm11 # 4d50 <_sk_callback_hsw+0x1ec>
- DB 196,98,125,24,37,181,55,0,0 ; vbroadcastss 0x37b5(%rip),%ymm12 # 4d54 <_sk_callback_hsw+0x1f0>
+ DB 196,98,125,24,29,126,56,0,0 ; vbroadcastss 0x387e(%rip),%ymm11 # 4e14 <_sk_callback_hsw+0x1ec>
+ DB 196,98,125,24,37,121,56,0,0 ; vbroadcastss 0x3879(%rip),%ymm12 # 4e18 <_sk_callback_hsw+0x1f0>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13
- DB 196,98,125,24,53,166,55,0,0 ; vbroadcastss 0x37a6(%rip),%ymm14 # 4d58 <_sk_callback_hsw+0x1f4>
+ DB 196,98,125,24,53,106,56,0,0 ; vbroadcastss 0x386a(%rip),%ymm14 # 4e1c <_sk_callback_hsw+0x1f4>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,156,55,0,0 ; vbroadcastss 0x379c(%rip),%ymm10 # 4d5c <_sk_callback_hsw+0x1f8>
+ DB 196,98,125,24,21,96,56,0,0 ; vbroadcastss 0x3860(%rip),%ymm10 # 4e20 <_sk_callback_hsw+0x1f8>
DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0
DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -1374,19 +1374,19 @@ _sk_from_srgb_hsw LABEL PROC
PUBLIC _sk_to_srgb_hsw
_sk_to_srgb_hsw LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,64,55,0,0 ; vbroadcastss 0x3740(%rip),%ymm8 # 4d60 <_sk_callback_hsw+0x1fc>
+ DB 196,98,125,24,5,4,56,0,0 ; vbroadcastss 0x3804(%rip),%ymm8 # 4e24 <_sk_callback_hsw+0x1fc>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,54,55,0,0 ; vbroadcastss 0x3736(%rip),%ymm11 # 4d64 <_sk_callback_hsw+0x200>
- DB 196,98,125,24,37,49,55,0,0 ; vbroadcastss 0x3731(%rip),%ymm12 # 4d68 <_sk_callback_hsw+0x204>
+ DB 196,98,125,24,29,250,55,0,0 ; vbroadcastss 0x37fa(%rip),%ymm11 # 4e28 <_sk_callback_hsw+0x200>
+ DB 196,98,125,24,37,245,55,0,0 ; vbroadcastss 0x37f5(%rip),%ymm12 # 4e2c <_sk_callback_hsw+0x204>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13
- DB 196,98,125,24,53,34,55,0,0 ; vbroadcastss 0x3722(%rip),%ymm14 # 4d6c <_sk_callback_hsw+0x208>
+ DB 196,98,125,24,53,230,55,0,0 ; vbroadcastss 0x37e6(%rip),%ymm14 # 4e30 <_sk_callback_hsw+0x208>
DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13
- DB 196,98,125,24,61,24,55,0,0 ; vbroadcastss 0x3718(%rip),%ymm15 # 4d70 <_sk_callback_hsw+0x20c>
+ DB 196,98,125,24,61,220,55,0,0 ; vbroadcastss 0x37dc(%rip),%ymm15 # 4e34 <_sk_callback_hsw+0x20c>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9
- DB 196,98,125,24,45,4,55,0,0 ; vbroadcastss 0x3704(%rip),%ymm13 # 4d74 <_sk_callback_hsw+0x210>
+ DB 196,98,125,24,45,200,55,0,0 ; vbroadcastss 0x37c8(%rip),%ymm13 # 4e38 <_sk_callback_hsw+0x210>
DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -1418,26 +1418,26 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,121,54,0,0 ; vbroadcastss 0x3679(%rip),%ymm11 # 4d78 <_sk_callback_hsw+0x214>
+ DB 196,98,125,24,29,61,55,0,0 ; vbroadcastss 0x373d(%rip),%ymm11 # 4e3c <_sk_callback_hsw+0x214>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13
- DB 196,98,125,24,53,102,54,0,0 ; vbroadcastss 0x3666(%rip),%ymm14 # 4d7c <_sk_callback_hsw+0x218>
+ DB 196,98,125,24,53,42,55,0,0 ; vbroadcastss 0x372a(%rip),%ymm14 # 4e40 <_sk_callback_hsw+0x218>
DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13
DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12
DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13
- DB 196,98,125,24,53,77,54,0,0 ; vbroadcastss 0x364d(%rip),%ymm14 # 4d84 <_sk_callback_hsw+0x220>
+ DB 196,98,125,24,53,17,55,0,0 ; vbroadcastss 0x3711(%rip),%ymm14 # 4e48 <_sk_callback_hsw+0x220>
DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13
- DB 196,98,125,24,53,59,54,0,0 ; vbroadcastss 0x363b(%rip),%ymm14 # 4d80 <_sk_callback_hsw+0x21c>
+ DB 196,98,125,24,53,255,54,0,0 ; vbroadcastss 0x36ff(%rip),%ymm14 # 4e44 <_sk_callback_hsw+0x21c>
DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2
DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1
DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,29,30,54,0,0 ; vbroadcastss 0x361e(%rip),%ymm11 # 4d8c <_sk_callback_hsw+0x228>
+ DB 196,98,125,24,29,226,54,0,0 ; vbroadcastss 0x36e2(%rip),%ymm11 # 4e50 <_sk_callback_hsw+0x228>
DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2
DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11
DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12
@@ -1447,7 +1447,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0
DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- DB 196,98,125,24,5,225,53,0,0 ; vbroadcastss 0x35e1(%rip),%ymm8 # 4d88 <_sk_callback_hsw+0x224>
+ DB 196,98,125,24,5,165,54,0,0 ; vbroadcastss 0x36a5(%rip),%ymm8 # 4e4c <_sk_callback_hsw+0x224>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1462,30 +1462,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 197,252,40,224 ; vmovaps %ymm0,%ymm4
- DB 196,98,125,24,5,168,53,0,0 ; vbroadcastss 0x35a8(%rip),%ymm8 # 4d90 <_sk_callback_hsw+0x22c>
+ DB 196,98,125,24,5,108,54,0,0 ; vbroadcastss 0x366c(%rip),%ymm8 # 4e54 <_sk_callback_hsw+0x22c>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10
DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11
DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
- DB 196,98,125,24,13,139,53,0,0 ; vbroadcastss 0x358b(%rip),%ymm9 # 4d94 <_sk_callback_hsw+0x230>
+ DB 196,98,125,24,13,79,54,0,0 ; vbroadcastss 0x364f(%rip),%ymm9 # 4e58 <_sk_callback_hsw+0x230>
DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9
- DB 196,98,125,24,29,129,53,0,0 ; vbroadcastss 0x3581(%rip),%ymm11 # 4d98 <_sk_callback_hsw+0x234>
+ DB 196,98,125,24,29,69,54,0,0 ; vbroadcastss 0x3645(%rip),%ymm11 # 4e5c <_sk_callback_hsw+0x234>
DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,45,107,53,0,0 ; vbroadcastss 0x356b(%rip),%ymm13 # 4da0 <_sk_callback_hsw+0x23c>
+ DB 196,98,125,24,45,47,54,0,0 ; vbroadcastss 0x362f(%rip),%ymm13 # 4e64 <_sk_callback_hsw+0x23c>
DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0
- DB 196,98,125,24,53,97,53,0,0 ; vbroadcastss 0x3561(%rip),%ymm14 # 4da4 <_sk_callback_hsw+0x240>
+ DB 196,98,125,24,53,37,54,0,0 ; vbroadcastss 0x3625(%rip),%ymm14 # 4e68 <_sk_callback_hsw+0x240>
DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12
DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12
- DB 196,226,125,24,29,71,53,0,0 ; vbroadcastss 0x3547(%rip),%ymm3 # 4d9c <_sk_callback_hsw+0x238>
+ DB 196,226,125,24,29,11,54,0,0 ; vbroadcastss 0x360b(%rip),%ymm3 # 4e60 <_sk_callback_hsw+0x238>
DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7
DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7
DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12
DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,37,50,53,0,0 ; vbroadcastss 0x3532(%rip),%ymm12 # 4da8 <_sk_callback_hsw+0x244>
+ DB 196,98,125,24,37,246,53,0,0 ; vbroadcastss 0x35f6(%rip),%ymm12 # 4e6c <_sk_callback_hsw+0x244>
DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15
DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0
DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -1501,7 +1501,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0
DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7
DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- DB 196,226,125,24,5,222,52,0,0 ; vbroadcastss 0x34de(%rip),%ymm0 # 4dac <_sk_callback_hsw+0x248>
+ DB 196,226,125,24,5,162,53,0,0 ; vbroadcastss 0x35a2(%rip),%ymm0 # 4e70 <_sk_callback_hsw+0x248>
DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
@@ -1547,10 +1547,10 @@ _sk_scale_u8_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,58 ; jne 19b5 <_sk_scale_u8_hsw+0x44>
DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8
- DB 197,57,219,5,247,56,0,0 ; vpand 0x38f7(%rip),%xmm8,%xmm8 # 5280 <_sk_callback_hsw+0x71c>
+ DB 197,57,219,5,215,57,0,0 ; vpand 0x39d7(%rip),%xmm8,%xmm8 # 5360 <_sk_callback_hsw+0x738>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,20,52,0,0 ; vbroadcastss 0x3414(%rip),%ymm9 # 4db0 <_sk_callback_hsw+0x24c>
+ DB 196,98,125,24,13,216,52,0,0 ; vbroadcastss 0x34d8(%rip),%ymm9 # 4e74 <_sk_callback_hsw+0x24c>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -1565,10 +1565,21 @@ _sk_scale_u8_hsw LABEL PROC
DB 65,128,249,6 ; cmp $0x6,%r9b
DB 119,183 ; ja 1981 <_sk_scale_u8_hsw+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,95,0,0,0 ; lea 0x5f(%rip),%r10 # 1a34 <_sk_scale_u8_hsw+0xc3>
+ DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 1a50 <_sk_scale_u8_hsw+0xdf>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 235,152 ; jmp 1981 <_sk_scale_u8_hsw+0x10>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 197,121,110,200 ; vmovd %eax,%xmm9
+ DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
+ DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ DB 233,111,255,255,255 ; jmpq 1981 <_sk_scale_u8_hsw+0x10>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -1576,32 +1587,24 @@ _sk_scale_u8_hsw LABEL PROC
DB 197,57,196,192,5 ; vpinsrw $0x5,%eax,%xmm8,%xmm8
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 197,57,196,192,4 ; vpinsrw $0x4,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 197,57,196,192,3 ; vpinsrw $0x3,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 197,57,196,192,1 ; vpinsrw $0x1,%eax,%xmm8,%xmm8
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 197,57,196,192,0 ; vpinsrw $0x0,%eax,%xmm8,%xmm8
- DB 233,77,255,255,255 ; jmpq 1981 <_sk_scale_u8_hsw+0x10>
- DB 241 ; icebp
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255,230 ; jmpq *%rsi
- DB 255 ; (bad)
+ DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9
+ DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
+ DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ DB 233,51,255,255,255 ; jmpq 1981 <_sk_scale_u8_hsw+0x10>
+ DB 102,144 ; xchg %ax,%ax
+ DB 142,255 ; mov %edi,%?
DB 255 ; (bad)
+ DB 255,169,255,255,255,153 ; ljmp *-0x66000001(%rcx)
DB 255 ; (bad)
- DB 219,255 ; (bad)
DB 255 ; (bad)
- DB 255,208 ; callq *%rax
DB 255 ; (bad)
+ DB 232,255,255,255,221 ; callq ffffffffde001a60 <_sk_callback_hsw+0xffffffffddffce38>
DB 255 ; (bad)
- DB 255,197 ; inc %ebp
DB 255 ; (bad)
+ DB 255,210 ; callq *%rdx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 186,255,255,255,170 ; mov $0xaaffffff,%edx
+ DB 255,194 ; inc %edx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -1626,12 +1629,12 @@ _sk_lerp_u8_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,78 ; jne 1ad7 <_sk_lerp_u8_hsw+0x58>
+ DB 117,78 ; jne 1af3 <_sk_lerp_u8_hsw+0x58>
DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8
- DB 197,57,219,5,249,55,0,0 ; vpand 0x37f9(%rip),%xmm8,%xmm8 # 5290 <_sk_callback_hsw+0x72c>
+ DB 197,57,219,5,189,56,0,0 ; vpand 0x38bd(%rip),%xmm8,%xmm8 # 5370 <_sk_callback_hsw+0x748>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,10,51,0,0 ; vbroadcastss 0x330a(%rip),%ymm9 # 4db4 <_sk_callback_hsw+0x250>
+ DB 196,98,125,24,13,178,51,0,0 ; vbroadcastss 0x33b2(%rip),%ymm9 # 4e78 <_sk_callback_hsw+0x250>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -1648,12 +1651,23 @@ _sk_lerp_u8_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,163 ; ja 1a8f <_sk_lerp_u8_hsw+0x10>
+ DB 119,163 ; ja 1aab <_sk_lerp_u8_hsw+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,97,0,0,0 ; lea 0x61(%rip),%r10 # 1b58 <_sk_lerp_u8_hsw+0xd9>
+ DB 76,141,21,121,0,0,0 ; lea 0x79(%rip),%r10 # 1b8c <_sk_lerp_u8_hsw+0xf1>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 235,132 ; jmp 1aab <_sk_lerp_u8_hsw+0x10>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 197,121,110,200 ; vmovd %eax,%xmm9
+ DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
+ DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ DB 233,91,255,255,255 ; jmpq 1aab <_sk_lerp_u8_hsw+0x10>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -1661,33 +1675,27 @@ _sk_lerp_u8_hsw LABEL PROC
DB 197,57,196,192,5 ; vpinsrw $0x5,%eax,%xmm8,%xmm8
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 197,57,196,192,4 ; vpinsrw $0x4,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 197,57,196,192,3 ; vpinsrw $0x3,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 197,57,196,192,1 ; vpinsrw $0x1,%eax,%xmm8,%xmm8
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 197,57,196,192,0 ; vpinsrw $0x0,%eax,%xmm8,%xmm8
- DB 233,57,255,255,255 ; jmpq 1a8f <_sk_lerp_u8_hsw+0x10>
- DB 102,144 ; xchg %ax,%ax
- DB 239 ; out %eax,(%dx)
+ DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9
+ DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
+ DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ DB 233,31,255,255,255 ; jmpq 1aab <_sk_lerp_u8_hsw+0x10>
+ DB 144 ; nop
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,228 ; jmpq *%rsp
+ DB 255,171,255,255,255,155 ; ljmp *-0x64000001(%rbx)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 217,255 ; fcos
+ DB 234 ; (bad)
DB 255 ; (bad)
- DB 255,206 ; dec %esi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,195 ; inc %ebx
+ DB 223,255 ; (bad)
DB 255 ; (bad)
+ DB 255,212 ; callq *%rsp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 184,255,255,255,168 ; mov $0xa8ffffff,%eax
+ DB 255,196 ; inc %esp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -1697,23 +1705,23 @@ _sk_lerp_565_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,169,0,0,0 ; jne 1c2b <_sk_lerp_565_hsw+0xb7>
+ DB 15,133,169,0,0,0 ; jne 1c5f <_sk_lerp_565_hsw+0xb7>
DB 196,65,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,34,50,0,0 ; vpbroadcastd 0x3222(%rip),%ymm9 # 4db8 <_sk_callback_hsw+0x254>
+ DB 196,98,125,88,13,178,50,0,0 ; vpbroadcastd 0x32b2(%rip),%ymm9 # 4e7c <_sk_callback_hsw+0x254>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,19,50,0,0 ; vbroadcastss 0x3213(%rip),%ymm10 # 4dbc <_sk_callback_hsw+0x258>
+ DB 196,98,125,24,21,163,50,0,0 ; vbroadcastss 0x32a3(%rip),%ymm10 # 4e80 <_sk_callback_hsw+0x258>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,9,50,0,0 ; vpbroadcastd 0x3209(%rip),%ymm10 # 4dc0 <_sk_callback_hsw+0x25c>
+ DB 196,98,125,88,21,153,50,0,0 ; vpbroadcastd 0x3299(%rip),%ymm10 # 4e84 <_sk_callback_hsw+0x25c>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,250,49,0,0 ; vbroadcastss 0x31fa(%rip),%ymm11 # 4dc4 <_sk_callback_hsw+0x260>
+ DB 196,98,125,24,29,138,50,0,0 ; vbroadcastss 0x328a(%rip),%ymm11 # 4e88 <_sk_callback_hsw+0x260>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,240,49,0,0 ; vpbroadcastd 0x31f0(%rip),%ymm11 # 4dc8 <_sk_callback_hsw+0x264>
+ DB 196,98,125,88,29,128,50,0,0 ; vpbroadcastd 0x3280(%rip),%ymm11 # 4e8c <_sk_callback_hsw+0x264>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,225,49,0,0 ; vbroadcastss 0x31e1(%rip),%ymm11 # 4dcc <_sk_callback_hsw+0x268>
+ DB 196,98,125,24,29,113,50,0,0 ; vbroadcastss 0x3271(%rip),%ymm11 # 4e90 <_sk_callback_hsw+0x268>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,53,168,196 ; vfmadd213ps %ymm4,%ymm9,%ymm0
@@ -1734,40 +1742,46 @@ _sk_lerp_565_hsw LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,68,255,255,255 ; ja 1b88 <_sk_lerp_565_hsw+0x14>
+ DB 15,135,68,255,255,255 ; ja 1bbc <_sk_lerp_565_hsw+0x14>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,77,0,0,0 ; lea 0x4d(%rip),%r10 # 1c9c <_sk_lerp_565_hsw+0x128>
+ DB 76,141,21,101,0,0,0 ; lea 0x65(%rip),%r10 # 1ce8 <_sk_lerp_565_hsw+0x140>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 233,34,255,255,255 ; jmpq 1bbc <_sk_lerp_565_hsw+0x14>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8
+ DB 196,65,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm9
+ DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8
+ DB 233,4,255,255,255 ; jmpq 1bbc <_sk_lerp_565_hsw+0x14>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm8,%xmm8
DB 196,65,57,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm8,%xmm8
DB 196,65,57,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm8,%xmm8
- DB 196,65,57,196,68,83,6,3 ; vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm8,%xmm8
- DB 196,65,57,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8
- DB 196,65,57,196,68,83,2,1 ; vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm8,%xmm8
- DB 196,65,57,196,4,83,0 ; vpinsrw $0x0,(%r11,%rdx,2),%xmm8,%xmm8
- DB 233,239,254,255,255 ; jmpq 1b88 <_sk_lerp_565_hsw+0x14>
- DB 15,31,0 ; nopl (%rax)
- DB 241 ; icebp
+ DB 196,65,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm9
+ DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8
+ DB 233,214,254,255,255 ; jmpq 1bbc <_sk_lerp_565_hsw+0x14>
+ DB 102,144 ; xchg %ax,%ax
+ DB 164 ; movsb %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,225 ; jmpq ffffffffe2001ca4 <_sk_callback_hsw+0xffffffffe1ffd140>
+ DB 191,255,255,255,178 ; mov $0xb2ffffff,%edi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 217,255 ; fcos
+ DB 237 ; in (%dx),%eax
DB 255 ; (bad)
- DB 255,209 ; callq *%rcx
DB 255 ; (bad)
+ DB 255,229 ; jmpq *%rbp
DB 255 ; (bad)
- DB 255,201 ; dec %ecx
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 221,255 ; (bad)
DB 255 ; (bad)
- DB 188 ; .byte 0xbc
+ DB 255,208 ; callq *%rax
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -1779,23 +1793,23 @@ _sk_load_tables_hsw LABEL PROC
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 76,3,16 ; add (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,105 ; jne 1d36 <_sk_load_tables_hsw+0x7e>
+ DB 117,105 ; jne 1d82 <_sk_load_tables_hsw+0x7e>
DB 196,193,124,16,26 ; vmovups (%r10),%ymm3
- DB 197,228,84,13,38,52,0,0 ; vandps 0x3426(%rip),%ymm3,%ymm1 # 5100 <_sk_callback_hsw+0x59c>
+ DB 197,228,84,13,186,52,0,0 ; vandps 0x34ba(%rip),%ymm3,%ymm1 # 51e0 <_sk_callback_hsw+0x5b8>
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 72,139,72,8 ; mov 0x8(%rax),%rcx
DB 76,139,80,16 ; mov 0x10(%rax),%r10
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 196,226,109,146,4,137 ; vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0
- DB 196,226,101,0,21,38,52,0,0 ; vpshufb 0x3426(%rip),%ymm3,%ymm2 # 5120 <_sk_callback_hsw+0x5bc>
+ DB 196,226,101,0,21,186,52,0,0 ; vpshufb 0x34ba(%rip),%ymm3,%ymm2 # 5200 <_sk_callback_hsw+0x5d8>
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,194,53,146,12,146 ; vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
- DB 196,98,101,0,13,46,52,0,0 ; vpshufb 0x342e(%rip),%ymm3,%ymm9 # 5140 <_sk_callback_hsw+0x5dc>
+ DB 196,98,101,0,13,194,52,0,0 ; vpshufb 0x34c2(%rip),%ymm3,%ymm9 # 5220 <_sk_callback_hsw+0x5f8>
DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,166,48,0,0 ; vbroadcastss 0x30a6(%rip),%ymm8 # 4dd0 <_sk_callback_hsw+0x26c>
+ DB 196,98,125,24,5,30,49,0,0 ; vbroadcastss 0x311e(%rip),%ymm8 # 4e94 <_sk_callback_hsw+0x26c>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -1808,7 +1822,7 @@ _sk_load_tables_hsw LABEL PROC
DB 196,193,249,110,195 ; vmovq %r11,%xmm0
DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0
DB 196,194,125,44,26 ; vmaskmovps (%r10),%ymm0,%ymm3
- DB 233,115,255,255,255 ; jmpq 1cd2 <_sk_load_tables_hsw+0x1a>
+ DB 233,115,255,255,255 ; jmpq 1d1e <_sk_load_tables_hsw+0x1a>
PUBLIC _sk_load_tables_u16_be_hsw
_sk_load_tables_u16_be_hsw LABEL PROC
@@ -1816,7 +1830,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,201,0,0,0 ; jne 1e3e <_sk_load_tables_u16_be_hsw+0xdf>
+ DB 15,133,201,0,0,0 ; jne 1e8a <_sk_load_tables_u16_be_hsw+0xdf>
DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8
DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2
DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -1832,7 +1846,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1
DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2
DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8
- DB 197,121,111,21,218,52,0,0 ; vmovdqa 0x34da(%rip),%xmm10 # 52a0 <_sk_callback_hsw+0x73c>
+ DB 197,121,111,21,110,53,0,0 ; vmovdqa 0x356e(%rip),%xmm10 # 5380 <_sk_callback_hsw+0x758>
DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -1854,36 +1868,36 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,159,47,0,0 ; vbroadcastss 0x2f9f(%rip),%ymm8 # 4dd4 <_sk_callback_hsw+0x270>
+ DB 196,98,125,24,5,23,48,0,0 ; vbroadcastss 0x3017(%rip),%ymm8 # 4e98 <_sk_callback_hsw+0x270>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 1ea4 <_sk_load_tables_u16_be_hsw+0x145>
+ DB 116,85 ; je 1ef0 <_sk_load_tables_u16_be_hsw+0x145>
DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 1ea4 <_sk_load_tables_u16_be_hsw+0x145>
+ DB 114,72 ; jb 1ef0 <_sk_load_tables_u16_be_hsw+0x145>
DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 1eb1 <_sk_load_tables_u16_be_hsw+0x152>
+ DB 116,72 ; je 1efd <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 1eb1 <_sk_load_tables_u16_be_hsw+0x152>
+ DB 114,59 ; jb 1efd <_sk_load_tables_u16_be_hsw+0x152>
DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,9,255,255,255 ; je 1d90 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,132,9,255,255,255 ; je 1ddc <_sk_load_tables_u16_be_hsw+0x31>
DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,248,254,255,255 ; jb 1d90 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 15,130,248,254,255,255 ; jb 1ddc <_sk_load_tables_u16_be_hsw+0x31>
DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9
- DB 233,236,254,255,255 ; jmpq 1d90 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,236,254,255,255 ; jmpq 1ddc <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,223,254,255,255 ; jmpq 1d90 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,223,254,255,255 ; jmpq 1ddc <_sk_load_tables_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,214,254,255,255 ; jmpq 1d90 <_sk_load_tables_u16_be_hsw+0x31>
+ DB 233,214,254,255,255 ; jmpq 1ddc <_sk_load_tables_u16_be_hsw+0x31>
PUBLIC _sk_load_tables_rgb_u16_be_hsw
_sk_load_tables_rgb_u16_be_hsw LABEL PROC
@@ -1891,7 +1905,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,193,0,0,0 ; jne 1f8d <_sk_load_tables_rgb_u16_be_hsw+0xd3>
+ DB 15,133,193,0,0,0 ; jne 1fd9 <_sk_load_tables_rgb_u16_be_hsw+0xd3>
DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0
DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2
DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -1912,7 +1926,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,122,51,0,0 ; vmovdqa 0x337a(%rip),%xmm9 # 52b0 <_sk_callback_hsw+0x74c>
+ DB 197,121,111,13,14,52,0,0 ; vmovdqa 0x340e(%rip),%xmm9 # 5390 <_sk_callback_hsw+0x768>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
@@ -1929,46 +1943,46 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8
DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,77,46,0,0 ; vbroadcastss 0x2e4d(%rip),%ymm3 # 4dd8 <_sk_callback_hsw+0x274>
+ DB 196,226,125,24,29,197,46,0,0 ; vbroadcastss 0x2ec5(%rip),%ymm3 # 4e9c <_sk_callback_hsw+0x274>
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 1fa6 <_sk_load_tables_rgb_u16_be_hsw+0xec>
- DB 233,90,255,255,255 ; jmpq 1f00 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,5 ; jne 1ff2 <_sk_load_tables_rgb_u16_be_hsw+0xec>
+ DB 233,90,255,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1
DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 1fd5 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
+ DB 114,26 ; jb 2021 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1
DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 1fda <_sk_load_tables_rgb_u16_be_hsw+0x120>
- DB 233,43,255,255,255 ; jmpq 1f00 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,38,255,255,255 ; jmpq 1f00 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 2026 <_sk_load_tables_rgb_u16_be_hsw+0x120>
+ DB 233,43,255,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,38,255,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1
DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 2009 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
+ DB 114,26 ; jb 2055 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1
DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 200e <_sk_load_tables_rgb_u16_be_hsw+0x154>
- DB 233,247,254,255,255 ; jmpq 1f00 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,242,254,255,255 ; jmpq 1f00 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 205a <_sk_load_tables_rgb_u16_be_hsw+0x154>
+ DB 233,247,254,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,242,254,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46>
DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3
DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 2037 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
+ DB 114,20 ; jb 2083 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3
DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- DB 233,201,254,255,255 ; jmpq 1f00 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,196,254,255,255 ; jmpq 1f00 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,201,254,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 233,196,254,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46>
PUBLIC _sk_byte_tables_hsw
_sk_byte_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,149,45,0,0 ; vbroadcastss 0x2d95(%rip),%ymm8 # 4ddc <_sk_callback_hsw+0x278>
+ DB 196,98,125,24,5,13,46,0,0 ; vbroadcastss 0x2e0d(%rip),%ymm8 # 4ea0 <_sk_callback_hsw+0x278>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -2090,7 +2104,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,58,43,0,0 ; vbroadcastss 0x2b3a(%rip),%ymm8 # 4de0 <_sk_callback_hsw+0x27c>
+ DB 196,98,125,24,5,178,43,0,0 ; vbroadcastss 0x2bb2(%rip),%ymm8 # 4ea4 <_sk_callback_hsw+0x27c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2204,7 +2218,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,38,41,0,0 ; vbroadcastss 0x2926(%rip),%ymm8 # 4de4 <_sk_callback_hsw+0x280>
+ DB 196,98,125,24,5,158,41,0,0 ; vbroadcastss 0x299e(%rip),%ymm8 # 4ea8 <_sk_callback_hsw+0x280>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2293,33 +2307,33 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10
DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,0,40,0,0 ; vbroadcastss 0x2800(%rip),%ymm12 # 4de8 <_sk_callback_hsw+0x284>
- DB 196,98,125,24,45,251,39,0,0 ; vbroadcastss 0x27fb(%rip),%ymm13 # 4dec <_sk_callback_hsw+0x288>
+ DB 196,98,125,24,37,120,40,0,0 ; vbroadcastss 0x2878(%rip),%ymm12 # 4eac <_sk_callback_hsw+0x284>
+ DB 196,98,125,24,45,115,40,0,0 ; vbroadcastss 0x2873(%rip),%ymm13 # 4eb0 <_sk_callback_hsw+0x288>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,241,39,0,0 ; vbroadcastss 0x27f1(%rip),%ymm13 # 4df0 <_sk_callback_hsw+0x28c>
+ DB 196,98,125,24,45,105,40,0,0 ; vbroadcastss 0x2869(%rip),%ymm13 # 4eb4 <_sk_callback_hsw+0x28c>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,231,39,0,0 ; vbroadcastss 0x27e7(%rip),%ymm13 # 4df4 <_sk_callback_hsw+0x290>
+ DB 196,98,125,24,45,95,40,0,0 ; vbroadcastss 0x285f(%rip),%ymm13 # 4eb8 <_sk_callback_hsw+0x290>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,221,39,0,0 ; vbroadcastss 0x27dd(%rip),%ymm11 # 4df8 <_sk_callback_hsw+0x294>
+ DB 196,98,125,24,29,85,40,0,0 ; vbroadcastss 0x2855(%rip),%ymm11 # 4ebc <_sk_callback_hsw+0x294>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,211,39,0,0 ; vbroadcastss 0x27d3(%rip),%ymm12 # 4dfc <_sk_callback_hsw+0x298>
+ DB 196,98,125,24,37,75,40,0,0 ; vbroadcastss 0x284b(%rip),%ymm12 # 4ec0 <_sk_callback_hsw+0x298>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,201,39,0,0 ; vbroadcastss 0x27c9(%rip),%ymm12 # 4e00 <_sk_callback_hsw+0x29c>
+ DB 196,98,125,24,37,65,40,0,0 ; vbroadcastss 0x2841(%rip),%ymm12 # 4ec4 <_sk_callback_hsw+0x29c>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,170,39,0,0 ; vbroadcastss 0x27aa(%rip),%ymm11 # 4e04 <_sk_callback_hsw+0x2a0>
+ DB 196,98,125,24,29,34,40,0,0 ; vbroadcastss 0x2822(%rip),%ymm11 # 4ec8 <_sk_callback_hsw+0x2a0>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,160,39,0,0 ; vbroadcastss 0x27a0(%rip),%ymm11 # 4e08 <_sk_callback_hsw+0x2a4>
+ DB 196,98,125,24,29,24,40,0,0 ; vbroadcastss 0x2818(%rip),%ymm11 # 4ecc <_sk_callback_hsw+0x2a4>
DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11
- DB 196,226,125,24,5,150,39,0,0 ; vbroadcastss 0x2796(%rip),%ymm0 # 4e0c <_sk_callback_hsw+0x2a8>
+ DB 196,226,125,24,5,14,40,0,0 ; vbroadcastss 0x280e(%rip),%ymm0 # 4ed0 <_sk_callback_hsw+0x2a8>
DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,140,39,0,0 ; vbroadcastss 0x278c(%rip),%ymm10 # 4e10 <_sk_callback_hsw+0x2ac>
+ DB 196,98,125,24,21,4,40,0,0 ; vbroadcastss 0x2804(%rip),%ymm10 # 4ed4 <_sk_callback_hsw+0x2ac>
DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0
DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,21,127,39,0,0 ; vbroadcastss 0x277f(%rip),%ymm10 # 4e14 <_sk_callback_hsw+0x2b0>
+ DB 196,98,125,24,21,247,39,0,0 ; vbroadcastss 0x27f7(%rip),%ymm10 # 4ed8 <_sk_callback_hsw+0x2b0>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2327,7 +2341,7 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,86,39,0,0 ; vbroadcastss 0x2756(%rip),%ymm8 # 4e18 <_sk_callback_hsw+0x2b4>
+ DB 196,98,125,24,5,206,39,0,0 ; vbroadcastss 0x27ce(%rip),%ymm8 # 4edc <_sk_callback_hsw+0x2b4>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2345,33 +2359,33 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10
DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,14,39,0,0 ; vbroadcastss 0x270e(%rip),%ymm12 # 4e1c <_sk_callback_hsw+0x2b8>
- DB 196,98,125,24,45,9,39,0,0 ; vbroadcastss 0x2709(%rip),%ymm13 # 4e20 <_sk_callback_hsw+0x2bc>
+ DB 196,98,125,24,37,134,39,0,0 ; vbroadcastss 0x2786(%rip),%ymm12 # 4ee0 <_sk_callback_hsw+0x2b8>
+ DB 196,98,125,24,45,129,39,0,0 ; vbroadcastss 0x2781(%rip),%ymm13 # 4ee4 <_sk_callback_hsw+0x2bc>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,255,38,0,0 ; vbroadcastss 0x26ff(%rip),%ymm13 # 4e24 <_sk_callback_hsw+0x2c0>
+ DB 196,98,125,24,45,119,39,0,0 ; vbroadcastss 0x2777(%rip),%ymm13 # 4ee8 <_sk_callback_hsw+0x2c0>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,245,38,0,0 ; vbroadcastss 0x26f5(%rip),%ymm13 # 4e28 <_sk_callback_hsw+0x2c4>
+ DB 196,98,125,24,45,109,39,0,0 ; vbroadcastss 0x276d(%rip),%ymm13 # 4eec <_sk_callback_hsw+0x2c4>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,235,38,0,0 ; vbroadcastss 0x26eb(%rip),%ymm11 # 4e2c <_sk_callback_hsw+0x2c8>
+ DB 196,98,125,24,29,99,39,0,0 ; vbroadcastss 0x2763(%rip),%ymm11 # 4ef0 <_sk_callback_hsw+0x2c8>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,225,38,0,0 ; vbroadcastss 0x26e1(%rip),%ymm12 # 4e30 <_sk_callback_hsw+0x2cc>
+ DB 196,98,125,24,37,89,39,0,0 ; vbroadcastss 0x2759(%rip),%ymm12 # 4ef4 <_sk_callback_hsw+0x2cc>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,215,38,0,0 ; vbroadcastss 0x26d7(%rip),%ymm12 # 4e34 <_sk_callback_hsw+0x2d0>
+ DB 196,98,125,24,37,79,39,0,0 ; vbroadcastss 0x274f(%rip),%ymm12 # 4ef8 <_sk_callback_hsw+0x2d0>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,184,38,0,0 ; vbroadcastss 0x26b8(%rip),%ymm11 # 4e38 <_sk_callback_hsw+0x2d4>
+ DB 196,98,125,24,29,48,39,0,0 ; vbroadcastss 0x2730(%rip),%ymm11 # 4efc <_sk_callback_hsw+0x2d4>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,174,38,0,0 ; vbroadcastss 0x26ae(%rip),%ymm11 # 4e3c <_sk_callback_hsw+0x2d8>
+ DB 196,98,125,24,29,38,39,0,0 ; vbroadcastss 0x2726(%rip),%ymm11 # 4f00 <_sk_callback_hsw+0x2d8>
DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11
- DB 196,226,125,24,13,164,38,0,0 ; vbroadcastss 0x26a4(%rip),%ymm1 # 4e40 <_sk_callback_hsw+0x2dc>
+ DB 196,226,125,24,13,28,39,0,0 ; vbroadcastss 0x271c(%rip),%ymm1 # 4f04 <_sk_callback_hsw+0x2dc>
DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,154,38,0,0 ; vbroadcastss 0x269a(%rip),%ymm10 # 4e44 <_sk_callback_hsw+0x2e0>
+ DB 196,98,125,24,21,18,39,0,0 ; vbroadcastss 0x2712(%rip),%ymm10 # 4f08 <_sk_callback_hsw+0x2e0>
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
- DB 196,98,125,24,21,141,38,0,0 ; vbroadcastss 0x268d(%rip),%ymm10 # 4e48 <_sk_callback_hsw+0x2e4>
+ DB 196,98,125,24,21,5,39,0,0 ; vbroadcastss 0x2705(%rip),%ymm10 # 4f0c <_sk_callback_hsw+0x2e4>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2379,7 +2393,7 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,100,38,0,0 ; vbroadcastss 0x2664(%rip),%ymm8 # 4e4c <_sk_callback_hsw+0x2e8>
+ DB 196,98,125,24,5,220,38,0,0 ; vbroadcastss 0x26dc(%rip),%ymm8 # 4f10 <_sk_callback_hsw+0x2e8>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2397,33 +2411,33 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,28,38,0,0 ; vbroadcastss 0x261c(%rip),%ymm12 # 4e50 <_sk_callback_hsw+0x2ec>
- DB 196,98,125,24,45,23,38,0,0 ; vbroadcastss 0x2617(%rip),%ymm13 # 4e54 <_sk_callback_hsw+0x2f0>
+ DB 196,98,125,24,37,148,38,0,0 ; vbroadcastss 0x2694(%rip),%ymm12 # 4f14 <_sk_callback_hsw+0x2ec>
+ DB 196,98,125,24,45,143,38,0,0 ; vbroadcastss 0x268f(%rip),%ymm13 # 4f18 <_sk_callback_hsw+0x2f0>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,13,38,0,0 ; vbroadcastss 0x260d(%rip),%ymm13 # 4e58 <_sk_callback_hsw+0x2f4>
+ DB 196,98,125,24,45,133,38,0,0 ; vbroadcastss 0x2685(%rip),%ymm13 # 4f1c <_sk_callback_hsw+0x2f4>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,3,38,0,0 ; vbroadcastss 0x2603(%rip),%ymm13 # 4e5c <_sk_callback_hsw+0x2f8>
+ DB 196,98,125,24,45,123,38,0,0 ; vbroadcastss 0x267b(%rip),%ymm13 # 4f20 <_sk_callback_hsw+0x2f8>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,249,37,0,0 ; vbroadcastss 0x25f9(%rip),%ymm11 # 4e60 <_sk_callback_hsw+0x2fc>
+ DB 196,98,125,24,29,113,38,0,0 ; vbroadcastss 0x2671(%rip),%ymm11 # 4f24 <_sk_callback_hsw+0x2fc>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,239,37,0,0 ; vbroadcastss 0x25ef(%rip),%ymm12 # 4e64 <_sk_callback_hsw+0x300>
+ DB 196,98,125,24,37,103,38,0,0 ; vbroadcastss 0x2667(%rip),%ymm12 # 4f28 <_sk_callback_hsw+0x300>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,229,37,0,0 ; vbroadcastss 0x25e5(%rip),%ymm12 # 4e68 <_sk_callback_hsw+0x304>
+ DB 196,98,125,24,37,93,38,0,0 ; vbroadcastss 0x265d(%rip),%ymm12 # 4f2c <_sk_callback_hsw+0x304>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,198,37,0,0 ; vbroadcastss 0x25c6(%rip),%ymm11 # 4e6c <_sk_callback_hsw+0x308>
+ DB 196,98,125,24,29,62,38,0,0 ; vbroadcastss 0x263e(%rip),%ymm11 # 4f30 <_sk_callback_hsw+0x308>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,188,37,0,0 ; vbroadcastss 0x25bc(%rip),%ymm11 # 4e70 <_sk_callback_hsw+0x30c>
+ DB 196,98,125,24,29,52,38,0,0 ; vbroadcastss 0x2634(%rip),%ymm11 # 4f34 <_sk_callback_hsw+0x30c>
DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11
- DB 196,226,125,24,21,178,37,0,0 ; vbroadcastss 0x25b2(%rip),%ymm2 # 4e74 <_sk_callback_hsw+0x310>
+ DB 196,226,125,24,21,42,38,0,0 ; vbroadcastss 0x262a(%rip),%ymm2 # 4f38 <_sk_callback_hsw+0x310>
DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,168,37,0,0 ; vbroadcastss 0x25a8(%rip),%ymm10 # 4e78 <_sk_callback_hsw+0x314>
+ DB 196,98,125,24,21,32,38,0,0 ; vbroadcastss 0x2620(%rip),%ymm10 # 4f3c <_sk_callback_hsw+0x314>
DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2
DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2
- DB 196,98,125,24,21,155,37,0,0 ; vbroadcastss 0x259b(%rip),%ymm10 # 4e7c <_sk_callback_hsw+0x318>
+ DB 196,98,125,24,21,19,38,0,0 ; vbroadcastss 0x2613(%rip),%ymm10 # 4f40 <_sk_callback_hsw+0x318>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2431,7 +2445,7 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,114,37,0,0 ; vbroadcastss 0x2572(%rip),%ymm8 # 4e80 <_sk_callback_hsw+0x31c>
+ DB 196,98,125,24,5,234,37,0,0 ; vbroadcastss 0x25ea(%rip),%ymm8 # 4f44 <_sk_callback_hsw+0x31c>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2449,33 +2463,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10
DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,42,37,0,0 ; vbroadcastss 0x252a(%rip),%ymm12 # 4e84 <_sk_callback_hsw+0x320>
- DB 196,98,125,24,45,37,37,0,0 ; vbroadcastss 0x2525(%rip),%ymm13 # 4e88 <_sk_callback_hsw+0x324>
+ DB 196,98,125,24,37,162,37,0,0 ; vbroadcastss 0x25a2(%rip),%ymm12 # 4f48 <_sk_callback_hsw+0x320>
+ DB 196,98,125,24,45,157,37,0,0 ; vbroadcastss 0x259d(%rip),%ymm13 # 4f4c <_sk_callback_hsw+0x324>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,27,37,0,0 ; vbroadcastss 0x251b(%rip),%ymm13 # 4e8c <_sk_callback_hsw+0x328>
+ DB 196,98,125,24,45,147,37,0,0 ; vbroadcastss 0x2593(%rip),%ymm13 # 4f50 <_sk_callback_hsw+0x328>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,17,37,0,0 ; vbroadcastss 0x2511(%rip),%ymm13 # 4e90 <_sk_callback_hsw+0x32c>
+ DB 196,98,125,24,45,137,37,0,0 ; vbroadcastss 0x2589(%rip),%ymm13 # 4f54 <_sk_callback_hsw+0x32c>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,7,37,0,0 ; vbroadcastss 0x2507(%rip),%ymm11 # 4e94 <_sk_callback_hsw+0x330>
+ DB 196,98,125,24,29,127,37,0,0 ; vbroadcastss 0x257f(%rip),%ymm11 # 4f58 <_sk_callback_hsw+0x330>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,253,36,0,0 ; vbroadcastss 0x24fd(%rip),%ymm12 # 4e98 <_sk_callback_hsw+0x334>
+ DB 196,98,125,24,37,117,37,0,0 ; vbroadcastss 0x2575(%rip),%ymm12 # 4f5c <_sk_callback_hsw+0x334>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,243,36,0,0 ; vbroadcastss 0x24f3(%rip),%ymm12 # 4e9c <_sk_callback_hsw+0x338>
+ DB 196,98,125,24,37,107,37,0,0 ; vbroadcastss 0x256b(%rip),%ymm12 # 4f60 <_sk_callback_hsw+0x338>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,212,36,0,0 ; vbroadcastss 0x24d4(%rip),%ymm11 # 4ea0 <_sk_callback_hsw+0x33c>
+ DB 196,98,125,24,29,76,37,0,0 ; vbroadcastss 0x254c(%rip),%ymm11 # 4f64 <_sk_callback_hsw+0x33c>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,202,36,0,0 ; vbroadcastss 0x24ca(%rip),%ymm11 # 4ea4 <_sk_callback_hsw+0x340>
+ DB 196,98,125,24,29,66,37,0,0 ; vbroadcastss 0x2542(%rip),%ymm11 # 4f68 <_sk_callback_hsw+0x340>
DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11
- DB 196,226,125,24,29,192,36,0,0 ; vbroadcastss 0x24c0(%rip),%ymm3 # 4ea8 <_sk_callback_hsw+0x344>
+ DB 196,226,125,24,29,56,37,0,0 ; vbroadcastss 0x2538(%rip),%ymm3 # 4f6c <_sk_callback_hsw+0x344>
DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,182,36,0,0 ; vbroadcastss 0x24b6(%rip),%ymm10 # 4eac <_sk_callback_hsw+0x348>
+ DB 196,98,125,24,21,46,37,0,0 ; vbroadcastss 0x252e(%rip),%ymm10 # 4f70 <_sk_callback_hsw+0x348>
DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3
DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3
- DB 196,98,125,24,21,169,36,0,0 ; vbroadcastss 0x24a9(%rip),%ymm10 # 4eb0 <_sk_callback_hsw+0x34c>
+ DB 196,98,125,24,21,33,37,0,0 ; vbroadcastss 0x2521(%rip),%ymm10 # 4f74 <_sk_callback_hsw+0x34c>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2483,33 +2497,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,128,36,0,0 ; vbroadcastss 0x2480(%rip),%ymm8 # 4eb4 <_sk_callback_hsw+0x350>
+ DB 196,98,125,24,5,248,36,0,0 ; vbroadcastss 0x24f8(%rip),%ymm8 # 4f78 <_sk_callback_hsw+0x350>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
PUBLIC _sk_lab_to_xyz_hsw
_sk_lab_to_xyz_hsw LABEL PROC
- DB 196,98,125,24,5,114,36,0,0 ; vbroadcastss 0x2472(%rip),%ymm8 # 4eb8 <_sk_callback_hsw+0x354>
- DB 196,98,125,24,13,109,36,0,0 ; vbroadcastss 0x246d(%rip),%ymm9 # 4ebc <_sk_callback_hsw+0x358>
- DB 196,98,125,24,21,104,36,0,0 ; vbroadcastss 0x2468(%rip),%ymm10 # 4ec0 <_sk_callback_hsw+0x35c>
+ DB 196,98,125,24,5,234,36,0,0 ; vbroadcastss 0x24ea(%rip),%ymm8 # 4f7c <_sk_callback_hsw+0x354>
+ DB 196,98,125,24,13,229,36,0,0 ; vbroadcastss 0x24e5(%rip),%ymm9 # 4f80 <_sk_callback_hsw+0x358>
+ DB 196,98,125,24,21,224,36,0,0 ; vbroadcastss 0x24e0(%rip),%ymm10 # 4f84 <_sk_callback_hsw+0x35c>
DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1
DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2
- DB 196,98,125,24,13,89,36,0,0 ; vbroadcastss 0x2459(%rip),%ymm9 # 4ec4 <_sk_callback_hsw+0x360>
+ DB 196,98,125,24,13,209,36,0,0 ; vbroadcastss 0x24d1(%rip),%ymm9 # 4f88 <_sk_callback_hsw+0x360>
DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9
- DB 196,226,125,24,5,79,36,0,0 ; vbroadcastss 0x244f(%rip),%ymm0 # 4ec8 <_sk_callback_hsw+0x364>
+ DB 196,226,125,24,5,199,36,0,0 ; vbroadcastss 0x24c7(%rip),%ymm0 # 4f8c <_sk_callback_hsw+0x364>
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
- DB 196,98,125,24,5,70,36,0,0 ; vbroadcastss 0x2446(%rip),%ymm8 # 4ecc <_sk_callback_hsw+0x368>
+ DB 196,98,125,24,5,190,36,0,0 ; vbroadcastss 0x24be(%rip),%ymm8 # 4f90 <_sk_callback_hsw+0x368>
DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8
- DB 196,98,125,24,13,60,36,0,0 ; vbroadcastss 0x243c(%rip),%ymm9 # 4ed0 <_sk_callback_hsw+0x36c>
+ DB 196,98,125,24,13,180,36,0,0 ; vbroadcastss 0x24b4(%rip),%ymm9 # 4f94 <_sk_callback_hsw+0x36c>
DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9
DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
- DB 196,226,125,24,21,41,36,0,0 ; vbroadcastss 0x2429(%rip),%ymm2 # 4ed4 <_sk_callback_hsw+0x370>
+ DB 196,226,125,24,21,161,36,0,0 ; vbroadcastss 0x24a1(%rip),%ymm2 # 4f98 <_sk_callback_hsw+0x370>
DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10
- DB 196,98,125,24,29,31,36,0,0 ; vbroadcastss 0x241f(%rip),%ymm11 # 4ed8 <_sk_callback_hsw+0x374>
+ DB 196,98,125,24,29,151,36,0,0 ; vbroadcastss 0x2497(%rip),%ymm11 # 4f9c <_sk_callback_hsw+0x374>
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,37,21,36,0,0 ; vbroadcastss 0x2415(%rip),%ymm12 # 4edc <_sk_callback_hsw+0x378>
+ DB 196,98,125,24,37,141,36,0,0 ; vbroadcastss 0x248d(%rip),%ymm12 # 4fa0 <_sk_callback_hsw+0x378>
DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8
DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -2524,9 +2538,9 @@ _sk_lab_to_xyz_hsw LABEL PROC
DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- DB 196,226,125,24,5,202,35,0,0 ; vbroadcastss 0x23ca(%rip),%ymm0 # 4ee0 <_sk_callback_hsw+0x37c>
+ DB 196,226,125,24,5,66,36,0,0 ; vbroadcastss 0x2442(%rip),%ymm0 # 4fa4 <_sk_callback_hsw+0x37c>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,193,35,0,0 ; vbroadcastss 0x23c1(%rip),%ymm8 # 4ee4 <_sk_callback_hsw+0x380>
+ DB 196,98,125,24,5,57,36,0,0 ; vbroadcastss 0x2439(%rip),%ymm8 # 4fa8 <_sk_callback_hsw+0x380>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2536,12 +2550,12 @@ _sk_load_a8_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,52 ; jne 2b6a <_sk_load_a8_hsw+0x3e>
+ DB 117,52 ; jne 2bb6 <_sk_load_a8_hsw+0x3e>
DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0
- DB 197,249,219,5,124,39,0,0 ; vpand 0x277c(%rip),%xmm0,%xmm0 # 52c0 <_sk_callback_hsw+0x75c>
+ DB 197,249,219,5,16,40,0,0 ; vpand 0x2810(%rip),%xmm0,%xmm0 # 53a0 <_sk_callback_hsw+0x778>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,146,35,0,0 ; vbroadcastss 0x2392(%rip),%ymm1 # 4ee8 <_sk_callback_hsw+0x384>
+ DB 196,226,125,24,13,10,36,0,0 ; vbroadcastss 0x240a(%rip),%ymm1 # 4fac <_sk_callback_hsw+0x384>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2553,12 +2567,23 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,190 ; ja 2b3c <_sk_load_a8_hsw+0x10>
+ DB 119,190 ; ja 2b88 <_sk_load_a8_hsw+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,95,0,0,0 ; lea 0x5f(%rip),%r10 # 2be8 <_sk_load_a8_hsw+0xbc>
+ DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 2c4c <_sk_load_a8_hsw+0xd4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 197,249,110,192 ; vmovd %eax,%xmm0
+ DB 235,159 ; jmp 2b88 <_sk_load_a8_hsw+0x10>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 197,249,110,200 ; vmovd %eax,%xmm1
+ DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
+ DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
+ DB 233,119,255,255,255 ; jmpq 2b88 <_sk_load_a8_hsw+0x10>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -2566,32 +2591,26 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,196,192,5 ; vpinsrw $0x5,%eax,%xmm0,%xmm0
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 197,249,196,192,4 ; vpinsrw $0x4,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 197,249,196,192,3 ; vpinsrw $0x3,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 197,249,196,192,1 ; vpinsrw $0x1,%eax,%xmm0,%xmm0
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 197,249,196,192,0 ; vpinsrw $0x0,%eax,%xmm0,%xmm0
- DB 233,85,255,255,255 ; jmpq 2b3c <_sk_load_a8_hsw+0x10>
- DB 144 ; nop
- DB 240,255 ; lock (bad)
+ DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1
+ DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
+ DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
+ DB 233,60,255,255,255 ; jmpq 2b88 <_sk_load_a8_hsw+0x10>
+ DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
- DB 255,229 ; jmpq *%rbp
DB 255 ; (bad)
+ DB 255,172,255,255,255,157,255 ; ljmp *-0x620001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 218,255 ; (bad)
+ DB 234 ; (bad)
DB 255 ; (bad)
- DB 255,207 ; dec %edi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,196 ; inc %esp
+ DB 223,255 ; (bad)
DB 255 ; (bad)
+ DB 255,212 ; callq *%rsp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 185,255,255,255,170 ; mov $0xaaffffff,%ecx
+ DB 255,197 ; inc %ebp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -2634,7 +2653,7 @@ _sk_gather_a8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,50,34,0,0 ; vbroadcastss 0x2232(%rip),%ymm1 # 4eec <_sk_callback_hsw+0x388>
+ DB 196,226,125,24,13,146,34,0,0 ; vbroadcastss 0x2292(%rip),%ymm1 # 4fb0 <_sk_callback_hsw+0x388>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2646,14 +2665,14 @@ PUBLIC _sk_store_a8_hsw
_sk_store_a8_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
- DB 196,98,125,24,5,20,34,0,0 ; vbroadcastss 0x2214(%rip),%ymm8 # 4ef0 <_sk_callback_hsw+0x38c>
+ DB 196,98,125,24,5,116,34,0,0 ; vbroadcastss 0x2274(%rip),%ymm8 # 4fb4 <_sk_callback_hsw+0x38c>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 2d05 <_sk_store_a8_hsw+0x37>
+ DB 117,10 ; jne 2d69 <_sk_store_a8_hsw+0x37>
DB 196,65,123,17,4,19 ; vmovsd %xmm8,(%r11,%rdx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2661,41 +2680,42 @@ _sk_store_a8_hsw LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 2d01 <_sk_store_a8_hsw+0x33>
+ DB 119,236 ; ja 2d65 <_sk_store_a8_hsw+0x33>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,67,0,0,0 ; lea 0x43(%rip),%r10 # 2d68 <_sk_store_a8_hsw+0x9a>
+ DB 76,141,21,87,0,0,0 ; lea 0x57(%rip),%r10 # 2de0 <_sk_store_a8_hsw+0xae>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 196,67,121,20,4,19,0 ; vpextrb $0x0,%xmm8,(%r11,%rdx,1)
+ DB 235,202 ; jmp 2d65 <_sk_store_a8_hsw+0x33>
+ DB 196,67,121,20,68,19,2,4 ; vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1)
+ DB 196,98,57,0,5,4,38,0,0 ; vpshufb 0x2604(%rip),%xmm8,%xmm8 # 53b0 <_sk_callback_hsw+0x788>
+ DB 196,67,121,21,4,19,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,1)
+ DB 235,176 ; jmp 2d65 <_sk_store_a8_hsw+0x33>
DB 196,67,121,20,68,19,6,12 ; vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1)
DB 196,67,121,20,68,19,5,10 ; vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1)
DB 196,67,121,20,68,19,4,8 ; vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1)
- DB 196,67,121,20,68,19,3,6 ; vpextrb $0x6,%xmm8,0x3(%r11,%rdx,1)
- DB 196,67,121,20,68,19,2,4 ; vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1)
- DB 196,67,121,20,68,19,1,2 ; vpextrb $0x2,%xmm8,0x1(%r11,%rdx,1)
- DB 196,67,121,20,4,19,0 ; vpextrb $0x0,%xmm8,(%r11,%rdx,1)
- DB 235,154 ; jmp 2d01 <_sk_store_a8_hsw+0x33>
- DB 144 ; nop
- DB 246,255 ; idiv %bh
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 238 ; out %al,(%dx)
+ DB 196,98,57,0,5,234,37,0,0 ; vpshufb 0x25ea(%rip),%xmm8,%xmm8 # 53c0 <_sk_callback_hsw+0x798>
+ DB 196,65,121,126,4,19 ; vmovd %xmm8,(%r11,%rdx,1)
+ DB 235,135 ; jmp 2d65 <_sk_store_a8_hsw+0x33>
+ DB 102,144 ; xchg %ax,%ax
+ DB 178,255 ; mov $0xff,%dl
DB 255 ; (bad)
+ DB 255,195 ; inc %ebx
DB 255 ; (bad)
- DB 255,230 ; jmpq *%rsi
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 187,255,255,255,237 ; mov $0xedffffff,%ebx
DB 255 ; (bad)
- DB 222,255 ; fdivrp %st,%st(7)
DB 255 ; (bad)
- DB 255,214 ; callq *%rsi
+ DB 255,229 ; jmpq *%rbp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,206 ; dec %esi
DB 255 ; (bad)
+ DB 221,255 ; (bad)
DB 255 ; (bad)
- DB 255,198 ; inc %esi
+ DB 255,213 ; callq *%rbp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -2705,15 +2725,15 @@ _sk_load_g8_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,57 ; jne 2dc7 <_sk_load_g8_hsw+0x43>
+ DB 117,57 ; jne 2e3f <_sk_load_g8_hsw+0x43>
DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0
- DB 197,249,219,5,52,37,0,0 ; vpand 0x2534(%rip),%xmm0,%xmm0 # 52d0 <_sk_callback_hsw+0x76c>
+ DB 197,249,219,5,188,37,0,0 ; vpand 0x25bc(%rip),%xmm0,%xmm0 # 53d0 <_sk_callback_hsw+0x7a8>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,70,33,0,0 ; vbroadcastss 0x2146(%rip),%ymm1 # 4ef4 <_sk_callback_hsw+0x390>
+ DB 196,226,125,24,13,146,33,0,0 ; vbroadcastss 0x2192(%rip),%ymm1 # 4fb8 <_sk_callback_hsw+0x390>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,59,33,0,0 ; vbroadcastss 0x213b(%rip),%ymm3 # 4ef8 <_sk_callback_hsw+0x394>
+ DB 196,226,125,24,29,135,33,0,0 ; vbroadcastss 0x2187(%rip),%ymm3 # 4fbc <_sk_callback_hsw+0x394>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -2722,12 +2742,23 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,185 ; ja 2d94 <_sk_load_g8_hsw+0x10>
+ DB 119,185 ; ja 2e0c <_sk_load_g8_hsw+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,94,0,0,0 ; lea 0x5e(%rip),%r10 # 2e44 <_sk_load_g8_hsw+0xc0>
+ DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # 2ed8 <_sk_load_g8_hsw+0xdc>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 197,249,110,192 ; vmovd %eax,%xmm0
+ DB 235,154 ; jmp 2e0c <_sk_load_g8_hsw+0x10>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 197,249,110,200 ; vmovd %eax,%xmm1
+ DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
+ DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
+ DB 233,114,255,255,255 ; jmpq 2e0c <_sk_load_g8_hsw+0x10>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -2735,32 +2766,27 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,196,192,5 ; vpinsrw $0x5,%eax,%xmm0,%xmm0
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 197,249,196,192,4 ; vpinsrw $0x4,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 197,249,196,192,3 ; vpinsrw $0x3,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 197,249,196,192,1 ; vpinsrw $0x1,%eax,%xmm0,%xmm0
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 197,249,196,192,0 ; vpinsrw $0x0,%eax,%xmm0,%xmm0
- DB 233,80,255,255,255 ; jmpq 2d94 <_sk_load_g8_hsw+0x10>
- DB 241 ; icebp
- DB 255 ; (bad)
+ DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1
+ DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
+ DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
+ DB 233,55,255,255,255 ; jmpq 2e0c <_sk_load_g8_hsw+0x10>
+ DB 15,31,0 ; nopl (%rax)
+ DB 143 ; (bad)
DB 255 ; (bad)
- DB 255,230 ; jmpq *%rsi
DB 255 ; (bad)
+ DB 255,169,255,255,255,154 ; ljmp *-0x65000001(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 219,255 ; (bad)
+ DB 255,231 ; jmpq *%rdi
DB 255 ; (bad)
- DB 255,208 ; callq *%rax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,197 ; inc %ebp
+ DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
+ DB 255,209 ; callq *%rcx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 186,255,255,255,171 ; mov $0xabffffff,%edx
+ DB 255,194 ; inc %edx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -2803,10 +2829,10 @@ _sk_gather_g8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,230,31,0,0 ; vbroadcastss 0x1fe6(%rip),%ymm1 # 4efc <_sk_callback_hsw+0x398>
+ DB 196,226,125,24,13,22,32,0,0 ; vbroadcastss 0x2016(%rip),%ymm1 # 4fc0 <_sk_callback_hsw+0x398>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,219,31,0,0 ; vbroadcastss 0x1fdb(%rip),%ymm3 # 4f00 <_sk_callback_hsw+0x39c>
+ DB 196,226,125,24,29,11,32,0,0 ; vbroadcastss 0x200b(%rip),%ymm3 # 4fc4 <_sk_callback_hsw+0x39c>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -2816,9 +2842,9 @@ _sk_gather_i8_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,137,193 ; mov %rax,%r9
DB 77,133,201 ; test %r9,%r9
- DB 116,5 ; je 2f3e <_sk_gather_i8_hsw+0xf>
+ DB 116,5 ; je 2fd2 <_sk_gather_i8_hsw+0xf>
DB 76,137,200 ; mov %r9,%rax
- DB 235,2 ; jmp 2f40 <_sk_gather_i8_hsw+0x11>
+ DB 235,2 ; jmp 2fd4 <_sk_gather_i8_hsw+0x11>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 83 ; push %rbx
DB 76,139,16 ; mov (%rax),%r10
@@ -2852,14 +2878,14 @@ _sk_gather_i8_hsw LABEL PROC
DB 73,139,65,8 ; mov 0x8(%r9),%rax
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,226,117,144,28,128 ; vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3
- DB 197,229,219,5,123,33,0,0 ; vpand 0x217b(%rip),%ymm3,%ymm0 # 5160 <_sk_callback_hsw+0x5fc>
+ DB 197,229,219,5,199,33,0,0 ; vpand 0x21c7(%rip),%ymm3,%ymm0 # 5240 <_sk_callback_hsw+0x618>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,18,31,0,0 ; vbroadcastss 0x1f12(%rip),%ymm8 # 4f04 <_sk_callback_hsw+0x3a0>
+ DB 196,98,125,24,5,66,31,0,0 ; vbroadcastss 0x1f42(%rip),%ymm8 # 4fc8 <_sk_callback_hsw+0x3a0>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,128,33,0,0 ; vpshufb 0x2180(%rip),%ymm3,%ymm1 # 5180 <_sk_callback_hsw+0x61c>
+ DB 196,226,101,0,13,204,33,0,0 ; vpshufb 0x21cc(%rip),%ymm3,%ymm1 # 5260 <_sk_callback_hsw+0x638>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,142,33,0,0 ; vpshufb 0x218e(%rip),%ymm3,%ymm2 # 51a0 <_sk_callback_hsw+0x63c>
+ DB 196,226,101,0,21,218,33,0,0 ; vpshufb 0x21da(%rip),%ymm3,%ymm2 # 5280 <_sk_callback_hsw+0x658>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -2874,68 +2900,69 @@ _sk_load_565_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,114 ; jne 30aa <_sk_load_565_hsw+0x7c>
+ DB 117,114 ; jne 313e <_sk_load_565_hsw+0x7c>
DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,188,30,0,0 ; vpbroadcastd 0x1ebc(%rip),%ymm0 # 4f08 <_sk_callback_hsw+0x3a4>
+ DB 196,226,125,88,5,236,30,0,0 ; vpbroadcastd 0x1eec(%rip),%ymm0 # 4fcc <_sk_callback_hsw+0x3a4>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,175,30,0,0 ; vbroadcastss 0x1eaf(%rip),%ymm1 # 4f0c <_sk_callback_hsw+0x3a8>
+ DB 196,226,125,24,13,223,30,0,0 ; vbroadcastss 0x1edf(%rip),%ymm1 # 4fd0 <_sk_callback_hsw+0x3a8>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,166,30,0,0 ; vpbroadcastd 0x1ea6(%rip),%ymm1 # 4f10 <_sk_callback_hsw+0x3ac>
+ DB 196,226,125,88,13,214,30,0,0 ; vpbroadcastd 0x1ed6(%rip),%ymm1 # 4fd4 <_sk_callback_hsw+0x3ac>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,153,30,0,0 ; vbroadcastss 0x1e99(%rip),%ymm3 # 4f14 <_sk_callback_hsw+0x3b0>
+ DB 196,226,125,24,29,201,30,0,0 ; vbroadcastss 0x1ec9(%rip),%ymm3 # 4fd8 <_sk_callback_hsw+0x3b0>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,144,30,0,0 ; vpbroadcastd 0x1e90(%rip),%ymm3 # 4f18 <_sk_callback_hsw+0x3b4>
+ DB 196,226,125,88,29,192,30,0,0 ; vpbroadcastd 0x1ec0(%rip),%ymm3 # 4fdc <_sk_callback_hsw+0x3b4>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,131,30,0,0 ; vbroadcastss 0x1e83(%rip),%ymm3 # 4f1c <_sk_callback_hsw+0x3b8>
+ DB 196,226,125,24,29,179,30,0,0 ; vbroadcastss 0x1eb3(%rip),%ymm3 # 4fe0 <_sk_callback_hsw+0x3b8>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,120,30,0,0 ; vbroadcastss 0x1e78(%rip),%ymm3 # 4f20 <_sk_callback_hsw+0x3bc>
+ DB 196,226,125,24,29,168,30,0,0 ; vbroadcastss 0x1ea8(%rip),%ymm3 # 4fe4 <_sk_callback_hsw+0x3bc>
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,128 ; ja 303e <_sk_load_565_hsw+0x10>
+ DB 119,128 ; ja 30d2 <_sk_load_565_hsw+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,75,0,0,0 ; lea 0x4b(%rip),%r10 # 3114 <_sk_load_565_hsw+0xe6>
+ DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 31c0 <_sk_load_565_hsw+0xfe>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax
+ DB 197,249,110,192 ; vmovd %eax,%xmm0
+ DB 233,94,255,255,255 ; jmpq 30d2 <_sk_load_565_hsw+0x10>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
+ DB 196,193,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm1
+ DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
+ DB 233,65,255,255,255 ; jmpq 30d2 <_sk_load_565_hsw+0x10>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0
DB 196,193,121,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0
DB 196,193,121,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,6,3 ; vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,2,1 ; vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,4,83,0 ; vpinsrw $0x0,(%r11,%rdx,2),%xmm0,%xmm0
- DB 233,44,255,255,255 ; jmpq 303e <_sk_load_565_hsw+0x10>
+ DB 196,193,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm1
+ DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
+ DB 233,20,255,255,255 ; jmpq 30d2 <_sk_load_565_hsw+0x10>
DB 102,144 ; xchg %ax,%ax
- DB 242,255 ; repnz (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 234 ; (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255,226 ; jmpq *%rdx
+ DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,192 ; inc %eax
DB 255 ; (bad)
- DB 218,255 ; (bad)
DB 255 ; (bad)
- DB 255,210 ; callq *%rdx
+ DB 255,180,255,255,255,237,255 ; pushq -0x120001(%rdi,%rdi,8)
DB 255 ; (bad)
+ DB 255,229 ; jmpq *%rbp
DB 255 ; (bad)
- DB 255,202 ; dec %edx
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 221,255 ; (bad)
DB 255 ; (bad)
- DB 190 ; .byte 0xbe
+ DB 255,209 ; callq *%rcx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -2979,34 +3006,34 @@ _sk_gather_565_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,67,29,0,0 ; vpbroadcastd 0x1d43(%rip),%ymm0 # 4f24 <_sk_callback_hsw+0x3c0>
+ DB 196,226,125,88,5,91,29,0,0 ; vpbroadcastd 0x1d5b(%rip),%ymm0 # 4fe8 <_sk_callback_hsw+0x3c0>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,54,29,0,0 ; vbroadcastss 0x1d36(%rip),%ymm1 # 4f28 <_sk_callback_hsw+0x3c4>
+ DB 196,226,125,24,13,78,29,0,0 ; vbroadcastss 0x1d4e(%rip),%ymm1 # 4fec <_sk_callback_hsw+0x3c4>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,45,29,0,0 ; vpbroadcastd 0x1d2d(%rip),%ymm1 # 4f2c <_sk_callback_hsw+0x3c8>
+ DB 196,226,125,88,13,69,29,0,0 ; vpbroadcastd 0x1d45(%rip),%ymm1 # 4ff0 <_sk_callback_hsw+0x3c8>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,32,29,0,0 ; vbroadcastss 0x1d20(%rip),%ymm3 # 4f30 <_sk_callback_hsw+0x3cc>
+ DB 196,226,125,24,29,56,29,0,0 ; vbroadcastss 0x1d38(%rip),%ymm3 # 4ff4 <_sk_callback_hsw+0x3cc>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,23,29,0,0 ; vpbroadcastd 0x1d17(%rip),%ymm3 # 4f34 <_sk_callback_hsw+0x3d0>
+ DB 196,226,125,88,29,47,29,0,0 ; vpbroadcastd 0x1d2f(%rip),%ymm3 # 4ff8 <_sk_callback_hsw+0x3d0>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,10,29,0,0 ; vbroadcastss 0x1d0a(%rip),%ymm3 # 4f38 <_sk_callback_hsw+0x3d4>
+ DB 196,226,125,24,29,34,29,0,0 ; vbroadcastss 0x1d22(%rip),%ymm3 # 4ffc <_sk_callback_hsw+0x3d4>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,255,28,0,0 ; vbroadcastss 0x1cff(%rip),%ymm3 # 4f3c <_sk_callback_hsw+0x3d8>
+ DB 196,226,125,24,29,23,29,0,0 ; vbroadcastss 0x1d17(%rip),%ymm3 # 5000 <_sk_callback_hsw+0x3d8>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_hsw
_sk_store_565_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
- DB 196,98,125,24,5,243,28,0,0 ; vbroadcastss 0x1cf3(%rip),%ymm8 # 4f40 <_sk_callback_hsw+0x3dc>
+ DB 196,98,125,24,5,11,29,0,0 ; vbroadcastss 0x1d0b(%rip),%ymm8 # 5004 <_sk_callback_hsw+0x3dc>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9
- DB 196,98,125,24,21,222,28,0,0 ; vbroadcastss 0x1cde(%rip),%ymm10 # 4f44 <_sk_callback_hsw+0x3e0>
+ DB 196,98,125,24,21,246,28,0,0 ; vbroadcastss 0x1cf6(%rip),%ymm10 # 5008 <_sk_callback_hsw+0x3e0>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10
@@ -3017,7 +3044,7 @@ _sk_store_565_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 32a4 <_sk_store_565_hsw+0x65>
+ DB 117,10 ; jne 3350 <_sk_store_565_hsw+0x65>
DB 196,65,122,127,4,83 ; vmovdqu %xmm8,(%r11,%rdx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3025,42 +3052,44 @@ _sk_store_565_hsw LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 32a0 <_sk_store_565_hsw+0x61>
+ DB 119,236 ; ja 334c <_sk_store_565_hsw+0x61>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # 3304 <_sk_store_565_hsw+0xc5>
+ DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # 33b0 <_sk_store_565_hsw+0xc5>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2)
+ DB 235,207 ; jmp 334c <_sk_store_565_hsw+0x61>
+ DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
+ DB 196,65,121,126,4,83 ; vmovd %xmm8,(%r11,%rdx,2)
+ DB 235,191 ; jmp 334c <_sk_store_565_hsw+0x61>
DB 196,67,121,21,68,83,12,6 ; vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2)
DB 196,67,121,21,68,83,10,5 ; vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2)
DB 196,67,121,21,68,83,8,4 ; vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2)
- DB 196,67,121,21,68,83,6,3 ; vpextrw $0x3,%xmm8,0x6(%r11,%rdx,2)
- DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
- DB 196,67,121,21,68,83,2,1 ; vpextrw $0x1,%xmm8,0x2(%r11,%rdx,2)
- DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2)
- DB 235,159 ; jmp 32a0 <_sk_store_565_hsw+0x61>
+ DB 196,65,121,214,4,83 ; vmovq %xmm8,(%r11,%rdx,2)
+ DB 235,159 ; jmp 334c <_sk_store_565_hsw+0x61>
DB 15,31,0 ; nopl (%rax)
- DB 244 ; hlt
+ DB 196 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,213 ; callq *%rbp
DB 255 ; (bad)
- DB 236 ; in (%dx),%al
DB 255 ; (bad)
+ DB 255,205 ; dec %ebp
DB 255 ; (bad)
- DB 255,228 ; jmpq *%rsp
DB 255 ; (bad)
+ DB 255,245 ; push %rbp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
- DB 255,212 ; callq *%rsp
+ DB 237 ; in (%dx),%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,204 ; dec %esp
+ DB 255,229 ; jmpq *%rbp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,196 ; inc %esp
DB 255 ; (bad)
+ DB 221,255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3069,28 +3098,28 @@ _sk_load_4444_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,138,0,0,0 ; jne 33b8 <_sk_load_4444_hsw+0x98>
+ DB 15,133,138,0,0,0 ; jne 3464 <_sk_load_4444_hsw+0x98>
DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,6,28,0,0 ; vpbroadcastd 0x1c06(%rip),%ymm0 # 4f48 <_sk_callback_hsw+0x3e4>
+ DB 196,226,125,88,5,30,28,0,0 ; vpbroadcastd 0x1c1e(%rip),%ymm0 # 500c <_sk_callback_hsw+0x3e4>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,249,27,0,0 ; vbroadcastss 0x1bf9(%rip),%ymm1 # 4f4c <_sk_callback_hsw+0x3e8>
+ DB 196,226,125,24,13,17,28,0,0 ; vbroadcastss 0x1c11(%rip),%ymm1 # 5010 <_sk_callback_hsw+0x3e8>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,240,27,0,0 ; vpbroadcastd 0x1bf0(%rip),%ymm1 # 4f50 <_sk_callback_hsw+0x3ec>
+ DB 196,226,125,88,13,8,28,0,0 ; vpbroadcastd 0x1c08(%rip),%ymm1 # 5014 <_sk_callback_hsw+0x3ec>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,227,27,0,0 ; vbroadcastss 0x1be3(%rip),%ymm2 # 4f54 <_sk_callback_hsw+0x3f0>
+ DB 196,226,125,24,21,251,27,0,0 ; vbroadcastss 0x1bfb(%rip),%ymm2 # 5018 <_sk_callback_hsw+0x3f0>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,218,27,0,0 ; vpbroadcastd 0x1bda(%rip),%ymm2 # 4f58 <_sk_callback_hsw+0x3f4>
+ DB 196,226,125,88,21,242,27,0,0 ; vpbroadcastd 0x1bf2(%rip),%ymm2 # 501c <_sk_callback_hsw+0x3f4>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,205,27,0,0 ; vbroadcastss 0x1bcd(%rip),%ymm8 # 4f5c <_sk_callback_hsw+0x3f8>
+ DB 196,98,125,24,5,229,27,0,0 ; vbroadcastss 0x1be5(%rip),%ymm8 # 5020 <_sk_callback_hsw+0x3f8>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,195,27,0,0 ; vpbroadcastd 0x1bc3(%rip),%ymm8 # 4f60 <_sk_callback_hsw+0x3fc>
+ DB 196,98,125,88,5,219,27,0,0 ; vpbroadcastd 0x1bdb(%rip),%ymm8 # 5024 <_sk_callback_hsw+0x3fc>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,181,27,0,0 ; vbroadcastss 0x1bb5(%rip),%ymm8 # 4f64 <_sk_callback_hsw+0x400>
+ DB 196,98,125,24,5,205,27,0,0 ; vbroadcastss 0x1bcd(%rip),%ymm8 # 5028 <_sk_callback_hsw+0x400>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3099,41 +3128,42 @@ _sk_load_4444_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,100,255,255,255 ; ja 3334 <_sk_load_4444_hsw+0x14>
+ DB 15,135,100,255,255,255 ; ja 33e0 <_sk_load_4444_hsw+0x14>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,73,0,0,0 ; lea 0x49(%rip),%r10 # 3424 <_sk_load_4444_hsw+0x104>
+ DB 76,141,21,97,0,0,0 ; lea 0x61(%rip),%r10 # 34e8 <_sk_load_4444_hsw+0x11c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax
+ DB 197,249,110,192 ; vmovd %eax,%xmm0
+ DB 233,66,255,255,255 ; jmpq 33e0 <_sk_load_4444_hsw+0x14>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
+ DB 196,193,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm1
+ DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
+ DB 233,37,255,255,255 ; jmpq 33e0 <_sk_load_4444_hsw+0x14>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0
DB 196,193,121,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0
DB 196,193,121,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,6,3 ; vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,2,1 ; vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,4,83,0 ; vpinsrw $0x0,(%r11,%rdx,2),%xmm0,%xmm0
- DB 233,16,255,255,255 ; jmpq 3334 <_sk_load_4444_hsw+0x14>
- DB 244 ; hlt
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 236 ; in (%dx),%al
- DB 255 ; (bad)
+ DB 196,193,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm1
+ DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
+ DB 233,248,254,255,255 ; jmpq 33e0 <_sk_load_4444_hsw+0x14>
+ DB 168,255 ; test $0xff,%al
DB 255 ; (bad)
- DB 255,228 ; jmpq *%rsp
+ DB 255,194 ; inc %edx
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,182,255,255,255,239 ; pushq -0x10000001(%rsi)
DB 255 ; (bad)
- DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
- DB 255,212 ; callq *%rsp
+ DB 255,231 ; jmpq *%rdi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,204 ; dec %esp
DB 255 ; (bad)
+ DB 223,255 ; (bad)
DB 255 ; (bad)
- DB 255,192 ; inc %eax
+ DB 255,211 ; callq *%rbx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3177,25 +3207,25 @@ _sk_gather_4444_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,119,26,0,0 ; vpbroadcastd 0x1a77(%rip),%ymm0 # 4f68 <_sk_callback_hsw+0x404>
+ DB 196,226,125,88,5,119,26,0,0 ; vpbroadcastd 0x1a77(%rip),%ymm0 # 502c <_sk_callback_hsw+0x404>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,106,26,0,0 ; vbroadcastss 0x1a6a(%rip),%ymm1 # 4f6c <_sk_callback_hsw+0x408>
+ DB 196,226,125,24,13,106,26,0,0 ; vbroadcastss 0x1a6a(%rip),%ymm1 # 5030 <_sk_callback_hsw+0x408>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,97,26,0,0 ; vpbroadcastd 0x1a61(%rip),%ymm1 # 4f70 <_sk_callback_hsw+0x40c>
+ DB 196,226,125,88,13,97,26,0,0 ; vpbroadcastd 0x1a61(%rip),%ymm1 # 5034 <_sk_callback_hsw+0x40c>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,84,26,0,0 ; vbroadcastss 0x1a54(%rip),%ymm2 # 4f74 <_sk_callback_hsw+0x410>
+ DB 196,226,125,24,21,84,26,0,0 ; vbroadcastss 0x1a54(%rip),%ymm2 # 5038 <_sk_callback_hsw+0x410>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,75,26,0,0 ; vpbroadcastd 0x1a4b(%rip),%ymm2 # 4f78 <_sk_callback_hsw+0x414>
+ DB 196,226,125,88,21,75,26,0,0 ; vpbroadcastd 0x1a4b(%rip),%ymm2 # 503c <_sk_callback_hsw+0x414>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,62,26,0,0 ; vbroadcastss 0x1a3e(%rip),%ymm8 # 4f7c <_sk_callback_hsw+0x418>
+ DB 196,98,125,24,5,62,26,0,0 ; vbroadcastss 0x1a3e(%rip),%ymm8 # 5040 <_sk_callback_hsw+0x418>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,52,26,0,0 ; vpbroadcastd 0x1a34(%rip),%ymm8 # 4f80 <_sk_callback_hsw+0x41c>
+ DB 196,98,125,88,5,52,26,0,0 ; vpbroadcastd 0x1a34(%rip),%ymm8 # 5044 <_sk_callback_hsw+0x41c>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,38,26,0,0 ; vbroadcastss 0x1a26(%rip),%ymm8 # 4f84 <_sk_callback_hsw+0x420>
+ DB 196,98,125,24,5,38,26,0,0 ; vbroadcastss 0x1a26(%rip),%ymm8 # 5048 <_sk_callback_hsw+0x420>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3204,7 +3234,7 @@ PUBLIC _sk_store_4444_hsw
_sk_store_4444_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
- DB 196,98,125,24,5,19,26,0,0 ; vbroadcastss 0x1a13(%rip),%ymm8 # 4f88 <_sk_callback_hsw+0x424>
+ DB 196,98,125,24,5,19,26,0,0 ; vbroadcastss 0x1a13(%rip),%ymm8 # 504c <_sk_callback_hsw+0x424>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9
@@ -3222,7 +3252,7 @@ _sk_store_4444_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 35d8 <_sk_store_4444_hsw+0x71>
+ DB 117,10 ; jne 369c <_sk_store_4444_hsw+0x71>
DB 196,65,122,127,4,83 ; vmovdqu %xmm8,(%r11,%rdx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3230,42 +3260,44 @@ _sk_store_4444_hsw LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 35d4 <_sk_store_4444_hsw+0x6d>
+ DB 119,236 ; ja 3698 <_sk_store_4444_hsw+0x6d>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # 3638 <_sk_store_4444_hsw+0xd1>
+ DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # 36fc <_sk_store_4444_hsw+0xd1>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2)
+ DB 235,207 ; jmp 3698 <_sk_store_4444_hsw+0x6d>
+ DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
+ DB 196,65,121,126,4,83 ; vmovd %xmm8,(%r11,%rdx,2)
+ DB 235,191 ; jmp 3698 <_sk_store_4444_hsw+0x6d>
DB 196,67,121,21,68,83,12,6 ; vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2)
DB 196,67,121,21,68,83,10,5 ; vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2)
DB 196,67,121,21,68,83,8,4 ; vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2)
- DB 196,67,121,21,68,83,6,3 ; vpextrw $0x3,%xmm8,0x6(%r11,%rdx,2)
- DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
- DB 196,67,121,21,68,83,2,1 ; vpextrw $0x1,%xmm8,0x2(%r11,%rdx,2)
- DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2)
- DB 235,159 ; jmp 35d4 <_sk_store_4444_hsw+0x6d>
+ DB 196,65,121,214,4,83 ; vmovq %xmm8,(%r11,%rdx,2)
+ DB 235,159 ; jmp 3698 <_sk_store_4444_hsw+0x6d>
DB 15,31,0 ; nopl (%rax)
- DB 244 ; hlt
+ DB 196 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,213 ; callq *%rbp
DB 255 ; (bad)
- DB 236 ; in (%dx),%al
DB 255 ; (bad)
+ DB 255,205 ; dec %ebp
DB 255 ; (bad)
- DB 255,228 ; jmpq *%rsp
DB 255 ; (bad)
+ DB 255,245 ; push %rbp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
- DB 255,212 ; callq *%rsp
+ DB 237 ; in (%dx),%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,204 ; dec %esp
+ DB 255,229 ; jmpq *%rbp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,196 ; inc %esp
DB 255 ; (bad)
+ DB 221,255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3276,16 +3308,16 @@ _sk_load_8888_hsw LABEL PROC
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 76,3,16 ; add (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,88 ; jne 36c1 <_sk_load_8888_hsw+0x6d>
+ DB 117,88 ; jne 3785 <_sk_load_8888_hsw+0x6d>
DB 196,193,124,16,26 ; vmovups (%r10),%ymm3
- DB 197,228,84,5,74,27,0,0 ; vandps 0x1b4a(%rip),%ymm3,%ymm0 # 51c0 <_sk_callback_hsw+0x65c>
+ DB 197,228,84,5,102,27,0,0 ; vandps 0x1b66(%rip),%ymm3,%ymm0 # 52a0 <_sk_callback_hsw+0x678>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,9,25,0,0 ; vbroadcastss 0x1909(%rip),%ymm8 # 4f8c <_sk_callback_hsw+0x428>
+ DB 196,98,125,24,5,9,25,0,0 ; vbroadcastss 0x1909(%rip),%ymm8 # 5050 <_sk_callback_hsw+0x428>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,79,27,0,0 ; vpshufb 0x1b4f(%rip),%ymm3,%ymm1 # 51e0 <_sk_callback_hsw+0x67c>
+ DB 196,226,101,0,13,107,27,0,0 ; vpshufb 0x1b6b(%rip),%ymm3,%ymm1 # 52c0 <_sk_callback_hsw+0x698>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,93,27,0,0 ; vpshufb 0x1b5d(%rip),%ymm3,%ymm2 # 5200 <_sk_callback_hsw+0x69c>
+ DB 196,226,101,0,21,121,27,0,0 ; vpshufb 0x1b79(%rip),%ymm3,%ymm2 # 52e0 <_sk_callback_hsw+0x6b8>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3302,7 +3334,7 @@ _sk_load_8888_hsw LABEL PROC
DB 196,225,249,110,192 ; vmovq %rax,%xmm0
DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0
DB 196,194,125,44,26 ; vmaskmovps (%r10),%ymm0,%ymm3
- DB 235,135 ; jmp 366e <_sk_load_8888_hsw+0x1a>
+ DB 235,135 ; jmp 3732 <_sk_load_8888_hsw+0x1a>
PUBLIC _sk_gather_8888_hsw
_sk_gather_8888_hsw LABEL PROC
@@ -3315,14 +3347,14 @@ _sk_gather_8888_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,11,27,0,0 ; vpand 0x1b0b(%rip),%ymm3,%ymm0 # 5220 <_sk_callback_hsw+0x6bc>
+ DB 197,229,219,5,39,27,0,0 ; vpand 0x1b27(%rip),%ymm3,%ymm0 # 5300 <_sk_callback_hsw+0x6d8>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,110,24,0,0 ; vbroadcastss 0x186e(%rip),%ymm8 # 4f90 <_sk_callback_hsw+0x42c>
+ DB 196,98,125,24,5,110,24,0,0 ; vbroadcastss 0x186e(%rip),%ymm8 # 5054 <_sk_callback_hsw+0x42c>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,16,27,0,0 ; vpshufb 0x1b10(%rip),%ymm3,%ymm1 # 5240 <_sk_callback_hsw+0x6dc>
+ DB 196,226,101,0,13,44,27,0,0 ; vpshufb 0x1b2c(%rip),%ymm3,%ymm1 # 5320 <_sk_callback_hsw+0x6f8>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,30,27,0,0 ; vpshufb 0x1b1e(%rip),%ymm3,%ymm2 # 5260 <_sk_callback_hsw+0x6fc>
+ DB 196,226,101,0,21,58,27,0,0 ; vpshufb 0x1b3a(%rip),%ymm3,%ymm2 # 5340 <_sk_callback_hsw+0x718>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3337,7 +3369,7 @@ _sk_store_8888_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 76,3,16 ; add (%rax),%r10
- DB 196,98,125,24,5,30,24,0,0 ; vbroadcastss 0x181e(%rip),%ymm8 # 4f94 <_sk_callback_hsw+0x430>
+ DB 196,98,125,24,5,30,24,0,0 ; vbroadcastss 0x181e(%rip),%ymm8 # 5058 <_sk_callback_hsw+0x430>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -3353,7 +3385,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,12 ; jne 37d0 <_sk_store_8888_hsw+0x73>
+ DB 117,12 ; jne 3894 <_sk_store_8888_hsw+0x73>
DB 196,65,124,17,2 ; vmovups %ymm8,(%r10)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -3366,14 +3398,14 @@ _sk_store_8888_hsw LABEL PROC
DB 196,97,249,110,200 ; vmovq %rax,%xmm9
DB 196,66,125,33,201 ; vpmovsxbd %xmm9,%ymm9
DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10)
- DB 235,211 ; jmp 37c9 <_sk_store_8888_hsw+0x6c>
+ DB 235,211 ; jmp 388d <_sk_store_8888_hsw+0x6c>
PUBLIC _sk_load_f16_hsw
_sk_load_f16_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,97 ; jne 3861 <_sk_load_f16_hsw+0x6b>
+ DB 117,97 ; jne 3925 <_sk_load_f16_hsw+0x6b>
DB 197,121,16,4,208 ; vmovupd (%rax,%rdx,8),%xmm8
DB 197,249,16,84,208,16 ; vmovupd 0x10(%rax,%rdx,8),%xmm2
DB 197,249,16,92,208,32 ; vmovupd 0x20(%rax,%rdx,8),%xmm3
@@ -3399,29 +3431,29 @@ _sk_load_f16_hsw LABEL PROC
DB 197,123,16,4,208 ; vmovsd (%rax,%rdx,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,79 ; je 38c0 <_sk_load_f16_hsw+0xca>
+ DB 116,79 ; je 3984 <_sk_load_f16_hsw+0xca>
DB 197,57,22,68,208,8 ; vmovhpd 0x8(%rax,%rdx,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,67 ; jb 38c0 <_sk_load_f16_hsw+0xca>
+ DB 114,67 ; jb 3984 <_sk_load_f16_hsw+0xca>
DB 197,251,16,84,208,16 ; vmovsd 0x10(%rax,%rdx,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,68 ; je 38cd <_sk_load_f16_hsw+0xd7>
+ DB 116,68 ; je 3991 <_sk_load_f16_hsw+0xd7>
DB 197,233,22,84,208,24 ; vmovhpd 0x18(%rax,%rdx,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,56 ; jb 38cd <_sk_load_f16_hsw+0xd7>
+ DB 114,56 ; jb 3991 <_sk_load_f16_hsw+0xd7>
DB 197,251,16,92,208,32 ; vmovsd 0x20(%rax,%rdx,8),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,114,255,255,255 ; je 3817 <_sk_load_f16_hsw+0x21>
+ DB 15,132,114,255,255,255 ; je 38db <_sk_load_f16_hsw+0x21>
DB 197,225,22,92,208,40 ; vmovhpd 0x28(%rax,%rdx,8),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,98,255,255,255 ; jb 3817 <_sk_load_f16_hsw+0x21>
+ DB 15,130,98,255,255,255 ; jb 38db <_sk_load_f16_hsw+0x21>
DB 197,122,126,76,208,48 ; vmovq 0x30(%rax,%rdx,8),%xmm9
- DB 233,87,255,255,255 ; jmpq 3817 <_sk_load_f16_hsw+0x21>
+ DB 233,87,255,255,255 ; jmpq 38db <_sk_load_f16_hsw+0x21>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,74,255,255,255 ; jmpq 3817 <_sk_load_f16_hsw+0x21>
+ DB 233,74,255,255,255 ; jmpq 38db <_sk_load_f16_hsw+0x21>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,65,255,255,255 ; jmpq 3817 <_sk_load_f16_hsw+0x21>
+ DB 233,65,255,255,255 ; jmpq 38db <_sk_load_f16_hsw+0x21>
PUBLIC _sk_gather_f16_hsw
_sk_gather_f16_hsw LABEL PROC
@@ -3475,7 +3507,7 @@ _sk_store_f16_hsw LABEL PROC
DB 196,65,57,98,205 ; vpunpckldq %xmm13,%xmm8,%xmm9
DB 196,65,57,106,197 ; vpunpckhdq %xmm13,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,27 ; jne 39c5 <_sk_store_f16_hsw+0x65>
+ DB 117,27 ; jne 3a89 <_sk_store_f16_hsw+0x65>
DB 197,120,17,28,208 ; vmovups %xmm11,(%rax,%rdx,8)
DB 197,120,17,84,208,16 ; vmovups %xmm10,0x10(%rax,%rdx,8)
DB 197,120,17,76,208,32 ; vmovups %xmm9,0x20(%rax,%rdx,8)
@@ -3484,22 +3516,22 @@ _sk_store_f16_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 197,121,214,28,208 ; vmovq %xmm11,(%rax,%rdx,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,241 ; je 39c1 <_sk_store_f16_hsw+0x61>
+ DB 116,241 ; je 3a85 <_sk_store_f16_hsw+0x61>
DB 197,121,23,92,208,8 ; vmovhpd %xmm11,0x8(%rax,%rdx,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,229 ; jb 39c1 <_sk_store_f16_hsw+0x61>
+ DB 114,229 ; jb 3a85 <_sk_store_f16_hsw+0x61>
DB 197,121,214,84,208,16 ; vmovq %xmm10,0x10(%rax,%rdx,8)
- DB 116,221 ; je 39c1 <_sk_store_f16_hsw+0x61>
+ DB 116,221 ; je 3a85 <_sk_store_f16_hsw+0x61>
DB 197,121,23,84,208,24 ; vmovhpd %xmm10,0x18(%rax,%rdx,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,209 ; jb 39c1 <_sk_store_f16_hsw+0x61>
+ DB 114,209 ; jb 3a85 <_sk_store_f16_hsw+0x61>
DB 197,121,214,76,208,32 ; vmovq %xmm9,0x20(%rax,%rdx,8)
- DB 116,201 ; je 39c1 <_sk_store_f16_hsw+0x61>
+ DB 116,201 ; je 3a85 <_sk_store_f16_hsw+0x61>
DB 197,121,23,76,208,40 ; vmovhpd %xmm9,0x28(%rax,%rdx,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,189 ; jb 39c1 <_sk_store_f16_hsw+0x61>
+ DB 114,189 ; jb 3a85 <_sk_store_f16_hsw+0x61>
DB 197,121,214,68,208,48 ; vmovq %xmm8,0x30(%rax,%rdx,8)
- DB 235,181 ; jmp 39c1 <_sk_store_f16_hsw+0x61>
+ DB 235,181 ; jmp 3a85 <_sk_store_f16_hsw+0x61>
PUBLIC _sk_load_u16_be_hsw
_sk_load_u16_be_hsw LABEL PROC
@@ -3507,7 +3539,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 3aee <_sk_load_u16_be_hsw+0xe2>
+ DB 15,133,204,0,0,0 ; jne 3bb2 <_sk_load_u16_be_hsw+0xe2>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -3526,7 +3558,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,21,21,0,0 ; vbroadcastss 0x1515(%rip),%ymm10 # 4f98 <_sk_callback_hsw+0x434>
+ DB 196,98,125,24,21,21,21,0,0 ; vbroadcastss 0x1515(%rip),%ymm10 # 505c <_sk_callback_hsw+0x434>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -3554,29 +3586,29 @@ _sk_load_u16_be_hsw LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 3b54 <_sk_load_u16_be_hsw+0x148>
+ DB 116,85 ; je 3c18 <_sk_load_u16_be_hsw+0x148>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 3b54 <_sk_load_u16_be_hsw+0x148>
+ DB 114,72 ; jb 3c18 <_sk_load_u16_be_hsw+0x148>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 3b61 <_sk_load_u16_be_hsw+0x155>
+ DB 116,72 ; je 3c25 <_sk_load_u16_be_hsw+0x155>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 3b61 <_sk_load_u16_be_hsw+0x155>
+ DB 114,59 ; jb 3c25 <_sk_load_u16_be_hsw+0x155>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,6,255,255,255 ; je 3a3d <_sk_load_u16_be_hsw+0x31>
+ DB 15,132,6,255,255,255 ; je 3b01 <_sk_load_u16_be_hsw+0x31>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,245,254,255,255 ; jb 3a3d <_sk_load_u16_be_hsw+0x31>
+ DB 15,130,245,254,255,255 ; jb 3b01 <_sk_load_u16_be_hsw+0x31>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,233,254,255,255 ; jmpq 3a3d <_sk_load_u16_be_hsw+0x31>
+ DB 233,233,254,255,255 ; jmpq 3b01 <_sk_load_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,220,254,255,255 ; jmpq 3a3d <_sk_load_u16_be_hsw+0x31>
+ DB 233,220,254,255,255 ; jmpq 3b01 <_sk_load_u16_be_hsw+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,211,254,255,255 ; jmpq 3a3d <_sk_load_u16_be_hsw+0x31>
+ DB 233,211,254,255,255 ; jmpq 3b01 <_sk_load_u16_be_hsw+0x31>
PUBLIC _sk_load_rgb_u16_be_hsw
_sk_load_rgb_u16_be_hsw LABEL PROC
@@ -3584,7 +3616,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,82 ; lea (%rdx,%rdx,2),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 3c48 <_sk_load_rgb_u16_be_hsw+0xde>
+ DB 15,133,204,0,0,0 ; jne 3d0c <_sk_load_rgb_u16_be_hsw+0xde>
DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -3608,7 +3640,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,166,19,0,0 ; vbroadcastss 0x13a6(%rip),%ymm10 # 4f9c <_sk_callback_hsw+0x438>
+ DB 196,98,125,24,21,166,19,0,0 ; vbroadcastss 0x13a6(%rip),%ymm10 # 5060 <_sk_callback_hsw+0x438>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -3625,48 +3657,48 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,90,19,0,0 ; vbroadcastss 0x135a(%rip),%ymm3 # 4fa0 <_sk_callback_hsw+0x43c>
+ DB 196,226,125,24,29,90,19,0,0 ; vbroadcastss 0x135a(%rip),%ymm3 # 5064 <_sk_callback_hsw+0x43c>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 3c61 <_sk_load_rgb_u16_be_hsw+0xf7>
- DB 233,79,255,255,255 ; jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 117,5 ; jne 3d25 <_sk_load_rgb_u16_be_hsw+0xf7>
+ DB 233,79,255,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46>
DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 3c90 <_sk_load_rgb_u16_be_hsw+0x126>
+ DB 114,26 ; jb 3d54 <_sk_load_rgb_u16_be_hsw+0x126>
DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 3c95 <_sk_load_rgb_u16_be_hsw+0x12b>
- DB 233,32,255,255,255 ; jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
- DB 233,27,255,255,255 ; jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 3d59 <_sk_load_rgb_u16_be_hsw+0x12b>
+ DB 233,32,255,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 233,27,255,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46>
DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 3cc4 <_sk_load_rgb_u16_be_hsw+0x15a>
+ DB 114,26 ; jb 3d88 <_sk_load_rgb_u16_be_hsw+0x15a>
DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 3cc9 <_sk_load_rgb_u16_be_hsw+0x15f>
- DB 233,236,254,255,255 ; jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
- DB 233,231,254,255,255 ; jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 117,10 ; jne 3d8d <_sk_load_rgb_u16_be_hsw+0x15f>
+ DB 233,236,254,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 233,231,254,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46>
DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 3cf2 <_sk_load_rgb_u16_be_hsw+0x188>
+ DB 114,20 ; jb 3db6 <_sk_load_rgb_u16_be_hsw+0x188>
DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,190,254,255,255 ; jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
- DB 233,185,254,255,255 ; jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 233,190,254,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46>
+ DB 233,185,254,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46>
PUBLIC _sk_store_u16_be_hsw
_sk_store_u16_be_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax
- DB 196,98,125,24,5,151,18,0,0 ; vbroadcastss 0x1297(%rip),%ymm8 # 4fa4 <_sk_callback_hsw+0x440>
+ DB 196,98,125,24,5,151,18,0,0 ; vbroadcastss 0x1297(%rip),%ymm8 # 5068 <_sk_callback_hsw+0x440>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -3704,7 +3736,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 3df1 <_sk_store_u16_be_hsw+0xfa>
+ DB 117,31 ; jne 3eb5 <_sk_store_u16_be_hsw+0xfa>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -3713,31 +3745,31 @@ _sk_store_u16_be_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 3ded <_sk_store_u16_be_hsw+0xf6>
+ DB 116,240 ; je 3eb1 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 3ded <_sk_store_u16_be_hsw+0xf6>
+ DB 114,227 ; jb 3eb1 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je 3ded <_sk_store_u16_be_hsw+0xf6>
+ DB 116,218 ; je 3eb1 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 3ded <_sk_store_u16_be_hsw+0xf6>
+ DB 114,205 ; jb 3eb1 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je 3ded <_sk_store_u16_be_hsw+0xf6>
+ DB 116,196 ; je 3eb1 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 3ded <_sk_store_u16_be_hsw+0xf6>
+ DB 114,183 ; jb 3eb1 <_sk_store_u16_be_hsw+0xf6>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp 3ded <_sk_store_u16_be_hsw+0xf6>
+ DB 235,174 ; jmp 3eb1 <_sk_store_u16_be_hsw+0xf6>
PUBLIC _sk_load_f32_hsw
_sk_load_f32_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 119,110 ; ja 3eb5 <_sk_load_f32_hsw+0x76>
+ DB 119,110 ; ja 3f79 <_sk_load_f32_hsw+0x76>
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
- DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # 3ee0 <_sk_load_f32_hsw+0xa1>
+ DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # 3fa4 <_sk_load_f32_hsw+0xa1>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -3796,7 +3828,7 @@ _sk_store_f32_hsw LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne 3f6d <_sk_store_f32_hsw+0x6d>
+ DB 117,55 ; jne 4031 <_sk_store_f32_hsw+0x6d>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -3809,22 +3841,22 @@ _sk_store_f32_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 3f69 <_sk_store_f32_hsw+0x69>
+ DB 116,240 ; je 402d <_sk_store_f32_hsw+0x69>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 3f69 <_sk_store_f32_hsw+0x69>
+ DB 114,227 ; jb 402d <_sk_store_f32_hsw+0x69>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je 3f69 <_sk_store_f32_hsw+0x69>
+ DB 116,218 ; je 402d <_sk_store_f32_hsw+0x69>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 3f69 <_sk_store_f32_hsw+0x69>
+ DB 114,205 ; jb 402d <_sk_store_f32_hsw+0x69>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je 3f69 <_sk_store_f32_hsw+0x69>
+ DB 116,195 ; je 402d <_sk_store_f32_hsw+0x69>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb 3f69 <_sk_store_f32_hsw+0x69>
+ DB 114,181 ; jb 402d <_sk_store_f32_hsw+0x69>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp 3f69 <_sk_store_f32_hsw+0x69>
+ DB 235,171 ; jmp 402d <_sk_store_f32_hsw+0x69>
PUBLIC _sk_clamp_x_hsw
_sk_clamp_x_hsw LABEL PROC
@@ -3887,7 +3919,7 @@ _sk_mirror_x_hsw LABEL PROC
DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8
- DB 197,178,89,5,37,15,0,0 ; vmulss 0xf25(%rip),%xmm9,%xmm0 # 4fa8 <_sk_callback_hsw+0x444>
+ DB 197,178,89,5,37,15,0,0 ; vmulss 0xf25(%rip),%xmm9,%xmm0 # 506c <_sk_callback_hsw+0x444>
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0
@@ -3911,7 +3943,7 @@ _sk_mirror_y_hsw LABEL PROC
DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8
- DB 197,178,89,13,201,14,0,0 ; vmulss 0xec9(%rip),%xmm9,%xmm1 # 4fac <_sk_callback_hsw+0x448>
+ DB 197,178,89,13,201,14,0,0 ; vmulss 0xec9(%rip),%xmm9,%xmm1 # 5070 <_sk_callback_hsw+0x448>
DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1
@@ -3930,7 +3962,7 @@ PUBLIC _sk_clamp_x_1_hsw
_sk_clamp_x_1_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,130,14,0,0 ; vbroadcastss 0xe82(%rip),%ymm8 # 4fb0 <_sk_callback_hsw+0x44c>
+ DB 196,98,125,24,5,130,14,0,0 ; vbroadcastss 0xe82(%rip),%ymm8 # 5074 <_sk_callback_hsw+0x44c>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3944,9 +3976,9 @@ _sk_repeat_x_1_hsw LABEL PROC
PUBLIC _sk_mirror_x_1_hsw
_sk_mirror_x_1_hsw LABEL PROC
- DB 196,98,125,24,5,101,14,0,0 ; vbroadcastss 0xe65(%rip),%ymm8 # 4fb4 <_sk_callback_hsw+0x450>
+ DB 196,98,125,24,5,101,14,0,0 ; vbroadcastss 0xe65(%rip),%ymm8 # 5078 <_sk_callback_hsw+0x450>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,91,14,0,0 ; vbroadcastss 0xe5b(%rip),%ymm9 # 4fb8 <_sk_callback_hsw+0x454>
+ DB 196,98,125,24,13,91,14,0,0 ; vbroadcastss 0xe5b(%rip),%ymm9 # 507c <_sk_callback_hsw+0x454>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -3960,11 +3992,11 @@ _sk_mirror_x_1_hsw LABEL PROC
PUBLIC _sk_luminance_to_alpha_hsw
_sk_luminance_to_alpha_hsw LABEL PROC
- DB 196,226,125,24,29,43,14,0,0 ; vbroadcastss 0xe2b(%rip),%ymm3 # 4fbc <_sk_callback_hsw+0x458>
- DB 196,98,125,24,5,38,14,0,0 ; vbroadcastss 0xe26(%rip),%ymm8 # 4fc0 <_sk_callback_hsw+0x45c>
+ DB 196,226,125,24,29,43,14,0,0 ; vbroadcastss 0xe2b(%rip),%ymm3 # 5080 <_sk_callback_hsw+0x458>
+ DB 196,98,125,24,5,38,14,0,0 ; vbroadcastss 0xe26(%rip),%ymm8 # 5084 <_sk_callback_hsw+0x45c>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1
- DB 196,226,125,24,29,23,14,0,0 ; vbroadcastss 0xe17(%rip),%ymm3 # 4fc4 <_sk_callback_hsw+0x460>
+ DB 196,226,125,24,29,23,14,0,0 ; vbroadcastss 0xe17(%rip),%ymm3 # 5088 <_sk_callback_hsw+0x460>
DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -4126,9 +4158,9 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 77,137,211 ; mov %r10,%r11
DB 73,255,203 ; dec %r11
- DB 120,7 ; js 4466 <_sk_evenly_spaced_gradient_hsw+0x19>
+ DB 120,7 ; js 452a <_sk_evenly_spaced_gradient_hsw+0x19>
DB 196,193,242,42,203 ; vcvtsi2ss %r11,%xmm1,%xmm1
- DB 235,22 ; jmp 447c <_sk_evenly_spaced_gradient_hsw+0x2f>
+ DB 235,22 ; jmp 4540 <_sk_evenly_spaced_gradient_hsw+0x2f>
DB 76,137,219 ; mov %r11,%rbx
DB 72,209,235 ; shr %rbx
DB 65,131,227,1 ; and $0x1,%r11d
@@ -4139,7 +4171,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 197,244,89,200 ; vmulps %ymm0,%ymm1,%ymm1
DB 197,126,91,217 ; vcvttps2dq %ymm1,%ymm11
DB 73,131,250,8 ; cmp $0x8,%r10
- DB 119,70 ; ja 44d5 <_sk_evenly_spaced_gradient_hsw+0x88>
+ DB 119,70 ; ja 4599 <_sk_evenly_spaced_gradient_hsw+0x88>
DB 196,66,37,22,1 ; vpermps (%r9),%ymm11,%ymm8
DB 72,139,88,40 ; mov 0x28(%rax),%rbx
DB 196,98,37,22,11 ; vpermps (%rbx),%ymm11,%ymm9
@@ -4155,7 +4187,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 196,226,37,22,27 ; vpermps (%rbx),%ymm11,%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,98,37,22,40 ; vpermps (%rax),%ymm11,%ymm13
- DB 235,110 ; jmp 4543 <_sk_evenly_spaced_gradient_hsw+0xf6>
+ DB 235,110 ; jmp 4607 <_sk_evenly_spaced_gradient_hsw+0xf6>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,153 ; vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -4190,14 +4222,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_hsw
_sk_gauss_a_to_rgba_hsw LABEL PROC
- DB 196,226,125,24,5,95,10,0,0 ; vbroadcastss 0xa5f(%rip),%ymm0 # 4fc8 <_sk_callback_hsw+0x464>
- DB 196,226,125,24,13,90,10,0,0 ; vbroadcastss 0xa5a(%rip),%ymm1 # 4fcc <_sk_callback_hsw+0x468>
+ DB 196,226,125,24,5,95,10,0,0 ; vbroadcastss 0xa5f(%rip),%ymm0 # 508c <_sk_callback_hsw+0x464>
+ DB 196,226,125,24,13,90,10,0,0 ; vbroadcastss 0xa5a(%rip),%ymm1 # 5090 <_sk_callback_hsw+0x468>
DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,80,10,0,0 ; vbroadcastss 0xa50(%rip),%ymm0 # 4fd0 <_sk_callback_hsw+0x46c>
+ DB 196,226,125,24,5,80,10,0,0 ; vbroadcastss 0xa50(%rip),%ymm0 # 5094 <_sk_callback_hsw+0x46c>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
- DB 196,226,125,24,13,70,10,0,0 ; vbroadcastss 0xa46(%rip),%ymm1 # 4fd4 <_sk_callback_hsw+0x470>
+ DB 196,226,125,24,13,70,10,0,0 ; vbroadcastss 0xa46(%rip),%ymm1 # 5098 <_sk_callback_hsw+0x470>
DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,60,10,0,0 ; vbroadcastss 0xa3c(%rip),%ymm0 # 4fd8 <_sk_callback_hsw+0x474>
+ DB 196,226,125,24,5,60,10,0,0 ; vbroadcastss 0xa3c(%rip),%ymm0 # 509c <_sk_callback_hsw+0x474>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -4210,11 +4242,11 @@ _sk_gradient_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 73,131,249,1 ; cmp $0x1,%r9
- DB 15,134,180,0,0,0 ; jbe 4674 <_sk_gradient_hsw+0xc3>
+ DB 15,134,180,0,0,0 ; jbe 4738 <_sk_gradient_hsw+0xc3>
DB 76,139,80,72 ; mov 0x48(%rax),%r10
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 65,187,1,0,0,0 ; mov $0x1,%r11d
- DB 196,226,125,24,21,5,10,0,0 ; vbroadcastss 0xa05(%rip),%ymm2 # 4fdc <_sk_callback_hsw+0x478>
+ DB 196,226,125,24,21,5,10,0,0 ; vbroadcastss 0xa05(%rip),%ymm2 # 50a0 <_sk_callback_hsw+0x478>
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
DB 196,130,125,24,28,154 ; vbroadcastss (%r10,%r11,4),%ymm3
DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3
@@ -4222,10 +4254,10 @@ _sk_gradient_hsw LABEL PROC
DB 196,65,101,254,201 ; vpaddd %ymm9,%ymm3,%ymm9
DB 73,255,195 ; inc %r11
DB 77,57,217 ; cmp %r11,%r9
- DB 117,226 ; jne 45dc <_sk_gradient_hsw+0x2b>
+ DB 117,226 ; jne 46a0 <_sk_gradient_hsw+0x2b>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 73,131,249,8 ; cmp $0x8,%r9
- DB 118,121 ; jbe 467d <_sk_gradient_hsw+0xcc>
+ DB 118,121 ; jbe 4741 <_sk_gradient_hsw+0xcc>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,138 ; vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -4249,7 +4281,7 @@ _sk_gradient_hsw LABEL PROC
DB 196,130,21,146,28,137 ; vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,34,13,146,44,136 ; vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- DB 235,77 ; jmp 46c1 <_sk_gradient_hsw+0x110>
+ DB 235,77 ; jmp 4785 <_sk_gradient_hsw+0x110>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 196,66,53,22,2 ; vpermps (%r10),%ymm9,%ymm8
@@ -4305,24 +4337,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,132,8,0,0 ; vbroadcastss 0x884(%rip),%ymm13 # 4fe0 <_sk_callback_hsw+0x47c>
- DB 196,98,125,24,53,127,8,0,0 ; vbroadcastss 0x87f(%rip),%ymm14 # 4fe4 <_sk_callback_hsw+0x480>
+ DB 196,98,125,24,45,132,8,0,0 ; vbroadcastss 0x884(%rip),%ymm13 # 50a4 <_sk_callback_hsw+0x47c>
+ DB 196,98,125,24,53,127,8,0,0 ; vbroadcastss 0x87f(%rip),%ymm14 # 50a8 <_sk_callback_hsw+0x480>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
- DB 196,98,125,24,45,117,8,0,0 ; vbroadcastss 0x875(%rip),%ymm13 # 4fe8 <_sk_callback_hsw+0x484>
+ DB 196,98,125,24,45,117,8,0,0 ; vbroadcastss 0x875(%rip),%ymm13 # 50ac <_sk_callback_hsw+0x484>
DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13
- DB 196,98,125,24,53,107,8,0,0 ; vbroadcastss 0x86b(%rip),%ymm14 # 4fec <_sk_callback_hsw+0x488>
+ DB 196,98,125,24,53,107,8,0,0 ; vbroadcastss 0x86b(%rip),%ymm14 # 50b0 <_sk_callback_hsw+0x488>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,86,8,0,0 ; vbroadcastss 0x856(%rip),%ymm10 # 4ff0 <_sk_callback_hsw+0x48c>
+ DB 196,98,125,24,21,86,8,0,0 ; vbroadcastss 0x856(%rip),%ymm10 # 50b4 <_sk_callback_hsw+0x48c>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,64,8,0,0 ; vbroadcastss 0x840(%rip),%ymm10 # 4ff4 <_sk_callback_hsw+0x490>
+ DB 196,98,125,24,21,64,8,0,0 ; vbroadcastss 0x840(%rip),%ymm10 # 50b8 <_sk_callback_hsw+0x490>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,42,8,0,0 ; vbroadcastss 0x82a(%rip),%ymm10 # 4ff8 <_sk_callback_hsw+0x494>
+ DB 196,98,125,24,21,42,8,0,0 ; vbroadcastss 0x82a(%rip),%ymm10 # 50bc <_sk_callback_hsw+0x494>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -4341,7 +4373,7 @@ _sk_xy_to_radius_hsw LABEL PROC
PUBLIC _sk_save_xy_hsw
_sk_save_xy_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,247,7,0,0 ; vbroadcastss 0x7f7(%rip),%ymm8 # 4ffc <_sk_callback_hsw+0x498>
+ DB 196,98,125,24,5,247,7,0,0 ; vbroadcastss 0x7f7(%rip),%ymm8 # 50c0 <_sk_callback_hsw+0x498>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -4371,9 +4403,9 @@ _sk_accumulate_hsw LABEL PROC
PUBLIC _sk_bilinear_nx_hsw
_sk_bilinear_nx_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,139,7,0,0 ; vbroadcastss 0x78b(%rip),%ymm0 # 5000 <_sk_callback_hsw+0x49c>
+ DB 196,226,125,24,5,139,7,0,0 ; vbroadcastss 0x78b(%rip),%ymm0 # 50c4 <_sk_callback_hsw+0x49c>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,130,7,0,0 ; vbroadcastss 0x782(%rip),%ymm8 # 5004 <_sk_callback_hsw+0x4a0>
+ DB 196,98,125,24,5,130,7,0,0 ; vbroadcastss 0x782(%rip),%ymm8 # 50c8 <_sk_callback_hsw+0x4a0>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4382,7 +4414,7 @@ _sk_bilinear_nx_hsw LABEL PROC
PUBLIC _sk_bilinear_px_hsw
_sk_bilinear_px_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,106,7,0,0 ; vbroadcastss 0x76a(%rip),%ymm0 # 5008 <_sk_callback_hsw+0x4a4>
+ DB 196,226,125,24,5,106,7,0,0 ; vbroadcastss 0x76a(%rip),%ymm0 # 50cc <_sk_callback_hsw+0x4a4>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -4392,9 +4424,9 @@ _sk_bilinear_px_hsw LABEL PROC
PUBLIC _sk_bilinear_ny_hsw
_sk_bilinear_ny_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,78,7,0,0 ; vbroadcastss 0x74e(%rip),%ymm1 # 500c <_sk_callback_hsw+0x4a8>
+ DB 196,226,125,24,13,78,7,0,0 ; vbroadcastss 0x74e(%rip),%ymm1 # 50d0 <_sk_callback_hsw+0x4a8>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,68,7,0,0 ; vbroadcastss 0x744(%rip),%ymm8 # 5010 <_sk_callback_hsw+0x4ac>
+ DB 196,98,125,24,5,68,7,0,0 ; vbroadcastss 0x744(%rip),%ymm8 # 50d4 <_sk_callback_hsw+0x4ac>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4403,7 +4435,7 @@ _sk_bilinear_ny_hsw LABEL PROC
PUBLIC _sk_bilinear_py_hsw
_sk_bilinear_py_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,44,7,0,0 ; vbroadcastss 0x72c(%rip),%ymm1 # 5014 <_sk_callback_hsw+0x4b0>
+ DB 196,226,125,24,13,44,7,0,0 ; vbroadcastss 0x72c(%rip),%ymm1 # 50d8 <_sk_callback_hsw+0x4b0>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -4413,13 +4445,13 @@ _sk_bilinear_py_hsw LABEL PROC
PUBLIC _sk_bicubic_n3x_hsw
_sk_bicubic_n3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,15,7,0,0 ; vbroadcastss 0x70f(%rip),%ymm0 # 5018 <_sk_callback_hsw+0x4b4>
+ DB 196,226,125,24,5,15,7,0,0 ; vbroadcastss 0x70f(%rip),%ymm0 # 50dc <_sk_callback_hsw+0x4b4>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,6,7,0,0 ; vbroadcastss 0x706(%rip),%ymm8 # 501c <_sk_callback_hsw+0x4b8>
+ DB 196,98,125,24,5,6,7,0,0 ; vbroadcastss 0x706(%rip),%ymm8 # 50e0 <_sk_callback_hsw+0x4b8>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,247,6,0,0 ; vbroadcastss 0x6f7(%rip),%ymm10 # 5020 <_sk_callback_hsw+0x4bc>
- DB 196,98,125,24,29,242,6,0,0 ; vbroadcastss 0x6f2(%rip),%ymm11 # 5024 <_sk_callback_hsw+0x4c0>
+ DB 196,98,125,24,21,247,6,0,0 ; vbroadcastss 0x6f7(%rip),%ymm10 # 50e4 <_sk_callback_hsw+0x4bc>
+ DB 196,98,125,24,29,242,6,0,0 ; vbroadcastss 0x6f2(%rip),%ymm11 # 50e8 <_sk_callback_hsw+0x4c0>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -4429,16 +4461,16 @@ _sk_bicubic_n3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n1x_hsw
_sk_bicubic_n1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,213,6,0,0 ; vbroadcastss 0x6d5(%rip),%ymm0 # 5028 <_sk_callback_hsw+0x4c4>
+ DB 196,226,125,24,5,213,6,0,0 ; vbroadcastss 0x6d5(%rip),%ymm0 # 50ec <_sk_callback_hsw+0x4c4>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,204,6,0,0 ; vbroadcastss 0x6cc(%rip),%ymm8 # 502c <_sk_callback_hsw+0x4c8>
+ DB 196,98,125,24,5,204,6,0,0 ; vbroadcastss 0x6cc(%rip),%ymm8 # 50f0 <_sk_callback_hsw+0x4c8>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm9 # 5030 <_sk_callback_hsw+0x4cc>
- DB 196,98,125,24,21,189,6,0,0 ; vbroadcastss 0x6bd(%rip),%ymm10 # 5034 <_sk_callback_hsw+0x4d0>
+ DB 196,98,125,24,13,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm9 # 50f4 <_sk_callback_hsw+0x4cc>
+ DB 196,98,125,24,21,189,6,0,0 ; vbroadcastss 0x6bd(%rip),%ymm10 # 50f8 <_sk_callback_hsw+0x4d0>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,179,6,0,0 ; vbroadcastss 0x6b3(%rip),%ymm9 # 5038 <_sk_callback_hsw+0x4d4>
+ DB 196,98,125,24,13,179,6,0,0 ; vbroadcastss 0x6b3(%rip),%ymm9 # 50fc <_sk_callback_hsw+0x4d4>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,169,6,0,0 ; vbroadcastss 0x6a9(%rip),%ymm10 # 503c <_sk_callback_hsw+0x4d8>
+ DB 196,98,125,24,21,169,6,0,0 ; vbroadcastss 0x6a9(%rip),%ymm10 # 5100 <_sk_callback_hsw+0x4d8>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4447,14 +4479,14 @@ _sk_bicubic_n1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p1x_hsw
_sk_bicubic_p1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,145,6,0,0 ; vbroadcastss 0x691(%rip),%ymm8 # 5040 <_sk_callback_hsw+0x4dc>
+ DB 196,98,125,24,5,145,6,0,0 ; vbroadcastss 0x691(%rip),%ymm8 # 5104 <_sk_callback_hsw+0x4dc>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,131,6,0,0 ; vbroadcastss 0x683(%rip),%ymm10 # 5044 <_sk_callback_hsw+0x4e0>
- DB 196,98,125,24,29,126,6,0,0 ; vbroadcastss 0x67e(%rip),%ymm11 # 5048 <_sk_callback_hsw+0x4e4>
+ DB 196,98,125,24,21,131,6,0,0 ; vbroadcastss 0x683(%rip),%ymm10 # 5108 <_sk_callback_hsw+0x4e0>
+ DB 196,98,125,24,29,126,6,0,0 ; vbroadcastss 0x67e(%rip),%ymm11 # 510c <_sk_callback_hsw+0x4e4>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,111,6,0,0 ; vbroadcastss 0x66f(%rip),%ymm8 # 504c <_sk_callback_hsw+0x4e8>
+ DB 196,98,125,24,5,111,6,0,0 ; vbroadcastss 0x66f(%rip),%ymm8 # 5110 <_sk_callback_hsw+0x4e8>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4463,12 +4495,12 @@ _sk_bicubic_p1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p3x_hsw
_sk_bicubic_p3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,87,6,0,0 ; vbroadcastss 0x657(%rip),%ymm0 # 5050 <_sk_callback_hsw+0x4ec>
+ DB 196,226,125,24,5,87,6,0,0 ; vbroadcastss 0x657(%rip),%ymm0 # 5114 <_sk_callback_hsw+0x4ec>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,68,6,0,0 ; vbroadcastss 0x644(%rip),%ymm10 # 5054 <_sk_callback_hsw+0x4f0>
- DB 196,98,125,24,29,63,6,0,0 ; vbroadcastss 0x63f(%rip),%ymm11 # 5058 <_sk_callback_hsw+0x4f4>
+ DB 196,98,125,24,21,68,6,0,0 ; vbroadcastss 0x644(%rip),%ymm10 # 5118 <_sk_callback_hsw+0x4f0>
+ DB 196,98,125,24,29,63,6,0,0 ; vbroadcastss 0x63f(%rip),%ymm11 # 511c <_sk_callback_hsw+0x4f4>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -4478,13 +4510,13 @@ _sk_bicubic_p3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n3y_hsw
_sk_bicubic_n3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,34,6,0,0 ; vbroadcastss 0x622(%rip),%ymm1 # 505c <_sk_callback_hsw+0x4f8>
+ DB 196,226,125,24,13,34,6,0,0 ; vbroadcastss 0x622(%rip),%ymm1 # 5120 <_sk_callback_hsw+0x4f8>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,24,6,0,0 ; vbroadcastss 0x618(%rip),%ymm8 # 5060 <_sk_callback_hsw+0x4fc>
+ DB 196,98,125,24,5,24,6,0,0 ; vbroadcastss 0x618(%rip),%ymm8 # 5124 <_sk_callback_hsw+0x4fc>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,9,6,0,0 ; vbroadcastss 0x609(%rip),%ymm10 # 5064 <_sk_callback_hsw+0x500>
- DB 196,98,125,24,29,4,6,0,0 ; vbroadcastss 0x604(%rip),%ymm11 # 5068 <_sk_callback_hsw+0x504>
+ DB 196,98,125,24,21,9,6,0,0 ; vbroadcastss 0x609(%rip),%ymm10 # 5128 <_sk_callback_hsw+0x500>
+ DB 196,98,125,24,29,4,6,0,0 ; vbroadcastss 0x604(%rip),%ymm11 # 512c <_sk_callback_hsw+0x504>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -4494,16 +4526,16 @@ _sk_bicubic_n3y_hsw LABEL PROC
PUBLIC _sk_bicubic_n1y_hsw
_sk_bicubic_n1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,231,5,0,0 ; vbroadcastss 0x5e7(%rip),%ymm1 # 506c <_sk_callback_hsw+0x508>
+ DB 196,226,125,24,13,231,5,0,0 ; vbroadcastss 0x5e7(%rip),%ymm1 # 5130 <_sk_callback_hsw+0x508>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,221,5,0,0 ; vbroadcastss 0x5dd(%rip),%ymm8 # 5070 <_sk_callback_hsw+0x50c>
+ DB 196,98,125,24,5,221,5,0,0 ; vbroadcastss 0x5dd(%rip),%ymm8 # 5134 <_sk_callback_hsw+0x50c>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,211,5,0,0 ; vbroadcastss 0x5d3(%rip),%ymm9 # 5074 <_sk_callback_hsw+0x510>
- DB 196,98,125,24,21,206,5,0,0 ; vbroadcastss 0x5ce(%rip),%ymm10 # 5078 <_sk_callback_hsw+0x514>
+ DB 196,98,125,24,13,211,5,0,0 ; vbroadcastss 0x5d3(%rip),%ymm9 # 5138 <_sk_callback_hsw+0x510>
+ DB 196,98,125,24,21,206,5,0,0 ; vbroadcastss 0x5ce(%rip),%ymm10 # 513c <_sk_callback_hsw+0x514>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,196,5,0,0 ; vbroadcastss 0x5c4(%rip),%ymm9 # 507c <_sk_callback_hsw+0x518>
+ DB 196,98,125,24,13,196,5,0,0 ; vbroadcastss 0x5c4(%rip),%ymm9 # 5140 <_sk_callback_hsw+0x518>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,186,5,0,0 ; vbroadcastss 0x5ba(%rip),%ymm10 # 5080 <_sk_callback_hsw+0x51c>
+ DB 196,98,125,24,21,186,5,0,0 ; vbroadcastss 0x5ba(%rip),%ymm10 # 5144 <_sk_callback_hsw+0x51c>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4512,14 +4544,14 @@ _sk_bicubic_n1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p1y_hsw
_sk_bicubic_p1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,162,5,0,0 ; vbroadcastss 0x5a2(%rip),%ymm8 # 5084 <_sk_callback_hsw+0x520>
+ DB 196,98,125,24,5,162,5,0,0 ; vbroadcastss 0x5a2(%rip),%ymm8 # 5148 <_sk_callback_hsw+0x520>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,147,5,0,0 ; vbroadcastss 0x593(%rip),%ymm10 # 5088 <_sk_callback_hsw+0x524>
- DB 196,98,125,24,29,142,5,0,0 ; vbroadcastss 0x58e(%rip),%ymm11 # 508c <_sk_callback_hsw+0x528>
+ DB 196,98,125,24,21,147,5,0,0 ; vbroadcastss 0x593(%rip),%ymm10 # 514c <_sk_callback_hsw+0x524>
+ DB 196,98,125,24,29,142,5,0,0 ; vbroadcastss 0x58e(%rip),%ymm11 # 5150 <_sk_callback_hsw+0x528>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,127,5,0,0 ; vbroadcastss 0x57f(%rip),%ymm8 # 5090 <_sk_callback_hsw+0x52c>
+ DB 196,98,125,24,5,127,5,0,0 ; vbroadcastss 0x57f(%rip),%ymm8 # 5154 <_sk_callback_hsw+0x52c>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -4528,12 +4560,12 @@ _sk_bicubic_p1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p3y_hsw
_sk_bicubic_p3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,103,5,0,0 ; vbroadcastss 0x567(%rip),%ymm1 # 5094 <_sk_callback_hsw+0x530>
+ DB 196,226,125,24,13,103,5,0,0 ; vbroadcastss 0x567(%rip),%ymm1 # 5158 <_sk_callback_hsw+0x530>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,83,5,0,0 ; vbroadcastss 0x553(%rip),%ymm10 # 5098 <_sk_callback_hsw+0x534>
- DB 196,98,125,24,29,78,5,0,0 ; vbroadcastss 0x54e(%rip),%ymm11 # 509c <_sk_callback_hsw+0x538>
+ DB 196,98,125,24,21,83,5,0,0 ; vbroadcastss 0x553(%rip),%ymm10 # 515c <_sk_callback_hsw+0x534>
+ DB 196,98,125,24,29,78,5,0,0 ; vbroadcastss 0x54e(%rip),%ymm11 # 5160 <_sk_callback_hsw+0x538>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -4655,25 +4687,25 @@ ALIGN 4
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 4d41 <.literal4+0xb1>
+ DB 71,225,61 ; rex.RXB loope 4e05 <.literal4+0xb1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 4d51 <.literal4+0xc1>
+ DB 71,225,61 ; rex.RXB loope 4e15 <.literal4+0xc1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 4d61 <.literal4+0xd1>
+ DB 71,225,61 ; rex.RXB loope 4e25 <.literal4+0xd1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 4d71 <.literal4+0xe1>
+ DB 71,225,61 ; rex.RXB loope 4e35 <.literal4+0xe1>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
@@ -4723,7 +4755,7 @@ ALIGN 4
DB 190,129,128,128,59 ; mov $0x3b808081,%esi
DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 4dc9 <.literal4+0x139>
+ DB 224,7 ; loopne 4e8d <.literal4+0x139>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -4739,10 +4771,10 @@ ALIGN 4
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 4df0 <.literal4+0x160>
+ DB 127,0 ; jg 4eb4 <.literal4+0x160>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4e69 <.literal4+0x1d9>
+ DB 119,115 ; ja 4f2d <.literal4+0x1d9>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -4756,10 +4788,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4e24 <.literal4+0x194>
+ DB 127,0 ; jg 4ee8 <.literal4+0x194>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4e9d <.literal4+0x20d>
+ DB 119,115 ; ja 4f61 <.literal4+0x20d>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -4773,10 +4805,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4e58 <.literal4+0x1c8>
+ DB 127,0 ; jg 4f1c <.literal4+0x1c8>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4ed1 <.literal4+0x241>
+ DB 119,115 ; ja 4f95 <.literal4+0x241>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -4790,10 +4822,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 4e8c <.literal4+0x1fc>
+ DB 127,0 ; jg 4f50 <.literal4+0x1fc>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 4f05 <.literal4+0x275>
+ DB 119,115 ; ja 4fc9 <.literal4+0x275>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -4806,7 +4838,7 @@ ALIGN 4
DB 0,75,0 ; add %cl,0x0(%rbx)
DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax)
DB 66,0,0 ; rex.X add %al,(%rax)
- DB 127,67 ; jg 4f03 <.literal4+0x273>
+ DB 127,67 ; jg 4fc7 <.literal4+0x273>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -4818,10 +4850,10 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 4f23 <.literal4+0x293>
+ DB 118,63 ; jbe 4fe7 <.literal4+0x293>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
- DB 127,67 ; jg 4f37 <.literal4+0x2a7>
+ DB 127,67 ; jg 4ffb <.literal4+0x2a7>
DB 129,128,128,59,0,0,128,63,129,128 ; addl $0x80813f80,0x3b80(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,128,63,129,128,128 ; add %al,-0x7f7f7ec1(%rax)
@@ -4830,7 +4862,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 4f19 <.literal4+0x289>
+ DB 224,7 ; loopne 4fdd <.literal4+0x289>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -4842,7 +4874,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 4f35 <.literal4+0x2a5>
+ DB 224,7 ; loopne 4ff9 <.literal4+0x2a5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -4853,7 +4885,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 4f8a <.literal4+0x2fa>
+ DB 124,66 ; jl 504e <.literal4+0x2fa>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -4871,9 +4903,9 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 4fcd <.literal4+0x33d>
+ DB 112,65 ; jo 5091 <.literal4+0x33d>
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
- DB 127,67 ; jg 4fdb <.literal4+0x34b>
+ DB 127,67 ; jg 509f <.literal4+0x34b>
DB 128,0,128 ; addb $0x80,(%rax)
DB 55 ; (bad)
DB 128,0,128 ; addb $0x80,(%rax)
@@ -4881,7 +4913,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 4fef <.literal4+0x35f>
+ DB 127,71 ; jg 50b3 <.literal4+0x35f>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -4993,16 +5025,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0050c8 <_sk_callback_hsw+0xa000564>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0051a8 <_sk_callback_hsw+0xa000580>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120050d0 <_sk_callback_hsw+0x1200056c>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120051b0 <_sk_callback_hsw+0x12000588>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0050d8 <_sk_callback_hsw+0x1a000574>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0051b8 <_sk_callback_hsw+0x1a000590>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30050e0 <_sk_callback_hsw+0x300057c>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30051c0 <_sk_callback_hsw+0x3000598>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -5045,16 +5077,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005128 <_sk_callback_hsw+0xa0005c4>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005208 <_sk_callback_hsw+0xa0005e0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005130 <_sk_callback_hsw+0x120005cc>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005210 <_sk_callback_hsw+0x120005e8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005138 <_sk_callback_hsw+0x1a0005d4>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005218 <_sk_callback_hsw+0x1a0005f0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005140 <_sk_callback_hsw+0x30005dc>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005220 <_sk_callback_hsw+0x30005f8>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -5097,16 +5129,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005188 <_sk_callback_hsw+0xa000624>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005268 <_sk_callback_hsw+0xa000640>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005190 <_sk_callback_hsw+0x1200062c>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005270 <_sk_callback_hsw+0x12000648>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005198 <_sk_callback_hsw+0x1a000634>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005278 <_sk_callback_hsw+0x1a000650>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30051a0 <_sk_callback_hsw+0x300063c>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005280 <_sk_callback_hsw+0x3000658>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -5149,16 +5181,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0051e8 <_sk_callback_hsw+0xa000684>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0052c8 <_sk_callback_hsw+0xa0006a0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120051f0 <_sk_callback_hsw+0x1200068c>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120052d0 <_sk_callback_hsw+0x120006a8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0051f8 <_sk_callback_hsw+0x1a000694>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0052d8 <_sk_callback_hsw+0x1a0006b0>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005200 <_sk_callback_hsw+0x300069c>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30052e0 <_sk_callback_hsw+0x30006b8>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -5201,16 +5233,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005248 <_sk_callback_hsw+0xa0006e4>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005328 <_sk_callback_hsw+0xa000700>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005250 <_sk_callback_hsw+0x120006ec>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005330 <_sk_callback_hsw+0x12000708>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005258 <_sk_callback_hsw+0x1a0006f4>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005338 <_sk_callback_hsw+0x1a000710>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005260 <_sk_callback_hsw+0x30006fc>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005340 <_sk_callback_hsw+0x3000718>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -5277,6 +5309,22 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
+ DB 0,2 ; add %al,(%rdx)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,2 ; add %al,(%rdx)
+ DB 4,6 ; add $0x6,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
@@ -5388,7 +5436,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,119,103,0,0 ; vbroadcastss 0x6777(%rip),%ymm1 # 68f0 <_sk_callback_avx+0x12a>
+ DB 196,226,125,24,13,55,104,0,0 ; vbroadcastss 0x6837(%rip),%ymm1 # 69b0 <_sk_callback_avx+0x12a>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -5397,7 +5445,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,81,103,0,0 ; vbroadcastss 0x6751(%rip),%ymm2 # 68f4 <_sk_callback_avx+0x12e>
+ DB 196,226,125,24,21,17,104,0,0 ; vbroadcastss 0x6811(%rip),%ymm2 # 69b4 <_sk_callback_avx+0x12e>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -5419,7 +5467,7 @@ _sk_dither_avx LABEL PROC
DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,250,102,0,0 ; vbroadcastss 0x66fa(%rip),%ymm11 # 68f8 <_sk_callback_avx+0x132>
+ DB 196,98,125,24,29,186,103,0,0 ; vbroadcastss 0x67ba(%rip),%ymm11 # 69b8 <_sk_callback_avx+0x132>
DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9
DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
@@ -5430,8 +5478,8 @@ _sk_dither_avx LABEL PROC
DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11
DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11
DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- DB 196,98,125,24,37,187,102,0,0 ; vbroadcastss 0x66bb(%rip),%ymm12 # 68fc <_sk_callback_avx+0x136>
- DB 196,98,125,24,45,182,102,0,0 ; vbroadcastss 0x66b6(%rip),%ymm13 # 6900 <_sk_callback_avx+0x13a>
+ DB 196,98,125,24,37,123,103,0,0 ; vbroadcastss 0x677b(%rip),%ymm12 # 69bc <_sk_callback_avx+0x136>
+ DB 196,98,125,24,45,118,103,0,0 ; vbroadcastss 0x6776(%rip),%ymm13 # 69c0 <_sk_callback_avx+0x13a>
DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14
DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15
DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14
@@ -5458,9 +5506,9 @@ _sk_dither_avx LABEL PROC
DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8
DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,33,102,0,0 ; vbroadcastss 0x6621(%rip),%ymm9 # 6904 <_sk_callback_avx+0x13e>
+ DB 196,98,125,24,13,225,102,0,0 ; vbroadcastss 0x66e1(%rip),%ymm9 # 69c4 <_sk_callback_avx+0x13e>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,23,102,0,0 ; vbroadcastss 0x6617(%rip),%ymm9 # 6908 <_sk_callback_avx+0x142>
+ DB 196,98,125,24,13,215,102,0,0 ; vbroadcastss 0x66d7(%rip),%ymm9 # 69c8 <_sk_callback_avx+0x142>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
@@ -5519,7 +5567,7 @@ _sk_clear_avx LABEL PROC
PUBLIC _sk_srcatop_avx
_sk_srcatop_avx LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,111,101,0,0 ; vbroadcastss 0x656f(%rip),%ymm8 # 690c <_sk_callback_avx+0x146>
+ DB 196,98,125,24,5,47,102,0,0 ; vbroadcastss 0x662f(%rip),%ymm8 # 69cc <_sk_callback_avx+0x146>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -5538,7 +5586,7 @@ _sk_srcatop_avx LABEL PROC
PUBLIC _sk_dstatop_avx
_sk_dstatop_avx LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
- DB 196,98,125,24,13,49,101,0,0 ; vbroadcastss 0x6531(%rip),%ymm9 # 6910 <_sk_callback_avx+0x14a>
+ DB 196,98,125,24,13,241,101,0,0 ; vbroadcastss 0x65f1(%rip),%ymm9 # 69d0 <_sk_callback_avx+0x14a>
DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
@@ -5574,7 +5622,7 @@ _sk_dstin_avx LABEL PROC
PUBLIC _sk_srcout_avx
_sk_srcout_avx LABEL PROC
- DB 196,98,125,24,5,208,100,0,0 ; vbroadcastss 0x64d0(%rip),%ymm8 # 6914 <_sk_callback_avx+0x14e>
+ DB 196,98,125,24,5,144,101,0,0 ; vbroadcastss 0x6590(%rip),%ymm8 # 69d4 <_sk_callback_avx+0x14e>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -5585,7 +5633,7 @@ _sk_srcout_avx LABEL PROC
PUBLIC _sk_dstout_avx
_sk_dstout_avx LABEL PROC
- DB 196,226,125,24,5,179,100,0,0 ; vbroadcastss 0x64b3(%rip),%ymm0 # 6918 <_sk_callback_avx+0x152>
+ DB 196,226,125,24,5,115,101,0,0 ; vbroadcastss 0x6573(%rip),%ymm0 # 69d8 <_sk_callback_avx+0x152>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -5596,7 +5644,7 @@ _sk_dstout_avx LABEL PROC
PUBLIC _sk_srcover_avx
_sk_srcover_avx LABEL PROC
- DB 196,98,125,24,5,150,100,0,0 ; vbroadcastss 0x6496(%rip),%ymm8 # 691c <_sk_callback_avx+0x156>
+ DB 196,98,125,24,5,86,101,0,0 ; vbroadcastss 0x6556(%rip),%ymm8 # 69dc <_sk_callback_avx+0x156>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -5611,7 +5659,7 @@ _sk_srcover_avx LABEL PROC
PUBLIC _sk_dstover_avx
_sk_dstover_avx LABEL PROC
- DB 196,98,125,24,5,105,100,0,0 ; vbroadcastss 0x6469(%rip),%ymm8 # 6920 <_sk_callback_avx+0x15a>
+ DB 196,98,125,24,5,41,101,0,0 ; vbroadcastss 0x6529(%rip),%ymm8 # 69e0 <_sk_callback_avx+0x15a>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -5635,7 +5683,7 @@ _sk_modulate_avx LABEL PROC
PUBLIC _sk_multiply_avx
_sk_multiply_avx LABEL PROC
- DB 196,98,125,24,5,40,100,0,0 ; vbroadcastss 0x6428(%rip),%ymm8 # 6924 <_sk_callback_avx+0x15e>
+ DB 196,98,125,24,5,232,100,0,0 ; vbroadcastss 0x64e8(%rip),%ymm8 # 69e4 <_sk_callback_avx+0x15e>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -5689,7 +5737,7 @@ _sk_screen_avx LABEL PROC
PUBLIC _sk_xor__avx
_sk_xor__avx LABEL PROC
- DB 196,98,125,24,5,119,99,0,0 ; vbroadcastss 0x6377(%rip),%ymm8 # 6928 <_sk_callback_avx+0x162>
+ DB 196,98,125,24,5,55,100,0,0 ; vbroadcastss 0x6437(%rip),%ymm8 # 69e8 <_sk_callback_avx+0x162>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -5724,7 +5772,7 @@ _sk_darken_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,247,98,0,0 ; vbroadcastss 0x62f7(%rip),%ymm8 # 692c <_sk_callback_avx+0x166>
+ DB 196,98,125,24,5,183,99,0,0 ; vbroadcastss 0x63b7(%rip),%ymm8 # 69ec <_sk_callback_avx+0x166>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -5748,7 +5796,7 @@ _sk_lighten_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,163,98,0,0 ; vbroadcastss 0x62a3(%rip),%ymm8 # 6930 <_sk_callback_avx+0x16a>
+ DB 196,98,125,24,5,99,99,0,0 ; vbroadcastss 0x6363(%rip),%ymm8 # 69f0 <_sk_callback_avx+0x16a>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -5775,7 +5823,7 @@ _sk_difference_avx LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,67,98,0,0 ; vbroadcastss 0x6243(%rip),%ymm8 # 6934 <_sk_callback_avx+0x16e>
+ DB 196,98,125,24,5,3,99,0,0 ; vbroadcastss 0x6303(%rip),%ymm8 # 69f4 <_sk_callback_avx+0x16e>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -5796,7 +5844,7 @@ _sk_exclusion_avx LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,254,97,0,0 ; vbroadcastss 0x61fe(%rip),%ymm8 # 6938 <_sk_callback_avx+0x172>
+ DB 196,98,125,24,5,190,98,0,0 ; vbroadcastss 0x62be(%rip),%ymm8 # 69f8 <_sk_callback_avx+0x172>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -5805,7 +5853,7 @@ _sk_exclusion_avx LABEL PROC
PUBLIC _sk_colorburn_avx
_sk_colorburn_avx LABEL PROC
- DB 196,98,125,24,5,233,97,0,0 ; vbroadcastss 0x61e9(%rip),%ymm8 # 693c <_sk_callback_avx+0x176>
+ DB 196,98,125,24,5,169,98,0,0 ; vbroadcastss 0x62a9(%rip),%ymm8 # 69fc <_sk_callback_avx+0x176>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -5865,7 +5913,7 @@ _sk_colorburn_avx LABEL PROC
PUBLIC _sk_colordodge_avx
_sk_colordodge_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,229,96,0,0 ; vbroadcastss 0x60e5(%rip),%ymm9 # 6940 <_sk_callback_avx+0x17a>
+ DB 196,98,125,24,13,165,97,0,0 ; vbroadcastss 0x61a5(%rip),%ymm9 # 6a00 <_sk_callback_avx+0x17a>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -5920,7 +5968,7 @@ _sk_colordodge_avx LABEL PROC
PUBLIC _sk_hardlight_avx
_sk_hardlight_avx LABEL PROC
- DB 196,98,125,24,5,247,95,0,0 ; vbroadcastss 0x5ff7(%rip),%ymm8 # 6944 <_sk_callback_avx+0x17e>
+ DB 196,98,125,24,5,183,96,0,0 ; vbroadcastss 0x60b7(%rip),%ymm8 # 6a04 <_sk_callback_avx+0x17e>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -5973,7 +6021,7 @@ _sk_hardlight_avx LABEL PROC
PUBLIC _sk_overlay_avx
_sk_overlay_avx LABEL PROC
- DB 196,98,125,24,5,32,95,0,0 ; vbroadcastss 0x5f20(%rip),%ymm8 # 6948 <_sk_callback_avx+0x182>
+ DB 196,98,125,24,5,224,95,0,0 ; vbroadcastss 0x5fe0(%rip),%ymm8 # 6a08 <_sk_callback_avx+0x182>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -6038,10 +6086,10 @@ _sk_softlight_avx LABEL PROC
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,29,19,94,0,0 ; vbroadcastss 0x5e13(%rip),%ymm11 # 6950 <_sk_callback_avx+0x18a>
+ DB 196,98,125,24,29,211,94,0,0 ; vbroadcastss 0x5ed3(%rip),%ymm11 # 6a10 <_sk_callback_avx+0x18a>
DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13
DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8
- DB 196,98,125,24,45,4,94,0,0 ; vbroadcastss 0x5e04(%rip),%ymm13 # 6954 <_sk_callback_avx+0x18e>
+ DB 196,98,125,24,45,196,94,0,0 ; vbroadcastss 0x5ec4(%rip),%ymm13 # 6a14 <_sk_callback_avx+0x18e>
DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14
DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8
DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14
@@ -6052,7 +6100,7 @@ _sk_softlight_avx LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,194,93,0,0 ; vbroadcastss 0x5dc2(%rip),%ymm8 # 694c <_sk_callback_avx+0x186>
+ DB 196,98,125,24,5,130,94,0,0 ; vbroadcastss 0x5e82(%rip),%ymm8 # 6a0c <_sk_callback_avx+0x186>
DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
@@ -6179,12 +6227,12 @@ _sk_hue_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,140,91,0,0 ; vbroadcastss 0x5b8c(%rip),%ymm14 # 6958 <_sk_callback_avx+0x192>
+ DB 196,98,125,24,53,76,92,0,0 ; vbroadcastss 0x5c4c(%rip),%ymm14 # 6a18 <_sk_callback_avx+0x192>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,130,91,0,0 ; vbroadcastss 0x5b82(%rip),%ymm15 # 695c <_sk_callback_avx+0x196>
+ DB 196,98,125,24,61,66,92,0,0 ; vbroadcastss 0x5c42(%rip),%ymm15 # 6a1c <_sk_callback_avx+0x196>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,115,91,0,0 ; vbroadcastss 0x5b73(%rip),%ymm0 # 6960 <_sk_callback_avx+0x19a>
+ DB 196,226,125,24,5,51,92,0,0 ; vbroadcastss 0x5c33(%rip),%ymm0 # 6a20 <_sk_callback_avx+0x19a>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -6245,7 +6293,7 @@ _sk_hue_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,76,90,0,0 ; vbroadcastss 0x5a4c(%rip),%ymm8 # 6964 <_sk_callback_avx+0x19e>
+ DB 196,98,125,24,5,12,91,0,0 ; vbroadcastss 0x5b0c(%rip),%ymm8 # 6a24 <_sk_callback_avx+0x19e>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -6302,12 +6350,12 @@ _sk_saturation_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,84,89,0,0 ; vbroadcastss 0x5954(%rip),%ymm14 # 6968 <_sk_callback_avx+0x1a2>
+ DB 196,98,125,24,53,20,90,0,0 ; vbroadcastss 0x5a14(%rip),%ymm14 # 6a28 <_sk_callback_avx+0x1a2>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,74,89,0,0 ; vbroadcastss 0x594a(%rip),%ymm15 # 696c <_sk_callback_avx+0x1a6>
+ DB 196,98,125,24,61,10,90,0,0 ; vbroadcastss 0x5a0a(%rip),%ymm15 # 6a2c <_sk_callback_avx+0x1a6>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,59,89,0,0 ; vbroadcastss 0x593b(%rip),%ymm0 # 6970 <_sk_callback_avx+0x1aa>
+ DB 196,226,125,24,5,251,89,0,0 ; vbroadcastss 0x59fb(%rip),%ymm0 # 6a30 <_sk_callback_avx+0x1aa>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -6368,7 +6416,7 @@ _sk_saturation_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,20,88,0,0 ; vbroadcastss 0x5814(%rip),%ymm8 # 6974 <_sk_callback_avx+0x1ae>
+ DB 196,98,125,24,5,212,88,0,0 ; vbroadcastss 0x58d4(%rip),%ymm8 # 6a34 <_sk_callback_avx+0x1ae>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -6397,12 +6445,12 @@ _sk_color_avx LABEL PROC
DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8
DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9
- DB 196,98,125,24,45,164,87,0,0 ; vbroadcastss 0x57a4(%rip),%ymm13 # 6978 <_sk_callback_avx+0x1b2>
+ DB 196,98,125,24,45,100,88,0,0 ; vbroadcastss 0x5864(%rip),%ymm13 # 6a38 <_sk_callback_avx+0x1b2>
DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10
- DB 196,98,125,24,53,154,87,0,0 ; vbroadcastss 0x579a(%rip),%ymm14 # 697c <_sk_callback_avx+0x1b6>
+ DB 196,98,125,24,53,90,88,0,0 ; vbroadcastss 0x585a(%rip),%ymm14 # 6a3c <_sk_callback_avx+0x1b6>
DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,139,87,0,0 ; vbroadcastss 0x578b(%rip),%ymm15 # 6980 <_sk_callback_avx+0x1ba>
+ DB 196,98,125,24,61,75,88,0,0 ; vbroadcastss 0x584b(%rip),%ymm15 # 6a40 <_sk_callback_avx+0x1ba>
DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -6465,7 +6513,7 @@ _sk_color_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,82,86,0,0 ; vbroadcastss 0x5652(%rip),%ymm0 # 6984 <_sk_callback_avx+0x1be>
+ DB 196,226,125,24,5,18,87,0,0 ; vbroadcastss 0x5712(%rip),%ymm0 # 6a44 <_sk_callback_avx+0x1be>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -6495,12 +6543,12 @@ _sk_luminosity_avx LABEL PROC
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9
- DB 196,98,125,24,45,222,85,0,0 ; vbroadcastss 0x55de(%rip),%ymm13 # 6988 <_sk_callback_avx+0x1c2>
+ DB 196,98,125,24,45,158,86,0,0 ; vbroadcastss 0x569e(%rip),%ymm13 # 6a48 <_sk_callback_avx+0x1c2>
DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10
- DB 196,98,125,24,53,212,85,0,0 ; vbroadcastss 0x55d4(%rip),%ymm14 # 698c <_sk_callback_avx+0x1c6>
+ DB 196,98,125,24,53,148,86,0,0 ; vbroadcastss 0x5694(%rip),%ymm14 # 6a4c <_sk_callback_avx+0x1c6>
DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,197,85,0,0 ; vbroadcastss 0x55c5(%rip),%ymm15 # 6990 <_sk_callback_avx+0x1ca>
+ DB 196,98,125,24,61,133,86,0,0 ; vbroadcastss 0x5685(%rip),%ymm15 # 6a50 <_sk_callback_avx+0x1ca>
DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -6563,7 +6611,7 @@ _sk_luminosity_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,140,84,0,0 ; vbroadcastss 0x548c(%rip),%ymm0 # 6994 <_sk_callback_avx+0x1ce>
+ DB 196,226,125,24,5,76,85,0,0 ; vbroadcastss 0x554c(%rip),%ymm0 # 6a54 <_sk_callback_avx+0x1ce>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -6594,7 +6642,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,47,1,0,0 ; jne 16a2 <_sk_srcover_rgba_8888_avx+0x14c>
DB 196,193,124,16,58 ; vmovups (%r10),%ymm7
- DB 197,124,40,13,160,88,0,0 ; vmovaps 0x58a0(%rip),%ymm9 # 6e20 <_sk_callback_avx+0x65a>
+ DB 197,124,40,13,128,89,0,0 ; vmovaps 0x5980(%rip),%ymm9 # 6f00 <_sk_callback_avx+0x67a>
DB 196,193,68,84,225 ; vandps %ymm9,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5
@@ -6612,9 +6660,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7
DB 196,227,53,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,183,83,0,0 ; vbroadcastss 0x53b7(%rip),%ymm8 # 6998 <_sk_callback_avx+0x1d2>
+ DB 196,98,125,24,5,119,84,0,0 ; vbroadcastss 0x5477(%rip),%ymm8 # 6a58 <_sk_callback_avx+0x1d2>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,174,83,0,0 ; vbroadcastss 0x53ae(%rip),%ymm9 # 699c <_sk_callback_avx+0x1d6>
+ DB 196,98,125,24,13,110,84,0,0 ; vbroadcastss 0x546e(%rip),%ymm9 # 6a5c <_sk_callback_avx+0x1d6>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
@@ -6660,9 +6708,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 72,211,232 ; shr %cl,%rax
DB 196,225,249,110,224 ; vmovq %rax,%xmm4
DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4
- DB 196,226,89,0,45,102,86,0,0 ; vpshufb 0x5666(%rip),%xmm4,%xmm5 # 6d30 <_sk_callback_avx+0x56a>
+ DB 196,226,89,0,45,38,87,0,0 ; vpshufb 0x5726(%rip),%xmm4,%xmm5 # 6df0 <_sk_callback_avx+0x56a>
DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5
- DB 196,226,89,0,37,104,86,0,0 ; vpshufb 0x5668(%rip),%xmm4,%xmm4 # 6d40 <_sk_callback_avx+0x57a>
+ DB 196,226,89,0,37,40,87,0,0 ; vpshufb 0x5728(%rip),%xmm4,%xmm4 # 6e00 <_sk_callback_avx+0x57a>
DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4
DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4
DB 196,194,93,44,58 ; vmaskmovps (%r10),%ymm4,%ymm7
@@ -6674,9 +6722,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 72,211,232 ; shr %cl,%rax
DB 196,97,249,110,200 ; vmovq %rax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
- DB 196,98,49,0,21,27,86,0,0 ; vpshufb 0x561b(%rip),%xmm9,%xmm10 # 6d30 <_sk_callback_avx+0x56a>
+ DB 196,98,49,0,21,219,86,0,0 ; vpshufb 0x56db(%rip),%xmm9,%xmm10 # 6df0 <_sk_callback_avx+0x56a>
DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10
- DB 196,98,49,0,13,29,86,0,0 ; vpshufb 0x561d(%rip),%xmm9,%xmm9 # 6d40 <_sk_callback_avx+0x57a>
+ DB 196,98,49,0,13,221,86,0,0 ; vpshufb 0x56dd(%rip),%xmm9,%xmm9 # 6e00 <_sk_callback_avx+0x57a>
DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10)
@@ -6694,7 +6742,7 @@ _sk_clamp_0_avx LABEL PROC
PUBLIC _sk_clamp_1_avx
_sk_clamp_1_avx LABEL PROC
- DB 196,98,125,24,5,66,82,0,0 ; vbroadcastss 0x5242(%rip),%ymm8 # 69a0 <_sk_callback_avx+0x1da>
+ DB 196,98,125,24,5,2,83,0,0 ; vbroadcastss 0x5302(%rip),%ymm8 # 6a60 <_sk_callback_avx+0x1da>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -6704,7 +6752,7 @@ _sk_clamp_1_avx LABEL PROC
PUBLIC _sk_clamp_a_avx
_sk_clamp_a_avx LABEL PROC
- DB 196,98,125,24,5,37,82,0,0 ; vbroadcastss 0x5225(%rip),%ymm8 # 69a4 <_sk_callback_avx+0x1de>
+ DB 196,98,125,24,5,229,82,0,0 ; vbroadcastss 0x52e5(%rip),%ymm8 # 6a64 <_sk_callback_avx+0x1de>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -6776,7 +6824,7 @@ PUBLIC _sk_unpremul_avx
_sk_unpremul_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,109,81,0,0 ; vbroadcastss 0x516d(%rip),%ymm10 # 69a8 <_sk_callback_avx+0x1e2>
+ DB 196,98,125,24,21,45,82,0,0 ; vbroadcastss 0x522d(%rip),%ymm10 # 6a68 <_sk_callback_avx+0x1e2>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -6787,17 +6835,17 @@ _sk_unpremul_avx LABEL PROC
PUBLIC _sk_from_srgb_avx
_sk_from_srgb_avx LABEL PROC
- DB 196,98,125,24,5,78,81,0,0 ; vbroadcastss 0x514e(%rip),%ymm8 # 69ac <_sk_callback_avx+0x1e6>
+ DB 196,98,125,24,5,14,82,0,0 ; vbroadcastss 0x520e(%rip),%ymm8 # 6a6c <_sk_callback_avx+0x1e6>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,64,81,0,0 ; vbroadcastss 0x5140(%rip),%ymm11 # 69b0 <_sk_callback_avx+0x1ea>
+ DB 196,98,125,24,29,0,82,0,0 ; vbroadcastss 0x5200(%rip),%ymm11 # 6a70 <_sk_callback_avx+0x1ea>
DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12
- DB 196,98,125,24,45,54,81,0,0 ; vbroadcastss 0x5136(%rip),%ymm13 # 69b4 <_sk_callback_avx+0x1ee>
+ DB 196,98,125,24,45,246,81,0,0 ; vbroadcastss 0x51f6(%rip),%ymm13 # 6a74 <_sk_callback_avx+0x1ee>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,39,81,0,0 ; vbroadcastss 0x5127(%rip),%ymm12 # 69b8 <_sk_callback_avx+0x1f2>
+ DB 196,98,125,24,37,231,81,0,0 ; vbroadcastss 0x51e7(%rip),%ymm12 # 6a78 <_sk_callback_avx+0x1f2>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,29,81,0,0 ; vbroadcastss 0x511d(%rip),%ymm14 # 69bc <_sk_callback_avx+0x1f6>
+ DB 196,98,125,24,53,221,81,0,0 ; vbroadcastss 0x51dd(%rip),%ymm14 # 6a7c <_sk_callback_avx+0x1f6>
DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0
DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -6822,20 +6870,20 @@ _sk_from_srgb_avx LABEL PROC
PUBLIC _sk_to_srgb_avx
_sk_to_srgb_avx LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,178,80,0,0 ; vbroadcastss 0x50b2(%rip),%ymm8 # 69c0 <_sk_callback_avx+0x1fa>
+ DB 196,98,125,24,5,114,81,0,0 ; vbroadcastss 0x5172(%rip),%ymm8 # 6a80 <_sk_callback_avx+0x1fa>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,168,80,0,0 ; vbroadcastss 0x50a8(%rip),%ymm11 # 69c4 <_sk_callback_avx+0x1fe>
+ DB 196,98,125,24,29,104,81,0,0 ; vbroadcastss 0x5168(%rip),%ymm11 # 6a84 <_sk_callback_avx+0x1fe>
DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12
- DB 196,98,125,24,45,158,80,0,0 ; vbroadcastss 0x509e(%rip),%ymm13 # 69c8 <_sk_callback_avx+0x202>
+ DB 196,98,125,24,45,94,81,0,0 ; vbroadcastss 0x515e(%rip),%ymm13 # 6a88 <_sk_callback_avx+0x202>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12
- DB 196,98,125,24,53,143,80,0,0 ; vbroadcastss 0x508f(%rip),%ymm14 # 69cc <_sk_callback_avx+0x206>
+ DB 196,98,125,24,53,79,81,0,0 ; vbroadcastss 0x514f(%rip),%ymm14 # 6a8c <_sk_callback_avx+0x206>
DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12
- DB 196,98,125,24,61,133,80,0,0 ; vbroadcastss 0x5085(%rip),%ymm15 # 69d0 <_sk_callback_avx+0x20a>
+ DB 196,98,125,24,61,69,81,0,0 ; vbroadcastss 0x5145(%rip),%ymm15 # 6a90 <_sk_callback_avx+0x20a>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
- DB 196,98,125,24,37,113,80,0,0 ; vbroadcastss 0x5071(%rip),%ymm12 # 69d4 <_sk_callback_avx+0x20e>
+ DB 196,98,125,24,37,49,81,0,0 ; vbroadcastss 0x5131(%rip),%ymm12 # 6a94 <_sk_callback_avx+0x20e>
DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -6870,7 +6918,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9
DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,215,79,0,0 ; vbroadcastss 0x4fd7(%rip),%ymm11 # 69d8 <_sk_callback_avx+0x212>
+ DB 196,98,125,24,29,151,80,0,0 ; vbroadcastss 0x5097(%rip),%ymm11 # 6a98 <_sk_callback_avx+0x212>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12
@@ -6880,19 +6928,19 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,176,79,0,0 ; vbroadcastss 0x4fb0(%rip),%ymm11 # 69e4 <_sk_callback_avx+0x21e>
+ DB 196,98,125,24,29,112,80,0,0 ; vbroadcastss 0x5070(%rip),%ymm11 # 6aa4 <_sk_callback_avx+0x21e>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,158,79,0,0 ; vbroadcastss 0x4f9e(%rip),%ymm11 # 69e0 <_sk_callback_avx+0x21a>
+ DB 196,98,125,24,29,94,80,0,0 ; vbroadcastss 0x505e(%rip),%ymm11 # 6aa0 <_sk_callback_avx+0x21a>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,134,79,0,0 ; vbroadcastss 0x4f86(%rip),%ymm2 # 69dc <_sk_callback_avx+0x216>
+ DB 196,226,125,24,21,70,80,0,0 ; vbroadcastss 0x5046(%rip),%ymm2 # 6a9c <_sk_callback_avx+0x216>
DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,37,109,79,0,0 ; vbroadcastss 0x4f6d(%rip),%ymm12 # 69ec <_sk_callback_avx+0x226>
+ DB 196,98,125,24,37,45,80,0,0 ; vbroadcastss 0x502d(%rip),%ymm12 # 6aac <_sk_callback_avx+0x226>
DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2
DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12
DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11
@@ -6902,7 +6950,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0
DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- DB 196,98,125,24,5,48,79,0,0 ; vbroadcastss 0x4f30(%rip),%ymm8 # 69e8 <_sk_callback_avx+0x222>
+ DB 196,98,125,24,5,240,79,0,0 ; vbroadcastss 0x4ff0(%rip),%ymm8 # 6aa8 <_sk_callback_avx+0x222>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -6917,7 +6965,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,225 ; vmovaps %ymm1,%ymm4
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
- DB 196,98,125,24,5,247,78,0,0 ; vbroadcastss 0x4ef7(%rip),%ymm8 # 69f0 <_sk_callback_avx+0x22a>
+ DB 196,98,125,24,5,183,79,0,0 ; vbroadcastss 0x4fb7(%rip),%ymm8 # 6ab0 <_sk_callback_avx+0x22a>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10
DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11
@@ -6925,23 +6973,23 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,29,209,78,0,0 ; vbroadcastss 0x4ed1(%rip),%ymm11 # 69f4 <_sk_callback_avx+0x22e>
+ DB 196,98,125,24,29,145,79,0,0 ; vbroadcastss 0x4f91(%rip),%ymm11 # 6ab4 <_sk_callback_avx+0x22e>
DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,37,187,78,0,0 ; vbroadcastss 0x4ebb(%rip),%ymm12 # 69fc <_sk_callback_avx+0x236>
+ DB 196,98,125,24,37,123,79,0,0 ; vbroadcastss 0x4f7b(%rip),%ymm12 # 6abc <_sk_callback_avx+0x236>
DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0
- DB 196,98,125,24,45,177,78,0,0 ; vbroadcastss 0x4eb1(%rip),%ymm13 # 6a00 <_sk_callback_avx+0x23a>
+ DB 196,98,125,24,45,113,79,0,0 ; vbroadcastss 0x4f71(%rip),%ymm13 # 6ac0 <_sk_callback_avx+0x23a>
DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14
DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
- DB 196,226,125,24,13,146,78,0,0 ; vbroadcastss 0x4e92(%rip),%ymm1 # 69f8 <_sk_callback_avx+0x232>
+ DB 196,226,125,24,13,82,79,0,0 ; vbroadcastss 0x4f52(%rip),%ymm1 # 6ab8 <_sk_callback_avx+0x232>
DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7
DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7
DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14
DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,53,125,78,0,0 ; vbroadcastss 0x4e7d(%rip),%ymm14 # 6a04 <_sk_callback_avx+0x23e>
+ DB 196,98,125,24,53,61,79,0,0 ; vbroadcastss 0x4f3d(%rip),%ymm14 # 6ac4 <_sk_callback_avx+0x23e>
DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6960,7 +7008,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6
DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6
DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- DB 196,226,125,24,5,31,78,0,0 ; vbroadcastss 0x4e1f(%rip),%ymm0 # 6a08 <_sk_callback_avx+0x242>
+ DB 196,226,125,24,5,223,78,0,0 ; vbroadcastss 0x4edf(%rip),%ymm0 # 6ac8 <_sk_callback_avx+0x242>
DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0
DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3
DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0
@@ -7008,13 +7056,13 @@ _sk_scale_u8_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,74 ; jne 1ce6 <_sk_scale_u8_avx+0x54>
DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8
- DB 197,57,219,5,166,80,0,0 ; vpand 0x50a6(%rip),%xmm8,%xmm8 # 6d50 <_sk_callback_avx+0x58a>
+ DB 197,57,219,5,102,81,0,0 ; vpand 0x5166(%rip),%xmm8,%xmm8 # 6e10 <_sk_callback_avx+0x58a>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,63,77,0,0 ; vbroadcastss 0x4d3f(%rip),%ymm9 # 6a0c <_sk_callback_avx+0x246>
+ DB 196,98,125,24,13,255,77,0,0 ; vbroadcastss 0x4dff(%rip),%ymm9 # 6acc <_sk_callback_avx+0x246>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -7029,10 +7077,21 @@ _sk_scale_u8_avx LABEL PROC
DB 65,128,249,6 ; cmp $0x6,%r9b
DB 119,167 ; ja 1ca2 <_sk_scale_u8_avx+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,98,0,0,0 ; lea 0x62(%rip),%r10 # 1d68 <_sk_scale_u8_avx+0xd6>
+ DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # 1d80 <_sk_scale_u8_avx+0xee>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 235,136 ; jmp 1ca2 <_sk_scale_u8_avx+0x10>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 197,121,110,200 ; vmovd %eax,%xmm9
+ DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
+ DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ DB 233,95,255,255,255 ; jmpq 1ca2 <_sk_scale_u8_avx+0x10>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -7040,32 +7099,25 @@ _sk_scale_u8_avx LABEL PROC
DB 197,57,196,192,5 ; vpinsrw $0x5,%eax,%xmm8,%xmm8
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 197,57,196,192,4 ; vpinsrw $0x4,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 197,57,196,192,3 ; vpinsrw $0x3,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 197,57,196,192,1 ; vpinsrw $0x1,%eax,%xmm8,%xmm8
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 197,57,196,192,0 ; vpinsrw $0x0,%eax,%xmm8,%xmm8
- DB 233,61,255,255,255 ; jmpq 1ca2 <_sk_scale_u8_avx+0x10>
- DB 15,31,0 ; nopl (%rax)
- DB 238 ; out %al,(%dx)
+ DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9
+ DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
+ DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ DB 233,35,255,255,255 ; jmpq 1ca2 <_sk_scale_u8_avx+0x10>
+ DB 144 ; nop
+ DB 143 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,227 ; jmpq *%rbx
+ DB 255,170,255,255,255,154 ; ljmp *-0x65000001(%rdx)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 216,255 ; fdivr %st(7),%st
+ DB 233,255,255,255,222 ; jmpq ffffffffdf001d90 <_sk_callback_avx+0xffffffffdeffb50a>
DB 255 ; (bad)
- DB 255,205 ; dec %ebp
DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255,194 ; inc %edx
+ DB 255,211 ; callq *%rbx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,183,255,255,255,167 ; pushq -0x58000001(%rdi)
+ DB 255,195 ; inc %ebx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -7094,15 +7146,15 @@ _sk_lerp_u8_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,110 ; jne 1e3b <_sk_lerp_u8_avx+0x78>
+ DB 117,110 ; jne 1e53 <_sk_lerp_u8_avx+0x78>
DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8
- DB 197,57,219,5,133,79,0,0 ; vpand 0x4f85(%rip),%xmm8,%xmm8 # 6d60 <_sk_callback_avx+0x59a>
+ DB 197,57,219,5,45,80,0,0 ; vpand 0x502d(%rip),%xmm8,%xmm8 # 6e20 <_sk_callback_avx+0x59a>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,18,76,0,0 ; vbroadcastss 0x4c12(%rip),%ymm9 # 6a10 <_sk_callback_avx+0x24a>
+ DB 196,98,125,24,13,186,76,0,0 ; vbroadcastss 0x4cba(%rip),%ymm9 # 6ad0 <_sk_callback_avx+0x24a>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
@@ -7123,12 +7175,23 @@ _sk_lerp_u8_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,131 ; ja 1dd3 <_sk_lerp_u8_avx+0x10>
+ DB 119,131 ; ja 1deb <_sk_lerp_u8_avx+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,97,0,0,0 ; lea 0x61(%rip),%r10 # 1ebc <_sk_lerp_u8_avx+0xf9>
+ DB 76,141,21,125,0,0,0 ; lea 0x7d(%rip),%r10 # 1ef0 <_sk_lerp_u8_avx+0x115>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 233,97,255,255,255 ; jmpq 1deb <_sk_lerp_u8_avx+0x10>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 197,121,110,200 ; vmovd %eax,%xmm9
+ DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
+ DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ DB 233,56,255,255,255 ; jmpq 1deb <_sk_lerp_u8_avx+0x10>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -7136,35 +7199,26 @@ _sk_lerp_u8_avx LABEL PROC
DB 197,57,196,192,5 ; vpinsrw $0x5,%eax,%xmm8,%xmm8
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 197,57,196,192,4 ; vpinsrw $0x4,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 197,57,196,192,3 ; vpinsrw $0x3,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 197,57,196,192,1 ; vpinsrw $0x1,%eax,%xmm8,%xmm8
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 197,57,196,192,0 ; vpinsrw $0x0,%eax,%xmm8,%xmm8
- DB 233,25,255,255,255 ; jmpq 1dd3 <_sk_lerp_u8_avx+0x10>
- DB 102,144 ; xchg %ax,%ax
- DB 239 ; out %eax,(%dx)
+ DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9
+ DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
+ DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ DB 233,252,254,255,255 ; jmpq 1deb <_sk_lerp_u8_avx+0x10>
+ DB 144 ; nop
+ DB 140,255 ; mov %?,%edi
DB 255 ; (bad)
+ DB 255,170,255,255,255,154 ; ljmp *-0x65000001(%rdx)
DB 255 ; (bad)
- DB 255,228 ; jmpq *%rsp
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 233,255,255,255,222 ; jmpq ffffffffdf001f00 <_sk_callback_avx+0xffffffffdeffb67a>
DB 255 ; (bad)
- DB 217,255 ; fcos
DB 255 ; (bad)
- DB 255,206 ; dec %esi
+ DB 255,211 ; callq *%rbx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,195 ; inc %ebx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255 ; (bad)
- DB 184,255,255,255,168 ; mov $0xa8ffffff,%eax
- DB 255 ; (bad)
- DB 255 ; (bad)
DB 255 ; .byte 0xff
PUBLIC _sk_lerp_565_avx
@@ -7172,26 +7226,26 @@ _sk_lerp_565_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,208,0,0,0 ; jne 1fb6 <_sk_lerp_565_avx+0xde>
+ DB 15,133,208,0,0,0 ; jne 1fea <_sk_lerp_565_avx+0xde>
DB 196,65,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,10,75,0,0 ; vbroadcastss 0x4b0a(%rip),%ymm9 # 6a14 <_sk_callback_avx+0x24e>
+ DB 196,98,125,24,13,150,75,0,0 ; vbroadcastss 0x4b96(%rip),%ymm9 # 6ad4 <_sk_callback_avx+0x24e>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,251,74,0,0 ; vbroadcastss 0x4afb(%rip),%ymm10 # 6a18 <_sk_callback_avx+0x252>
+ DB 196,98,125,24,21,135,75,0,0 ; vbroadcastss 0x4b87(%rip),%ymm10 # 6ad8 <_sk_callback_avx+0x252>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,241,74,0,0 ; vbroadcastss 0x4af1(%rip),%ymm10 # 6a1c <_sk_callback_avx+0x256>
+ DB 196,98,125,24,21,125,75,0,0 ; vbroadcastss 0x4b7d(%rip),%ymm10 # 6adc <_sk_callback_avx+0x256>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,226,74,0,0 ; vbroadcastss 0x4ae2(%rip),%ymm11 # 6a20 <_sk_callback_avx+0x25a>
+ DB 196,98,125,24,29,110,75,0,0 ; vbroadcastss 0x4b6e(%rip),%ymm11 # 6ae0 <_sk_callback_avx+0x25a>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,216,74,0,0 ; vbroadcastss 0x4ad8(%rip),%ymm11 # 6a24 <_sk_callback_avx+0x25e>
+ DB 196,98,125,24,29,100,75,0,0 ; vbroadcastss 0x4b64(%rip),%ymm11 # 6ae4 <_sk_callback_avx+0x25e>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,201,74,0,0 ; vbroadcastss 0x4ac9(%rip),%ymm11 # 6a28 <_sk_callback_avx+0x262>
+ DB 196,98,125,24,29,85,75,0,0 ; vbroadcastss 0x4b55(%rip),%ymm11 # 6ae8 <_sk_callback_avx+0x262>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
@@ -7218,22 +7272,29 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,29,255,255,255 ; ja 1eec <_sk_lerp_565_avx+0x14>
+ DB 15,135,29,255,255,255 ; ja 1f20 <_sk_lerp_565_avx+0x14>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,74,0,0,0 ; lea 0x4a(%rip),%r10 # 2024 <_sk_lerp_565_avx+0x14c>
+ DB 76,141,21,102,0,0,0 ; lea 0x66(%rip),%r10 # 2074 <_sk_lerp_565_avx+0x168>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax
+ DB 197,121,110,192 ; vmovd %eax,%xmm8
+ DB 233,251,254,255,255 ; jmpq 1f20 <_sk_lerp_565_avx+0x14>
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 196,65,57,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8
+ DB 196,65,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm9
+ DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
+ DB 233,221,254,255,255 ; jmpq 1f20 <_sk_lerp_565_avx+0x14>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm8,%xmm8
DB 196,65,57,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm8,%xmm8
DB 196,65,57,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm8,%xmm8
- DB 196,65,57,196,68,83,6,3 ; vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm8,%xmm8
- DB 196,65,57,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8
- DB 196,65,57,196,68,83,2,1 ; vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm8,%xmm8
- DB 196,65,57,196,4,83,0 ; vpinsrw $0x0,(%r11,%rdx,2),%xmm8,%xmm8
- DB 233,200,254,255,255 ; jmpq 1eec <_sk_lerp_565_avx+0x14>
- DB 244 ; hlt
+ DB 196,65,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm9
+ DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
+ DB 233,175,254,255,255 ; jmpq 1f20 <_sk_lerp_565_avx+0x14>
+ DB 15,31,0 ; nopl (%rax)
+ DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -7246,14 +7307,7 @@ _sk_lerp_565_avx LABEL PROC
DB 255 ; (bad)
DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
- DB 255,212 ; callq *%rsp
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255,204 ; dec %esp
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 191 ; .byte 0xbf
+ DB 255,207 ; dec %edi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -7268,9 +7322,9 @@ _sk_load_tables_avx LABEL PROC
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 76,3,16 ; add (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,251,1,0,0 ; jne 225e <_sk_load_tables_avx+0x21e>
+ DB 15,133,251,1,0,0 ; jne 22ae <_sk_load_tables_avx+0x21e>
DB 196,65,124,16,18 ; vmovups (%r10),%ymm10
- DB 197,124,40,13,208,77,0,0 ; vmovaps 0x4dd0(%rip),%ymm9 # 6e40 <_sk_callback_avx+0x67a>
+ DB 197,124,40,13,96,78,0,0 ; vmovaps 0x4e60(%rip),%ymm9 # 6f20 <_sk_callback_avx+0x69a>
DB 196,193,44,84,201 ; vandps %ymm9,%ymm10,%ymm1
DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0
DB 196,193,249,126,195 ; vmovq %xmm0,%r11
@@ -7362,7 +7416,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,227,71,0,0 ; vbroadcastss 0x47e3(%rip),%ymm7 # 6a2c <_sk_callback_avx+0x266>
+ DB 196,226,125,24,61,83,72,0,0 ; vbroadcastss 0x4853(%rip),%ymm7 # 6aec <_sk_callback_avx+0x266>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -7377,13 +7431,13 @@ _sk_load_tables_avx LABEL PROC
DB 73,211,235 ; shr %cl,%r11
DB 196,193,249,110,195 ; vmovq %r11,%xmm0
DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0
- DB 196,226,121,0,13,234,74,0,0 ; vpshufb 0x4aea(%rip),%xmm0,%xmm1 # 6d70 <_sk_callback_avx+0x5aa>
+ DB 196,226,121,0,13,90,75,0,0 ; vpshufb 0x4b5a(%rip),%xmm0,%xmm1 # 6e30 <_sk_callback_avx+0x5aa>
DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1
- DB 196,226,121,0,5,236,74,0,0 ; vpshufb 0x4aec(%rip),%xmm0,%xmm0 # 6d80 <_sk_callback_avx+0x5ba>
+ DB 196,226,121,0,5,92,75,0,0 ; vpshufb 0x4b5c(%rip),%xmm0,%xmm0 # 6e40 <_sk_callback_avx+0x5ba>
DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 196,66,125,44,18 ; vmaskmovps (%r10),%ymm0,%ymm10
- DB 233,191,253,255,255 ; jmpq 2068 <_sk_load_tables_avx+0x28>
+ DB 233,191,253,255,255 ; jmpq 20b8 <_sk_load_tables_avx+0x28>
PUBLIC _sk_load_tables_u16_be_avx
_sk_load_tables_u16_be_avx LABEL PROC
@@ -7393,7 +7447,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
DB 197,252,17,60,36 ; vmovups %ymm7,(%rsp)
- DB 15,133,87,2,0,0 ; jne 251f <_sk_load_tables_u16_be_avx+0x276>
+ DB 15,133,87,2,0,0 ; jne 256f <_sk_load_tables_u16_be_avx+0x276>
DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8
DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2
DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -7408,7 +7462,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11
DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1
DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12
- DB 197,121,111,21,123,74,0,0 ; vmovdqa 0x4a7b(%rip),%xmm10 # 6d90 <_sk_callback_avx+0x5ca>
+ DB 197,121,111,21,235,74,0,0 ; vmovdqa 0x4aeb(%rip),%xmm10 # 6e50 <_sk_callback_avx+0x5ca>
DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -7506,7 +7560,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,34,69,0,0 ; vbroadcastss 0x4522(%rip),%ymm7 # 6a30 <_sk_callback_avx+0x26a>
+ DB 196,226,125,24,61,146,69,0,0 ; vbroadcastss 0x4592(%rip),%ymm7 # 6af0 <_sk_callback_avx+0x26a>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -7515,29 +7569,29 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 2585 <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 116,85 ; je 25d5 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 2585 <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 114,72 ; jb 25d5 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 2592 <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 116,72 ; je 25e2 <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 2592 <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 114,59 ; jb 25e2 <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,123,253,255,255 ; je 22e3 <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,132,123,253,255,255 ; je 2333 <_sk_load_tables_u16_be_avx+0x3a>
DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,106,253,255,255 ; jb 22e3 <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,130,106,253,255,255 ; jb 2333 <_sk_load_tables_u16_be_avx+0x3a>
DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9
- DB 233,94,253,255,255 ; jmpq 22e3 <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,94,253,255,255 ; jmpq 2333 <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,81,253,255,255 ; jmpq 22e3 <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,81,253,255,255 ; jmpq 2333 <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,72,253,255,255 ; jmpq 22e3 <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,72,253,255,255 ; jmpq 2333 <_sk_load_tables_u16_be_avx+0x3a>
PUBLIC _sk_load_tables_rgb_u16_be_avx
_sk_load_tables_rgb_u16_be_avx LABEL PROC
@@ -7548,7 +7602,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 197,252,17,124,36,32 ; vmovups %ymm7,0x20(%rsp)
DB 197,252,17,52,36 ; vmovups %ymm6,(%rsp)
- DB 15,133,74,2,0,0 ; jne 2806 <_sk_load_tables_rgb_u16_be_avx+0x26b>
+ DB 15,133,74,2,0,0 ; jne 2856 <_sk_load_tables_rgb_u16_be_avx+0x26b>
DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0
DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2
DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1
@@ -7569,7 +7623,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
DB 197,57,109,218 ; vpunpckhqdq %xmm2,%xmm8,%xmm11
DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,122,71,0,0 ; vmovdqa 0x477a(%rip),%xmm9 # 6da0 <_sk_callback_avx+0x5da>
+ DB 197,121,111,13,234,71,0,0 ; vmovdqa 0x47ea(%rip),%xmm9 # 6e60 <_sk_callback_avx+0x5da>
DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1
@@ -7659,7 +7713,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2
DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,63,66,0,0 ; vbroadcastss 0x423f(%rip),%ymm3 # 6a34 <_sk_callback_avx+0x26e>
+ DB 196,226,125,24,29,175,66,0,0 ; vbroadcastss 0x42af(%rip),%ymm3 # 6af4 <_sk_callback_avx+0x26e>
DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6
DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7
DB 72,131,196,88 ; add $0x58,%rsp
@@ -7667,41 +7721,41 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 281f <_sk_load_tables_rgb_u16_be_avx+0x284>
- DB 233,209,253,255,255 ; jmpq 25f0 <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 117,5 ; jne 286f <_sk_load_tables_rgb_u16_be_avx+0x284>
+ DB 233,209,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55>
DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1
DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 284e <_sk_load_tables_rgb_u16_be_avx+0x2b3>
+ DB 114,26 ; jb 289e <_sk_load_tables_rgb_u16_be_avx+0x2b3>
DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1
DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 2853 <_sk_load_tables_rgb_u16_be_avx+0x2b8>
- DB 233,162,253,255,255 ; jmpq 25f0 <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,157,253,255,255 ; jmpq 25f0 <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 117,10 ; jne 28a3 <_sk_load_tables_rgb_u16_be_avx+0x2b8>
+ DB 233,162,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,157,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55>
DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1
DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 2882 <_sk_load_tables_rgb_u16_be_avx+0x2e7>
+ DB 114,26 ; jb 28d2 <_sk_load_tables_rgb_u16_be_avx+0x2e7>
DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1
DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 2887 <_sk_load_tables_rgb_u16_be_avx+0x2ec>
- DB 233,110,253,255,255 ; jmpq 25f0 <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,105,253,255,255 ; jmpq 25f0 <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 117,10 ; jne 28d7 <_sk_load_tables_rgb_u16_be_avx+0x2ec>
+ DB 233,110,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,105,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55>
DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3
DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 28b0 <_sk_load_tables_rgb_u16_be_avx+0x315>
+ DB 114,20 ; jb 2900 <_sk_load_tables_rgb_u16_be_avx+0x315>
DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3
DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- DB 233,64,253,255,255 ; jmpq 25f0 <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,59,253,255,255 ; jmpq 25f0 <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,64,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 233,59,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55>
PUBLIC _sk_byte_tables_avx
_sk_byte_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,120,65,0,0 ; vbroadcastss 0x4178(%rip),%ymm8 # 6a38 <_sk_callback_avx+0x272>
+ DB 196,98,125,24,5,232,65,0,0 ; vbroadcastss 0x41e8(%rip),%ymm8 # 6af8 <_sk_callback_avx+0x272>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -7820,7 +7874,7 @@ _sk_byte_tables_avx LABEL PROC
DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1
DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- DB 196,98,125,24,13,34,63,0,0 ; vbroadcastss 0x3f22(%rip),%ymm9 # 6a3c <_sk_callback_avx+0x276>
+ DB 196,98,125,24,13,146,63,0,0 ; vbroadcastss 0x3f92(%rip),%ymm9 # 6afc <_sk_callback_avx+0x276>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -7934,7 +7988,7 @@ _sk_byte_tables_rgb_avx LABEL PROC
DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,3,61,0,0 ; vbroadcastss 0x3d03(%rip),%ymm9 # 6a40 <_sk_callback_avx+0x27a>
+ DB 196,98,125,24,13,115,61,0,0 ; vbroadcastss 0x3d73(%rip),%ymm9 # 6b00 <_sk_callback_avx+0x27a>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1
DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2
@@ -8129,36 +8183,36 @@ _sk_parametric_r_avx LABEL PROC
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11
- DB 196,98,125,24,37,176,57,0,0 ; vbroadcastss 0x39b0(%rip),%ymm12 # 6a44 <_sk_callback_avx+0x27e>
+ DB 196,98,125,24,37,32,58,0,0 ; vbroadcastss 0x3a20(%rip),%ymm12 # 6b04 <_sk_callback_avx+0x27e>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,166,57,0,0 ; vbroadcastss 0x39a6(%rip),%ymm12 # 6a48 <_sk_callback_avx+0x282>
+ DB 196,98,125,24,37,22,58,0,0 ; vbroadcastss 0x3a16(%rip),%ymm12 # 6b08 <_sk_callback_avx+0x282>
DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,156,57,0,0 ; vbroadcastss 0x399c(%rip),%ymm12 # 6a4c <_sk_callback_avx+0x286>
+ DB 196,98,125,24,37,12,58,0,0 ; vbroadcastss 0x3a0c(%rip),%ymm12 # 6b0c <_sk_callback_avx+0x286>
DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,146,57,0,0 ; vbroadcastss 0x3992(%rip),%ymm12 # 6a50 <_sk_callback_avx+0x28a>
+ DB 196,98,125,24,37,2,58,0,0 ; vbroadcastss 0x3a02(%rip),%ymm12 # 6b10 <_sk_callback_avx+0x28a>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,136,57,0,0 ; vbroadcastss 0x3988(%rip),%ymm12 # 6a54 <_sk_callback_avx+0x28e>
+ DB 196,98,125,24,37,248,57,0,0 ; vbroadcastss 0x39f8(%rip),%ymm12 # 6b14 <_sk_callback_avx+0x28e>
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,121,57,0,0 ; vbroadcastss 0x3979(%rip),%ymm12 # 6a58 <_sk_callback_avx+0x292>
+ DB 196,98,125,24,37,233,57,0,0 ; vbroadcastss 0x39e9(%rip),%ymm12 # 6b18 <_sk_callback_avx+0x292>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,111,57,0,0 ; vbroadcastss 0x396f(%rip),%ymm12 # 6a5c <_sk_callback_avx+0x296>
+ DB 196,98,125,24,37,223,57,0,0 ; vbroadcastss 0x39df(%rip),%ymm12 # 6b1c <_sk_callback_avx+0x296>
DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,83,57,0,0 ; vbroadcastss 0x3953(%rip),%ymm11 # 6a60 <_sk_callback_avx+0x29a>
+ DB 196,98,125,24,29,195,57,0,0 ; vbroadcastss 0x39c3(%rip),%ymm11 # 6b20 <_sk_callback_avx+0x29a>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,73,57,0,0 ; vbroadcastss 0x3949(%rip),%ymm11 # 6a64 <_sk_callback_avx+0x29e>
+ DB 196,98,125,24,29,185,57,0,0 ; vbroadcastss 0x39b9(%rip),%ymm11 # 6b24 <_sk_callback_avx+0x29e>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,58,57,0,0 ; vbroadcastss 0x393a(%rip),%ymm11 # 6a68 <_sk_callback_avx+0x2a2>
+ DB 196,98,125,24,29,170,57,0,0 ; vbroadcastss 0x39aa(%rip),%ymm11 # 6b28 <_sk_callback_avx+0x2a2>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,48,57,0,0 ; vbroadcastss 0x3930(%rip),%ymm11 # 6a6c <_sk_callback_avx+0x2a6>
+ DB 196,98,125,24,29,160,57,0,0 ; vbroadcastss 0x39a0(%rip),%ymm11 # 6b2c <_sk_callback_avx+0x2a6>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,33,57,0,0 ; vbroadcastss 0x3921(%rip),%ymm10 # 6a70 <_sk_callback_avx+0x2aa>
+ DB 196,98,125,24,21,145,57,0,0 ; vbroadcastss 0x3991(%rip),%ymm10 # 6b30 <_sk_callback_avx+0x2aa>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -8166,7 +8220,7 @@ _sk_parametric_r_avx LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,248,56,0,0 ; vbroadcastss 0x38f8(%rip),%ymm8 # 6a74 <_sk_callback_avx+0x2ae>
+ DB 196,98,125,24,5,104,57,0,0 ; vbroadcastss 0x3968(%rip),%ymm8 # 6b34 <_sk_callback_avx+0x2ae>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8186,36 +8240,36 @@ _sk_parametric_g_avx LABEL PROC
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11
- DB 196,98,125,24,37,169,56,0,0 ; vbroadcastss 0x38a9(%rip),%ymm12 # 6a78 <_sk_callback_avx+0x2b2>
+ DB 196,98,125,24,37,25,57,0,0 ; vbroadcastss 0x3919(%rip),%ymm12 # 6b38 <_sk_callback_avx+0x2b2>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,159,56,0,0 ; vbroadcastss 0x389f(%rip),%ymm12 # 6a7c <_sk_callback_avx+0x2b6>
+ DB 196,98,125,24,37,15,57,0,0 ; vbroadcastss 0x390f(%rip),%ymm12 # 6b3c <_sk_callback_avx+0x2b6>
DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,149,56,0,0 ; vbroadcastss 0x3895(%rip),%ymm12 # 6a80 <_sk_callback_avx+0x2ba>
+ DB 196,98,125,24,37,5,57,0,0 ; vbroadcastss 0x3905(%rip),%ymm12 # 6b40 <_sk_callback_avx+0x2ba>
DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,139,56,0,0 ; vbroadcastss 0x388b(%rip),%ymm12 # 6a84 <_sk_callback_avx+0x2be>
+ DB 196,98,125,24,37,251,56,0,0 ; vbroadcastss 0x38fb(%rip),%ymm12 # 6b44 <_sk_callback_avx+0x2be>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,129,56,0,0 ; vbroadcastss 0x3881(%rip),%ymm12 # 6a88 <_sk_callback_avx+0x2c2>
+ DB 196,98,125,24,37,241,56,0,0 ; vbroadcastss 0x38f1(%rip),%ymm12 # 6b48 <_sk_callback_avx+0x2c2>
DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,114,56,0,0 ; vbroadcastss 0x3872(%rip),%ymm12 # 6a8c <_sk_callback_avx+0x2c6>
+ DB 196,98,125,24,37,226,56,0,0 ; vbroadcastss 0x38e2(%rip),%ymm12 # 6b4c <_sk_callback_avx+0x2c6>
DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,104,56,0,0 ; vbroadcastss 0x3868(%rip),%ymm12 # 6a90 <_sk_callback_avx+0x2ca>
+ DB 196,98,125,24,37,216,56,0,0 ; vbroadcastss 0x38d8(%rip),%ymm12 # 6b50 <_sk_callback_avx+0x2ca>
DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1
DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1
DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,76,56,0,0 ; vbroadcastss 0x384c(%rip),%ymm11 # 6a94 <_sk_callback_avx+0x2ce>
+ DB 196,98,125,24,29,188,56,0,0 ; vbroadcastss 0x38bc(%rip),%ymm11 # 6b54 <_sk_callback_avx+0x2ce>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,66,56,0,0 ; vbroadcastss 0x3842(%rip),%ymm11 # 6a98 <_sk_callback_avx+0x2d2>
+ DB 196,98,125,24,29,178,56,0,0 ; vbroadcastss 0x38b2(%rip),%ymm11 # 6b58 <_sk_callback_avx+0x2d2>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,51,56,0,0 ; vbroadcastss 0x3833(%rip),%ymm11 # 6a9c <_sk_callback_avx+0x2d6>
+ DB 196,98,125,24,29,163,56,0,0 ; vbroadcastss 0x38a3(%rip),%ymm11 # 6b5c <_sk_callback_avx+0x2d6>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,41,56,0,0 ; vbroadcastss 0x3829(%rip),%ymm11 # 6aa0 <_sk_callback_avx+0x2da>
+ DB 196,98,125,24,29,153,56,0,0 ; vbroadcastss 0x3899(%rip),%ymm11 # 6b60 <_sk_callback_avx+0x2da>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,26,56,0,0 ; vbroadcastss 0x381a(%rip),%ymm10 # 6aa4 <_sk_callback_avx+0x2de>
+ DB 196,98,125,24,21,138,56,0,0 ; vbroadcastss 0x388a(%rip),%ymm10 # 6b64 <_sk_callback_avx+0x2de>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -8223,7 +8277,7 @@ _sk_parametric_g_avx LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,241,55,0,0 ; vbroadcastss 0x37f1(%rip),%ymm8 # 6aa8 <_sk_callback_avx+0x2e2>
+ DB 196,98,125,24,5,97,56,0,0 ; vbroadcastss 0x3861(%rip),%ymm8 # 6b68 <_sk_callback_avx+0x2e2>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8243,36 +8297,36 @@ _sk_parametric_b_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11
- DB 196,98,125,24,37,162,55,0,0 ; vbroadcastss 0x37a2(%rip),%ymm12 # 6aac <_sk_callback_avx+0x2e6>
+ DB 196,98,125,24,37,18,56,0,0 ; vbroadcastss 0x3812(%rip),%ymm12 # 6b6c <_sk_callback_avx+0x2e6>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,152,55,0,0 ; vbroadcastss 0x3798(%rip),%ymm12 # 6ab0 <_sk_callback_avx+0x2ea>
+ DB 196,98,125,24,37,8,56,0,0 ; vbroadcastss 0x3808(%rip),%ymm12 # 6b70 <_sk_callback_avx+0x2ea>
DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,142,55,0,0 ; vbroadcastss 0x378e(%rip),%ymm12 # 6ab4 <_sk_callback_avx+0x2ee>
+ DB 196,98,125,24,37,254,55,0,0 ; vbroadcastss 0x37fe(%rip),%ymm12 # 6b74 <_sk_callback_avx+0x2ee>
DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,132,55,0,0 ; vbroadcastss 0x3784(%rip),%ymm12 # 6ab8 <_sk_callback_avx+0x2f2>
+ DB 196,98,125,24,37,244,55,0,0 ; vbroadcastss 0x37f4(%rip),%ymm12 # 6b78 <_sk_callback_avx+0x2f2>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,122,55,0,0 ; vbroadcastss 0x377a(%rip),%ymm12 # 6abc <_sk_callback_avx+0x2f6>
+ DB 196,98,125,24,37,234,55,0,0 ; vbroadcastss 0x37ea(%rip),%ymm12 # 6b7c <_sk_callback_avx+0x2f6>
DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,107,55,0,0 ; vbroadcastss 0x376b(%rip),%ymm12 # 6ac0 <_sk_callback_avx+0x2fa>
+ DB 196,98,125,24,37,219,55,0,0 ; vbroadcastss 0x37db(%rip),%ymm12 # 6b80 <_sk_callback_avx+0x2fa>
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,97,55,0,0 ; vbroadcastss 0x3761(%rip),%ymm12 # 6ac4 <_sk_callback_avx+0x2fe>
+ DB 196,98,125,24,37,209,55,0,0 ; vbroadcastss 0x37d1(%rip),%ymm12 # 6b84 <_sk_callback_avx+0x2fe>
DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2
DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,69,55,0,0 ; vbroadcastss 0x3745(%rip),%ymm11 # 6ac8 <_sk_callback_avx+0x302>
+ DB 196,98,125,24,29,181,55,0,0 ; vbroadcastss 0x37b5(%rip),%ymm11 # 6b88 <_sk_callback_avx+0x302>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,59,55,0,0 ; vbroadcastss 0x373b(%rip),%ymm11 # 6acc <_sk_callback_avx+0x306>
+ DB 196,98,125,24,29,171,55,0,0 ; vbroadcastss 0x37ab(%rip),%ymm11 # 6b8c <_sk_callback_avx+0x306>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,44,55,0,0 ; vbroadcastss 0x372c(%rip),%ymm11 # 6ad0 <_sk_callback_avx+0x30a>
+ DB 196,98,125,24,29,156,55,0,0 ; vbroadcastss 0x379c(%rip),%ymm11 # 6b90 <_sk_callback_avx+0x30a>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,34,55,0,0 ; vbroadcastss 0x3722(%rip),%ymm11 # 6ad4 <_sk_callback_avx+0x30e>
+ DB 196,98,125,24,29,146,55,0,0 ; vbroadcastss 0x3792(%rip),%ymm11 # 6b94 <_sk_callback_avx+0x30e>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,19,55,0,0 ; vbroadcastss 0x3713(%rip),%ymm10 # 6ad8 <_sk_callback_avx+0x312>
+ DB 196,98,125,24,21,131,55,0,0 ; vbroadcastss 0x3783(%rip),%ymm10 # 6b98 <_sk_callback_avx+0x312>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -8280,7 +8334,7 @@ _sk_parametric_b_avx LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,234,54,0,0 ; vbroadcastss 0x36ea(%rip),%ymm8 # 6adc <_sk_callback_avx+0x316>
+ DB 196,98,125,24,5,90,55,0,0 ; vbroadcastss 0x375a(%rip),%ymm8 # 6b9c <_sk_callback_avx+0x316>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8300,36 +8354,36 @@ _sk_parametric_a_avx LABEL PROC
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11
- DB 196,98,125,24,37,155,54,0,0 ; vbroadcastss 0x369b(%rip),%ymm12 # 6ae0 <_sk_callback_avx+0x31a>
+ DB 196,98,125,24,37,11,55,0,0 ; vbroadcastss 0x370b(%rip),%ymm12 # 6ba0 <_sk_callback_avx+0x31a>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,145,54,0,0 ; vbroadcastss 0x3691(%rip),%ymm12 # 6ae4 <_sk_callback_avx+0x31e>
+ DB 196,98,125,24,37,1,55,0,0 ; vbroadcastss 0x3701(%rip),%ymm12 # 6ba4 <_sk_callback_avx+0x31e>
DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,135,54,0,0 ; vbroadcastss 0x3687(%rip),%ymm12 # 6ae8 <_sk_callback_avx+0x322>
+ DB 196,98,125,24,37,247,54,0,0 ; vbroadcastss 0x36f7(%rip),%ymm12 # 6ba8 <_sk_callback_avx+0x322>
DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,125,54,0,0 ; vbroadcastss 0x367d(%rip),%ymm12 # 6aec <_sk_callback_avx+0x326>
+ DB 196,98,125,24,37,237,54,0,0 ; vbroadcastss 0x36ed(%rip),%ymm12 # 6bac <_sk_callback_avx+0x326>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,115,54,0,0 ; vbroadcastss 0x3673(%rip),%ymm12 # 6af0 <_sk_callback_avx+0x32a>
+ DB 196,98,125,24,37,227,54,0,0 ; vbroadcastss 0x36e3(%rip),%ymm12 # 6bb0 <_sk_callback_avx+0x32a>
DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,100,54,0,0 ; vbroadcastss 0x3664(%rip),%ymm12 # 6af4 <_sk_callback_avx+0x32e>
+ DB 196,98,125,24,37,212,54,0,0 ; vbroadcastss 0x36d4(%rip),%ymm12 # 6bb4 <_sk_callback_avx+0x32e>
DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,90,54,0,0 ; vbroadcastss 0x365a(%rip),%ymm12 # 6af8 <_sk_callback_avx+0x332>
+ DB 196,98,125,24,37,202,54,0,0 ; vbroadcastss 0x36ca(%rip),%ymm12 # 6bb8 <_sk_callback_avx+0x332>
DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3
DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,62,54,0,0 ; vbroadcastss 0x363e(%rip),%ymm11 # 6afc <_sk_callback_avx+0x336>
+ DB 196,98,125,24,29,174,54,0,0 ; vbroadcastss 0x36ae(%rip),%ymm11 # 6bbc <_sk_callback_avx+0x336>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,52,54,0,0 ; vbroadcastss 0x3634(%rip),%ymm11 # 6b00 <_sk_callback_avx+0x33a>
+ DB 196,98,125,24,29,164,54,0,0 ; vbroadcastss 0x36a4(%rip),%ymm11 # 6bc0 <_sk_callback_avx+0x33a>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,37,54,0,0 ; vbroadcastss 0x3625(%rip),%ymm11 # 6b04 <_sk_callback_avx+0x33e>
+ DB 196,98,125,24,29,149,54,0,0 ; vbroadcastss 0x3695(%rip),%ymm11 # 6bc4 <_sk_callback_avx+0x33e>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,27,54,0,0 ; vbroadcastss 0x361b(%rip),%ymm11 # 6b08 <_sk_callback_avx+0x342>
+ DB 196,98,125,24,29,139,54,0,0 ; vbroadcastss 0x368b(%rip),%ymm11 # 6bc8 <_sk_callback_avx+0x342>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,12,54,0,0 ; vbroadcastss 0x360c(%rip),%ymm10 # 6b0c <_sk_callback_avx+0x346>
+ DB 196,98,125,24,21,124,54,0,0 ; vbroadcastss 0x367c(%rip),%ymm10 # 6bcc <_sk_callback_avx+0x346>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -8337,38 +8391,38 @@ _sk_parametric_a_avx LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,227,53,0,0 ; vbroadcastss 0x35e3(%rip),%ymm8 # 6b10 <_sk_callback_avx+0x34a>
+ DB 196,98,125,24,5,83,54,0,0 ; vbroadcastss 0x3653(%rip),%ymm8 # 6bd0 <_sk_callback_avx+0x34a>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
PUBLIC _sk_lab_to_xyz_avx
_sk_lab_to_xyz_avx LABEL PROC
- DB 196,98,125,24,5,213,53,0,0 ; vbroadcastss 0x35d5(%rip),%ymm8 # 6b14 <_sk_callback_avx+0x34e>
+ DB 196,98,125,24,5,69,54,0,0 ; vbroadcastss 0x3645(%rip),%ymm8 # 6bd4 <_sk_callback_avx+0x34e>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,203,53,0,0 ; vbroadcastss 0x35cb(%rip),%ymm8 # 6b18 <_sk_callback_avx+0x352>
+ DB 196,98,125,24,5,59,54,0,0 ; vbroadcastss 0x363b(%rip),%ymm8 # 6bd8 <_sk_callback_avx+0x352>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,193,53,0,0 ; vbroadcastss 0x35c1(%rip),%ymm9 # 6b1c <_sk_callback_avx+0x356>
+ DB 196,98,125,24,13,49,54,0,0 ; vbroadcastss 0x3631(%rip),%ymm9 # 6bdc <_sk_callback_avx+0x356>
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2
- DB 196,98,125,24,5,173,53,0,0 ; vbroadcastss 0x35ad(%rip),%ymm8 # 6b20 <_sk_callback_avx+0x35a>
+ DB 196,98,125,24,5,29,54,0,0 ; vbroadcastss 0x361d(%rip),%ymm8 # 6be0 <_sk_callback_avx+0x35a>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,163,53,0,0 ; vbroadcastss 0x35a3(%rip),%ymm8 # 6b24 <_sk_callback_avx+0x35e>
+ DB 196,98,125,24,5,19,54,0,0 ; vbroadcastss 0x3613(%rip),%ymm8 # 6be4 <_sk_callback_avx+0x35e>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,153,53,0,0 ; vbroadcastss 0x3599(%rip),%ymm8 # 6b28 <_sk_callback_avx+0x362>
+ DB 196,98,125,24,5,9,54,0,0 ; vbroadcastss 0x3609(%rip),%ymm8 # 6be8 <_sk_callback_avx+0x362>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1
- DB 196,98,125,24,5,139,53,0,0 ; vbroadcastss 0x358b(%rip),%ymm8 # 6b2c <_sk_callback_avx+0x366>
+ DB 196,98,125,24,5,251,53,0,0 ; vbroadcastss 0x35fb(%rip),%ymm8 # 6bec <_sk_callback_avx+0x366>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2
DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8
DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8
- DB 196,98,125,24,13,116,53,0,0 ; vbroadcastss 0x3574(%rip),%ymm9 # 6b30 <_sk_callback_avx+0x36a>
+ DB 196,98,125,24,13,228,53,0,0 ; vbroadcastss 0x35e4(%rip),%ymm9 # 6bf0 <_sk_callback_avx+0x36a>
DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,105,53,0,0 ; vbroadcastss 0x3569(%rip),%ymm11 # 6b34 <_sk_callback_avx+0x36e>
+ DB 196,98,125,24,29,217,53,0,0 ; vbroadcastss 0x35d9(%rip),%ymm11 # 6bf4 <_sk_callback_avx+0x36e>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,37,95,53,0,0 ; vbroadcastss 0x355f(%rip),%ymm12 # 6b38 <_sk_callback_avx+0x372>
+ DB 196,98,125,24,37,207,53,0,0 ; vbroadcastss 0x35cf(%rip),%ymm12 # 6bf8 <_sk_callback_avx+0x372>
DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1
DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -8383,9 +8437,9 @@ _sk_lab_to_xyz_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2
DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- DB 196,226,125,24,5,21,53,0,0 ; vbroadcastss 0x3515(%rip),%ymm0 # 6b3c <_sk_callback_avx+0x376>
+ DB 196,226,125,24,5,133,53,0,0 ; vbroadcastss 0x3585(%rip),%ymm0 # 6bfc <_sk_callback_avx+0x376>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,12,53,0,0 ; vbroadcastss 0x350c(%rip),%ymm8 # 6b40 <_sk_callback_avx+0x37a>
+ DB 196,98,125,24,5,124,53,0,0 ; vbroadcastss 0x357c(%rip),%ymm8 # 6c00 <_sk_callback_avx+0x37a>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8395,15 +8449,15 @@ _sk_load_a8_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 3689 <_sk_load_a8_avx+0x4c>
+ DB 117,66 ; jne 36d9 <_sk_load_a8_avx+0x4c>
DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0
- DB 197,249,219,5,91,55,0,0 ; vpand 0x375b(%rip),%xmm0,%xmm0 # 6db0 <_sk_callback_avx+0x5ea>
+ DB 197,249,219,5,203,55,0,0 ; vpand 0x37cb(%rip),%xmm0,%xmm0 # 6e70 <_sk_callback_avx+0x5ea>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,207,52,0,0 ; vbroadcastss 0x34cf(%rip),%ymm1 # 6b44 <_sk_callback_avx+0x37e>
+ DB 196,226,125,24,13,63,53,0,0 ; vbroadcastss 0x353f(%rip),%ymm1 # 6c04 <_sk_callback_avx+0x37e>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -8415,12 +8469,23 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,176 ; ja 364d <_sk_load_a8_avx+0x10>
+ DB 119,176 ; ja 369d <_sk_load_a8_avx+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,96,0,0,0 ; lea 0x60(%rip),%r10 # 3708 <_sk_load_a8_avx+0xcb>
+ DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 3770 <_sk_load_a8_avx+0xe3>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 197,249,110,192 ; vmovd %eax,%xmm0
+ DB 235,145 ; jmp 369d <_sk_load_a8_avx+0x10>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 197,249,110,200 ; vmovd %eax,%xmm1
+ DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
+ DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
+ DB 233,105,255,255,255 ; jmpq 369d <_sk_load_a8_avx+0x10>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -8428,33 +8493,25 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,196,192,5 ; vpinsrw $0x5,%eax,%xmm0,%xmm0
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 197,249,196,192,4 ; vpinsrw $0x4,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 197,249,196,192,3 ; vpinsrw $0x3,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 197,249,196,192,1 ; vpinsrw $0x1,%eax,%xmm0,%xmm0
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 197,249,196,192,0 ; vpinsrw $0x0,%eax,%xmm0,%xmm0
- DB 233,71,255,255,255 ; jmpq 364d <_sk_load_a8_avx+0x10>
- DB 102,144 ; xchg %ax,%ax
- DB 239 ; out %eax,(%dx)
- DB 255 ; (bad)
+ DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1
+ DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
+ DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
+ DB 233,46,255,255,255 ; jmpq 369d <_sk_load_a8_avx+0x10>
+ DB 144 ; nop
+ DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
- DB 255,228 ; jmpq *%rsp
DB 255 ; (bad)
+ DB 255,171,255,255,255,156 ; ljmp *-0x63000001(%rbx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 217,255 ; fcos
DB 255 ; (bad)
- DB 255,206 ; dec %esi
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003780 <_sk_callback_avx+0xffffffffdeffcefa>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,195 ; inc %ebx
+ DB 255,211 ; callq *%rbx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255 ; (bad)
- DB 184,255,255,255,169 ; mov $0xa9ffffff,%eax
+ DB 255,196 ; inc %esp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8501,7 +8558,7 @@ _sk_gather_a8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,88,51,0,0 ; vbroadcastss 0x3358(%rip),%ymm1 # 6b48 <_sk_callback_avx+0x382>
+ DB 196,226,125,24,13,176,51,0,0 ; vbroadcastss 0x33b0(%rip),%ymm1 # 6c08 <_sk_callback_avx+0x382>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -8513,14 +8570,14 @@ PUBLIC _sk_store_a8_avx
_sk_store_a8_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
- DB 196,98,125,24,5,58,51,0,0 ; vbroadcastss 0x333a(%rip),%ymm8 # 6b4c <_sk_callback_avx+0x386>
+ DB 196,98,125,24,5,146,51,0,0 ; vbroadcastss 0x3392(%rip),%ymm8 # 6c0c <_sk_callback_avx+0x386>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 383b <_sk_store_a8_avx+0x37>
+ DB 117,10 ; jne 38a3 <_sk_store_a8_avx+0x37>
DB 196,65,123,17,4,19 ; vmovsd %xmm8,(%r11,%rdx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8528,42 +8585,41 @@ _sk_store_a8_avx LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 3837 <_sk_store_a8_avx+0x33>
+ DB 119,236 ; ja 389f <_sk_store_a8_avx+0x33>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # 38a0 <_sk_store_a8_avx+0x9c>
+ DB 76,141,21,85,0,0,0 ; lea 0x55(%rip),%r10 # 3918 <_sk_store_a8_avx+0xac>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 196,67,121,20,4,19,0 ; vpextrb $0x0,%xmm8,(%r11,%rdx,1)
+ DB 235,202 ; jmp 389f <_sk_store_a8_avx+0x33>
+ DB 196,67,121,20,68,19,2,4 ; vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1)
+ DB 196,98,57,0,5,154,53,0,0 ; vpshufb 0x359a(%rip),%xmm8,%xmm8 # 6e80 <_sk_callback_avx+0x5fa>
+ DB 196,67,121,21,4,19,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,1)
+ DB 235,176 ; jmp 389f <_sk_store_a8_avx+0x33>
DB 196,67,121,20,68,19,6,12 ; vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1)
DB 196,67,121,20,68,19,5,10 ; vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1)
DB 196,67,121,20,68,19,4,8 ; vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1)
- DB 196,67,121,20,68,19,3,6 ; vpextrb $0x6,%xmm8,0x3(%r11,%rdx,1)
- DB 196,67,121,20,68,19,2,4 ; vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1)
- DB 196,67,121,20,68,19,1,2 ; vpextrb $0x2,%xmm8,0x1(%r11,%rdx,1)
- DB 196,67,121,20,4,19,0 ; vpextrb $0x0,%xmm8,(%r11,%rdx,1)
- DB 235,154 ; jmp 3837 <_sk_store_a8_avx+0x33>
- DB 15,31,0 ; nopl (%rax)
- DB 244 ; hlt
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 236 ; in (%dx),%al
+ DB 196,98,57,0,5,128,53,0,0 ; vpshufb 0x3580(%rip),%xmm8,%xmm8 # 6e90 <_sk_callback_avx+0x60a>
+ DB 196,65,121,126,4,19 ; vmovd %xmm8,(%r11,%rdx,1)
+ DB 235,135 ; jmp 389f <_sk_store_a8_avx+0x33>
+ DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
+ DB 255,197 ; inc %ebp
DB 255 ; (bad)
- DB 255,228 ; jmpq *%rsp
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 189,255,255,255,239 ; mov $0xefffffff,%ebp
DB 255 ; (bad)
- DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
- DB 255,212 ; callq *%rsp
+ DB 255,231 ; jmpq *%rdi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,204 ; dec %esp
DB 255 ; (bad)
+ DB 223,255 ; (bad)
DB 255 ; (bad)
- DB 255,196 ; inc %esp
+ DB 255,215 ; callq *%rdi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8573,18 +8629,18 @@ _sk_load_g8_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,71 ; jne 390d <_sk_load_g8_avx+0x51>
+ DB 117,71 ; jne 3985 <_sk_load_g8_avx+0x51>
DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0
- DB 197,249,219,5,236,52,0,0 ; vpand 0x34ec(%rip),%xmm0,%xmm0 # 6dc0 <_sk_callback_avx+0x5fa>
+ DB 197,249,219,5,84,53,0,0 ; vpand 0x3554(%rip),%xmm0,%xmm0 # 6ea0 <_sk_callback_avx+0x61a>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,92,50,0,0 ; vbroadcastss 0x325c(%rip),%ymm1 # 6b50 <_sk_callback_avx+0x38a>
+ DB 196,226,125,24,13,164,50,0,0 ; vbroadcastss 0x32a4(%rip),%ymm1 # 6c10 <_sk_callback_avx+0x38a>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,81,50,0,0 ; vbroadcastss 0x3251(%rip),%ymm3 # 6b54 <_sk_callback_avx+0x38e>
+ DB 196,226,125,24,29,153,50,0,0 ; vbroadcastss 0x3299(%rip),%ymm3 # 6c14 <_sk_callback_avx+0x38e>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -8593,12 +8649,23 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,171 ; ja 38cc <_sk_load_g8_avx+0x10>
+ DB 119,171 ; ja 3944 <_sk_load_g8_avx+0x10>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,96,0,0,0 ; lea 0x60(%rip),%r10 # 398c <_sk_load_g8_avx+0xd0>
+ DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 3a1c <_sk_load_g8_avx+0xe8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 197,249,110,192 ; vmovd %eax,%xmm0
+ DB 235,140 ; jmp 3944 <_sk_load_g8_avx+0x10>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 197,249,110,200 ; vmovd %eax,%xmm1
+ DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
+ DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
+ DB 233,100,255,255,255 ; jmpq 3944 <_sk_load_g8_avx+0x10>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -8606,33 +8673,25 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,196,192,5 ; vpinsrw $0x5,%eax,%xmm0,%xmm0
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 197,249,196,192,4 ; vpinsrw $0x4,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 197,249,196,192,3 ; vpinsrw $0x3,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 197,249,196,192,1 ; vpinsrw $0x1,%eax,%xmm0,%xmm0
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 197,249,196,192,0 ; vpinsrw $0x0,%eax,%xmm0,%xmm0
- DB 233,66,255,255,255 ; jmpq 38cc <_sk_load_g8_avx+0x10>
- DB 102,144 ; xchg %ax,%ax
- DB 239 ; out %eax,(%dx)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255,228 ; jmpq *%rsp
+ DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1
+ DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
+ DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
+ DB 233,41,255,255,255 ; jmpq 3944 <_sk_load_g8_avx+0x10>
+ DB 144 ; nop
+ DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,171,255,255,255,156 ; ljmp *-0x63000001(%rbx)
DB 255 ; (bad)
- DB 217,255 ; fcos
DB 255 ; (bad)
- DB 255,206 ; dec %esi
DB 255 ; (bad)
+ DB 233,255,255,255,222 ; jmpq ffffffffdf003a2c <_sk_callback_avx+0xffffffffdeffd1a6>
DB 255 ; (bad)
- DB 255,195 ; inc %ebx
DB 255 ; (bad)
+ DB 255,211 ; callq *%rbx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 184,255,255,255,169 ; mov $0xa9ffffff,%eax
+ DB 255,196 ; inc %esp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8679,10 +8738,10 @@ _sk_gather_g8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,228,48,0,0 ; vbroadcastss 0x30e4(%rip),%ymm1 # 6b58 <_sk_callback_avx+0x392>
+ DB 196,226,125,24,13,20,49,0,0 ; vbroadcastss 0x3114(%rip),%ymm1 # 6c18 <_sk_callback_avx+0x392>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,217,48,0,0 ; vbroadcastss 0x30d9(%rip),%ymm3 # 6b5c <_sk_callback_avx+0x396>
+ DB 196,226,125,24,29,9,49,0,0 ; vbroadcastss 0x3109(%rip),%ymm3 # 6c1c <_sk_callback_avx+0x396>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -8692,9 +8751,9 @@ _sk_gather_i8_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,137,193 ; mov %rax,%r9
DB 77,133,201 ; test %r9,%r9
- DB 116,5 ; je 3a9c <_sk_gather_i8_avx+0xf>
+ DB 116,5 ; je 3b2c <_sk_gather_i8_avx+0xf>
DB 76,137,200 ; mov %r9,%rax
- DB 235,2 ; jmp 3a9e <_sk_gather_i8_avx+0x11>
+ DB 235,2 ; jmp 3b2e <_sk_gather_i8_avx+0x11>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 83 ; push %rbx
DB 76,139,16 ; mov (%rax),%r10
@@ -8752,10 +8811,10 @@ _sk_gather_i8_avx LABEL PROC
DB 72,193,235,30 ; shr $0x1e,%rbx
DB 196,195,121,34,28,27,3 ; vpinsrd $0x3,(%r11,%rbx,1),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,164,50,0,0 ; vmovaps 0x32a4(%rip),%ymm10 # 6e60 <_sk_callback_avx+0x69a>
+ DB 197,124,40,21,244,50,0,0 ; vmovaps 0x32f4(%rip),%ymm10 # 6f40 <_sk_callback_avx+0x6ba>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,146,47,0,0 ; vbroadcastss 0x2f92(%rip),%ymm9 # 6b60 <_sk_callback_avx+0x39a>
+ DB 196,98,125,24,13,194,47,0,0 ; vbroadcastss 0x2fc2(%rip),%ymm9 # 6c20 <_sk_callback_avx+0x39a>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -8783,71 +8842,72 @@ _sk_load_565_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,128,0,0,0 ; jne 3cbe <_sk_load_565_avx+0x8e>
+ DB 15,133,128,0,0,0 ; jne 3d4e <_sk_load_565_avx+0x8e>
DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,4,47,0,0 ; vbroadcastss 0x2f04(%rip),%ymm0 # 6b64 <_sk_callback_avx+0x39e>
+ DB 196,226,125,24,5,52,47,0,0 ; vbroadcastss 0x2f34(%rip),%ymm0 # 6c24 <_sk_callback_avx+0x39e>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,247,46,0,0 ; vbroadcastss 0x2ef7(%rip),%ymm1 # 6b68 <_sk_callback_avx+0x3a2>
+ DB 196,226,125,24,13,39,47,0,0 ; vbroadcastss 0x2f27(%rip),%ymm1 # 6c28 <_sk_callback_avx+0x3a2>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,238,46,0,0 ; vbroadcastss 0x2eee(%rip),%ymm1 # 6b6c <_sk_callback_avx+0x3a6>
+ DB 196,226,125,24,13,30,47,0,0 ; vbroadcastss 0x2f1e(%rip),%ymm1 # 6c2c <_sk_callback_avx+0x3a6>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,225,46,0,0 ; vbroadcastss 0x2ee1(%rip),%ymm3 # 6b70 <_sk_callback_avx+0x3aa>
+ DB 196,226,125,24,29,17,47,0,0 ; vbroadcastss 0x2f11(%rip),%ymm3 # 6c30 <_sk_callback_avx+0x3aa>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,216,46,0,0 ; vbroadcastss 0x2ed8(%rip),%ymm3 # 6b74 <_sk_callback_avx+0x3ae>
+ DB 196,226,125,24,29,8,47,0,0 ; vbroadcastss 0x2f08(%rip),%ymm3 # 6c34 <_sk_callback_avx+0x3ae>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,203,46,0,0 ; vbroadcastss 0x2ecb(%rip),%ymm3 # 6b78 <_sk_callback_avx+0x3b2>
+ DB 196,226,125,24,29,251,46,0,0 ; vbroadcastss 0x2efb(%rip),%ymm3 # 6c38 <_sk_callback_avx+0x3b2>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,192,46,0,0 ; vbroadcastss 0x2ec0(%rip),%ymm3 # 6b7c <_sk_callback_avx+0x3b6>
+ DB 196,226,125,24,29,240,46,0,0 ; vbroadcastss 0x2ef0(%rip),%ymm3 # 6c3c <_sk_callback_avx+0x3b6>
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,110,255,255,255 ; ja 3c44 <_sk_load_565_avx+0x14>
+ DB 15,135,110,255,255,255 ; ja 3cd4 <_sk_load_565_avx+0x14>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,75,0,0,0 ; lea 0x4b(%rip),%r10 # 3d2c <_sk_load_565_avx+0xfc>
+ DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 3dd4 <_sk_load_565_avx+0x114>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax
+ DB 197,249,110,192 ; vmovd %eax,%xmm0
+ DB 233,76,255,255,255 ; jmpq 3cd4 <_sk_load_565_avx+0x14>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
+ DB 196,193,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm1
+ DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
+ DB 233,47,255,255,255 ; jmpq 3cd4 <_sk_load_565_avx+0x14>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0
DB 196,193,121,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0
DB 196,193,121,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,6,3 ; vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,2,1 ; vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,4,83,0 ; vpinsrw $0x0,(%r11,%rdx,2),%xmm0,%xmm0
- DB 233,26,255,255,255 ; jmpq 3c44 <_sk_load_565_avx+0x14>
+ DB 196,193,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm1
+ DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
+ DB 233,2,255,255,255 ; jmpq 3cd4 <_sk_load_565_avx+0x14>
DB 102,144 ; xchg %ax,%ax
- DB 242,255 ; repnz (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 234 ; (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255,226 ; jmpq *%rdx
+ DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,192 ; inc %eax
DB 255 ; (bad)
- DB 218,255 ; (bad)
DB 255 ; (bad)
- DB 255,210 ; callq *%rdx
+ DB 255,180,255,255,255,237,255 ; pushq -0x120001(%rdi,%rdi,8)
DB 255 ; (bad)
+ DB 255,229 ; jmpq *%rbp
DB 255 ; (bad)
- DB 255,202 ; dec %edx
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 221,255 ; (bad)
DB 255 ; (bad)
- DB 190 ; .byte 0xbe
+ DB 255,209 ; callq *%rcx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8898,37 +8958,37 @@ _sk_gather_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,102,45,0,0 ; vbroadcastss 0x2d66(%rip),%ymm0 # 6b80 <_sk_callback_avx+0x3ba>
+ DB 196,226,125,24,5,126,45,0,0 ; vbroadcastss 0x2d7e(%rip),%ymm0 # 6c40 <_sk_callback_avx+0x3ba>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,89,45,0,0 ; vbroadcastss 0x2d59(%rip),%ymm1 # 6b84 <_sk_callback_avx+0x3be>
+ DB 196,226,125,24,13,113,45,0,0 ; vbroadcastss 0x2d71(%rip),%ymm1 # 6c44 <_sk_callback_avx+0x3be>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,80,45,0,0 ; vbroadcastss 0x2d50(%rip),%ymm1 # 6b88 <_sk_callback_avx+0x3c2>
+ DB 196,226,125,24,13,104,45,0,0 ; vbroadcastss 0x2d68(%rip),%ymm1 # 6c48 <_sk_callback_avx+0x3c2>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,67,45,0,0 ; vbroadcastss 0x2d43(%rip),%ymm3 # 6b8c <_sk_callback_avx+0x3c6>
+ DB 196,226,125,24,29,91,45,0,0 ; vbroadcastss 0x2d5b(%rip),%ymm3 # 6c4c <_sk_callback_avx+0x3c6>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,58,45,0,0 ; vbroadcastss 0x2d3a(%rip),%ymm3 # 6b90 <_sk_callback_avx+0x3ca>
+ DB 196,226,125,24,29,82,45,0,0 ; vbroadcastss 0x2d52(%rip),%ymm3 # 6c50 <_sk_callback_avx+0x3ca>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,45,45,0,0 ; vbroadcastss 0x2d2d(%rip),%ymm3 # 6b94 <_sk_callback_avx+0x3ce>
+ DB 196,226,125,24,29,69,45,0,0 ; vbroadcastss 0x2d45(%rip),%ymm3 # 6c54 <_sk_callback_avx+0x3ce>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,34,45,0,0 ; vbroadcastss 0x2d22(%rip),%ymm3 # 6b98 <_sk_callback_avx+0x3d2>
+ DB 196,226,125,24,29,58,45,0,0 ; vbroadcastss 0x2d3a(%rip),%ymm3 # 6c58 <_sk_callback_avx+0x3d2>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_avx
_sk_store_565_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
- DB 196,98,125,24,5,22,45,0,0 ; vbroadcastss 0x2d16(%rip),%ymm8 # 6b9c <_sk_callback_avx+0x3d6>
+ DB 196,98,125,24,5,46,45,0,0 ; vbroadcastss 0x2d2e(%rip),%ymm8 # 6c5c <_sk_callback_avx+0x3d6>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- DB 196,98,125,24,21,239,44,0,0 ; vbroadcastss 0x2cef(%rip),%ymm10 # 6ba0 <_sk_callback_avx+0x3da>
+ DB 196,98,125,24,21,7,45,0,0 ; vbroadcastss 0x2d07(%rip),%ymm10 # 6c60 <_sk_callback_avx+0x3da>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11
@@ -8942,7 +9002,7 @@ _sk_store_565_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3f01 <_sk_store_565_avx+0x89>
+ DB 117,10 ; jne 3fa9 <_sk_store_565_avx+0x89>
DB 196,65,122,127,4,83 ; vmovdqu %xmm8,(%r11,%rdx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8950,42 +9010,42 @@ _sk_store_565_avx LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 3efd <_sk_store_565_avx+0x85>
+ DB 119,236 ; ja 3fa5 <_sk_store_565_avx+0x85>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,68,0,0,0 ; lea 0x44(%rip),%r10 # 3f60 <_sk_store_565_avx+0xe8>
+ DB 76,141,21,68,0,0,0 ; lea 0x44(%rip),%r10 # 4008 <_sk_store_565_avx+0xe8>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2)
+ DB 235,207 ; jmp 3fa5 <_sk_store_565_avx+0x85>
+ DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
+ DB 196,65,121,126,4,83 ; vmovd %xmm8,(%r11,%rdx,2)
+ DB 235,191 ; jmp 3fa5 <_sk_store_565_avx+0x85>
DB 196,67,121,21,68,83,12,6 ; vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2)
DB 196,67,121,21,68,83,10,5 ; vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2)
DB 196,67,121,21,68,83,8,4 ; vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2)
- DB 196,67,121,21,68,83,6,3 ; vpextrw $0x3,%xmm8,0x6(%r11,%rdx,2)
- DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
- DB 196,67,121,21,68,83,2,1 ; vpextrw $0x1,%xmm8,0x2(%r11,%rdx,2)
- DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2)
- DB 235,159 ; jmp 3efd <_sk_store_565_avx+0x85>
+ DB 196,65,121,214,4,83 ; vmovq %xmm8,(%r11,%rdx,2)
+ DB 235,159 ; jmp 3fa5 <_sk_store_565_avx+0x85>
DB 102,144 ; xchg %ax,%ax
- DB 245 ; cmc
- DB 255 ; (bad)
- DB 255 ; (bad)
+ DB 197,255,255 ; (bad)
+ DB 255,214 ; callq *%rsi
DB 255 ; (bad)
- DB 237 ; in (%dx),%eax
DB 255 ; (bad)
+ DB 255,206 ; dec %esi
DB 255 ; (bad)
- DB 255,229 ; jmpq *%rbp
DB 255 ; (bad)
+ DB 255,246 ; push %rsi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 221,255 ; (bad)
DB 255 ; (bad)
- DB 255,213 ; callq *%rbp
+ DB 238 ; out %al,(%dx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,205 ; dec %ebp
+ DB 255,230 ; jmpq *%rsi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,197 ; inc %ebp
DB 255 ; (bad)
+ DB 222,255 ; fdivrp %st,%st(7)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -8994,31 +9054,31 @@ _sk_load_4444_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,152,0,0,0 ; jne 4022 <_sk_load_4444_avx+0xa6>
+ DB 15,133,152,0,0,0 ; jne 40ca <_sk_load_4444_avx+0xa6>
DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,248,43,0,0 ; vbroadcastss 0x2bf8(%rip),%ymm0 # 6ba4 <_sk_callback_avx+0x3de>
+ DB 196,226,125,24,5,16,44,0,0 ; vbroadcastss 0x2c10(%rip),%ymm0 # 6c64 <_sk_callback_avx+0x3de>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,235,43,0,0 ; vbroadcastss 0x2beb(%rip),%ymm1 # 6ba8 <_sk_callback_avx+0x3e2>
+ DB 196,226,125,24,13,3,44,0,0 ; vbroadcastss 0x2c03(%rip),%ymm1 # 6c68 <_sk_callback_avx+0x3e2>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,226,43,0,0 ; vbroadcastss 0x2be2(%rip),%ymm1 # 6bac <_sk_callback_avx+0x3e6>
+ DB 196,226,125,24,13,250,43,0,0 ; vbroadcastss 0x2bfa(%rip),%ymm1 # 6c6c <_sk_callback_avx+0x3e6>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,213,43,0,0 ; vbroadcastss 0x2bd5(%rip),%ymm2 # 6bb0 <_sk_callback_avx+0x3ea>
+ DB 196,226,125,24,21,237,43,0,0 ; vbroadcastss 0x2bed(%rip),%ymm2 # 6c70 <_sk_callback_avx+0x3ea>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,204,43,0,0 ; vbroadcastss 0x2bcc(%rip),%ymm2 # 6bb4 <_sk_callback_avx+0x3ee>
+ DB 196,226,125,24,21,228,43,0,0 ; vbroadcastss 0x2be4(%rip),%ymm2 # 6c74 <_sk_callback_avx+0x3ee>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,191,43,0,0 ; vbroadcastss 0x2bbf(%rip),%ymm8 # 6bb8 <_sk_callback_avx+0x3f2>
+ DB 196,98,125,24,5,215,43,0,0 ; vbroadcastss 0x2bd7(%rip),%ymm8 # 6c78 <_sk_callback_avx+0x3f2>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,181,43,0,0 ; vbroadcastss 0x2bb5(%rip),%ymm8 # 6bbc <_sk_callback_avx+0x3f6>
+ DB 196,98,125,24,5,205,43,0,0 ; vbroadcastss 0x2bcd(%rip),%ymm8 # 6c7c <_sk_callback_avx+0x3f6>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,167,43,0,0 ; vbroadcastss 0x2ba7(%rip),%ymm8 # 6bc0 <_sk_callback_avx+0x3fa>
+ DB 196,98,125,24,5,191,43,0,0 ; vbroadcastss 0x2bbf(%rip),%ymm8 # 6c80 <_sk_callback_avx+0x3fa>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9027,42 +9087,43 @@ _sk_load_4444_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,86,255,255,255 ; ja 3f90 <_sk_load_4444_avx+0x14>
+ DB 15,135,86,255,255,255 ; ja 4038 <_sk_load_4444_avx+0x14>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,75,0,0,0 ; lea 0x4b(%rip),%r10 # 4090 <_sk_load_4444_avx+0x114>
+ DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 4150 <_sk_load_4444_avx+0x12c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax
+ DB 197,249,110,192 ; vmovd %eax,%xmm0
+ DB 233,52,255,255,255 ; jmpq 4038 <_sk_load_4444_avx+0x14>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
+ DB 196,193,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm1
+ DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
+ DB 233,23,255,255,255 ; jmpq 4038 <_sk_load_4444_avx+0x14>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0
DB 196,193,121,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0
DB 196,193,121,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,6,3 ; vpinsrw $0x3,0x6(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,68,83,2,1 ; vpinsrw $0x1,0x2(%r11,%rdx,2),%xmm0,%xmm0
- DB 196,193,121,196,4,83,0 ; vpinsrw $0x0,(%r11,%rdx,2),%xmm0,%xmm0
- DB 233,2,255,255,255 ; jmpq 3f90 <_sk_load_4444_avx+0x14>
+ DB 196,193,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm1
+ DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
+ DB 233,234,254,255,255 ; jmpq 4038 <_sk_load_4444_avx+0x14>
DB 102,144 ; xchg %ax,%ax
- DB 242,255 ; repnz (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 234 ; (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255,226 ; jmpq *%rdx
+ DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,192 ; inc %eax
DB 255 ; (bad)
- DB 218,255 ; (bad)
DB 255 ; (bad)
- DB 255,210 ; callq *%rdx
+ DB 255,180,255,255,255,237,255 ; pushq -0x120001(%rdi,%rdi,8)
DB 255 ; (bad)
+ DB 255,229 ; jmpq *%rbp
DB 255 ; (bad)
- DB 255,202 ; dec %edx
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 221,255 ; (bad)
DB 255 ; (bad)
- DB 190 ; .byte 0xbe
+ DB 255,209 ; callq *%rcx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -9113,25 +9174,25 @@ _sk_gather_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,70,42,0,0 ; vbroadcastss 0x2a46(%rip),%ymm0 # 6bc4 <_sk_callback_avx+0x3fe>
+ DB 196,226,125,24,5,70,42,0,0 ; vbroadcastss 0x2a46(%rip),%ymm0 # 6c84 <_sk_callback_avx+0x3fe>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,57,42,0,0 ; vbroadcastss 0x2a39(%rip),%ymm1 # 6bc8 <_sk_callback_avx+0x402>
+ DB 196,226,125,24,13,57,42,0,0 ; vbroadcastss 0x2a39(%rip),%ymm1 # 6c88 <_sk_callback_avx+0x402>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,48,42,0,0 ; vbroadcastss 0x2a30(%rip),%ymm1 # 6bcc <_sk_callback_avx+0x406>
+ DB 196,226,125,24,13,48,42,0,0 ; vbroadcastss 0x2a30(%rip),%ymm1 # 6c8c <_sk_callback_avx+0x406>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,35,42,0,0 ; vbroadcastss 0x2a23(%rip),%ymm2 # 6bd0 <_sk_callback_avx+0x40a>
+ DB 196,226,125,24,21,35,42,0,0 ; vbroadcastss 0x2a23(%rip),%ymm2 # 6c90 <_sk_callback_avx+0x40a>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,26,42,0,0 ; vbroadcastss 0x2a1a(%rip),%ymm2 # 6bd4 <_sk_callback_avx+0x40e>
+ DB 196,226,125,24,21,26,42,0,0 ; vbroadcastss 0x2a1a(%rip),%ymm2 # 6c94 <_sk_callback_avx+0x40e>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,13,42,0,0 ; vbroadcastss 0x2a0d(%rip),%ymm8 # 6bd8 <_sk_callback_avx+0x412>
+ DB 196,98,125,24,5,13,42,0,0 ; vbroadcastss 0x2a0d(%rip),%ymm8 # 6c98 <_sk_callback_avx+0x412>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,3,42,0,0 ; vbroadcastss 0x2a03(%rip),%ymm8 # 6bdc <_sk_callback_avx+0x416>
+ DB 196,98,125,24,5,3,42,0,0 ; vbroadcastss 0x2a03(%rip),%ymm8 # 6c9c <_sk_callback_avx+0x416>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,245,41,0,0 ; vbroadcastss 0x29f5(%rip),%ymm8 # 6be0 <_sk_callback_avx+0x41a>
+ DB 196,98,125,24,5,245,41,0,0 ; vbroadcastss 0x29f5(%rip),%ymm8 # 6ca0 <_sk_callback_avx+0x41a>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9140,7 +9201,7 @@ PUBLIC _sk_store_4444_avx
_sk_store_4444_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
- DB 196,98,125,24,5,226,41,0,0 ; vbroadcastss 0x29e2(%rip),%ymm8 # 6be4 <_sk_callback_avx+0x41e>
+ DB 196,98,125,24,5,226,41,0,0 ; vbroadcastss 0x29e2(%rip),%ymm8 # 6ca4 <_sk_callback_avx+0x41e>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10
@@ -9167,7 +9228,7 @@ _sk_store_4444_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 429b <_sk_store_4444_avx+0xa7>
+ DB 117,10 ; jne 435b <_sk_store_4444_avx+0xa7>
DB 196,65,122,127,4,83 ; vmovdqu %xmm8,(%r11,%rdx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9175,39 +9236,40 @@ _sk_store_4444_avx LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 4297 <_sk_store_4444_avx+0xa3>
+ DB 119,236 ; ja 4357 <_sk_store_4444_avx+0xa3>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,66,0,0,0 ; lea 0x42(%rip),%r10 # 42f8 <_sk_store_4444_avx+0x104>
+ DB 76,141,21,66,0,0,0 ; lea 0x42(%rip),%r10 # 43b8 <_sk_store_4444_avx+0x104>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2)
+ DB 235,207 ; jmp 4357 <_sk_store_4444_avx+0xa3>
+ DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
+ DB 196,65,121,126,4,83 ; vmovd %xmm8,(%r11,%rdx,2)
+ DB 235,191 ; jmp 4357 <_sk_store_4444_avx+0xa3>
DB 196,67,121,21,68,83,12,6 ; vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2)
DB 196,67,121,21,68,83,10,5 ; vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2)
DB 196,67,121,21,68,83,8,4 ; vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2)
- DB 196,67,121,21,68,83,6,3 ; vpextrw $0x3,%xmm8,0x6(%r11,%rdx,2)
- DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2)
- DB 196,67,121,21,68,83,2,1 ; vpextrw $0x1,%xmm8,0x2(%r11,%rdx,2)
- DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2)
- DB 235,159 ; jmp 4297 <_sk_store_4444_avx+0xa3>
- DB 247,255 ; idiv %edi
+ DB 196,65,121,214,4,83 ; vmovq %xmm8,(%r11,%rdx,2)
+ DB 235,159 ; jmp 4357 <_sk_store_4444_avx+0xa3>
+ DB 199 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 239 ; out %eax,(%dx)
DB 255 ; (bad)
+ DB 216,255 ; fdivr %st(7),%st
DB 255 ; (bad)
- DB 255,231 ; jmpq *%rdi
+ DB 255,208 ; callq *%rax
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 223,255 ; (bad)
+ DB 248 ; clc
DB 255 ; (bad)
- DB 255,215 ; callq *%rdi
DB 255 ; (bad)
+ DB 255,240 ; push %rax
DB 255 ; (bad)
- DB 255,207 ; dec %edi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,199 ; inc %edi
+ DB 232,255,255,255,224 ; callq ffffffffe10043d0 <_sk_callback_avx+0xffffffffe0ffdb4a>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -9220,12 +9282,12 @@ _sk_load_8888_avx LABEL PROC
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 76,3,16 ; add (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,139,0,0,0 ; jne 43b9 <_sk_load_8888_avx+0xa5>
+ DB 15,133,139,0,0,0 ; jne 4479 <_sk_load_8888_avx+0xa5>
DB 196,193,124,16,26 ; vmovups (%r10),%ymm3
- DB 197,124,40,21,69,43,0,0 ; vmovaps 0x2b45(%rip),%ymm10 # 6e80 <_sk_callback_avx+0x6ba>
+ DB 197,124,40,21,101,43,0,0 ; vmovaps 0x2b65(%rip),%ymm10 # 6f60 <_sk_callback_avx+0x6da>
DB 196,193,100,84,194 ; vandps %ymm10,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,155,40,0,0 ; vbroadcastss 0x289b(%rip),%ymm8 # 6be8 <_sk_callback_avx+0x422>
+ DB 196,98,125,24,5,155,40,0,0 ; vbroadcastss 0x289b(%rip),%ymm8 # 6ca8 <_sk_callback_avx+0x422>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
DB 196,195,125,25,217,1 ; vextractf128 $0x1,%ymm3,%xmm9
@@ -9256,13 +9318,13 @@ _sk_load_8888_avx LABEL PROC
DB 72,211,232 ; shr %cl,%rax
DB 196,225,249,110,192 ; vmovq %rax,%xmm0
DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0
- DB 196,226,121,0,13,239,41,0,0 ; vpshufb 0x29ef(%rip),%xmm0,%xmm1 # 6dd0 <_sk_callback_avx+0x60a>
+ DB 196,226,121,0,13,15,42,0,0 ; vpshufb 0x2a0f(%rip),%xmm0,%xmm1 # 6eb0 <_sk_callback_avx+0x62a>
DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1
- DB 196,226,121,0,5,241,41,0,0 ; vpshufb 0x29f1(%rip),%xmm0,%xmm0 # 6de0 <_sk_callback_avx+0x61a>
+ DB 196,226,121,0,5,17,42,0,0 ; vpshufb 0x2a11(%rip),%xmm0,%xmm0 # 6ec0 <_sk_callback_avx+0x63a>
DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 196,194,125,44,26 ; vmaskmovps (%r10),%ymm0,%ymm3
- DB 233,47,255,255,255 ; jmpq 4333 <_sk_load_8888_avx+0x1f>
+ DB 233,47,255,255,255 ; jmpq 43f3 <_sk_load_8888_avx+0x1f>
PUBLIC _sk_gather_8888_avx
_sk_gather_8888_avx LABEL PROC
@@ -9299,10 +9361,10 @@ _sk_gather_8888_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,241,41,0,0 ; vmovaps 0x29f1(%rip),%ymm10 # 6ea0 <_sk_callback_avx+0x6da>
+ DB 197,124,40,21,17,42,0,0 ; vmovaps 0x2a11(%rip),%ymm10 # 6f80 <_sk_callback_avx+0x6fa>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,43,39,0,0 ; vbroadcastss 0x272b(%rip),%ymm9 # 6bec <_sk_callback_avx+0x426>
+ DB 196,98,125,24,13,43,39,0,0 ; vbroadcastss 0x272b(%rip),%ymm9 # 6cac <_sk_callback_avx+0x426>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -9331,7 +9393,7 @@ _sk_store_8888_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 76,3,16 ; add (%rax),%r10
- DB 196,98,125,24,5,180,38,0,0 ; vbroadcastss 0x26b4(%rip),%ymm8 # 6bf0 <_sk_callback_avx+0x42a>
+ DB 196,98,125,24,5,180,38,0,0 ; vbroadcastss 0x26b4(%rip),%ymm8 # 6cb0 <_sk_callback_avx+0x42a>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -9356,7 +9418,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,14 ; jne 45ce <_sk_store_8888_avx+0xac>
+ DB 117,14 ; jne 468e <_sk_store_8888_avx+0xac>
DB 196,65,124,17,2 ; vmovups %ymm8,(%r10)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,137,201 ; mov %r9,%rcx
@@ -9369,13 +9431,13 @@ _sk_store_8888_avx LABEL PROC
DB 72,211,232 ; shr %cl,%rax
DB 196,97,249,110,200 ; vmovq %rax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
- DB 196,98,49,0,21,250,39,0,0 ; vpshufb 0x27fa(%rip),%xmm9,%xmm10 # 6df0 <_sk_callback_avx+0x62a>
+ DB 196,98,49,0,21,26,40,0,0 ; vpshufb 0x281a(%rip),%xmm9,%xmm10 # 6ed0 <_sk_callback_avx+0x64a>
DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10
- DB 196,98,49,0,13,252,39,0,0 ; vpshufb 0x27fc(%rip),%xmm9,%xmm9 # 6e00 <_sk_callback_avx+0x63a>
+ DB 196,98,49,0,13,28,40,0,0 ; vpshufb 0x281c(%rip),%xmm9,%xmm9 # 6ee0 <_sk_callback_avx+0x65a>
DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10)
- DB 235,175 ; jmp 45c5 <_sk_store_8888_avx+0xa3>
+ DB 235,175 ; jmp 4685 <_sk_store_8888_avx+0xa3>
PUBLIC _sk_load_f16_avx
_sk_load_f16_avx LABEL PROC
@@ -9387,7 +9449,7 @@ _sk_load_f16_avx LABEL PROC
DB 197,252,17,116,36,64 ; vmovups %ymm6,0x40(%rsp)
DB 197,252,17,108,36,32 ; vmovups %ymm5,0x20(%rsp)
DB 197,254,127,36,36 ; vmovdqu %ymm4,(%rsp)
- DB 15,133,143,2,0,0 ; jne 48d1 <_sk_load_f16_avx+0x2bb>
+ DB 15,133,143,2,0,0 ; jne 4991 <_sk_load_f16_avx+0x2bb>
DB 197,121,16,4,208 ; vmovupd (%rax,%rdx,8),%xmm8
DB 197,249,16,84,208,16 ; vmovupd 0x10(%rax,%rdx,8),%xmm2
DB 197,249,16,76,208,32 ; vmovupd 0x20(%rax,%rdx,8),%xmm1
@@ -9405,13 +9467,13 @@ _sk_load_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,89,37,0,0 ; vbroadcastss 0x2559(%rip),%ymm12 # 6bf4 <_sk_callback_avx+0x42e>
+ DB 196,98,125,24,37,89,37,0,0 ; vbroadcastss 0x2559(%rip),%ymm12 # 6cb4 <_sk_callback_avx+0x42e>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,69,37,0,0 ; vbroadcastss 0x2545(%rip),%xmm11 # 6bf8 <_sk_callback_avx+0x432>
+ DB 196,98,121,24,29,69,37,0,0 ; vbroadcastss 0x2545(%rip),%xmm11 # 6cb8 <_sk_callback_avx+0x432>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,59,37,0,0 ; vbroadcastss 0x253b(%rip),%xmm13 # 6bfc <_sk_callback_avx+0x436>
+ DB 196,98,121,24,45,59,37,0,0 ; vbroadcastss 0x253b(%rip),%xmm13 # 6cbc <_sk_callback_avx+0x436>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -9425,7 +9487,7 @@ _sk_load_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,241,36,0,0 ; vbroadcastss 0x24f1(%rip),%xmm3 # 6c00 <_sk_callback_avx+0x43a>
+ DB 196,226,121,24,29,241,36,0,0 ; vbroadcastss 0x24f1(%rip),%xmm3 # 6cc0 <_sk_callback_avx+0x43a>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -9518,29 +9580,29 @@ _sk_load_f16_avx LABEL PROC
DB 197,123,16,4,208 ; vmovsd (%rax,%rdx,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,79 ; je 4930 <_sk_load_f16_avx+0x31a>
+ DB 116,79 ; je 49f0 <_sk_load_f16_avx+0x31a>
DB 197,57,22,68,208,8 ; vmovhpd 0x8(%rax,%rdx,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,67 ; jb 4930 <_sk_load_f16_avx+0x31a>
+ DB 114,67 ; jb 49f0 <_sk_load_f16_avx+0x31a>
DB 197,251,16,84,208,16 ; vmovsd 0x10(%rax,%rdx,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,68 ; je 493d <_sk_load_f16_avx+0x327>
+ DB 116,68 ; je 49fd <_sk_load_f16_avx+0x327>
DB 197,233,22,84,208,24 ; vmovhpd 0x18(%rax,%rdx,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,56 ; jb 493d <_sk_load_f16_avx+0x327>
+ DB 114,56 ; jb 49fd <_sk_load_f16_avx+0x327>
DB 197,251,16,76,208,32 ; vmovsd 0x20(%rax,%rdx,8),%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,68,253,255,255 ; je 4659 <_sk_load_f16_avx+0x43>
+ DB 15,132,68,253,255,255 ; je 4719 <_sk_load_f16_avx+0x43>
DB 197,241,22,76,208,40 ; vmovhpd 0x28(%rax,%rdx,8),%xmm1,%xmm1
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,52,253,255,255 ; jb 4659 <_sk_load_f16_avx+0x43>
+ DB 15,130,52,253,255,255 ; jb 4719 <_sk_load_f16_avx+0x43>
DB 197,122,126,76,208,48 ; vmovq 0x30(%rax,%rdx,8),%xmm9
- DB 233,41,253,255,255 ; jmpq 4659 <_sk_load_f16_avx+0x43>
+ DB 233,41,253,255,255 ; jmpq 4719 <_sk_load_f16_avx+0x43>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,28,253,255,255 ; jmpq 4659 <_sk_load_f16_avx+0x43>
+ DB 233,28,253,255,255 ; jmpq 4719 <_sk_load_f16_avx+0x43>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
- DB 233,19,253,255,255 ; jmpq 4659 <_sk_load_f16_avx+0x43>
+ DB 233,19,253,255,255 ; jmpq 4719 <_sk_load_f16_avx+0x43>
PUBLIC _sk_gather_f16_avx
_sk_gather_f16_avx LABEL PROC
@@ -9599,13 +9661,13 @@ _sk_gather_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,178,33,0,0 ; vbroadcastss 0x21b2(%rip),%ymm12 # 6c04 <_sk_callback_avx+0x43e>
+ DB 196,98,125,24,37,178,33,0,0 ; vbroadcastss 0x21b2(%rip),%ymm12 # 6cc4 <_sk_callback_avx+0x43e>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,158,33,0,0 ; vbroadcastss 0x219e(%rip),%xmm11 # 6c08 <_sk_callback_avx+0x442>
+ DB 196,98,121,24,29,158,33,0,0 ; vbroadcastss 0x219e(%rip),%xmm11 # 6cc8 <_sk_callback_avx+0x442>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,148,33,0,0 ; vbroadcastss 0x2194(%rip),%xmm13 # 6c0c <_sk_callback_avx+0x446>
+ DB 196,98,121,24,45,148,33,0,0 ; vbroadcastss 0x2194(%rip),%xmm13 # 6ccc <_sk_callback_avx+0x446>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -9619,7 +9681,7 @@ _sk_gather_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,74,33,0,0 ; vbroadcastss 0x214a(%rip),%xmm3 # 6c10 <_sk_callback_avx+0x44a>
+ DB 196,226,121,24,29,74,33,0,0 ; vbroadcastss 0x214a(%rip),%xmm3 # 6cd0 <_sk_callback_avx+0x44a>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -9717,12 +9779,12 @@ _sk_store_f16_avx LABEL PROC
DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
- DB 196,98,125,24,13,94,31,0,0 ; vbroadcastss 0x1f5e(%rip),%ymm9 # 6c14 <_sk_callback_avx+0x44e>
+ DB 196,98,125,24,13,94,31,0,0 ; vbroadcastss 0x1f5e(%rip),%ymm9 # 6cd4 <_sk_callback_avx+0x44e>
DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11
DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12
- DB 196,98,121,24,5,68,31,0,0 ; vbroadcastss 0x1f44(%rip),%xmm8 # 6c18 <_sk_callback_avx+0x452>
+ DB 196,98,121,24,5,68,31,0,0 ; vbroadcastss 0x1f44(%rip),%xmm8 # 6cd8 <_sk_callback_avx+0x452>
DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13
DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14
DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -9732,7 +9794,7 @@ _sk_store_f16_avx LABEL PROC
DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11
DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12
- DB 196,98,125,24,21,11,31,0,0 ; vbroadcastss 0x1f0b(%rip),%ymm10 # 6c1c <_sk_callback_avx+0x456>
+ DB 196,98,125,24,21,11,31,0,0 ; vbroadcastss 0x1f0b(%rip),%ymm10 # 6cdc <_sk_callback_avx+0x456>
DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14
DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15
DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12
@@ -9814,7 +9876,7 @@ _sk_store_f16_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,75 ; jne 4ef8 <_sk_store_f16_avx+0x270>
+ DB 117,75 ; jne 4fb8 <_sk_store_f16_avx+0x270>
DB 197,120,17,28,208 ; vmovups %xmm11,(%rax,%rdx,8)
DB 197,120,17,84,208,16 ; vmovups %xmm10,0x10(%rax,%rdx,8)
DB 197,120,17,76,208,32 ; vmovups %xmm9,0x20(%rax,%rdx,8)
@@ -9830,22 +9892,22 @@ _sk_store_f16_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 197,121,214,28,208 ; vmovq %xmm11,(%rax,%rdx,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,193 ; je 4ec4 <_sk_store_f16_avx+0x23c>
+ DB 116,193 ; je 4f84 <_sk_store_f16_avx+0x23c>
DB 197,121,23,92,208,8 ; vmovhpd %xmm11,0x8(%rax,%rdx,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,181 ; jb 4ec4 <_sk_store_f16_avx+0x23c>
+ DB 114,181 ; jb 4f84 <_sk_store_f16_avx+0x23c>
DB 197,121,214,84,208,16 ; vmovq %xmm10,0x10(%rax,%rdx,8)
- DB 116,173 ; je 4ec4 <_sk_store_f16_avx+0x23c>
+ DB 116,173 ; je 4f84 <_sk_store_f16_avx+0x23c>
DB 197,121,23,84,208,24 ; vmovhpd %xmm10,0x18(%rax,%rdx,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,161 ; jb 4ec4 <_sk_store_f16_avx+0x23c>
+ DB 114,161 ; jb 4f84 <_sk_store_f16_avx+0x23c>
DB 197,121,214,76,208,32 ; vmovq %xmm9,0x20(%rax,%rdx,8)
- DB 116,153 ; je 4ec4 <_sk_store_f16_avx+0x23c>
+ DB 116,153 ; je 4f84 <_sk_store_f16_avx+0x23c>
DB 197,121,23,76,208,40 ; vmovhpd %xmm9,0x28(%rax,%rdx,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,141 ; jb 4ec4 <_sk_store_f16_avx+0x23c>
+ DB 114,141 ; jb 4f84 <_sk_store_f16_avx+0x23c>
DB 197,121,214,68,208,48 ; vmovq %xmm8,0x30(%rax,%rdx,8)
- DB 235,133 ; jmp 4ec4 <_sk_store_f16_avx+0x23c>
+ DB 235,133 ; jmp 4f84 <_sk_store_f16_avx+0x23c>
PUBLIC _sk_load_u16_be_avx
_sk_load_u16_be_avx LABEL PROC
@@ -9853,7 +9915,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,253,0,0,0 ; jne 5052 <_sk_load_u16_be_avx+0x113>
+ DB 15,133,253,0,0,0 ; jne 5112 <_sk_load_u16_be_avx+0x113>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -9875,7 +9937,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,90,28,0,0 ; vbroadcastss 0x1c5a(%rip),%ymm11 # 6c20 <_sk_callback_avx+0x45a>
+ DB 196,98,125,24,29,90,28,0,0 ; vbroadcastss 0x1c5a(%rip),%ymm11 # 6ce0 <_sk_callback_avx+0x45a>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -9909,29 +9971,29 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 50b8 <_sk_load_u16_be_avx+0x179>
+ DB 116,85 ; je 5178 <_sk_load_u16_be_avx+0x179>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 50b8 <_sk_load_u16_be_avx+0x179>
+ DB 114,72 ; jb 5178 <_sk_load_u16_be_avx+0x179>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 50c5 <_sk_load_u16_be_avx+0x186>
+ DB 116,72 ; je 5185 <_sk_load_u16_be_avx+0x186>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 50c5 <_sk_load_u16_be_avx+0x186>
+ DB 114,59 ; jb 5185 <_sk_load_u16_be_avx+0x186>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,213,254,255,255 ; je 4f70 <_sk_load_u16_be_avx+0x31>
+ DB 15,132,213,254,255,255 ; je 5030 <_sk_load_u16_be_avx+0x31>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,196,254,255,255 ; jb 4f70 <_sk_load_u16_be_avx+0x31>
+ DB 15,130,196,254,255,255 ; jb 5030 <_sk_load_u16_be_avx+0x31>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,184,254,255,255 ; jmpq 4f70 <_sk_load_u16_be_avx+0x31>
+ DB 233,184,254,255,255 ; jmpq 5030 <_sk_load_u16_be_avx+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,171,254,255,255 ; jmpq 4f70 <_sk_load_u16_be_avx+0x31>
+ DB 233,171,254,255,255 ; jmpq 5030 <_sk_load_u16_be_avx+0x31>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,162,254,255,255 ; jmpq 4f70 <_sk_load_u16_be_avx+0x31>
+ DB 233,162,254,255,255 ; jmpq 5030 <_sk_load_u16_be_avx+0x31>
PUBLIC _sk_load_rgb_u16_be_avx
_sk_load_rgb_u16_be_avx LABEL PROC
@@ -9939,7 +10001,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,82 ; lea (%rdx,%rdx,2),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,243,0,0,0 ; jne 51d3 <_sk_load_rgb_u16_be_avx+0x105>
+ DB 15,133,243,0,0,0 ; jne 5293 <_sk_load_rgb_u16_be_avx+0x105>
DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
@@ -9966,7 +10028,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,186,26,0,0 ; vbroadcastss 0x1aba(%rip),%ymm11 # 6c24 <_sk_callback_avx+0x45e>
+ DB 196,98,125,24,29,186,26,0,0 ; vbroadcastss 0x1aba(%rip),%ymm11 # 6ce4 <_sk_callback_avx+0x45e>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -9987,48 +10049,48 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,87,26,0,0 ; vbroadcastss 0x1a57(%rip),%ymm3 # 6c28 <_sk_callback_avx+0x462>
+ DB 196,226,125,24,29,87,26,0,0 ; vbroadcastss 0x1a57(%rip),%ymm3 # 6ce8 <_sk_callback_avx+0x462>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 51ec <_sk_load_rgb_u16_be_avx+0x11e>
- DB 233,40,255,255,255 ; jmpq 5114 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 117,5 ; jne 52ac <_sk_load_rgb_u16_be_avx+0x11e>
+ DB 233,40,255,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46>
DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 521b <_sk_load_rgb_u16_be_avx+0x14d>
+ DB 114,26 ; jb 52db <_sk_load_rgb_u16_be_avx+0x14d>
DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 5220 <_sk_load_rgb_u16_be_avx+0x152>
- DB 233,249,254,255,255 ; jmpq 5114 <_sk_load_rgb_u16_be_avx+0x46>
- DB 233,244,254,255,255 ; jmpq 5114 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 117,10 ; jne 52e0 <_sk_load_rgb_u16_be_avx+0x152>
+ DB 233,249,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 233,244,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46>
DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 524f <_sk_load_rgb_u16_be_avx+0x181>
+ DB 114,26 ; jb 530f <_sk_load_rgb_u16_be_avx+0x181>
DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 5254 <_sk_load_rgb_u16_be_avx+0x186>
- DB 233,197,254,255,255 ; jmpq 5114 <_sk_load_rgb_u16_be_avx+0x46>
- DB 233,192,254,255,255 ; jmpq 5114 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 117,10 ; jne 5314 <_sk_load_rgb_u16_be_avx+0x186>
+ DB 233,197,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 233,192,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46>
DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 527d <_sk_load_rgb_u16_be_avx+0x1af>
+ DB 114,20 ; jb 533d <_sk_load_rgb_u16_be_avx+0x1af>
DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,151,254,255,255 ; jmpq 5114 <_sk_load_rgb_u16_be_avx+0x46>
- DB 233,146,254,255,255 ; jmpq 5114 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 233,151,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46>
+ DB 233,146,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46>
PUBLIC _sk_store_u16_be_avx
_sk_store_u16_be_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax
- DB 196,98,125,24,5,148,25,0,0 ; vbroadcastss 0x1994(%rip),%ymm8 # 6c2c <_sk_callback_avx+0x466>
+ DB 196,98,125,24,5,148,25,0,0 ; vbroadcastss 0x1994(%rip),%ymm8 # 6cec <_sk_callback_avx+0x466>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -10066,7 +10128,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 537c <_sk_store_u16_be_avx+0xfa>
+ DB 117,31 ; jne 543c <_sk_store_u16_be_avx+0xfa>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -10075,31 +10137,31 @@ _sk_store_u16_be_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 5378 <_sk_store_u16_be_avx+0xf6>
+ DB 116,240 ; je 5438 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 5378 <_sk_store_u16_be_avx+0xf6>
+ DB 114,227 ; jb 5438 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je 5378 <_sk_store_u16_be_avx+0xf6>
+ DB 116,218 ; je 5438 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 5378 <_sk_store_u16_be_avx+0xf6>
+ DB 114,205 ; jb 5438 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je 5378 <_sk_store_u16_be_avx+0xf6>
+ DB 116,196 ; je 5438 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 5378 <_sk_store_u16_be_avx+0xf6>
+ DB 114,183 ; jb 5438 <_sk_store_u16_be_avx+0xf6>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp 5378 <_sk_store_u16_be_avx+0xf6>
+ DB 235,174 ; jmp 5438 <_sk_store_u16_be_avx+0xf6>
PUBLIC _sk_load_f32_avx
_sk_load_f32_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 119,110 ; ja 5440 <_sk_load_f32_avx+0x76>
+ DB 119,110 ; ja 5500 <_sk_load_f32_avx+0x76>
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
- DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 5468 <_sk_load_f32_avx+0x9e>
+ DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 5528 <_sk_load_f32_avx+0x9e>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
@@ -10156,7 +10218,7 @@ _sk_store_f32_avx LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne 54f5 <_sk_store_f32_avx+0x6d>
+ DB 117,55 ; jne 55b5 <_sk_store_f32_avx+0x6d>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -10169,22 +10231,22 @@ _sk_store_f32_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 54f1 <_sk_store_f32_avx+0x69>
+ DB 116,240 ; je 55b1 <_sk_store_f32_avx+0x69>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 54f1 <_sk_store_f32_avx+0x69>
+ DB 114,227 ; jb 55b1 <_sk_store_f32_avx+0x69>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je 54f1 <_sk_store_f32_avx+0x69>
+ DB 116,218 ; je 55b1 <_sk_store_f32_avx+0x69>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 54f1 <_sk_store_f32_avx+0x69>
+ DB 114,205 ; jb 55b1 <_sk_store_f32_avx+0x69>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je 54f1 <_sk_store_f32_avx+0x69>
+ DB 116,195 ; je 55b1 <_sk_store_f32_avx+0x69>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb 54f1 <_sk_store_f32_avx+0x69>
+ DB 114,181 ; jb 55b1 <_sk_store_f32_avx+0x69>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp 54f1 <_sk_store_f32_avx+0x69>
+ DB 235,171 ; jmp 55b1 <_sk_store_f32_avx+0x69>
PUBLIC _sk_clamp_x_avx
_sk_clamp_x_avx LABEL PROC
@@ -10263,7 +10325,7 @@ _sk_mirror_x_avx LABEL PROC
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- DB 197,178,89,5,199,21,0,0 ; vmulss 0x15c7(%rip),%xmm9,%xmm0 # 6c30 <_sk_callback_avx+0x46a>
+ DB 197,178,89,5,199,21,0,0 ; vmulss 0x15c7(%rip),%xmm9,%xmm0 # 6cf0 <_sk_callback_avx+0x46a>
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
@@ -10294,7 +10356,7 @@ _sk_mirror_y_avx LABEL PROC
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- DB 197,178,89,13,66,21,0,0 ; vmulss 0x1542(%rip),%xmm9,%xmm1 # 6c34 <_sk_callback_avx+0x46e>
+ DB 197,178,89,13,66,21,0,0 ; vmulss 0x1542(%rip),%xmm9,%xmm1 # 6cf4 <_sk_callback_avx+0x46e>
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
@@ -10318,7 +10380,7 @@ PUBLIC _sk_clamp_x_1_avx
_sk_clamp_x_1_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,224,20,0,0 ; vbroadcastss 0x14e0(%rip),%ymm8 # 6c38 <_sk_callback_avx+0x472>
+ DB 196,98,125,24,5,224,20,0,0 ; vbroadcastss 0x14e0(%rip),%ymm8 # 6cf8 <_sk_callback_avx+0x472>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10332,9 +10394,9 @@ _sk_repeat_x_1_avx LABEL PROC
PUBLIC _sk_mirror_x_1_avx
_sk_mirror_x_1_avx LABEL PROC
- DB 196,98,125,24,5,195,20,0,0 ; vbroadcastss 0x14c3(%rip),%ymm8 # 6c3c <_sk_callback_avx+0x476>
+ DB 196,98,125,24,5,195,20,0,0 ; vbroadcastss 0x14c3(%rip),%ymm8 # 6cfc <_sk_callback_avx+0x476>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,185,20,0,0 ; vbroadcastss 0x14b9(%rip),%ymm9 # 6c40 <_sk_callback_avx+0x47a>
+ DB 196,98,125,24,13,185,20,0,0 ; vbroadcastss 0x14b9(%rip),%ymm9 # 6d00 <_sk_callback_avx+0x47a>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -10348,12 +10410,12 @@ _sk_mirror_x_1_avx LABEL PROC
PUBLIC _sk_luminance_to_alpha_avx
_sk_luminance_to_alpha_avx LABEL PROC
- DB 196,226,125,24,29,137,20,0,0 ; vbroadcastss 0x1489(%rip),%ymm3 # 6c44 <_sk_callback_avx+0x47e>
+ DB 196,226,125,24,29,137,20,0,0 ; vbroadcastss 0x1489(%rip),%ymm3 # 6d04 <_sk_callback_avx+0x47e>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,29,128,20,0,0 ; vbroadcastss 0x1480(%rip),%ymm3 # 6c48 <_sk_callback_avx+0x482>
+ DB 196,226,125,24,29,128,20,0,0 ; vbroadcastss 0x1480(%rip),%ymm3 # 6d08 <_sk_callback_avx+0x482>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,115,20,0,0 ; vbroadcastss 0x1473(%rip),%ymm1 # 6c4c <_sk_callback_avx+0x486>
+ DB 196,226,125,24,13,115,20,0,0 ; vbroadcastss 0x1473(%rip),%ymm1 # 6d0c <_sk_callback_avx+0x486>
DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -10562,9 +10624,9 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 72,139,104,8 ; mov 0x8(%rax),%rbp
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 5b38 <_sk_evenly_spaced_gradient_avx+0x28>
+ DB 120,7 ; js 5bf8 <_sk_evenly_spaced_gradient_avx+0x28>
DB 196,225,242,42,203 ; vcvtsi2ss %rbx,%xmm1,%xmm1
- DB 235,21 ; jmp 5b4d <_sk_evenly_spaced_gradient_avx+0x3d>
+ DB 235,21 ; jmp 5c0d <_sk_evenly_spaced_gradient_avx+0x3d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -10721,18 +10783,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_avx
_sk_gauss_a_to_rgba_avx LABEL PROC
- DB 196,226,125,24,5,156,13,0,0 ; vbroadcastss 0xd9c(%rip),%ymm0 # 6c50 <_sk_callback_avx+0x48a>
+ DB 196,226,125,24,5,156,13,0,0 ; vbroadcastss 0xd9c(%rip),%ymm0 # 6d10 <_sk_callback_avx+0x48a>
DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
- DB 196,226,125,24,13,147,13,0,0 ; vbroadcastss 0xd93(%rip),%ymm1 # 6c54 <_sk_callback_avx+0x48e>
+ DB 196,226,125,24,13,147,13,0,0 ; vbroadcastss 0xd93(%rip),%ymm1 # 6d14 <_sk_callback_avx+0x48e>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,134,13,0,0 ; vbroadcastss 0xd86(%rip),%ymm1 # 6c58 <_sk_callback_avx+0x492>
+ DB 196,226,125,24,13,134,13,0,0 ; vbroadcastss 0xd86(%rip),%ymm1 # 6d18 <_sk_callback_avx+0x492>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,121,13,0,0 ; vbroadcastss 0xd79(%rip),%ymm1 # 6c5c <_sk_callback_avx+0x496>
+ DB 196,226,125,24,13,121,13,0,0 ; vbroadcastss 0xd79(%rip),%ymm1 # 6d1c <_sk_callback_avx+0x496>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,108,13,0,0 ; vbroadcastss 0xd6c(%rip),%ymm1 # 6c60 <_sk_callback_avx+0x49a>
+ DB 196,226,125,24,13,108,13,0,0 ; vbroadcastss 0xd6c(%rip),%ymm1 # 6d20 <_sk_callback_avx+0x49a>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -10754,12 +10816,12 @@ _sk_gradient_avx LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,80 ; jb 5f7a <_sk_gradient_avx+0x72>
+ DB 114,80 ; jb 603a <_sk_gradient_avx+0x72>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
- DB 196,98,125,24,21,33,13,0,0 ; vbroadcastss 0xd21(%rip),%ymm10 # 6c64 <_sk_callback_avx+0x49e>
+ DB 196,98,125,24,21,33,13,0,0 ; vbroadcastss 0xd21(%rip),%ymm10 # 6d24 <_sk_callback_avx+0x49e>
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8
DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8
@@ -10771,7 +10833,7 @@ _sk_gradient_avx LABEL PROC
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,205 ; jne 5f47 <_sk_gradient_avx+0x3f>
+ DB 117,205 ; jne 6007 <_sk_gradient_avx+0x3f>
DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -10951,27 +11013,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,20,9,0,0 ; vbroadcastss 0x914(%rip),%ymm13 # 6c68 <_sk_callback_avx+0x4a2>
+ DB 196,98,125,24,45,20,9,0,0 ; vbroadcastss 0x914(%rip),%ymm13 # 6d28 <_sk_callback_avx+0x4a2>
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,10,9,0,0 ; vbroadcastss 0x90a(%rip),%ymm14 # 6c6c <_sk_callback_avx+0x4a6>
+ DB 196,98,125,24,53,10,9,0,0 ; vbroadcastss 0x90a(%rip),%ymm14 # 6d2c <_sk_callback_avx+0x4a6>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,251,8,0,0 ; vbroadcastss 0x8fb(%rip),%ymm14 # 6c70 <_sk_callback_avx+0x4aa>
+ DB 196,98,125,24,53,251,8,0,0 ; vbroadcastss 0x8fb(%rip),%ymm14 # 6d30 <_sk_callback_avx+0x4aa>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12
- DB 196,98,125,24,45,236,8,0,0 ; vbroadcastss 0x8ec(%rip),%ymm13 # 6c74 <_sk_callback_avx+0x4ae>
+ DB 196,98,125,24,45,236,8,0,0 ; vbroadcastss 0x8ec(%rip),%ymm13 # 6d34 <_sk_callback_avx+0x4ae>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,215,8,0,0 ; vbroadcastss 0x8d7(%rip),%ymm10 # 6c78 <_sk_callback_avx+0x4b2>
+ DB 196,98,125,24,21,215,8,0,0 ; vbroadcastss 0x8d7(%rip),%ymm10 # 6d38 <_sk_callback_avx+0x4b2>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,193,8,0,0 ; vbroadcastss 0x8c1(%rip),%ymm10 # 6c7c <_sk_callback_avx+0x4b6>
+ DB 196,98,125,24,21,193,8,0,0 ; vbroadcastss 0x8c1(%rip),%ymm10 # 6d3c <_sk_callback_avx+0x4b6>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,171,8,0,0 ; vbroadcastss 0x8ab(%rip),%ymm10 # 6c80 <_sk_callback_avx+0x4ba>
+ DB 196,98,125,24,21,171,8,0,0 ; vbroadcastss 0x8ab(%rip),%ymm10 # 6d40 <_sk_callback_avx+0x4ba>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -10991,7 +11053,7 @@ _sk_xy_to_radius_avx LABEL PROC
PUBLIC _sk_save_xy_avx
_sk_save_xy_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,117,8,0,0 ; vbroadcastss 0x875(%rip),%ymm8 # 6c84 <_sk_callback_avx+0x4be>
+ DB 196,98,125,24,5,117,8,0,0 ; vbroadcastss 0x875(%rip),%ymm8 # 6d44 <_sk_callback_avx+0x4be>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -11024,9 +11086,9 @@ _sk_accumulate_avx LABEL PROC
PUBLIC _sk_bilinear_nx_avx
_sk_bilinear_nx_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,1,8,0,0 ; vbroadcastss 0x801(%rip),%ymm0 # 6c88 <_sk_callback_avx+0x4c2>
+ DB 196,226,125,24,5,1,8,0,0 ; vbroadcastss 0x801(%rip),%ymm0 # 6d48 <_sk_callback_avx+0x4c2>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,248,7,0,0 ; vbroadcastss 0x7f8(%rip),%ymm8 # 6c8c <_sk_callback_avx+0x4c6>
+ DB 196,98,125,24,5,248,7,0,0 ; vbroadcastss 0x7f8(%rip),%ymm8 # 6d4c <_sk_callback_avx+0x4c6>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -11035,7 +11097,7 @@ _sk_bilinear_nx_avx LABEL PROC
PUBLIC _sk_bilinear_px_avx
_sk_bilinear_px_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,224,7,0,0 ; vbroadcastss 0x7e0(%rip),%ymm0 # 6c90 <_sk_callback_avx+0x4ca>
+ DB 196,226,125,24,5,224,7,0,0 ; vbroadcastss 0x7e0(%rip),%ymm0 # 6d50 <_sk_callback_avx+0x4ca>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -11045,9 +11107,9 @@ _sk_bilinear_px_avx LABEL PROC
PUBLIC _sk_bilinear_ny_avx
_sk_bilinear_ny_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,196,7,0,0 ; vbroadcastss 0x7c4(%rip),%ymm1 # 6c94 <_sk_callback_avx+0x4ce>
+ DB 196,226,125,24,13,196,7,0,0 ; vbroadcastss 0x7c4(%rip),%ymm1 # 6d54 <_sk_callback_avx+0x4ce>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,186,7,0,0 ; vbroadcastss 0x7ba(%rip),%ymm8 # 6c98 <_sk_callback_avx+0x4d2>
+ DB 196,98,125,24,5,186,7,0,0 ; vbroadcastss 0x7ba(%rip),%ymm8 # 6d58 <_sk_callback_avx+0x4d2>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -11056,7 +11118,7 @@ _sk_bilinear_ny_avx LABEL PROC
PUBLIC _sk_bilinear_py_avx
_sk_bilinear_py_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,162,7,0,0 ; vbroadcastss 0x7a2(%rip),%ymm1 # 6c9c <_sk_callback_avx+0x4d6>
+ DB 196,226,125,24,13,162,7,0,0 ; vbroadcastss 0x7a2(%rip),%ymm1 # 6d5c <_sk_callback_avx+0x4d6>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -11066,14 +11128,14 @@ _sk_bilinear_py_avx LABEL PROC
PUBLIC _sk_bicubic_n3x_avx
_sk_bicubic_n3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,133,7,0,0 ; vbroadcastss 0x785(%rip),%ymm0 # 6ca0 <_sk_callback_avx+0x4da>
+ DB 196,226,125,24,5,133,7,0,0 ; vbroadcastss 0x785(%rip),%ymm0 # 6d60 <_sk_callback_avx+0x4da>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,124,7,0,0 ; vbroadcastss 0x77c(%rip),%ymm8 # 6ca4 <_sk_callback_avx+0x4de>
+ DB 196,98,125,24,5,124,7,0,0 ; vbroadcastss 0x77c(%rip),%ymm8 # 6d64 <_sk_callback_avx+0x4de>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,109,7,0,0 ; vbroadcastss 0x76d(%rip),%ymm10 # 6ca8 <_sk_callback_avx+0x4e2>
+ DB 196,98,125,24,21,109,7,0,0 ; vbroadcastss 0x76d(%rip),%ymm10 # 6d68 <_sk_callback_avx+0x4e2>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,99,7,0,0 ; vbroadcastss 0x763(%rip),%ymm10 # 6cac <_sk_callback_avx+0x4e6>
+ DB 196,98,125,24,21,99,7,0,0 ; vbroadcastss 0x763(%rip),%ymm10 # 6d6c <_sk_callback_avx+0x4e6>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -11083,19 +11145,19 @@ _sk_bicubic_n3x_avx LABEL PROC
PUBLIC _sk_bicubic_n1x_avx
_sk_bicubic_n1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,70,7,0,0 ; vbroadcastss 0x746(%rip),%ymm0 # 6cb0 <_sk_callback_avx+0x4ea>
+ DB 196,226,125,24,5,70,7,0,0 ; vbroadcastss 0x746(%rip),%ymm0 # 6d70 <_sk_callback_avx+0x4ea>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,61,7,0,0 ; vbroadcastss 0x73d(%rip),%ymm8 # 6cb4 <_sk_callback_avx+0x4ee>
+ DB 196,98,125,24,5,61,7,0,0 ; vbroadcastss 0x73d(%rip),%ymm8 # 6d74 <_sk_callback_avx+0x4ee>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,51,7,0,0 ; vbroadcastss 0x733(%rip),%ymm9 # 6cb8 <_sk_callback_avx+0x4f2>
+ DB 196,98,125,24,13,51,7,0,0 ; vbroadcastss 0x733(%rip),%ymm9 # 6d78 <_sk_callback_avx+0x4f2>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,41,7,0,0 ; vbroadcastss 0x729(%rip),%ymm10 # 6cbc <_sk_callback_avx+0x4f6>
+ DB 196,98,125,24,21,41,7,0,0 ; vbroadcastss 0x729(%rip),%ymm10 # 6d7c <_sk_callback_avx+0x4f6>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,26,7,0,0 ; vbroadcastss 0x71a(%rip),%ymm10 # 6cc0 <_sk_callback_avx+0x4fa>
+ DB 196,98,125,24,21,26,7,0,0 ; vbroadcastss 0x71a(%rip),%ymm10 # 6d80 <_sk_callback_avx+0x4fa>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,11,7,0,0 ; vbroadcastss 0x70b(%rip),%ymm9 # 6cc4 <_sk_callback_avx+0x4fe>
+ DB 196,98,125,24,13,11,7,0,0 ; vbroadcastss 0x70b(%rip),%ymm9 # 6d84 <_sk_callback_avx+0x4fe>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -11104,17 +11166,17 @@ _sk_bicubic_n1x_avx LABEL PROC
PUBLIC _sk_bicubic_p1x_avx
_sk_bicubic_p1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,243,6,0,0 ; vbroadcastss 0x6f3(%rip),%ymm8 # 6cc8 <_sk_callback_avx+0x502>
+ DB 196,98,125,24,5,243,6,0,0 ; vbroadcastss 0x6f3(%rip),%ymm8 # 6d88 <_sk_callback_avx+0x502>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,229,6,0,0 ; vbroadcastss 0x6e5(%rip),%ymm10 # 6ccc <_sk_callback_avx+0x506>
+ DB 196,98,125,24,21,229,6,0,0 ; vbroadcastss 0x6e5(%rip),%ymm10 # 6d8c <_sk_callback_avx+0x506>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,219,6,0,0 ; vbroadcastss 0x6db(%rip),%ymm11 # 6cd0 <_sk_callback_avx+0x50a>
+ DB 196,98,125,24,29,219,6,0,0 ; vbroadcastss 0x6db(%rip),%ymm11 # 6d90 <_sk_callback_avx+0x50a>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm9 # 6cd4 <_sk_callback_avx+0x50e>
+ DB 196,98,125,24,13,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm9 # 6d94 <_sk_callback_avx+0x50e>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -11123,13 +11185,13 @@ _sk_bicubic_p1x_avx LABEL PROC
PUBLIC _sk_bicubic_p3x_avx
_sk_bicubic_p3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,170,6,0,0 ; vbroadcastss 0x6aa(%rip),%ymm0 # 6cd8 <_sk_callback_avx+0x512>
+ DB 196,226,125,24,5,170,6,0,0 ; vbroadcastss 0x6aa(%rip),%ymm0 # 6d98 <_sk_callback_avx+0x512>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,151,6,0,0 ; vbroadcastss 0x697(%rip),%ymm10 # 6cdc <_sk_callback_avx+0x516>
+ DB 196,98,125,24,21,151,6,0,0 ; vbroadcastss 0x697(%rip),%ymm10 # 6d9c <_sk_callback_avx+0x516>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,141,6,0,0 ; vbroadcastss 0x68d(%rip),%ymm10 # 6ce0 <_sk_callback_avx+0x51a>
+ DB 196,98,125,24,21,141,6,0,0 ; vbroadcastss 0x68d(%rip),%ymm10 # 6da0 <_sk_callback_avx+0x51a>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -11139,14 +11201,14 @@ _sk_bicubic_p3x_avx LABEL PROC
PUBLIC _sk_bicubic_n3y_avx
_sk_bicubic_n3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,112,6,0,0 ; vbroadcastss 0x670(%rip),%ymm1 # 6ce4 <_sk_callback_avx+0x51e>
+ DB 196,226,125,24,13,112,6,0,0 ; vbroadcastss 0x670(%rip),%ymm1 # 6da4 <_sk_callback_avx+0x51e>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,102,6,0,0 ; vbroadcastss 0x666(%rip),%ymm8 # 6ce8 <_sk_callback_avx+0x522>
+ DB 196,98,125,24,5,102,6,0,0 ; vbroadcastss 0x666(%rip),%ymm8 # 6da8 <_sk_callback_avx+0x522>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,87,6,0,0 ; vbroadcastss 0x657(%rip),%ymm10 # 6cec <_sk_callback_avx+0x526>
+ DB 196,98,125,24,21,87,6,0,0 ; vbroadcastss 0x657(%rip),%ymm10 # 6dac <_sk_callback_avx+0x526>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,77,6,0,0 ; vbroadcastss 0x64d(%rip),%ymm10 # 6cf0 <_sk_callback_avx+0x52a>
+ DB 196,98,125,24,21,77,6,0,0 ; vbroadcastss 0x64d(%rip),%ymm10 # 6db0 <_sk_callback_avx+0x52a>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -11156,19 +11218,19 @@ _sk_bicubic_n3y_avx LABEL PROC
PUBLIC _sk_bicubic_n1y_avx
_sk_bicubic_n1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,48,6,0,0 ; vbroadcastss 0x630(%rip),%ymm1 # 6cf4 <_sk_callback_avx+0x52e>
+ DB 196,226,125,24,13,48,6,0,0 ; vbroadcastss 0x630(%rip),%ymm1 # 6db4 <_sk_callback_avx+0x52e>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,38,6,0,0 ; vbroadcastss 0x626(%rip),%ymm8 # 6cf8 <_sk_callback_avx+0x532>
+ DB 196,98,125,24,5,38,6,0,0 ; vbroadcastss 0x626(%rip),%ymm8 # 6db8 <_sk_callback_avx+0x532>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,28,6,0,0 ; vbroadcastss 0x61c(%rip),%ymm9 # 6cfc <_sk_callback_avx+0x536>
+ DB 196,98,125,24,13,28,6,0,0 ; vbroadcastss 0x61c(%rip),%ymm9 # 6dbc <_sk_callback_avx+0x536>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,18,6,0,0 ; vbroadcastss 0x612(%rip),%ymm10 # 6d00 <_sk_callback_avx+0x53a>
+ DB 196,98,125,24,21,18,6,0,0 ; vbroadcastss 0x612(%rip),%ymm10 # 6dc0 <_sk_callback_avx+0x53a>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,3,6,0,0 ; vbroadcastss 0x603(%rip),%ymm10 # 6d04 <_sk_callback_avx+0x53e>
+ DB 196,98,125,24,21,3,6,0,0 ; vbroadcastss 0x603(%rip),%ymm10 # 6dc4 <_sk_callback_avx+0x53e>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,244,5,0,0 ; vbroadcastss 0x5f4(%rip),%ymm9 # 6d08 <_sk_callback_avx+0x542>
+ DB 196,98,125,24,13,244,5,0,0 ; vbroadcastss 0x5f4(%rip),%ymm9 # 6dc8 <_sk_callback_avx+0x542>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -11177,17 +11239,17 @@ _sk_bicubic_n1y_avx LABEL PROC
PUBLIC _sk_bicubic_p1y_avx
_sk_bicubic_p1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,220,5,0,0 ; vbroadcastss 0x5dc(%rip),%ymm8 # 6d0c <_sk_callback_avx+0x546>
+ DB 196,98,125,24,5,220,5,0,0 ; vbroadcastss 0x5dc(%rip),%ymm8 # 6dcc <_sk_callback_avx+0x546>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,205,5,0,0 ; vbroadcastss 0x5cd(%rip),%ymm10 # 6d10 <_sk_callback_avx+0x54a>
+ DB 196,98,125,24,21,205,5,0,0 ; vbroadcastss 0x5cd(%rip),%ymm10 # 6dd0 <_sk_callback_avx+0x54a>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,195,5,0,0 ; vbroadcastss 0x5c3(%rip),%ymm11 # 6d14 <_sk_callback_avx+0x54e>
+ DB 196,98,125,24,29,195,5,0,0 ; vbroadcastss 0x5c3(%rip),%ymm11 # 6dd4 <_sk_callback_avx+0x54e>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,170,5,0,0 ; vbroadcastss 0x5aa(%rip),%ymm9 # 6d18 <_sk_callback_avx+0x552>
+ DB 196,98,125,24,13,170,5,0,0 ; vbroadcastss 0x5aa(%rip),%ymm9 # 6dd8 <_sk_callback_avx+0x552>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -11196,13 +11258,13 @@ _sk_bicubic_p1y_avx LABEL PROC
PUBLIC _sk_bicubic_p3y_avx
_sk_bicubic_p3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,146,5,0,0 ; vbroadcastss 0x592(%rip),%ymm1 # 6d1c <_sk_callback_avx+0x556>
+ DB 196,226,125,24,13,146,5,0,0 ; vbroadcastss 0x592(%rip),%ymm1 # 6ddc <_sk_callback_avx+0x556>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,126,5,0,0 ; vbroadcastss 0x57e(%rip),%ymm10 # 6d20 <_sk_callback_avx+0x55a>
+ DB 196,98,125,24,21,126,5,0,0 ; vbroadcastss 0x57e(%rip),%ymm10 # 6de0 <_sk_callback_avx+0x55a>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,116,5,0,0 ; vbroadcastss 0x574(%rip),%ymm10 # 6d24 <_sk_callback_avx+0x55e>
+ DB 196,98,125,24,21,116,5,0,0 ; vbroadcastss 0x574(%rip),%ymm10 # 6de4 <_sk_callback_avx+0x55e>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -11324,25 +11386,25 @@ ALIGN 4
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 69a1 <.literal4+0xb1>
+ DB 71,225,61 ; rex.RXB loope 6a61 <.literal4+0xb1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 69b1 <.literal4+0xc1>
+ DB 71,225,61 ; rex.RXB loope 6a71 <.literal4+0xc1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 69c1 <.literal4+0xd1>
+ DB 71,225,61 ; rex.RXB loope 6a81 <.literal4+0xd1>
DB 0,0 ; add %al,(%rax)
DB 128,63,154 ; cmpb $0x9a,(%rdi)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 69d1 <.literal4+0xe1>
+ DB 71,225,61 ; rex.RXB loope 6a91 <.literal4+0xe1>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
@@ -11394,7 +11456,7 @@ ALIGN 4
DB 190,129,128,128,59 ; mov $0x3b808081,%esi
DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6a25 <.literal4+0x135>
+ DB 224,7 ; loopne 6ae5 <.literal4+0x135>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -11410,10 +11472,10 @@ ALIGN 4
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 6a4c <.literal4+0x15c>
+ DB 127,0 ; jg 6b0c <.literal4+0x15c>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6ac5 <.literal4+0x1d5>
+ DB 119,115 ; ja 6b85 <.literal4+0x1d5>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -11427,10 +11489,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6a80 <.literal4+0x190>
+ DB 127,0 ; jg 6b40 <.literal4+0x190>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6af9 <.literal4+0x209>
+ DB 119,115 ; ja 6bb9 <.literal4+0x209>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -11444,10 +11506,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6ab4 <.literal4+0x1c4>
+ DB 127,0 ; jg 6b74 <.literal4+0x1c4>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6b2d <.literal4+0x23d>
+ DB 119,115 ; ja 6bed <.literal4+0x23d>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -11461,10 +11523,10 @@ ALIGN 4
DB 0,128,63,0,0,0 ; add %al,0x3f(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 6ae8 <.literal4+0x1f8>
+ DB 127,0 ; jg 6ba8 <.literal4+0x1f8>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6b61 <.literal4+0x271>
+ DB 119,115 ; ja 6c21 <.literal4+0x271>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -11477,7 +11539,7 @@ ALIGN 4
DB 0,75,0 ; add %cl,0x0(%rbx)
DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax)
DB 66,0,0 ; rex.X add %al,(%rax)
- DB 127,67 ; jg 6b5f <.literal4+0x26f>
+ DB 127,67 ; jg 6c1f <.literal4+0x26f>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -11489,10 +11551,10 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6b7f <.literal4+0x28f>
+ DB 118,63 ; jbe 6c3f <.literal4+0x28f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
- DB 127,67 ; jg 6b93 <.literal4+0x2a3>
+ DB 127,67 ; jg 6c53 <.literal4+0x2a3>
DB 129,128,128,59,0,0,128,63,129,128 ; addl $0x80813f80,0x3b80(%rax)
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,128,63,129,128,128 ; add %al,-0x7f7f7ec1(%rax)
@@ -11501,7 +11563,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6b75 <.literal4+0x285>
+ DB 224,7 ; loopne 6c35 <.literal4+0x285>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -11513,7 +11575,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6b91 <.literal4+0x2a1>
+ DB 224,7 ; loopne 6c51 <.literal4+0x2a1>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -11524,7 +11586,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 6be6 <.literal4+0x2f6>
+ DB 124,66 ; jl 6ca6 <.literal4+0x2f6>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -11542,9 +11604,9 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 6c29 <.literal4+0x339>
+ DB 112,65 ; jo 6ce9 <.literal4+0x339>
DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax)
- DB 127,67 ; jg 6c37 <.literal4+0x347>
+ DB 127,67 ; jg 6cf7 <.literal4+0x347>
DB 0,128,0,0,0,0 ; add %al,0x0(%rax)
DB 0,128,0,4,0,128 ; add %al,-0x7ffffc00(%rax)
DB 0,0 ; add %al,(%rax)
@@ -11560,7 +11622,7 @@ ALIGN 4
DB 0,128,55,0,0,128 ; add %al,-0x7fffffc9(%rax)
DB 63 ; (bad)
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 6c77 <.literal4+0x387>
+ DB 127,71 ; jg 6d37 <.literal4+0x387>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -11733,6 +11795,22 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
+ DB 0,2 ; add %al,(%rdx)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,2 ; add %al,(%rdx)
+ DB 4,6 ; add $0x6,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
@@ -11956,7 +12034,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,151,80,0,0 ; movaps 0x5097(%rip),%xmm2 # 51f0 <_sk_callback_sse41+0xda>
+ DB 15,40,21,247,80,0,0 ; movaps 0x50f7(%rip),%xmm2 # 5250 <_sk_callback_sse41+0xd0>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -11965,7 +12043,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,134,80,0,0 ; movaps 0x5086(%rip),%xmm2 # 5200 <_sk_callback_sse41+0xea>
+ DB 15,40,21,230,80,0,0 ; movaps 0x50e6(%rip),%xmm2 # 5260 <_sk_callback_sse41+0xe0>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -11983,14 +12061,14 @@ _sk_dither_sse41 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,84,80,0,0 ; movdqa 0x5054(%rip),%xmm10 # 5210 <_sk_callback_sse41+0xfa>
+ DB 102,68,15,111,21,180,80,0,0 ; movdqa 0x50b4(%rip),%xmm10 # 5270 <_sk_callback_sse41+0xf0>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,64,80,0,0 ; movdqa 0x5040(%rip),%xmm12 # 5220 <_sk_callback_sse41+0x10a>
- DB 102,68,15,111,45,71,80,0,0 ; movdqa 0x5047(%rip),%xmm13 # 5230 <_sk_callback_sse41+0x11a>
+ DB 102,68,15,111,37,160,80,0,0 ; movdqa 0x50a0(%rip),%xmm12 # 5280 <_sk_callback_sse41+0x100>
+ DB 102,68,15,111,45,167,80,0,0 ; movdqa 0x50a7(%rip),%xmm13 # 5290 <_sk_callback_sse41+0x110>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -12006,8 +12084,8 @@ _sk_dither_sse41 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,2,80,0,0 ; mulps 0x5002(%rip),%xmm8 # 5240 <_sk_callback_sse41+0x12a>
- DB 68,15,88,5,10,80,0,0 ; addps 0x500a(%rip),%xmm8 # 5250 <_sk_callback_sse41+0x13a>
+ DB 68,15,89,5,98,80,0,0 ; mulps 0x5062(%rip),%xmm8 # 52a0 <_sk_callback_sse41+0x120>
+ DB 68,15,88,5,106,80,0,0 ; addps 0x506a(%rip),%xmm8 # 52b0 <_sk_callback_sse41+0x130>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -12074,7 +12152,7 @@ _sk_clear_sse41 LABEL PROC
PUBLIC _sk_srcatop_sse41
_sk_srcatop_sse41 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,100,79,0,0 ; movaps 0x4f64(%rip),%xmm8 # 5260 <_sk_callback_sse41+0x14a>
+ DB 68,15,40,5,196,79,0,0 ; movaps 0x4fc4(%rip),%xmm8 # 52c0 <_sk_callback_sse41+0x140>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -12097,7 +12175,7 @@ PUBLIC _sk_dstatop_sse41
_sk_dstatop_sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,39,79,0,0 ; movaps 0x4f27(%rip),%xmm9 # 5270 <_sk_callback_sse41+0x15a>
+ DB 68,15,40,13,135,79,0,0 ; movaps 0x4f87(%rip),%xmm9 # 52d0 <_sk_callback_sse41+0x150>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -12138,7 +12216,7 @@ _sk_dstin_sse41 LABEL PROC
PUBLIC _sk_srcout_sse41
_sk_srcout_sse41 LABEL PROC
- DB 68,15,40,5,203,78,0,0 ; movaps 0x4ecb(%rip),%xmm8 # 5280 <_sk_callback_sse41+0x16a>
+ DB 68,15,40,5,43,79,0,0 ; movaps 0x4f2b(%rip),%xmm8 # 52e0 <_sk_callback_sse41+0x160>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -12149,7 +12227,7 @@ _sk_srcout_sse41 LABEL PROC
PUBLIC _sk_dstout_sse41
_sk_dstout_sse41 LABEL PROC
- DB 68,15,40,5,187,78,0,0 ; movaps 0x4ebb(%rip),%xmm8 # 5290 <_sk_callback_sse41+0x17a>
+ DB 68,15,40,5,27,79,0,0 ; movaps 0x4f1b(%rip),%xmm8 # 52f0 <_sk_callback_sse41+0x170>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -12164,7 +12242,7 @@ _sk_dstout_sse41 LABEL PROC
PUBLIC _sk_srcover_sse41
_sk_srcover_sse41 LABEL PROC
- DB 68,15,40,5,158,78,0,0 ; movaps 0x4e9e(%rip),%xmm8 # 52a0 <_sk_callback_sse41+0x18a>
+ DB 68,15,40,5,254,78,0,0 ; movaps 0x4efe(%rip),%xmm8 # 5300 <_sk_callback_sse41+0x180>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -12182,7 +12260,7 @@ _sk_srcover_sse41 LABEL PROC
PUBLIC _sk_dstover_sse41
_sk_dstover_sse41 LABEL PROC
- DB 68,15,40,5,114,78,0,0 ; movaps 0x4e72(%rip),%xmm8 # 52b0 <_sk_callback_sse41+0x19a>
+ DB 68,15,40,5,210,78,0,0 ; movaps 0x4ed2(%rip),%xmm8 # 5310 <_sk_callback_sse41+0x190>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -12206,7 +12284,7 @@ _sk_modulate_sse41 LABEL PROC
PUBLIC _sk_multiply_sse41
_sk_multiply_sse41 LABEL PROC
- DB 68,15,40,5,70,78,0,0 ; movaps 0x4e46(%rip),%xmm8 # 52c0 <_sk_callback_sse41+0x1aa>
+ DB 68,15,40,5,166,78,0,0 ; movaps 0x4ea6(%rip),%xmm8 # 5320 <_sk_callback_sse41+0x1a0>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -12275,7 +12353,7 @@ _sk_screen_sse41 LABEL PROC
PUBLIC _sk_xor__sse41
_sk_xor__sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,123,77,0,0 ; movaps 0x4d7b(%rip),%xmm3 # 52d0 <_sk_callback_sse41+0x1ba>
+ DB 15,40,29,219,77,0,0 ; movaps 0x4ddb(%rip),%xmm3 # 5330 <_sk_callback_sse41+0x1b0>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -12321,7 +12399,7 @@ _sk_darken_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,230,76,0,0 ; movaps 0x4ce6(%rip),%xmm2 # 52e0 <_sk_callback_sse41+0x1ca>
+ DB 15,40,21,70,77,0,0 ; movaps 0x4d46(%rip),%xmm2 # 5340 <_sk_callback_sse41+0x1c0>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -12353,7 +12431,7 @@ _sk_lighten_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,139,76,0,0 ; movaps 0x4c8b(%rip),%xmm2 # 52f0 <_sk_callback_sse41+0x1da>
+ DB 15,40,21,235,76,0,0 ; movaps 0x4ceb(%rip),%xmm2 # 5350 <_sk_callback_sse41+0x1d0>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -12388,7 +12466,7 @@ _sk_difference_sse41 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,37,76,0,0 ; movaps 0x4c25(%rip),%xmm2 # 5300 <_sk_callback_sse41+0x1ea>
+ DB 15,40,21,133,76,0,0 ; movaps 0x4c85(%rip),%xmm2 # 5360 <_sk_callback_sse41+0x1e0>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -12414,7 +12492,7 @@ _sk_exclusion_sse41 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,229,75,0,0 ; movaps 0x4be5(%rip),%xmm2 # 5310 <_sk_callback_sse41+0x1fa>
+ DB 15,40,21,69,76,0,0 ; movaps 0x4c45(%rip),%xmm2 # 5370 <_sk_callback_sse41+0x1f0>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -12425,7 +12503,7 @@ _sk_exclusion_sse41 LABEL PROC
PUBLIC _sk_colorburn_sse41
_sk_colorburn_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,216,75,0,0 ; movaps 0x4bd8(%rip),%xmm10 # 5320 <_sk_callback_sse41+0x20a>
+ DB 68,15,40,21,56,76,0,0 ; movaps 0x4c38(%rip),%xmm10 # 5380 <_sk_callback_sse41+0x200>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,203 ; movaps %xmm11,%xmm9
@@ -12505,7 +12583,7 @@ _sk_colorburn_sse41 LABEL PROC
PUBLIC _sk_colordodge_sse41
_sk_colordodge_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,182,74,0,0 ; movaps 0x4ab6(%rip),%xmm10 # 5330 <_sk_callback_sse41+0x21a>
+ DB 68,15,40,21,22,75,0,0 ; movaps 0x4b16(%rip),%xmm10 # 5390 <_sk_callback_sse41+0x210>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -12586,7 +12664,7 @@ _sk_hardlight_sse41 LABEL PROC
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,140,73,0,0 ; movaps 0x498c(%rip),%xmm10 # 5340 <_sk_callback_sse41+0x22a>
+ DB 68,15,40,21,236,73,0,0 ; movaps 0x49ec(%rip),%xmm10 # 53a0 <_sk_callback_sse41+0x220>
DB 65,15,40,234 ; movaps %xmm10,%xmm5
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -12668,7 +12746,7 @@ PUBLIC _sk_overlay_sse41
_sk_overlay_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,240 ; movaps %xmm0,%xmm14
- DB 68,15,40,21,110,72,0,0 ; movaps 0x486e(%rip),%xmm10 # 5350 <_sk_callback_sse41+0x23a>
+ DB 68,15,40,21,206,72,0,0 ; movaps 0x48ce(%rip),%xmm10 # 53b0 <_sk_callback_sse41+0x230>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -12752,7 +12830,7 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 65,15,84,193 ; andps %xmm9,%xmm0
- DB 15,40,13,65,71,0,0 ; movaps 0x4741(%rip),%xmm1 # 5360 <_sk_callback_sse41+0x24a>
+ DB 15,40,13,161,71,0,0 ; movaps 0x47a1(%rip),%xmm1 # 53c0 <_sk_callback_sse41+0x240>
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 68,15,40,240 ; movaps %xmm0,%xmm14
@@ -12765,10 +12843,10 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,40,45,31,71,0,0 ; movaps 0x471f(%rip),%xmm13 # 5370 <_sk_callback_sse41+0x25a>
+ DB 68,15,40,45,127,71,0,0 ; movaps 0x477f(%rip),%xmm13 # 53d0 <_sk_callback_sse41+0x250>
DB 69,15,88,245 ; addps %xmm13,%xmm14
DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 68,15,40,37,31,71,0,0 ; movaps 0x471f(%rip),%xmm12 # 5380 <_sk_callback_sse41+0x26a>
+ DB 68,15,40,37,127,71,0,0 ; movaps 0x477f(%rip),%xmm12 # 53e0 <_sk_callback_sse41+0x260>
DB 69,15,89,252 ; mulps %xmm12,%xmm15
DB 69,15,88,254 ; addps %xmm14,%xmm15
DB 15,40,198 ; movaps %xmm6,%xmm0
@@ -12954,12 +13032,12 @@ _sk_hue_sse41 LABEL PROC
DB 68,15,84,208 ; andps %xmm0,%xmm10
DB 15,84,200 ; andps %xmm0,%xmm1
DB 68,15,84,232 ; andps %xmm0,%xmm13
- DB 15,40,5,133,68,0,0 ; movaps 0x4485(%rip),%xmm0 # 5390 <_sk_callback_sse41+0x27a>
+ DB 15,40,5,229,68,0,0 ; movaps 0x44e5(%rip),%xmm0 # 53f0 <_sk_callback_sse41+0x270>
DB 68,15,89,224 ; mulps %xmm0,%xmm12
- DB 15,40,21,138,68,0,0 ; movaps 0x448a(%rip),%xmm2 # 53a0 <_sk_callback_sse41+0x28a>
+ DB 15,40,21,234,68,0,0 ; movaps 0x44ea(%rip),%xmm2 # 5400 <_sk_callback_sse41+0x280>
DB 15,89,250 ; mulps %xmm2,%xmm7
DB 65,15,88,252 ; addps %xmm12,%xmm7
- DB 68,15,40,53,139,68,0,0 ; movaps 0x448b(%rip),%xmm14 # 53b0 <_sk_callback_sse41+0x29a>
+ DB 68,15,40,53,235,68,0,0 ; movaps 0x44eb(%rip),%xmm14 # 5410 <_sk_callback_sse41+0x290>
DB 68,15,40,252 ; movaps %xmm4,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,255 ; addps %xmm7,%xmm15
@@ -13042,7 +13120,7 @@ _sk_hue_sse41 LABEL PROC
DB 65,15,88,214 ; addps %xmm14,%xmm2
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,40,13,80,67,0,0 ; movaps 0x4350(%rip),%xmm9 # 53c0 <_sk_callback_sse41+0x2aa>
+ DB 68,15,40,13,176,67,0,0 ; movaps 0x43b0(%rip),%xmm9 # 5420 <_sk_callback_sse41+0x2a0>
DB 65,15,40,225 ; movaps %xmm9,%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0
@@ -13136,14 +13214,14 @@ _sk_saturation_sse41 LABEL PROC
DB 68,15,84,215 ; andps %xmm7,%xmm10
DB 68,15,84,223 ; andps %xmm7,%xmm11
DB 68,15,84,199 ; andps %xmm7,%xmm8
- DB 15,40,21,3,66,0,0 ; movaps 0x4203(%rip),%xmm2 # 53d0 <_sk_callback_sse41+0x2ba>
+ DB 15,40,21,99,66,0,0 ; movaps 0x4263(%rip),%xmm2 # 5430 <_sk_callback_sse41+0x2b0>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,40,13,6,66,0,0 ; movaps 0x4206(%rip),%xmm1 # 53e0 <_sk_callback_sse41+0x2ca>
+ DB 15,40,13,102,66,0,0 ; movaps 0x4266(%rip),%xmm1 # 5440 <_sk_callback_sse41+0x2c0>
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,249 ; mulps %xmm1,%xmm7
DB 15,88,251 ; addps %xmm3,%xmm7
- DB 68,15,40,45,5,66,0,0 ; movaps 0x4205(%rip),%xmm13 # 53f0 <_sk_callback_sse41+0x2da>
+ DB 68,15,40,45,101,66,0,0 ; movaps 0x4265(%rip),%xmm13 # 5450 <_sk_callback_sse41+0x2d0>
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 68,15,88,247 ; addps %xmm7,%xmm14
DB 65,15,40,218 ; movaps %xmm10,%xmm3
@@ -13224,7 +13302,7 @@ _sk_saturation_sse41 LABEL PROC
DB 65,15,88,253 ; addps %xmm13,%xmm7
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11
- DB 68,15,40,13,203,64,0,0 ; movaps 0x40cb(%rip),%xmm9 # 5400 <_sk_callback_sse41+0x2ea>
+ DB 68,15,40,13,43,65,0,0 ; movaps 0x412b(%rip),%xmm9 # 5460 <_sk_callback_sse41+0x2e0>
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 68,15,92,204 ; subps %xmm4,%xmm9
DB 15,40,60,36 ; movaps (%rsp),%xmm7
@@ -13279,14 +13357,14 @@ _sk_color_sse41 LABEL PROC
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 68,15,89,244 ; mulps %xmm4,%xmm14
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 68,15,40,13,16,64,0,0 ; movaps 0x4010(%rip),%xmm9 # 5410 <_sk_callback_sse41+0x2fa>
+ DB 68,15,40,13,112,64,0,0 ; movaps 0x4070(%rip),%xmm9 # 5470 <_sk_callback_sse41+0x2f0>
DB 65,15,40,250 ; movaps %xmm10,%xmm7
DB 65,15,89,249 ; mulps %xmm9,%xmm7
- DB 68,15,40,21,16,64,0,0 ; movaps 0x4010(%rip),%xmm10 # 5420 <_sk_callback_sse41+0x30a>
+ DB 68,15,40,21,112,64,0,0 ; movaps 0x4070(%rip),%xmm10 # 5480 <_sk_callback_sse41+0x300>
DB 65,15,40,219 ; movaps %xmm11,%xmm3
DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,40,29,13,64,0,0 ; movaps 0x400d(%rip),%xmm11 # 5430 <_sk_callback_sse41+0x31a>
+ DB 68,15,40,29,109,64,0,0 ; movaps 0x406d(%rip),%xmm11 # 5490 <_sk_callback_sse41+0x310>
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
@@ -13371,7 +13449,7 @@ _sk_color_sse41 LABEL PROC
DB 65,15,88,251 ; addps %xmm11,%xmm7
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1
- DB 68,15,40,13,201,62,0,0 ; movaps 0x3ec9(%rip),%xmm9 # 5440 <_sk_callback_sse41+0x32a>
+ DB 68,15,40,13,41,63,0,0 ; movaps 0x3f29(%rip),%xmm9 # 54a0 <_sk_callback_sse41+0x320>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
DB 68,15,89,192 ; mulps %xmm0,%xmm8
@@ -13423,13 +13501,13 @@ _sk_luminosity_sse41 LABEL PROC
DB 69,15,89,216 ; mulps %xmm8,%xmm11
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,89,205 ; mulps %xmm5,%xmm9
- DB 68,15,40,5,27,62,0,0 ; movaps 0x3e1b(%rip),%xmm8 # 5450 <_sk_callback_sse41+0x33a>
+ DB 68,15,40,5,123,62,0,0 ; movaps 0x3e7b(%rip),%xmm8 # 54b0 <_sk_callback_sse41+0x330>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 68,15,40,21,31,62,0,0 ; movaps 0x3e1f(%rip),%xmm10 # 5460 <_sk_callback_sse41+0x34a>
+ DB 68,15,40,21,127,62,0,0 ; movaps 0x3e7f(%rip),%xmm10 # 54c0 <_sk_callback_sse41+0x340>
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 65,15,89,234 ; mulps %xmm10,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 68,15,40,37,29,62,0,0 ; movaps 0x3e1d(%rip),%xmm12 # 5470 <_sk_callback_sse41+0x35a>
+ DB 68,15,40,37,125,62,0,0 ; movaps 0x3e7d(%rip),%xmm12 # 54d0 <_sk_callback_sse41+0x350>
DB 68,15,40,242 ; movaps %xmm2,%xmm14
DB 69,15,89,244 ; mulps %xmm12,%xmm14
DB 68,15,88,245 ; addps %xmm5,%xmm14
@@ -13514,7 +13592,7 @@ _sk_luminosity_sse41 LABEL PROC
DB 65,15,88,244 ; addps %xmm12,%xmm6
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9
- DB 15,40,5,211,60,0,0 ; movaps 0x3cd3(%rip),%xmm0 # 5480 <_sk_callback_sse41+0x36a>
+ DB 15,40,5,51,61,0,0 ; movaps 0x3d33(%rip),%xmm0 # 54e0 <_sk_callback_sse41+0x360>
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,92,215 ; subps %xmm7,%xmm2
DB 15,89,226 ; mulps %xmm2,%xmm4
@@ -13556,20 +13634,20 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 15,133,217,0,0,0 ; jne 1904 <_sk_srcover_rgba_8888_sse41+0xe7>
DB 243,15,111,60,144 ; movdqu (%rax,%rdx,4),%xmm7
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,37,85,60,0,0 ; movdqa 0x3c55(%rip),%xmm4 # 5490 <_sk_callback_sse41+0x37a>
+ DB 102,15,111,37,181,60,0,0 ; movdqa 0x3cb5(%rip),%xmm4 # 54f0 <_sk_callback_sse41+0x370>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,81,60,0,0 ; pshufb 0x3c51(%rip),%xmm5 # 54a0 <_sk_callback_sse41+0x38a>
+ DB 102,15,56,0,45,177,60,0,0 ; pshufb 0x3cb1(%rip),%xmm5 # 5500 <_sk_callback_sse41+0x380>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,81,60,0,0 ; pshufb 0x3c51(%rip),%xmm6 # 54b0 <_sk_callback_sse41+0x39a>
+ DB 102,15,56,0,53,177,60,0,0 ; pshufb 0x3cb1(%rip),%xmm6 # 5510 <_sk_callback_sse41+0x390>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 68,15,40,5,78,60,0,0 ; movaps 0x3c4e(%rip),%xmm8 # 54c0 <_sk_callback_sse41+0x3aa>
+ DB 68,15,40,5,174,60,0,0 ; movaps 0x3cae(%rip),%xmm8 # 5520 <_sk_callback_sse41+0x3a0>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,82,60,0,0 ; movaps 0x3c52(%rip),%xmm12 # 54d0 <_sk_callback_sse41+0x3ba>
+ DB 68,15,40,37,178,60,0,0 ; movaps 0x3cb2(%rip),%xmm12 # 5530 <_sk_callback_sse41+0x3b0>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -13595,7 +13673,7 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,89 ; jne 1944 <_sk_srcover_rgba_8888_sse41+0x127>
+ DB 117,85 ; jne 1940 <_sk_srcover_rgba_8888_sse41+0x123>
DB 243,15,127,4,144 ; movdqu %xmm0,(%rax,%rdx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -13605,30 +13683,33 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,35 ; je 1938 <_sk_srcover_rgba_8888_sse41+0x11b>
+ DB 116,87 ; je 1968 <_sk_srcover_rgba_8888_sse41+0x14b>
+ DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,249,2 ; cmp $0x2,%r9b
DB 116,21 ; je 1930 <_sk_srcover_rgba_8888_sse41+0x113>
DB 65,128,249,3 ; cmp $0x3,%r9b
DB 15,133,11,255,255,255 ; jne 1830 <_sk_srcover_rgba_8888_sse41+0x13>
DB 102,15,110,100,144,8 ; movd 0x8(%rax,%rdx,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
- DB 102,15,58,34,124,144,4,1 ; pinsrd $0x1,0x4(%rax,%rdx,4),%xmm7
- DB 102,15,58,34,60,144,0 ; pinsrd $0x0,(%rax,%rdx,4),%xmm7
- DB 233,236,254,255,255 ; jmpq 1830 <_sk_srcover_rgba_8888_sse41+0x13>
+ DB 243,15,126,36,144 ; movq (%rax,%rdx,4),%xmm4
+ DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
+ DB 233,240,254,255,255 ; jmpq 1830 <_sk_srcover_rgba_8888_sse41+0x13>
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,28 ; je 196d <_sk_srcover_rgba_8888_sse41+0x150>
+ DB 116,37 ; je 1972 <_sk_srcover_rgba_8888_sse41+0x155>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,14 ; je 1965 <_sk_srcover_rgba_8888_sse41+0x148>
+ DB 116,14 ; je 1961 <_sk_srcover_rgba_8888_sse41+0x144>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,147 ; jne 18f0 <_sk_srcover_rgba_8888_sse41+0xd3>
+ DB 117,151 ; jne 18f0 <_sk_srcover_rgba_8888_sse41+0xd3>
DB 102,15,58,22,68,144,8,2 ; pextrd $0x2,%xmm0,0x8(%rax,%rdx,4)
- DB 102,15,58,22,68,144,4,1 ; pextrd $0x1,%xmm0,0x4(%rax,%rdx,4)
+ DB 102,15,214,4,144 ; movq %xmm0,(%rax,%rdx,4)
+ DB 235,136 ; jmp 18f0 <_sk_srcover_rgba_8888_sse41+0xd3>
+ DB 102,15,110,60,144 ; movd (%rax,%rdx,4),%xmm7
+ DB 233,190,254,255,255 ; jmpq 1830 <_sk_srcover_rgba_8888_sse41+0x13>
DB 102,15,126,4,144 ; movd %xmm0,(%rax,%rdx,4)
- DB 233,121,255,255,255 ; jmpq 18f0 <_sk_srcover_rgba_8888_sse41+0xd3>
+ DB 233,116,255,255,255 ; jmpq 18f0 <_sk_srcover_rgba_8888_sse41+0xd3>
PUBLIC _sk_clamp_0_sse41
_sk_clamp_0_sse41 LABEL PROC
@@ -13642,7 +13723,7 @@ _sk_clamp_0_sse41 LABEL PROC
PUBLIC _sk_clamp_1_sse41
_sk_clamp_1_sse41 LABEL PROC
- DB 68,15,40,5,73,59,0,0 ; movaps 0x3b49(%rip),%xmm8 # 54e0 <_sk_callback_sse41+0x3ca>
+ DB 68,15,40,5,164,59,0,0 ; movaps 0x3ba4(%rip),%xmm8 # 5540 <_sk_callback_sse41+0x3c0>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -13652,7 +13733,7 @@ _sk_clamp_1_sse41 LABEL PROC
PUBLIC _sk_clamp_a_sse41
_sk_clamp_a_sse41 LABEL PROC
- DB 15,93,29,62,59,0,0 ; minps 0x3b3e(%rip),%xmm3 # 54f0 <_sk_callback_sse41+0x3da>
+ DB 15,93,29,153,59,0,0 ; minps 0x3b99(%rip),%xmm3 # 5550 <_sk_callback_sse41+0x3d0>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -13725,7 +13806,7 @@ _sk_premul_sse41 LABEL PROC
PUBLIC _sk_unpremul_sse41
_sk_unpremul_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,169,58,0,0 ; movaps 0x3aa9(%rip),%xmm9 # 5500 <_sk_callback_sse41+0x3ea>
+ DB 68,15,40,13,4,59,0,0 ; movaps 0x3b04(%rip),%xmm9 # 5560 <_sk_callback_sse41+0x3e0>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -13737,20 +13818,20 @@ _sk_unpremul_sse41 LABEL PROC
PUBLIC _sk_from_srgb_sse41
_sk_from_srgb_sse41 LABEL PROC
- DB 68,15,40,29,148,58,0,0 ; movaps 0x3a94(%rip),%xmm11 # 5510 <_sk_callback_sse41+0x3fa>
+ DB 68,15,40,29,239,58,0,0 ; movaps 0x3aef(%rip),%xmm11 # 5570 <_sk_callback_sse41+0x3f0>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
DB 68,15,40,208 ; movaps %xmm0,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
- DB 68,15,40,37,140,58,0,0 ; movaps 0x3a8c(%rip),%xmm12 # 5520 <_sk_callback_sse41+0x40a>
+ DB 68,15,40,37,231,58,0,0 ; movaps 0x3ae7(%rip),%xmm12 # 5580 <_sk_callback_sse41+0x400>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,140,58,0,0 ; movaps 0x3a8c(%rip),%xmm13 # 5530 <_sk_callback_sse41+0x41a>
+ DB 68,15,40,45,231,58,0,0 ; movaps 0x3ae7(%rip),%xmm13 # 5590 <_sk_callback_sse41+0x410>
DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,40,53,140,58,0,0 ; movaps 0x3a8c(%rip),%xmm14 # 5540 <_sk_callback_sse41+0x42a>
+ DB 68,15,40,53,231,58,0,0 ; movaps 0x3ae7(%rip),%xmm14 # 55a0 <_sk_callback_sse41+0x420>
DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 68,15,40,61,144,58,0,0 ; movaps 0x3a90(%rip),%xmm15 # 5550 <_sk_callback_sse41+0x43a>
+ DB 68,15,40,61,235,58,0,0 ; movaps 0x3aeb(%rip),%xmm15 # 55b0 <_sk_callback_sse41+0x430>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,40,209 ; movaps %xmm1,%xmm10
@@ -13792,22 +13873,22 @@ _sk_to_srgb_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
- DB 68,15,40,29,5,58,0,0 ; movaps 0x3a05(%rip),%xmm11 # 5560 <_sk_callback_sse41+0x44a>
+ DB 68,15,40,29,96,58,0,0 ; movaps 0x3a60(%rip),%xmm11 # 55c0 <_sk_callback_sse41+0x440>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 68,15,40,37,5,58,0,0 ; movaps 0x3a05(%rip),%xmm12 # 5570 <_sk_callback_sse41+0x45a>
+ DB 68,15,40,37,96,58,0,0 ; movaps 0x3a60(%rip),%xmm12 # 55d0 <_sk_callback_sse41+0x450>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 69,15,89,252 ; mulps %xmm12,%xmm15
- DB 68,15,40,21,5,58,0,0 ; movaps 0x3a05(%rip),%xmm10 # 5580 <_sk_callback_sse41+0x46a>
+ DB 68,15,40,21,96,58,0,0 ; movaps 0x3a60(%rip),%xmm10 # 55e0 <_sk_callback_sse41+0x460>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 68,15,40,45,5,58,0,0 ; movaps 0x3a05(%rip),%xmm13 # 5590 <_sk_callback_sse41+0x47a>
+ DB 68,15,40,45,96,58,0,0 ; movaps 0x3a60(%rip),%xmm13 # 55f0 <_sk_callback_sse41+0x470>
DB 69,15,88,253 ; addps %xmm13,%xmm15
- DB 68,15,40,53,9,58,0,0 ; movaps 0x3a09(%rip),%xmm14 # 55a0 <_sk_callback_sse41+0x48a>
+ DB 68,15,40,53,100,58,0,0 ; movaps 0x3a64(%rip),%xmm14 # 5600 <_sk_callback_sse41+0x480>
DB 69,15,88,198 ; addps %xmm14,%xmm8
DB 69,15,83,192 ; rcpps %xmm8,%xmm8
DB 69,15,89,199 ; mulps %xmm15,%xmm8
- DB 68,15,40,61,5,58,0,0 ; movaps 0x3a05(%rip),%xmm15 # 55b0 <_sk_callback_sse41+0x49a>
+ DB 68,15,40,61,96,58,0,0 ; movaps 0x3a60(%rip),%xmm15 # 5610 <_sk_callback_sse41+0x490>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9
@@ -13859,7 +13940,7 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 68,15,93,226 ; minps %xmm2,%xmm12
DB 65,15,40,203 ; movaps %xmm11,%xmm1
DB 65,15,92,204 ; subps %xmm12,%xmm1
- DB 68,15,40,53,79,57,0,0 ; movaps 0x394f(%rip),%xmm14 # 55c0 <_sk_callback_sse41+0x4aa>
+ DB 68,15,40,53,170,57,0,0 ; movaps 0x39aa(%rip),%xmm14 # 5620 <_sk_callback_sse41+0x4a0>
DB 68,15,94,241 ; divps %xmm1,%xmm14
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10
@@ -13868,27 +13949,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15
- DB 68,15,84,61,54,57,0,0 ; andps 0x3936(%rip),%xmm15 # 55d0 <_sk_callback_sse41+0x4ba>
+ DB 68,15,84,61,145,57,0,0 ; andps 0x3991(%rip),%xmm15 # 5630 <_sk_callback_sse41+0x4b0>
DB 68,15,88,248 ; addps %xmm0,%xmm15
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 68,15,40,45,41,57,0,0 ; movaps 0x3929(%rip),%xmm13 # 55e0 <_sk_callback_sse41+0x4ca>
+ DB 68,15,40,45,132,57,0,0 ; movaps 0x3984(%rip),%xmm13 # 5640 <_sk_callback_sse41+0x4c0>
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,88,5,37,57,0,0 ; addps 0x3925(%rip),%xmm8 # 55f0 <_sk_callback_sse41+0x4da>
+ DB 68,15,88,5,128,57,0,0 ; addps 0x3980(%rip),%xmm8 # 5650 <_sk_callback_sse41+0x4d0>
DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8
- DB 68,15,89,5,29,57,0,0 ; mulps 0x391d(%rip),%xmm8 # 5600 <_sk_callback_sse41+0x4ea>
+ DB 68,15,89,5,120,57,0,0 ; mulps 0x3978(%rip),%xmm8 # 5660 <_sk_callback_sse41+0x4e0>
DB 69,15,40,203 ; movaps %xmm11,%xmm9
DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9
DB 69,15,84,193 ; andps %xmm9,%xmm8
DB 69,15,92,235 ; subps %xmm11,%xmm13
DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,5,17,57,0,0 ; movaps 0x3911(%rip),%xmm0 # 5610 <_sk_callback_sse41+0x4fa>
+ DB 15,40,5,108,57,0,0 ; movaps 0x396c(%rip),%xmm0 # 5670 <_sk_callback_sse41+0x4f0>
DB 65,15,40,211 ; movaps %xmm11,%xmm2
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
@@ -13909,7 +13990,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp)
DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
DB 68,15,40,208 ; movaps %xmm0,%xmm10
- DB 68,15,40,13,211,56,0,0 ; movaps 0x38d3(%rip),%xmm9 # 5620 <_sk_callback_sse41+0x50a>
+ DB 68,15,40,13,46,57,0,0 ; movaps 0x392e(%rip),%xmm9 # 5680 <_sk_callback_sse41+0x500>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
DB 15,40,217 ; movaps %xmm1,%xmm3
@@ -13922,19 +14003,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,20,36 ; movaps %xmm2,(%rsp)
DB 69,15,88,192 ; addps %xmm8,%xmm8
DB 68,15,92,197 ; subps %xmm5,%xmm8
- DB 68,15,40,53,175,56,0,0 ; movaps 0x38af(%rip),%xmm14 # 5630 <_sk_callback_sse41+0x51a>
+ DB 68,15,40,53,10,57,0,0 ; movaps 0x390a(%rip),%xmm14 # 5690 <_sk_callback_sse41+0x510>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0
DB 68,15,92,240 ; subps %xmm0,%xmm14
- DB 68,15,40,29,168,56,0,0 ; movaps 0x38a8(%rip),%xmm11 # 5640 <_sk_callback_sse41+0x52a>
+ DB 68,15,40,29,3,57,0,0 ; movaps 0x3903(%rip),%xmm11 # 56a0 <_sk_callback_sse41+0x520>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 65,15,92,240 ; subps %xmm8,%xmm6
- DB 15,40,61,161,56,0,0 ; movaps 0x38a1(%rip),%xmm7 # 5650 <_sk_callback_sse41+0x53a>
+ DB 15,40,61,252,56,0,0 ; movaps 0x38fc(%rip),%xmm7 # 56b0 <_sk_callback_sse41+0x530>
DB 69,15,40,238 ; movaps %xmm14,%xmm13
DB 68,15,89,239 ; mulps %xmm7,%xmm13
- DB 15,40,29,162,56,0,0 ; movaps 0x38a2(%rip),%xmm3 # 5660 <_sk_callback_sse41+0x54a>
+ DB 15,40,29,253,56,0,0 ; movaps 0x38fd(%rip),%xmm3 # 56c0 <_sk_callback_sse41+0x540>
DB 68,15,40,227 ; movaps %xmm3,%xmm12
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 68,15,89,230 ; mulps %xmm6,%xmm12
@@ -13944,7 +14025,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,40,253 ; movaps %xmm5,%xmm15
DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15
- DB 68,15,40,37,129,56,0,0 ; movaps 0x3881(%rip),%xmm12 # 5670 <_sk_callback_sse41+0x55a>
+ DB 68,15,40,37,220,56,0,0 ; movaps 0x38dc(%rip),%xmm12 # 56d0 <_sk_callback_sse41+0x550>
DB 65,15,40,196 ; movaps %xmm12,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,89,238 ; mulps %xmm6,%xmm13
@@ -13978,7 +14059,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,40,198 ; movaps %xmm14,%xmm0
DB 15,40,20,36 ; movaps (%rsp),%xmm2
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,88,21,250,55,0,0 ; addps 0x37fa(%rip),%xmm10 # 5680 <_sk_callback_sse41+0x56a>
+ DB 68,15,88,21,85,56,0,0 ; addps 0x3855(%rip),%xmm10 # 56e0 <_sk_callback_sse41+0x560>
DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11
@@ -14026,11 +14107,11 @@ _sk_scale_u8_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,52 ; jne 1f63 <_sk_scale_u8_sse41+0x3e>
+ DB 117,52 ; jne 1f68 <_sk_scale_u8_sse41+0x3e>
DB 102,69,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm8
- DB 102,68,15,219,5,81,55,0,0 ; pand 0x3751(%rip),%xmm8 # 5690 <_sk_callback_sse41+0x57a>
+ DB 102,68,15,219,5,172,55,0,0 ; pand 0x37ac(%rip),%xmm8 # 56f0 <_sk_callback_sse41+0x570>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,85,55,0,0 ; mulps 0x3755(%rip),%xmm8 # 56a0 <_sk_callback_sse41+0x58a>
+ DB 68,15,89,5,176,55,0,0 ; mulps 0x37b0(%rip),%xmm8 # 5700 <_sk_callback_sse41+0x580>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -14040,21 +14121,24 @@ _sk_scale_u8_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,42 ; je 1f9f <_sk_scale_u8_sse41+0x7a>
+ DB 116,59 ; je 1fb0 <_sk_scale_u8_sse41+0x86>
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 1f92 <_sk_scale_u8_sse41+0x6d>
+ DB 116,23 ; je 1f97 <_sk_scale_u8_sse41+0x6d>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,181 ; jne 1f36 <_sk_scale_u8_sse41+0x11>
+ DB 117,181 ; jne 1f3b <_sk_scale_u8_sse41+0x11>
DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
- DB 65,15,182,68,18,1 ; movzbl 0x1(%r10,%rdx,1),%eax
- DB 102,68,15,58,34,192,1 ; pinsrd $0x1,%eax,%xmm8
+ DB 65,15,183,4,18 ; movzwl (%r10,%rdx,1),%eax
+ DB 102,68,15,110,200 ; movd %eax,%xmm9
+ DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
+ DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
+ DB 235,139 ; jmp 1f3b <_sk_scale_u8_sse41+0x11>
DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax
- DB 102,68,15,58,34,192,0 ; pinsrd $0x0,%eax,%xmm8
- DB 235,137 ; jmp 1f36 <_sk_scale_u8_sse41+0x11>
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 233,124,255,255,255 ; jmpq 1f3b <_sk_scale_u8_sse41+0x11>
PUBLIC _sk_lerp_1_float_sse41
_sk_lerp_1_float_sse41 LABEL PROC
@@ -14081,11 +14165,11 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne 2037 <_sk_lerp_u8_sse41+0x52>
+ DB 117,72 ; jne 2049 <_sk_lerp_u8_sse41+0x52>
DB 102,69,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm8
- DB 102,68,15,219,5,177,54,0,0 ; pand 0x36b1(%rip),%xmm8 # 56b0 <_sk_callback_sse41+0x59a>
+ DB 102,68,15,219,5,255,54,0,0 ; pand 0x36ff(%rip),%xmm8 # 5710 <_sk_callback_sse41+0x590>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,181,54,0,0 ; mulps 0x36b5(%rip),%xmm8 # 56c0 <_sk_callback_sse41+0x5aa>
+ DB 68,15,89,5,3,55,0,0 ; mulps 0x3703(%rip),%xmm8 # 5720 <_sk_callback_sse41+0x5a0>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -14102,90 +14186,95 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,42 ; je 2073 <_sk_lerp_u8_sse41+0x8e>
+ DB 116,62 ; je 2094 <_sk_lerp_u8_sse41+0x9d>
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 2066 <_sk_lerp_u8_sse41+0x81>
+ DB 116,23 ; je 2078 <_sk_lerp_u8_sse41+0x81>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,161 ; jne 1ff6 <_sk_lerp_u8_sse41+0x11>
+ DB 117,161 ; jne 2008 <_sk_lerp_u8_sse41+0x11>
DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
- DB 65,15,182,68,18,1 ; movzbl 0x1(%r10,%rdx,1),%eax
- DB 102,68,15,58,34,192,1 ; pinsrd $0x1,%eax,%xmm8
+ DB 65,15,183,4,18 ; movzwl (%r10,%rdx,1),%eax
+ DB 102,68,15,110,200 ; movd %eax,%xmm9
+ DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
+ DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
+ DB 233,116,255,255,255 ; jmpq 2008 <_sk_lerp_u8_sse41+0x11>
DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax
- DB 102,68,15,58,34,192,0 ; pinsrd $0x0,%eax,%xmm8
- DB 233,114,255,255,255 ; jmpq 1ff6 <_sk_lerp_u8_sse41+0x11>
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 233,101,255,255,255 ; jmpq 2008 <_sk_lerp_u8_sse41+0x11>
PUBLIC _sk_lerp_565_sse41
_sk_lerp_565_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,152,0,0,0 ; jne 212a <_sk_lerp_565_sse41+0xa6>
- DB 102,69,15,56,51,12,82 ; pmovzxwd (%r10,%rdx,2),%xmm9
- DB 102,68,15,111,5,46,54,0,0 ; movdqa 0x362e(%rip),%xmm8 # 56d0 <_sk_callback_sse41+0x5ba>
- DB 102,69,15,219,193 ; pand %xmm9,%xmm8
+ DB 15,133,152,0,0,0 ; jne 2149 <_sk_lerp_565_sse41+0xa6>
+ DB 102,69,15,56,51,20,82 ; pmovzxwd (%r10,%rdx,2),%xmm10
+ DB 102,68,15,111,5,111,54,0,0 ; movdqa 0x366f(%rip),%xmm8 # 5730 <_sk_callback_sse41+0x5b0>
+ DB 102,69,15,219,194 ; pand %xmm10,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,45,54,0,0 ; mulps 0x362d(%rip),%xmm8 # 56e0 <_sk_callback_sse41+0x5ca>
- DB 102,68,15,111,21,52,54,0,0 ; movdqa 0x3634(%rip),%xmm10 # 56f0 <_sk_callback_sse41+0x5da>
- DB 102,69,15,219,209 ; pand %xmm9,%xmm10
- DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,51,54,0,0 ; mulps 0x3633(%rip),%xmm10 # 5700 <_sk_callback_sse41+0x5ea>
- DB 102,68,15,219,13,58,54,0,0 ; pand 0x363a(%rip),%xmm9 # 5710 <_sk_callback_sse41+0x5fa>
+ DB 68,15,89,5,110,54,0,0 ; mulps 0x366e(%rip),%xmm8 # 5740 <_sk_callback_sse41+0x5c0>
+ DB 102,68,15,111,13,117,54,0,0 ; movdqa 0x3675(%rip),%xmm9 # 5750 <_sk_callback_sse41+0x5d0>
+ DB 102,69,15,219,202 ; pand %xmm10,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,62,54,0,0 ; mulps 0x363e(%rip),%xmm9 # 5720 <_sk_callback_sse41+0x60a>
+ DB 68,15,89,13,116,54,0,0 ; mulps 0x3674(%rip),%xmm9 # 5760 <_sk_callback_sse41+0x5e0>
+ DB 102,68,15,219,21,123,54,0,0 ; pand 0x367b(%rip),%xmm10 # 5770 <_sk_callback_sse41+0x5f0>
+ DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
+ DB 68,15,89,21,127,54,0,0 ; mulps 0x367f(%rip),%xmm10 # 5780 <_sk_callback_sse41+0x600>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
DB 15,92,205 ; subps %xmm5,%xmm1
- DB 65,15,89,202 ; mulps %xmm10,%xmm1
+ DB 65,15,89,201 ; mulps %xmm9,%xmm1
DB 15,88,205 ; addps %xmm5,%xmm1
DB 15,92,214 ; subps %xmm6,%xmm2
- DB 65,15,89,209 ; mulps %xmm9,%xmm2
+ DB 65,15,89,210 ; mulps %xmm10,%xmm2
DB 15,88,214 ; addps %xmm6,%xmm2
DB 15,92,223 ; subps %xmm7,%xmm3
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 68,15,88,199 ; addps %xmm7,%xmm8
- DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,88,215 ; addps %xmm7,%xmm10
- DB 65,15,89,217 ; mulps %xmm9,%xmm3
+ DB 68,15,89,203 ; mulps %xmm3,%xmm9
+ DB 68,15,88,207 ; addps %xmm7,%xmm9
+ DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,95,211 ; maxps %xmm3,%xmm10
- DB 69,15,95,194 ; maxps %xmm10,%xmm8
+ DB 68,15,95,203 ; maxps %xmm3,%xmm9
+ DB 69,15,95,193 ; maxps %xmm9,%xmm8
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,216 ; movaps %xmm8,%xmm3
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,46 ; je 216a <_sk_lerp_565_sse41+0xe6>
+ DB 116,62 ; je 2194 <_sk_lerp_565_sse41+0xf1>
+ DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,27 ; je 215d <_sk_lerp_565_sse41+0xd9>
+ DB 116,27 ; je 217c <_sk_lerp_565_sse41+0xd9>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,77,255,255,255 ; jne 2099 <_sk_lerp_565_sse41+0x15>
+ DB 15,133,77,255,255,255 ; jne 20b8 <_sk_lerp_565_sse41+0x15>
DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 102,69,15,112,200,69 ; pshufd $0x45,%xmm8,%xmm9
- DB 65,15,183,68,82,2 ; movzwl 0x2(%r10,%rdx,2),%eax
- DB 102,68,15,58,34,200,1 ; pinsrd $0x1,%eax,%xmm9
+ DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10
+ DB 102,69,15,110,4,82 ; movd (%r10,%rdx,2),%xmm8
+ DB 102,69,15,56,51,192 ; pmovzxwd %xmm8,%xmm8
+ DB 102,69,15,58,14,208,15 ; pblendw $0xf,%xmm8,%xmm10
+ DB 233,36,255,255,255 ; jmpq 20b8 <_sk_lerp_565_sse41+0x15>
DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax
- DB 102,68,15,58,34,200,0 ; pinsrd $0x0,%eax,%xmm9
- DB 233,30,255,255,255 ; jmpq 2099 <_sk_lerp_565_sse41+0x15>
+ DB 102,68,15,110,208 ; movd %eax,%xmm10
+ DB 233,21,255,255,255 ; jmpq 20b8 <_sk_lerp_565_sse41+0x15>
PUBLIC _sk_load_tables_sse41
_sk_load_tables_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,24,1,0,0 ; jne 22a1 <_sk_load_tables_sse41+0x126>
+ DB 15,133,24,1,0,0 ; jne 22c9 <_sk_load_tables_sse41+0x126>
DB 243,69,15,111,4,145 ; movdqu (%r9,%rdx,4),%xmm8
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,15,111,5,148,53,0,0 ; movdqa 0x3594(%rip),%xmm0 # 5730 <_sk_callback_sse41+0x61a>
+ DB 102,15,111,5,204,53,0,0 ; movdqa 0x35cc(%rip),%xmm0 # 5790 <_sk_callback_sse41+0x610>
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -14200,7 +14289,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,66,15,58,33,4,179,32 ; insertps $0x20,(%rbx,%r14,4),%xmm0
DB 102,66,15,58,33,4,11,48 ; insertps $0x30,(%rbx,%r9,1),%xmm0
DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1
- DB 102,15,56,0,13,79,53,0,0 ; pshufb 0x354f(%rip),%xmm1 # 5740 <_sk_callback_sse41+0x62a>
+ DB 102,15,56,0,13,135,53,0,0 ; pshufb 0x3587(%rip),%xmm1 # 57a0 <_sk_callback_sse41+0x620>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
DB 68,15,182,211 ; movzbl %bl,%r10d
@@ -14215,7 +14304,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
DB 76,139,72,24 ; mov 0x18(%rax),%r9
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
- DB 102,15,56,0,21,11,53,0,0 ; pshufb 0x350b(%rip),%xmm2 # 5750 <_sk_callback_sse41+0x63a>
+ DB 102,15,56,0,21,67,53,0,0 ; pshufb 0x3543(%rip),%xmm2 # 57b0 <_sk_callback_sse41+0x630>
DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx
DB 102,72,15,126,208 ; movq %xmm2,%rax
DB 68,15,182,208 ; movzbl %al,%r10d
@@ -14230,7 +14319,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3
- DB 15,89,29,200,52,0,0 ; mulps 0x34c8(%rip),%xmm3 # 5760 <_sk_callback_sse41+0x64a>
+ DB 15,89,29,0,53,0,0 ; mulps 0x3500(%rip),%xmm3 # 57c0 <_sk_callback_sse41+0x640>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -14238,18 +14327,20 @@ _sk_load_tables_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
- DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,38 ; je 22d9 <_sk_load_tables_sse41+0x15e>
+ DB 116,52 ; je 230a <_sk_load_tables_sse41+0x167>
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 22d0 <_sk_load_tables_sse41+0x155>
+ DB 116,23 ; je 22f8 <_sk_load_tables_sse41+0x155>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,204,254,255,255 ; jne 218f <_sk_load_tables_sse41+0x14>
+ DB 15,133,204,254,255,255 ; jne 21b7 <_sk_load_tables_sse41+0x14>
DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0
DB 102,68,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm8
- DB 102,69,15,58,34,68,145,4,1 ; pinsrd $0x1,0x4(%r9,%rdx,4),%xmm8
- DB 102,69,15,58,34,4,145,0 ; pinsrd $0x0,(%r9,%rdx,4),%xmm8
- DB 233,169,254,255,255 ; jmpq 218f <_sk_load_tables_sse41+0x14>
+ DB 243,65,15,126,4,145 ; movq (%r9,%rdx,4),%xmm0
+ DB 102,68,15,58,14,192,15 ; pblendw $0xf,%xmm0,%xmm8
+ DB 233,173,254,255,255 ; jmpq 21b7 <_sk_load_tables_sse41+0x14>
+ DB 102,69,15,110,4,145 ; movd (%r9,%rdx,4),%xmm8
+ DB 233,162,254,255,255 ; jmpq 21b7 <_sk_load_tables_sse41+0x14>
PUBLIC _sk_load_tables_u16_be_sse41
_sk_load_tables_u16_be_sse41 LABEL PROC
@@ -14257,7 +14348,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,99,1,0,0 ; jne 245f <_sk_load_tables_u16_be_sse41+0x179>
+ DB 15,133,99,1,0,0 ; jne 248e <_sk_load_tables_u16_be_sse41+0x179>
DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0
DB 243,67,15,111,76,81,16 ; movdqu 0x10(%r9,%r10,2),%xmm1
DB 65,87 ; push %r15
@@ -14269,7 +14360,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,5,61,52,0,0 ; movdqa 0x343d(%rip),%xmm8 # 5770 <_sk_callback_sse41+0x65a>
+ DB 102,68,15,111,5,110,52,0,0 ; movdqa 0x346e(%rip),%xmm8 # 57d0 <_sk_callback_sse41+0x650>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -14287,7 +14378,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
DB 243,66,15,16,20,11 ; movss (%rbx,%r9,1),%xmm2
DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
- DB 102,15,56,0,13,236,51,0,0 ; pshufb 0x33ec(%rip),%xmm1 # 5780 <_sk_callback_sse41+0x66a>
+ DB 102,15,56,0,13,29,52,0,0 ; pshufb 0x341d(%rip),%xmm1 # 57e0 <_sk_callback_sse41+0x660>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -14323,7 +14414,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,235,216 ; por %xmm8,%xmm3
DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,58,51,0,0 ; mulps 0x333a(%rip),%xmm3 # 5790 <_sk_callback_sse41+0x67a>
+ DB 15,89,29,107,51,0,0 ; mulps 0x336b(%rip),%xmm3 # 57f0 <_sk_callback_sse41+0x670>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -14331,16 +14422,16 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 2478 <_sk_load_tables_u16_be_sse41+0x192>
+ DB 117,13 ; jne 24a7 <_sk_load_tables_u16_be_sse41+0x192>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,145,254,255,255 ; jmpq 2309 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,145,254,255,255 ; jmpq 2338 <_sk_load_tables_u16_be_sse41+0x23>
DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,124,254,255,255 ; jb 2309 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 15,130,124,254,255,255 ; jb 2338 <_sk_load_tables_u16_be_sse41+0x23>
DB 243,67,15,126,76,81,16 ; movq 0x10(%r9,%r10,2),%xmm1
- DB 233,112,254,255,255 ; jmpq 2309 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,112,254,255,255 ; jmpq 2338 <_sk_load_tables_u16_be_sse41+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse41
_sk_load_tables_rgb_u16_be_sse41 LABEL PROC
@@ -14348,7 +14439,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,83,1,0,0 ; jne 25fe <_sk_load_tables_rgb_u16_be_sse41+0x165>
+ DB 15,133,83,1,0,0 ; jne 262d <_sk_load_tables_rgb_u16_be_sse41+0x165>
DB 243,67,15,111,20,81 ; movdqu (%r9,%r10,2),%xmm2
DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -14363,7 +14454,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
- DB 102,68,15,111,5,175,50,0,0 ; movdqa 0x32af(%rip),%xmm8 # 57a0 <_sk_callback_sse41+0x68a>
+ DB 102,68,15,111,5,224,50,0,0 ; movdqa 0x32e0(%rip),%xmm8 # 5800 <_sk_callback_sse41+0x680>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -14381,7 +14472,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0
DB 243,66,15,16,28,11 ; movss (%rbx,%r9,1),%xmm3
DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0
- DB 102,15,56,0,13,94,50,0,0 ; pshufb 0x325e(%rip),%xmm1 # 57b0 <_sk_callback_sse41+0x69a>
+ DB 102,15,56,0,13,143,50,0,0 ; pshufb 0x328f(%rip),%xmm1 # 5810 <_sk_callback_sse41+0x690>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -14412,7 +14503,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,65,15,16,28,25 ; movss (%r9,%rbx,1),%xmm3
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,201,49,0,0 ; movaps 0x31c9(%rip),%xmm3 # 57c0 <_sk_callback_sse41+0x6aa>
+ DB 15,40,29,250,49,0,0 ; movaps 0x31fa(%rip),%xmm3 # 5820 <_sk_callback_sse41+0x6a0>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -14421,21 +14512,21 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,67,15,196,84,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,14 ; jne 2624 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
+ DB 117,14 ; jne 2653 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
- DB 233,173,254,255,255 ; jmpq 24d1 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,173,254,255,255 ; jmpq 2500 <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,71,15,110,76,81,6 ; movd 0x6(%r9,%r10,2),%xmm9
DB 102,71,15,196,76,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm9
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 2655 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
+ DB 114,24 ; jb 2684 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1
DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,124,254,255,255 ; jmpq 24d1 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,124,254,255,255 ; jmpq 2500 <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,115,254,255,255 ; jmpq 24d1 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,115,254,255,255 ; jmpq 2500 <_sk_load_tables_rgb_u16_be_sse41+0x38>
PUBLIC _sk_byte_tables_sse41
_sk_byte_tables_sse41 LABEL PROC
@@ -14444,7 +14535,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 65,84 ; push %r12
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,97,49,0,0 ; movaps 0x3161(%rip),%xmm8 # 57d0 <_sk_callback_sse41+0x6ba>
+ DB 68,15,40,5,146,49,0,0 ; movaps 0x3192(%rip),%xmm8 # 5830 <_sk_callback_sse41+0x6b0>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
@@ -14463,7 +14554,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,18,49,0,0 ; movaps 0x3112(%rip),%xmm9 # 57e0 <_sk_callback_sse41+0x6ca>
+ DB 68,15,40,13,67,49,0,0 ; movaps 0x3143(%rip),%xmm9 # 5840 <_sk_callback_sse41+0x6c0>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -14557,7 +14648,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,138,47,0,0 ; movaps 0x2f8a(%rip),%xmm9 # 57f0 <_sk_callback_sse41+0x6da>
+ DB 68,15,40,13,187,47,0,0 ; movaps 0x2fbb(%rip),%xmm9 # 5850 <_sk_callback_sse41+0x6d0>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -14734,31 +14825,31 @@ _sk_parametric_r_sse41 LABEL PROC
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8
- DB 68,15,89,5,210,44,0,0 ; mulps 0x2cd2(%rip),%xmm8 # 5800 <_sk_callback_sse41+0x6ea>
- DB 68,15,84,21,218,44,0,0 ; andps 0x2cda(%rip),%xmm10 # 5810 <_sk_callback_sse41+0x6fa>
- DB 68,15,86,21,226,44,0,0 ; orps 0x2ce2(%rip),%xmm10 # 5820 <_sk_callback_sse41+0x70a>
- DB 68,15,88,5,234,44,0,0 ; addps 0x2cea(%rip),%xmm8 # 5830 <_sk_callback_sse41+0x71a>
- DB 68,15,40,37,242,44,0,0 ; movaps 0x2cf2(%rip),%xmm12 # 5840 <_sk_callback_sse41+0x72a>
+ DB 68,15,89,5,3,45,0,0 ; mulps 0x2d03(%rip),%xmm8 # 5860 <_sk_callback_sse41+0x6e0>
+ DB 68,15,84,21,11,45,0,0 ; andps 0x2d0b(%rip),%xmm10 # 5870 <_sk_callback_sse41+0x6f0>
+ DB 68,15,86,21,19,45,0,0 ; orps 0x2d13(%rip),%xmm10 # 5880 <_sk_callback_sse41+0x700>
+ DB 68,15,88,5,27,45,0,0 ; addps 0x2d1b(%rip),%xmm8 # 5890 <_sk_callback_sse41+0x710>
+ DB 68,15,40,37,35,45,0,0 ; movaps 0x2d23(%rip),%xmm12 # 58a0 <_sk_callback_sse41+0x720>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
- DB 68,15,88,21,242,44,0,0 ; addps 0x2cf2(%rip),%xmm10 # 5850 <_sk_callback_sse41+0x73a>
- DB 68,15,40,37,250,44,0,0 ; movaps 0x2cfa(%rip),%xmm12 # 5860 <_sk_callback_sse41+0x74a>
+ DB 68,15,88,21,35,45,0,0 ; addps 0x2d23(%rip),%xmm10 # 58b0 <_sk_callback_sse41+0x730>
+ DB 68,15,40,37,43,45,0,0 ; movaps 0x2d2b(%rip),%xmm12 # 58c0 <_sk_callback_sse41+0x740>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
DB 69,15,89,195 ; mulps %xmm11,%xmm8
DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,5,231,44,0,0 ; addps 0x2ce7(%rip),%xmm8 # 5870 <_sk_callback_sse41+0x75a>
- DB 68,15,40,21,239,44,0,0 ; movaps 0x2cef(%rip),%xmm10 # 5880 <_sk_callback_sse41+0x76a>
+ DB 68,15,88,5,24,45,0,0 ; addps 0x2d18(%rip),%xmm8 # 58d0 <_sk_callback_sse41+0x750>
+ DB 68,15,40,21,32,45,0,0 ; movaps 0x2d20(%rip),%xmm10 # 58e0 <_sk_callback_sse41+0x760>
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 69,15,92,194 ; subps %xmm10,%xmm8
- DB 68,15,40,21,239,44,0,0 ; movaps 0x2cef(%rip),%xmm10 # 5890 <_sk_callback_sse41+0x77a>
+ DB 68,15,40,21,32,45,0,0 ; movaps 0x2d20(%rip),%xmm10 # 58f0 <_sk_callback_sse41+0x770>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 68,15,40,29,243,44,0,0 ; movaps 0x2cf3(%rip),%xmm11 # 58a0 <_sk_callback_sse41+0x78a>
+ DB 68,15,40,29,36,45,0,0 ; movaps 0x2d24(%rip),%xmm11 # 5900 <_sk_callback_sse41+0x780>
DB 69,15,94,218 ; divps %xmm10,%xmm11
DB 69,15,88,216 ; addps %xmm8,%xmm11
- DB 68,15,89,29,243,44,0,0 ; mulps 0x2cf3(%rip),%xmm11 # 58b0 <_sk_callback_sse41+0x79a>
+ DB 68,15,89,29,36,45,0,0 ; mulps 0x2d24(%rip),%xmm11 # 5910 <_sk_callback_sse41+0x790>
DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10
DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
@@ -14766,7 +14857,7 @@ _sk_parametric_r_sse41 LABEL PROC
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,218,44,0,0 ; minps 0x2cda(%rip),%xmm8 # 58c0 <_sk_callback_sse41+0x7aa>
+ DB 68,15,93,5,11,45,0,0 ; minps 0x2d0b(%rip),%xmm8 # 5920 <_sk_callback_sse41+0x7a0>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -14794,31 +14885,31 @@ _sk_parametric_g_sse41 LABEL PROC
DB 68,15,88,217 ; addps %xmm1,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,123,44,0,0 ; mulps 0x2c7b(%rip),%xmm12 # 58d0 <_sk_callback_sse41+0x7ba>
- DB 68,15,84,29,131,44,0,0 ; andps 0x2c83(%rip),%xmm11 # 58e0 <_sk_callback_sse41+0x7ca>
- DB 68,15,86,29,139,44,0,0 ; orps 0x2c8b(%rip),%xmm11 # 58f0 <_sk_callback_sse41+0x7da>
- DB 68,15,88,37,147,44,0,0 ; addps 0x2c93(%rip),%xmm12 # 5900 <_sk_callback_sse41+0x7ea>
- DB 15,40,13,156,44,0,0 ; movaps 0x2c9c(%rip),%xmm1 # 5910 <_sk_callback_sse41+0x7fa>
+ DB 68,15,89,37,172,44,0,0 ; mulps 0x2cac(%rip),%xmm12 # 5930 <_sk_callback_sse41+0x7b0>
+ DB 68,15,84,29,180,44,0,0 ; andps 0x2cb4(%rip),%xmm11 # 5940 <_sk_callback_sse41+0x7c0>
+ DB 68,15,86,29,188,44,0,0 ; orps 0x2cbc(%rip),%xmm11 # 5950 <_sk_callback_sse41+0x7d0>
+ DB 68,15,88,37,196,44,0,0 ; addps 0x2cc4(%rip),%xmm12 # 5960 <_sk_callback_sse41+0x7e0>
+ DB 15,40,13,205,44,0,0 ; movaps 0x2ccd(%rip),%xmm1 # 5970 <_sk_callback_sse41+0x7f0>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,88,29,156,44,0,0 ; addps 0x2c9c(%rip),%xmm11 # 5920 <_sk_callback_sse41+0x80a>
- DB 15,40,13,165,44,0,0 ; movaps 0x2ca5(%rip),%xmm1 # 5930 <_sk_callback_sse41+0x81a>
+ DB 68,15,88,29,205,44,0,0 ; addps 0x2ccd(%rip),%xmm11 # 5980 <_sk_callback_sse41+0x800>
+ DB 15,40,13,214,44,0,0 ; movaps 0x2cd6(%rip),%xmm1 # 5990 <_sk_callback_sse41+0x810>
DB 65,15,94,203 ; divps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,146,44,0,0 ; addps 0x2c92(%rip),%xmm12 # 5940 <_sk_callback_sse41+0x82a>
- DB 15,40,13,155,44,0,0 ; movaps 0x2c9b(%rip),%xmm1 # 5950 <_sk_callback_sse41+0x83a>
+ DB 68,15,88,37,195,44,0,0 ; addps 0x2cc3(%rip),%xmm12 # 59a0 <_sk_callback_sse41+0x820>
+ DB 15,40,13,204,44,0,0 ; movaps 0x2ccc(%rip),%xmm1 # 59b0 <_sk_callback_sse41+0x830>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,40,21,155,44,0,0 ; movaps 0x2c9b(%rip),%xmm10 # 5960 <_sk_callback_sse41+0x84a>
+ DB 68,15,40,21,204,44,0,0 ; movaps 0x2ccc(%rip),%xmm10 # 59c0 <_sk_callback_sse41+0x840>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,13,160,44,0,0 ; movaps 0x2ca0(%rip),%xmm1 # 5970 <_sk_callback_sse41+0x85a>
+ DB 15,40,13,209,44,0,0 ; movaps 0x2cd1(%rip),%xmm1 # 59d0 <_sk_callback_sse41+0x850>
DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,204 ; addps %xmm12,%xmm1
- DB 15,89,13,161,44,0,0 ; mulps 0x2ca1(%rip),%xmm1 # 5980 <_sk_callback_sse41+0x86a>
+ DB 15,89,13,210,44,0,0 ; mulps 0x2cd2(%rip),%xmm1 # 59e0 <_sk_callback_sse41+0x860>
DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10
DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
@@ -14826,7 +14917,7 @@ _sk_parametric_g_sse41 LABEL PROC
DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,93,13,140,44,0,0 ; minps 0x2c8c(%rip),%xmm1 # 5990 <_sk_callback_sse41+0x87a>
+ DB 15,93,13,189,44,0,0 ; minps 0x2cbd(%rip),%xmm1 # 59f0 <_sk_callback_sse41+0x870>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -14854,31 +14945,31 @@ _sk_parametric_b_sse41 LABEL PROC
DB 68,15,88,218 ; addps %xmm2,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,45,44,0,0 ; mulps 0x2c2d(%rip),%xmm12 # 59a0 <_sk_callback_sse41+0x88a>
- DB 68,15,84,29,53,44,0,0 ; andps 0x2c35(%rip),%xmm11 # 59b0 <_sk_callback_sse41+0x89a>
- DB 68,15,86,29,61,44,0,0 ; orps 0x2c3d(%rip),%xmm11 # 59c0 <_sk_callback_sse41+0x8aa>
- DB 68,15,88,37,69,44,0,0 ; addps 0x2c45(%rip),%xmm12 # 59d0 <_sk_callback_sse41+0x8ba>
- DB 15,40,21,78,44,0,0 ; movaps 0x2c4e(%rip),%xmm2 # 59e0 <_sk_callback_sse41+0x8ca>
+ DB 68,15,89,37,94,44,0,0 ; mulps 0x2c5e(%rip),%xmm12 # 5a00 <_sk_callback_sse41+0x880>
+ DB 68,15,84,29,102,44,0,0 ; andps 0x2c66(%rip),%xmm11 # 5a10 <_sk_callback_sse41+0x890>
+ DB 68,15,86,29,110,44,0,0 ; orps 0x2c6e(%rip),%xmm11 # 5a20 <_sk_callback_sse41+0x8a0>
+ DB 68,15,88,37,118,44,0,0 ; addps 0x2c76(%rip),%xmm12 # 5a30 <_sk_callback_sse41+0x8b0>
+ DB 15,40,21,127,44,0,0 ; movaps 0x2c7f(%rip),%xmm2 # 5a40 <_sk_callback_sse41+0x8c0>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,88,29,78,44,0,0 ; addps 0x2c4e(%rip),%xmm11 # 59f0 <_sk_callback_sse41+0x8da>
- DB 15,40,21,87,44,0,0 ; movaps 0x2c57(%rip),%xmm2 # 5a00 <_sk_callback_sse41+0x8ea>
+ DB 68,15,88,29,127,44,0,0 ; addps 0x2c7f(%rip),%xmm11 # 5a50 <_sk_callback_sse41+0x8d0>
+ DB 15,40,21,136,44,0,0 ; movaps 0x2c88(%rip),%xmm2 # 5a60 <_sk_callback_sse41+0x8e0>
DB 65,15,94,211 ; divps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,68,44,0,0 ; addps 0x2c44(%rip),%xmm12 # 5a10 <_sk_callback_sse41+0x8fa>
- DB 15,40,21,77,44,0,0 ; movaps 0x2c4d(%rip),%xmm2 # 5a20 <_sk_callback_sse41+0x90a>
+ DB 68,15,88,37,117,44,0,0 ; addps 0x2c75(%rip),%xmm12 # 5a70 <_sk_callback_sse41+0x8f0>
+ DB 15,40,21,126,44,0,0 ; movaps 0x2c7e(%rip),%xmm2 # 5a80 <_sk_callback_sse41+0x900>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,40,21,77,44,0,0 ; movaps 0x2c4d(%rip),%xmm10 # 5a30 <_sk_callback_sse41+0x91a>
+ DB 68,15,40,21,126,44,0,0 ; movaps 0x2c7e(%rip),%xmm10 # 5a90 <_sk_callback_sse41+0x910>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,21,82,44,0,0 ; movaps 0x2c52(%rip),%xmm2 # 5a40 <_sk_callback_sse41+0x92a>
+ DB 15,40,21,131,44,0,0 ; movaps 0x2c83(%rip),%xmm2 # 5aa0 <_sk_callback_sse41+0x920>
DB 65,15,94,210 ; divps %xmm10,%xmm2
DB 65,15,88,212 ; addps %xmm12,%xmm2
- DB 15,89,21,83,44,0,0 ; mulps 0x2c53(%rip),%xmm2 # 5a50 <_sk_callback_sse41+0x93a>
+ DB 15,89,21,132,44,0,0 ; mulps 0x2c84(%rip),%xmm2 # 5ab0 <_sk_callback_sse41+0x930>
DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10
DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
@@ -14886,7 +14977,7 @@ _sk_parametric_b_sse41 LABEL PROC
DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,93,21,62,44,0,0 ; minps 0x2c3e(%rip),%xmm2 # 5a60 <_sk_callback_sse41+0x94a>
+ DB 15,93,21,111,44,0,0 ; minps 0x2c6f(%rip),%xmm2 # 5ac0 <_sk_callback_sse41+0x940>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -14914,31 +15005,31 @@ _sk_parametric_a_sse41 LABEL PROC
DB 68,15,88,219 ; addps %xmm3,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,223,43,0,0 ; mulps 0x2bdf(%rip),%xmm12 # 5a70 <_sk_callback_sse41+0x95a>
- DB 68,15,84,29,231,43,0,0 ; andps 0x2be7(%rip),%xmm11 # 5a80 <_sk_callback_sse41+0x96a>
- DB 68,15,86,29,239,43,0,0 ; orps 0x2bef(%rip),%xmm11 # 5a90 <_sk_callback_sse41+0x97a>
- DB 68,15,88,37,247,43,0,0 ; addps 0x2bf7(%rip),%xmm12 # 5aa0 <_sk_callback_sse41+0x98a>
- DB 15,40,29,0,44,0,0 ; movaps 0x2c00(%rip),%xmm3 # 5ab0 <_sk_callback_sse41+0x99a>
+ DB 68,15,89,37,16,44,0,0 ; mulps 0x2c10(%rip),%xmm12 # 5ad0 <_sk_callback_sse41+0x950>
+ DB 68,15,84,29,24,44,0,0 ; andps 0x2c18(%rip),%xmm11 # 5ae0 <_sk_callback_sse41+0x960>
+ DB 68,15,86,29,32,44,0,0 ; orps 0x2c20(%rip),%xmm11 # 5af0 <_sk_callback_sse41+0x970>
+ DB 68,15,88,37,40,44,0,0 ; addps 0x2c28(%rip),%xmm12 # 5b00 <_sk_callback_sse41+0x980>
+ DB 15,40,29,49,44,0,0 ; movaps 0x2c31(%rip),%xmm3 # 5b10 <_sk_callback_sse41+0x990>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,88,29,0,44,0,0 ; addps 0x2c00(%rip),%xmm11 # 5ac0 <_sk_callback_sse41+0x9aa>
- DB 15,40,29,9,44,0,0 ; movaps 0x2c09(%rip),%xmm3 # 5ad0 <_sk_callback_sse41+0x9ba>
+ DB 68,15,88,29,49,44,0,0 ; addps 0x2c31(%rip),%xmm11 # 5b20 <_sk_callback_sse41+0x9a0>
+ DB 15,40,29,58,44,0,0 ; movaps 0x2c3a(%rip),%xmm3 # 5b30 <_sk_callback_sse41+0x9b0>
DB 65,15,94,219 ; divps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,246,43,0,0 ; addps 0x2bf6(%rip),%xmm12 # 5ae0 <_sk_callback_sse41+0x9ca>
- DB 15,40,29,255,43,0,0 ; movaps 0x2bff(%rip),%xmm3 # 5af0 <_sk_callback_sse41+0x9da>
+ DB 68,15,88,37,39,44,0,0 ; addps 0x2c27(%rip),%xmm12 # 5b40 <_sk_callback_sse41+0x9c0>
+ DB 15,40,29,48,44,0,0 ; movaps 0x2c30(%rip),%xmm3 # 5b50 <_sk_callback_sse41+0x9d0>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,40,21,255,43,0,0 ; movaps 0x2bff(%rip),%xmm10 # 5b00 <_sk_callback_sse41+0x9ea>
+ DB 68,15,40,21,48,44,0,0 ; movaps 0x2c30(%rip),%xmm10 # 5b60 <_sk_callback_sse41+0x9e0>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,29,4,44,0,0 ; movaps 0x2c04(%rip),%xmm3 # 5b10 <_sk_callback_sse41+0x9fa>
+ DB 15,40,29,53,44,0,0 ; movaps 0x2c35(%rip),%xmm3 # 5b70 <_sk_callback_sse41+0x9f0>
DB 65,15,94,218 ; divps %xmm10,%xmm3
DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 15,89,29,5,44,0,0 ; mulps 0x2c05(%rip),%xmm3 # 5b20 <_sk_callback_sse41+0xa0a>
+ DB 15,89,29,54,44,0,0 ; mulps 0x2c36(%rip),%xmm3 # 5b80 <_sk_callback_sse41+0xa00>
DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10
DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
@@ -14946,7 +15037,7 @@ _sk_parametric_a_sse41 LABEL PROC
DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,93,29,240,43,0,0 ; minps 0x2bf0(%rip),%xmm3 # 5b30 <_sk_callback_sse41+0xa1a>
+ DB 15,93,29,33,44,0,0 ; minps 0x2c21(%rip),%xmm3 # 5b90 <_sk_callback_sse41+0xa10>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -14954,29 +15045,29 @@ _sk_parametric_a_sse41 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse41
_sk_lab_to_xyz_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,89,5,236,43,0,0 ; mulps 0x2bec(%rip),%xmm8 # 5b40 <_sk_callback_sse41+0xa2a>
- DB 68,15,40,13,244,43,0,0 ; movaps 0x2bf4(%rip),%xmm9 # 5b50 <_sk_callback_sse41+0xa3a>
+ DB 68,15,89,5,29,44,0,0 ; mulps 0x2c1d(%rip),%xmm8 # 5ba0 <_sk_callback_sse41+0xa20>
+ DB 68,15,40,13,37,44,0,0 ; movaps 0x2c25(%rip),%xmm9 # 5bb0 <_sk_callback_sse41+0xa30>
DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,40,5,249,43,0,0 ; movaps 0x2bf9(%rip),%xmm0 # 5b60 <_sk_callback_sse41+0xa4a>
+ DB 15,40,5,42,44,0,0 ; movaps 0x2c2a(%rip),%xmm0 # 5bc0 <_sk_callback_sse41+0xa40>
DB 15,88,200 ; addps %xmm0,%xmm1
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,88,5,247,43,0,0 ; addps 0x2bf7(%rip),%xmm8 # 5b70 <_sk_callback_sse41+0xa5a>
- DB 68,15,89,5,255,43,0,0 ; mulps 0x2bff(%rip),%xmm8 # 5b80 <_sk_callback_sse41+0xa6a>
- DB 15,89,13,8,44,0,0 ; mulps 0x2c08(%rip),%xmm1 # 5b90 <_sk_callback_sse41+0xa7a>
+ DB 68,15,88,5,40,44,0,0 ; addps 0x2c28(%rip),%xmm8 # 5bd0 <_sk_callback_sse41+0xa50>
+ DB 68,15,89,5,48,44,0,0 ; mulps 0x2c30(%rip),%xmm8 # 5be0 <_sk_callback_sse41+0xa60>
+ DB 15,89,13,57,44,0,0 ; mulps 0x2c39(%rip),%xmm1 # 5bf0 <_sk_callback_sse41+0xa70>
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 15,89,21,13,44,0,0 ; mulps 0x2c0d(%rip),%xmm2 # 5ba0 <_sk_callback_sse41+0xa8a>
+ DB 15,89,21,62,44,0,0 ; mulps 0x2c3e(%rip),%xmm2 # 5c00 <_sk_callback_sse41+0xa80>
DB 69,15,40,208 ; movaps %xmm8,%xmm10
DB 68,15,92,210 ; subps %xmm2,%xmm10
DB 68,15,40,217 ; movaps %xmm1,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
- DB 68,15,40,13,1,44,0,0 ; movaps 0x2c01(%rip),%xmm9 # 5bb0 <_sk_callback_sse41+0xa9a>
+ DB 68,15,40,13,50,44,0,0 ; movaps 0x2c32(%rip),%xmm9 # 5c10 <_sk_callback_sse41+0xa90>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 15,40,21,1,44,0,0 ; movaps 0x2c01(%rip),%xmm2 # 5bc0 <_sk_callback_sse41+0xaaa>
+ DB 15,40,21,50,44,0,0 ; movaps 0x2c32(%rip),%xmm2 # 5c20 <_sk_callback_sse41+0xaa0>
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 68,15,40,37,6,44,0,0 ; movaps 0x2c06(%rip),%xmm12 # 5bd0 <_sk_callback_sse41+0xaba>
+ DB 68,15,40,37,55,44,0,0 ; movaps 0x2c37(%rip),%xmm12 # 5c30 <_sk_callback_sse41+0xab0>
DB 65,15,89,204 ; mulps %xmm12,%xmm1
DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
DB 69,15,40,216 ; movaps %xmm8,%xmm11
@@ -14995,8 +15086,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC
DB 65,15,89,212 ; mulps %xmm12,%xmm2
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2
- DB 15,89,13,191,43,0,0 ; mulps 0x2bbf(%rip),%xmm1 # 5be0 <_sk_callback_sse41+0xaca>
- DB 15,89,21,200,43,0,0 ; mulps 0x2bc8(%rip),%xmm2 # 5bf0 <_sk_callback_sse41+0xada>
+ DB 15,89,13,240,43,0,0 ; mulps 0x2bf0(%rip),%xmm1 # 5c40 <_sk_callback_sse41+0xac0>
+ DB 15,89,21,249,43,0,0 ; mulps 0x2bf9(%rip),%xmm2 # 5c50 <_sk_callback_sse41+0xad0>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,40,200 ; movaps %xmm8,%xmm1
@@ -15007,33 +15098,36 @@ _sk_load_a8_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,38 ; jne 3063 <_sk_load_a8_sse41+0x30>
+ DB 117,39 ; jne 3093 <_sk_load_a8_sse41+0x31>
DB 102,65,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm0
- DB 102,15,219,5,180,43,0,0 ; pand 0x2bb4(%rip),%xmm0 # 5c00 <_sk_callback_sse41+0xaea>
+ DB 102,15,219,5,229,43,0,0 ; pand 0x2be5(%rip),%xmm0 # 5c60 <_sk_callback_sse41+0xae0>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,186,43,0,0 ; mulps 0x2bba(%rip),%xmm3 # 5c10 <_sk_callback_sse41+0xafa>
+ DB 15,89,29,235,43,0,0 ; mulps 0x2beb(%rip),%xmm3 # 5c70 <_sk_callback_sse41+0xaf0>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 15,87,201 ; xorps %xmm1,%xmm1
+ DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,39 ; je 309b <_sk_load_a8_sse41+0x68>
+ DB 116,53 ; je 30d5 <_sk_load_a8_sse41+0x73>
+ DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 308f <_sk_load_a8_sse41+0x5c>
+ DB 116,21 ; je 30bf <_sk_load_a8_sse41+0x5d>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,196 ; jne 3044 <_sk_load_a8_sse41+0x11>
+ DB 117,195 ; jne 3073 <_sk_load_a8_sse41+0x11>
DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
- DB 65,15,182,68,18,1 ; movzbl 0x1(%r10,%rdx,1),%eax
- DB 102,15,58,34,192,1 ; pinsrd $0x1,%eax,%xmm0
+ DB 65,15,183,4,18 ; movzwl (%r10,%rdx,1),%eax
+ DB 102,15,110,200 ; movd %eax,%xmm1
+ DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
+ DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
+ DB 235,158 ; jmp 3073 <_sk_load_a8_sse41+0x11>
DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax
- DB 102,15,58,34,192,0 ; pinsrd $0x0,%eax,%xmm0
- DB 235,156 ; jmp 3044 <_sk_load_a8_sse41+0x11>
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 235,147 ; jmp 3073 <_sk_load_a8_sse41+0x11>
PUBLIC _sk_gather_a8_sse41
_sk_gather_a8_sse41 LABEL PROC
@@ -15060,7 +15154,7 @@ _sk_gather_a8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,8,43,0,0 ; mulps 0x2b08(%rip),%xmm3 # 5c20 <_sk_callback_sse41+0xb0a>
+ DB 15,89,29,48,43,0,0 ; mulps 0x2b30(%rip),%xmm3 # 5c80 <_sk_callback_sse41+0xb00>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -15073,13 +15167,13 @@ _sk_store_a8_sse41 LABEL PROC
DB 72,131,236,4 ; sub $0x4,%rsp
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 68,15,40,5,247,42,0,0 ; movaps 0x2af7(%rip),%xmm8 # 5c30 <_sk_callback_sse41+0xb1a>
+ DB 68,15,40,5,31,43,0,0 ; movaps 0x2b1f(%rip),%xmm8 # 5c90 <_sk_callback_sse41+0xb10>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 3163 <_sk_store_a8_sse41+0x3b>
+ DB 117,17 ; jne 319b <_sk_store_a8_sse41+0x3b>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 65,137,4,18 ; mov %eax,(%r10,%rdx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -15089,48 +15183,53 @@ _sk_store_a8_sse41 LABEL PROC
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,30 ; je 3194 <_sk_store_a8_sse41+0x6c>
+ DB 116,41 ; je 31d7 <_sk_store_a8_sse41+0x77>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 318b <_sk_store_a8_sse41+0x63>
+ DB 116,15 ; je 31c3 <_sk_store_a8_sse41+0x63>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,217 ; jne 315b <_sk_store_a8_sse41+0x33>
+ DB 117,217 ; jne 3193 <_sk_store_a8_sse41+0x33>
DB 102,69,15,58,20,68,18,2,8 ; pextrb $0x8,%xmm8,0x2(%r10,%rdx,1)
- DB 102,69,15,58,20,68,18,1,4 ; pextrb $0x4,%xmm8,0x1(%r10,%rdx,1)
+ DB 102,68,15,56,0,5,211,42,0,0 ; pshufb 0x2ad3(%rip),%xmm8 # 5ca0 <_sk_callback_sse41+0xb20>
+ DB 102,69,15,58,21,4,18,0 ; pextrw $0x0,%xmm8,(%r10,%rdx,1)
+ DB 235,188 ; jmp 3193 <_sk_store_a8_sse41+0x33>
DB 102,69,15,58,20,4,18,0 ; pextrb $0x0,%xmm8,(%r10,%rdx,1)
- DB 235,189 ; jmp 315b <_sk_store_a8_sse41+0x33>
+ DB 235,178 ; jmp 3193 <_sk_store_a8_sse41+0x33>
PUBLIC _sk_load_g8_sse41
_sk_load_g8_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 31d2 <_sk_load_g8_sse41+0x34>
+ DB 117,42 ; jne 3215 <_sk_load_g8_sse41+0x34>
DB 102,65,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm0
- DB 102,15,219,5,137,42,0,0 ; pand 0x2a89(%rip),%xmm0 # 5c40 <_sk_callback_sse41+0xb2a>
+ DB 102,15,219,5,182,42,0,0 ; pand 0x2ab6(%rip),%xmm0 # 5cb0 <_sk_callback_sse41+0xb30>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,143,42,0,0 ; mulps 0x2a8f(%rip),%xmm0 # 5c50 <_sk_callback_sse41+0xb3a>
+ DB 15,89,5,188,42,0,0 ; mulps 0x2abc(%rip),%xmm0 # 5cc0 <_sk_callback_sse41+0xb40>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,150,42,0,0 ; movaps 0x2a96(%rip),%xmm3 # 5c60 <_sk_callback_sse41+0xb4a>
+ DB 15,40,29,195,42,0,0 ; movaps 0x2ac3(%rip),%xmm3 # 5cd0 <_sk_callback_sse41+0xb50>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,39 ; je 320a <_sk_load_g8_sse41+0x6c>
+ DB 116,53 ; je 3257 <_sk_load_g8_sse41+0x76>
+ DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 31fe <_sk_load_g8_sse41+0x60>
+ DB 116,21 ; je 3241 <_sk_load_g8_sse41+0x60>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,192 ; jne 31af <_sk_load_g8_sse41+0x11>
+ DB 117,192 ; jne 31f2 <_sk_load_g8_sse41+0x11>
DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
- DB 65,15,182,68,18,1 ; movzbl 0x1(%r10,%rdx,1),%eax
- DB 102,15,58,34,192,1 ; pinsrd $0x1,%eax,%xmm0
+ DB 65,15,183,4,18 ; movzwl (%r10,%rdx,1),%eax
+ DB 102,15,110,200 ; movd %eax,%xmm1
+ DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
+ DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
+ DB 235,155 ; jmp 31f2 <_sk_load_g8_sse41+0x11>
DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax
- DB 102,15,58,34,192,0 ; pinsrd $0x0,%eax,%xmm0
- DB 235,152 ; jmp 31af <_sk_load_g8_sse41+0x11>
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 235,144 ; jmp 31f2 <_sk_load_g8_sse41+0x11>
PUBLIC _sk_gather_g8_sse41
_sk_gather_g8_sse41 LABEL PROC
@@ -15157,9 +15256,9 @@ _sk_gather_g8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,233,41,0,0 ; mulps 0x29e9(%rip),%xmm0 # 5c70 <_sk_callback_sse41+0xb5a>
+ DB 15,89,5,14,42,0,0 ; mulps 0x2a0e(%rip),%xmm0 # 5ce0 <_sk_callback_sse41+0xb60>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,240,41,0,0 ; movaps 0x29f0(%rip),%xmm3 # 5c80 <_sk_callback_sse41+0xb6a>
+ DB 15,40,29,21,42,0,0 ; movaps 0x2a15(%rip),%xmm3 # 5cf0 <_sk_callback_sse41+0xb70>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -15170,9 +15269,9 @@ _sk_gather_i8_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,137,193 ; mov %rax,%r9
DB 77,133,201 ; test %r9,%r9
- DB 116,5 ; je 32a8 <_sk_gather_i8_sse41+0xf>
+ DB 116,5 ; je 32f3 <_sk_gather_i8_sse41+0xf>
DB 76,137,200 ; mov %r9,%rax
- DB 235,2 ; jmp 32aa <_sk_gather_i8_sse41+0x11>
+ DB 235,2 ; jmp 32f5 <_sk_gather_i8_sse41+0x11>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,86 ; push %r14
DB 83 ; push %rbx
@@ -15205,17 +15304,17 @@ _sk_gather_i8_sse41 LABEL PROC
DB 102,15,58,34,28,24,1 ; pinsrd $0x1,(%rax,%rbx,1),%xmm3
DB 102,66,15,58,34,28,152,2 ; pinsrd $0x2,(%rax,%r11,4),%xmm3
DB 102,66,15,58,34,28,16,3 ; pinsrd $0x3,(%rax,%r10,1),%xmm3
- DB 102,15,111,5,67,41,0,0 ; movdqa 0x2943(%rip),%xmm0 # 5c90 <_sk_callback_sse41+0xb7a>
+ DB 102,15,111,5,104,41,0,0 ; movdqa 0x2968(%rip),%xmm0 # 5d00 <_sk_callback_sse41+0xb80>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,68,41,0,0 ; movaps 0x2944(%rip),%xmm8 # 5ca0 <_sk_callback_sse41+0xb8a>
+ DB 68,15,40,5,105,41,0,0 ; movaps 0x2969(%rip),%xmm8 # 5d10 <_sk_callback_sse41+0xb90>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,67,41,0,0 ; pshufb 0x2943(%rip),%xmm1 # 5cb0 <_sk_callback_sse41+0xb9a>
+ DB 102,15,56,0,13,104,41,0,0 ; pshufb 0x2968(%rip),%xmm1 # 5d20 <_sk_callback_sse41+0xba0>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,63,41,0,0 ; pshufb 0x293f(%rip),%xmm2 # 5cc0 <_sk_callback_sse41+0xbaa>
+ DB 102,15,56,0,21,100,41,0,0 ; pshufb 0x2964(%rip),%xmm2 # 5d30 <_sk_callback_sse41+0xbb0>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -15231,39 +15330,41 @@ _sk_load_565_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,80 ; jne 33f5 <_sk_load_565_sse41+0x5a>
+ DB 117,80 ; jne 3440 <_sk_load_565_sse41+0x5a>
DB 102,65,15,56,51,20,82 ; pmovzxwd (%r10,%rdx,2),%xmm2
- DB 102,15,111,5,28,41,0,0 ; movdqa 0x291c(%rip),%xmm0 # 5cd0 <_sk_callback_sse41+0xbba>
+ DB 102,15,111,5,65,41,0,0 ; movdqa 0x2941(%rip),%xmm0 # 5d40 <_sk_callback_sse41+0xbc0>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,30,41,0,0 ; mulps 0x291e(%rip),%xmm0 # 5ce0 <_sk_callback_sse41+0xbca>
- DB 102,15,111,13,38,41,0,0 ; movdqa 0x2926(%rip),%xmm1 # 5cf0 <_sk_callback_sse41+0xbda>
+ DB 15,89,5,67,41,0,0 ; mulps 0x2943(%rip),%xmm0 # 5d50 <_sk_callback_sse41+0xbd0>
+ DB 102,15,111,13,75,41,0,0 ; movdqa 0x294b(%rip),%xmm1 # 5d60 <_sk_callback_sse41+0xbe0>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,40,41,0,0 ; mulps 0x2928(%rip),%xmm1 # 5d00 <_sk_callback_sse41+0xbea>
- DB 102,15,219,21,48,41,0,0 ; pand 0x2930(%rip),%xmm2 # 5d10 <_sk_callback_sse41+0xbfa>
+ DB 15,89,13,77,41,0,0 ; mulps 0x294d(%rip),%xmm1 # 5d70 <_sk_callback_sse41+0xbf0>
+ DB 102,15,219,21,85,41,0,0 ; pand 0x2955(%rip),%xmm2 # 5d80 <_sk_callback_sse41+0xc00>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,54,41,0,0 ; mulps 0x2936(%rip),%xmm2 # 5d20 <_sk_callback_sse41+0xc0a>
+ DB 15,89,21,91,41,0,0 ; mulps 0x295b(%rip),%xmm2 # 5d90 <_sk_callback_sse41+0xc10>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,61,41,0,0 ; movaps 0x293d(%rip),%xmm3 # 5d30 <_sk_callback_sse41+0xc1a>
+ DB 15,40,29,98,41,0,0 ; movaps 0x2962(%rip),%xmm3 # 5da0 <_sk_callback_sse41+0xc20>
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,39 ; je 342d <_sk_load_565_sse41+0x92>
+ DB 116,53 ; je 3482 <_sk_load_565_sse41+0x9c>
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 3421 <_sk_load_565_sse41+0x86>
+ DB 116,21 ; je 346c <_sk_load_565_sse41+0x86>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,154 ; jne 33ac <_sk_load_565_sse41+0x11>
+ DB 117,154 ; jne 33f7 <_sk_load_565_sse41+0x11>
DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
- DB 65,15,183,68,82,2 ; movzwl 0x2(%r10,%rdx,2),%eax
- DB 102,15,58,34,208,1 ; pinsrd $0x1,%eax,%xmm2
+ DB 102,65,15,110,4,82 ; movd (%r10,%rdx,2),%xmm0
+ DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
+ DB 102,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm2
+ DB 233,117,255,255,255 ; jmpq 33f7 <_sk_load_565_sse41+0x11>
DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax
- DB 102,15,58,34,208,0 ; pinsrd $0x0,%eax,%xmm2
- DB 233,111,255,255,255 ; jmpq 33ac <_sk_load_565_sse41+0x11>
+ DB 102,15,110,208 ; movd %eax,%xmm2
+ DB 233,103,255,255,255 ; jmpq 33f7 <_sk_load_565_sse41+0x11>
PUBLIC _sk_gather_565_sse41
_sk_gather_565_sse41 LABEL PROC
@@ -15289,19 +15390,19 @@ _sk_gather_565_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2
- DB 102,15,111,5,153,40,0,0 ; movdqa 0x2899(%rip),%xmm0 # 5d40 <_sk_callback_sse41+0xc2a>
+ DB 102,15,111,5,182,40,0,0 ; movdqa 0x28b6(%rip),%xmm0 # 5db0 <_sk_callback_sse41+0xc30>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,155,40,0,0 ; mulps 0x289b(%rip),%xmm0 # 5d50 <_sk_callback_sse41+0xc3a>
- DB 102,15,111,13,163,40,0,0 ; movdqa 0x28a3(%rip),%xmm1 # 5d60 <_sk_callback_sse41+0xc4a>
+ DB 15,89,5,184,40,0,0 ; mulps 0x28b8(%rip),%xmm0 # 5dc0 <_sk_callback_sse41+0xc40>
+ DB 102,15,111,13,192,40,0,0 ; movdqa 0x28c0(%rip),%xmm1 # 5dd0 <_sk_callback_sse41+0xc50>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,165,40,0,0 ; mulps 0x28a5(%rip),%xmm1 # 5d70 <_sk_callback_sse41+0xc5a>
- DB 102,15,219,21,173,40,0,0 ; pand 0x28ad(%rip),%xmm2 # 5d80 <_sk_callback_sse41+0xc6a>
+ DB 15,89,13,194,40,0,0 ; mulps 0x28c2(%rip),%xmm1 # 5de0 <_sk_callback_sse41+0xc60>
+ DB 102,15,219,21,202,40,0,0 ; pand 0x28ca(%rip),%xmm2 # 5df0 <_sk_callback_sse41+0xc70>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,179,40,0,0 ; mulps 0x28b3(%rip),%xmm2 # 5d90 <_sk_callback_sse41+0xc7a>
+ DB 15,89,21,208,40,0,0 ; mulps 0x28d0(%rip),%xmm2 # 5e00 <_sk_callback_sse41+0xc80>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,186,40,0,0 ; movaps 0x28ba(%rip),%xmm3 # 5da0 <_sk_callback_sse41+0xc8a>
+ DB 15,40,29,215,40,0,0 ; movaps 0x28d7(%rip),%xmm3 # 5e10 <_sk_callback_sse41+0xc90>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -15309,12 +15410,12 @@ PUBLIC _sk_store_565_sse41
_sk_store_565_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,186,40,0,0 ; movaps 0x28ba(%rip),%xmm8 # 5db0 <_sk_callback_sse41+0xc9a>
+ DB 68,15,40,5,215,40,0,0 ; movaps 0x28d7(%rip),%xmm8 # 5e20 <_sk_callback_sse41+0xca0>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,175,40,0,0 ; movaps 0x28af(%rip),%xmm10 # 5dc0 <_sk_callback_sse41+0xcaa>
+ DB 68,15,40,21,204,40,0,0 ; movaps 0x28cc(%rip),%xmm10 # 5e30 <_sk_callback_sse41+0xcb0>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -15324,7 +15425,7 @@ _sk_store_565_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3548 <_sk_store_565_sse41+0x5f>
+ DB 117,10 ; jne 359b <_sk_store_565_sse41+0x5f>
DB 242,68,15,17,4,80 ; movsd %xmm8,(%rax,%rdx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -15332,57 +15433,61 @@ _sk_store_565_sse41 LABEL PROC
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,30 ; je 3579 <_sk_store_565_sse41+0x90>
+ DB 116,35 ; je 35d1 <_sk_store_565_sse41+0x95>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 3570 <_sk_store_565_sse41+0x87>
+ DB 116,15 ; je 35c3 <_sk_store_565_sse41+0x87>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,221 ; jne 3544 <_sk_store_565_sse41+0x5b>
+ DB 117,221 ; jne 3597 <_sk_store_565_sse41+0x5b>
DB 102,68,15,58,21,68,80,4,4 ; pextrw $0x4,%xmm8,0x4(%rax,%rdx,2)
- DB 102,68,15,58,21,68,80,2,2 ; pextrw $0x2,%xmm8,0x2(%rax,%rdx,2)
+ DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
+ DB 102,68,15,126,4,80 ; movd %xmm8,(%rax,%rdx,2)
+ DB 235,198 ; jmp 3597 <_sk_store_565_sse41+0x5b>
DB 102,68,15,58,21,4,80,0 ; pextrw $0x0,%xmm8,(%rax,%rdx,2)
- DB 235,193 ; jmp 3544 <_sk_store_565_sse41+0x5b>
+ DB 235,188 ; jmp 3597 <_sk_store_565_sse41+0x5b>
PUBLIC _sk_load_4444_sse41
_sk_load_4444_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,95 ; jne 35ec <_sk_load_4444_sse41+0x69>
+ DB 117,95 ; jne 3644 <_sk_load_4444_sse41+0x69>
DB 102,65,15,56,51,28,82 ; pmovzxwd (%r10,%rdx,2),%xmm3
- DB 102,15,111,5,52,40,0,0 ; movdqa 0x2834(%rip),%xmm0 # 5dd0 <_sk_callback_sse41+0xcba>
+ DB 102,15,111,5,76,40,0,0 ; movdqa 0x284c(%rip),%xmm0 # 5e40 <_sk_callback_sse41+0xcc0>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,54,40,0,0 ; mulps 0x2836(%rip),%xmm0 # 5de0 <_sk_callback_sse41+0xcca>
- DB 102,15,111,13,62,40,0,0 ; movdqa 0x283e(%rip),%xmm1 # 5df0 <_sk_callback_sse41+0xcda>
+ DB 15,89,5,78,40,0,0 ; mulps 0x284e(%rip),%xmm0 # 5e50 <_sk_callback_sse41+0xcd0>
+ DB 102,15,111,13,86,40,0,0 ; movdqa 0x2856(%rip),%xmm1 # 5e60 <_sk_callback_sse41+0xce0>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,64,40,0,0 ; mulps 0x2840(%rip),%xmm1 # 5e00 <_sk_callback_sse41+0xcea>
- DB 102,15,111,21,72,40,0,0 ; movdqa 0x2848(%rip),%xmm2 # 5e10 <_sk_callback_sse41+0xcfa>
+ DB 15,89,13,88,40,0,0 ; mulps 0x2858(%rip),%xmm1 # 5e70 <_sk_callback_sse41+0xcf0>
+ DB 102,15,111,21,96,40,0,0 ; movdqa 0x2860(%rip),%xmm2 # 5e80 <_sk_callback_sse41+0xd00>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,74,40,0,0 ; mulps 0x284a(%rip),%xmm2 # 5e20 <_sk_callback_sse41+0xd0a>
- DB 102,15,219,29,82,40,0,0 ; pand 0x2852(%rip),%xmm3 # 5e30 <_sk_callback_sse41+0xd1a>
+ DB 15,89,21,98,40,0,0 ; mulps 0x2862(%rip),%xmm2 # 5e90 <_sk_callback_sse41+0xd10>
+ DB 102,15,219,29,106,40,0,0 ; pand 0x286a(%rip),%xmm3 # 5ea0 <_sk_callback_sse41+0xd20>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,88,40,0,0 ; mulps 0x2858(%rip),%xmm3 # 5e40 <_sk_callback_sse41+0xd2a>
+ DB 15,89,29,112,40,0,0 ; mulps 0x2870(%rip),%xmm3 # 5eb0 <_sk_callback_sse41+0xd30>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,39 ; je 3624 <_sk_load_4444_sse41+0xa1>
+ DB 116,53 ; je 3686 <_sk_load_4444_sse41+0xab>
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 3618 <_sk_load_4444_sse41+0x95>
+ DB 116,21 ; je 3670 <_sk_load_4444_sse41+0x95>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,139 ; jne 3594 <_sk_load_4444_sse41+0x11>
+ DB 117,139 ; jne 35ec <_sk_load_4444_sse41+0x11>
DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
- DB 65,15,183,68,82,2 ; movzwl 0x2(%r10,%rdx,2),%eax
- DB 102,15,58,34,216,1 ; pinsrd $0x1,%eax,%xmm3
+ DB 102,65,15,110,4,82 ; movd (%r10,%rdx,2),%xmm0
+ DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
+ DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
+ DB 233,102,255,255,255 ; jmpq 35ec <_sk_load_4444_sse41+0x11>
DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax
- DB 102,15,58,34,216,0 ; pinsrd $0x0,%eax,%xmm3
- DB 233,96,255,255,255 ; jmpq 3594 <_sk_load_4444_sse41+0x11>
+ DB 102,15,110,216 ; movd %eax,%xmm3
+ DB 233,88,255,255,255 ; jmpq 35ec <_sk_load_4444_sse41+0x11>
PUBLIC _sk_gather_4444_sse41
_sk_gather_4444_sse41 LABEL PROC
@@ -15408,21 +15513,21 @@ _sk_gather_4444_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3
- DB 102,15,111,5,178,39,0,0 ; movdqa 0x27b2(%rip),%xmm0 # 5e50 <_sk_callback_sse41+0xd3a>
+ DB 102,15,111,5,194,39,0,0 ; movdqa 0x27c2(%rip),%xmm0 # 5ec0 <_sk_callback_sse41+0xd40>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,180,39,0,0 ; mulps 0x27b4(%rip),%xmm0 # 5e60 <_sk_callback_sse41+0xd4a>
- DB 102,15,111,13,188,39,0,0 ; movdqa 0x27bc(%rip),%xmm1 # 5e70 <_sk_callback_sse41+0xd5a>
+ DB 15,89,5,196,39,0,0 ; mulps 0x27c4(%rip),%xmm0 # 5ed0 <_sk_callback_sse41+0xd50>
+ DB 102,15,111,13,204,39,0,0 ; movdqa 0x27cc(%rip),%xmm1 # 5ee0 <_sk_callback_sse41+0xd60>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,190,39,0,0 ; mulps 0x27be(%rip),%xmm1 # 5e80 <_sk_callback_sse41+0xd6a>
- DB 102,15,111,21,198,39,0,0 ; movdqa 0x27c6(%rip),%xmm2 # 5e90 <_sk_callback_sse41+0xd7a>
+ DB 15,89,13,206,39,0,0 ; mulps 0x27ce(%rip),%xmm1 # 5ef0 <_sk_callback_sse41+0xd70>
+ DB 102,15,111,21,214,39,0,0 ; movdqa 0x27d6(%rip),%xmm2 # 5f00 <_sk_callback_sse41+0xd80>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,200,39,0,0 ; mulps 0x27c8(%rip),%xmm2 # 5ea0 <_sk_callback_sse41+0xd8a>
- DB 102,15,219,29,208,39,0,0 ; pand 0x27d0(%rip),%xmm3 # 5eb0 <_sk_callback_sse41+0xd9a>
+ DB 15,89,21,216,39,0,0 ; mulps 0x27d8(%rip),%xmm2 # 5f10 <_sk_callback_sse41+0xd90>
+ DB 102,15,219,29,224,39,0,0 ; pand 0x27e0(%rip),%xmm3 # 5f20 <_sk_callback_sse41+0xda0>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,214,39,0,0 ; mulps 0x27d6(%rip),%xmm3 # 5ec0 <_sk_callback_sse41+0xdaa>
+ DB 15,89,29,230,39,0,0 ; mulps 0x27e6(%rip),%xmm3 # 5f30 <_sk_callback_sse41+0xdb0>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -15431,7 +15536,7 @@ PUBLIC _sk_store_4444_sse41
_sk_store_4444_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,212,39,0,0 ; movaps 0x27d4(%rip),%xmm8 # 5ed0 <_sk_callback_sse41+0xdba>
+ DB 68,15,40,5,228,39,0,0 ; movaps 0x27e4(%rip),%xmm8 # 5f40 <_sk_callback_sse41+0xdc0>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -15451,7 +15556,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3762 <_sk_store_4444_sse41+0x73>
+ DB 117,10 ; jne 37c2 <_sk_store_4444_sse41+0x73>
DB 242,68,15,17,4,80 ; movsd %xmm8,(%rax,%rdx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -15459,34 +15564,36 @@ _sk_store_4444_sse41 LABEL PROC
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,30 ; je 3793 <_sk_store_4444_sse41+0xa4>
+ DB 116,35 ; je 37f8 <_sk_store_4444_sse41+0xa9>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 378a <_sk_store_4444_sse41+0x9b>
+ DB 116,15 ; je 37ea <_sk_store_4444_sse41+0x9b>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,221 ; jne 375e <_sk_store_4444_sse41+0x6f>
+ DB 117,221 ; jne 37be <_sk_store_4444_sse41+0x6f>
DB 102,68,15,58,21,68,80,4,4 ; pextrw $0x4,%xmm8,0x4(%rax,%rdx,2)
- DB 102,68,15,58,21,68,80,2,2 ; pextrw $0x2,%xmm8,0x2(%rax,%rdx,2)
+ DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
+ DB 102,68,15,126,4,80 ; movd %xmm8,(%rax,%rdx,2)
+ DB 235,198 ; jmp 37be <_sk_store_4444_sse41+0x6f>
DB 102,68,15,58,21,4,80,0 ; pextrw $0x0,%xmm8,(%rax,%rdx,2)
- DB 235,193 ; jmp 375e <_sk_store_4444_sse41+0x6f>
+ DB 235,188 ; jmp 37be <_sk_store_4444_sse41+0x6f>
PUBLIC _sk_load_8888_sse41
_sk_load_8888_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,88 ; jne 37ff <_sk_load_8888_sse41+0x62>
+ DB 117,88 ; jne 3864 <_sk_load_8888_sse41+0x62>
DB 243,15,111,28,144 ; movdqu (%rax,%rdx,4),%xmm3
- DB 102,15,111,5,44,39,0,0 ; movdqa 0x272c(%rip),%xmm0 # 5ee0 <_sk_callback_sse41+0xdca>
+ DB 102,15,111,5,55,39,0,0 ; movdqa 0x2737(%rip),%xmm0 # 5f50 <_sk_callback_sse41+0xdd0>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,45,39,0,0 ; movaps 0x272d(%rip),%xmm8 # 5ef0 <_sk_callback_sse41+0xdda>
+ DB 68,15,40,5,56,39,0,0 ; movaps 0x2738(%rip),%xmm8 # 5f60 <_sk_callback_sse41+0xde0>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,44,39,0,0 ; pshufb 0x272c(%rip),%xmm1 # 5f00 <_sk_callback_sse41+0xdea>
+ DB 102,15,56,0,13,55,39,0,0 ; pshufb 0x2737(%rip),%xmm1 # 5f70 <_sk_callback_sse41+0xdf0>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,40,39,0,0 ; pshufb 0x2728(%rip),%xmm2 # 5f10 <_sk_callback_sse41+0xdfa>
+ DB 102,15,56,0,21,51,39,0,0 ; pshufb 0x2733(%rip),%xmm2 # 5f80 <_sk_callback_sse41+0xe00>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -15496,18 +15603,20 @@ _sk_load_8888_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,31 ; je 382f <_sk_load_8888_sse41+0x92>
+ DB 116,43 ; je 389c <_sk_load_8888_sse41+0x9a>
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,17 ; je 3827 <_sk_load_8888_sse41+0x8a>
+ DB 116,17 ; je 388c <_sk_load_8888_sse41+0x8a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,144 ; jne 37ac <_sk_load_8888_sse41+0xf>
+ DB 117,144 ; jne 3811 <_sk_load_8888_sse41+0xf>
DB 102,15,110,68,144,8 ; movd 0x8(%rax,%rdx,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
- DB 102,15,58,34,92,144,4,1 ; pinsrd $0x1,0x4(%rax,%rdx,4),%xmm3
- DB 102,15,58,34,28,144,0 ; pinsrd $0x0,(%rax,%rdx,4),%xmm3
- DB 233,113,255,255,255 ; jmpq 37ac <_sk_load_8888_sse41+0xf>
+ DB 243,15,126,4,144 ; movq (%rax,%rdx,4),%xmm0
+ DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
+ DB 233,117,255,255,255 ; jmpq 3811 <_sk_load_8888_sse41+0xf>
+ DB 102,15,110,28,144 ; movd (%rax,%rdx,4),%xmm3
+ DB 233,107,255,255,255 ; jmpq 3811 <_sk_load_8888_sse41+0xf>
PUBLIC _sk_gather_8888_sse41
_sk_gather_8888_sse41 LABEL PROC
@@ -15530,17 +15639,17 @@ _sk_gather_8888_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,132,38,0,0 ; movdqa 0x2684(%rip),%xmm0 # 5f20 <_sk_callback_sse41+0xe0a>
+ DB 102,15,111,5,137,38,0,0 ; movdqa 0x2689(%rip),%xmm0 # 5f90 <_sk_callback_sse41+0xe10>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,133,38,0,0 ; movaps 0x2685(%rip),%xmm8 # 5f30 <_sk_callback_sse41+0xe1a>
+ DB 68,15,40,5,138,38,0,0 ; movaps 0x268a(%rip),%xmm8 # 5fa0 <_sk_callback_sse41+0xe20>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,132,38,0,0 ; pshufb 0x2684(%rip),%xmm1 # 5f40 <_sk_callback_sse41+0xe2a>
+ DB 102,15,56,0,13,137,38,0,0 ; pshufb 0x2689(%rip),%xmm1 # 5fb0 <_sk_callback_sse41+0xe30>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,128,38,0,0 ; pshufb 0x2680(%rip),%xmm2 # 5f50 <_sk_callback_sse41+0xe3a>
+ DB 102,15,56,0,21,133,38,0,0 ; pshufb 0x2685(%rip),%xmm2 # 5fc0 <_sk_callback_sse41+0xe40>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -15554,7 +15663,7 @@ PUBLIC _sk_store_8888_sse41
_sk_store_8888_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,107,38,0,0 ; movaps 0x266b(%rip),%xmm8 # 5f60 <_sk_callback_sse41+0xe4a>
+ DB 68,15,40,5,112,38,0,0 ; movaps 0x2670(%rip),%xmm8 # 5fd0 <_sk_callback_sse41+0xe50>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -15573,29 +15682,30 @@ _sk_store_8888_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3955 <_sk_store_8888_sse41+0x6d>
+ DB 117,10 ; jne 39c0 <_sk_store_8888_sse41+0x6d>
DB 243,68,15,127,4,144 ; movdqu %xmm8,(%rax,%rdx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,30 ; je 3980 <_sk_store_8888_sse41+0x98>
+ DB 116,29 ; je 39ea <_sk_store_8888_sse41+0x97>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,15 ; je 3977 <_sk_store_8888_sse41+0x8f>
+ DB 116,15 ; je 39e2 <_sk_store_8888_sse41+0x8f>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,227 ; jne 3951 <_sk_store_8888_sse41+0x69>
+ DB 117,227 ; jne 39bc <_sk_store_8888_sse41+0x69>
DB 102,68,15,58,22,68,144,8,2 ; pextrd $0x2,%xmm8,0x8(%rax,%rdx,4)
- DB 102,68,15,58,22,68,144,4,1 ; pextrd $0x1,%xmm8,0x4(%rax,%rdx,4)
+ DB 102,68,15,214,4,144 ; movq %xmm8,(%rax,%rdx,4)
+ DB 235,210 ; jmp 39bc <_sk_store_8888_sse41+0x69>
DB 102,68,15,126,4,144 ; movd %xmm8,(%rax,%rdx,4)
- DB 235,201 ; jmp 3951 <_sk_store_8888_sse41+0x69>
+ DB 235,202 ; jmp 39bc <_sk_store_8888_sse41+0x69>
PUBLIC _sk_load_f16_sse41
_sk_load_f16_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,60,1,0,0 ; jne 3ad2 <_sk_load_f16_sse41+0x14a>
+ DB 15,133,60,1,0,0 ; jne 3b3c <_sk_load_f16_sse41+0x14a>
DB 102,15,16,4,208 ; movupd (%rax,%rdx,8),%xmm0
DB 243,15,111,76,208,16 ; movdqu 0x10(%rax,%rdx,8),%xmm1
DB 102,68,15,40,200 ; movapd %xmm0,%xmm9
@@ -15605,18 +15715,18 @@ _sk_load_f16_sse41 LABEL PROC
DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,163,37,0,0 ; movdqa 0x25a3(%rip),%xmm8 # 5f70 <_sk_callback_sse41+0xe5a>
+ DB 102,68,15,111,5,169,37,0,0 ; movdqa 0x25a9(%rip),%xmm8 # 5fe0 <_sk_callback_sse41+0xe60>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,158,37,0,0 ; movdqa 0x259e(%rip),%xmm3 # 5f80 <_sk_callback_sse41+0xe6a>
+ DB 102,15,111,29,164,37,0,0 ; movdqa 0x25a4(%rip),%xmm3 # 5ff0 <_sk_callback_sse41+0xe70>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,138,37,0,0 ; movdqa 0x258a(%rip),%xmm10 # 5f90 <_sk_callback_sse41+0xe7a>
+ DB 102,68,15,111,21,144,37,0,0 ; movdqa 0x2590(%rip),%xmm10 # 6000 <_sk_callback_sse41+0xe80>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -15659,16 +15769,16 @@ _sk_load_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,15,16,4,208 ; movsd (%rax,%rdx,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 3aea <_sk_load_f16_sse41+0x162>
+ DB 117,13 ; jne 3b54 <_sk_load_f16_sse41+0x162>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,183,254,255,255 ; jmpq 39a1 <_sk_load_f16_sse41+0x19>
+ DB 233,183,254,255,255 ; jmpq 3a0b <_sk_load_f16_sse41+0x19>
DB 102,15,22,68,208,8 ; movhpd 0x8(%rax,%rdx,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,163,254,255,255 ; jb 39a1 <_sk_load_f16_sse41+0x19>
+ DB 15,130,163,254,255,255 ; jb 3a0b <_sk_load_f16_sse41+0x19>
DB 243,15,126,76,208,16 ; movq 0x10(%rax,%rdx,8),%xmm1
- DB 233,152,254,255,255 ; jmpq 39a1 <_sk_load_f16_sse41+0x19>
+ DB 233,152,254,255,255 ; jmpq 3a0b <_sk_load_f16_sse41+0x19>
PUBLIC _sk_gather_f16_sse41
_sk_gather_f16_sse41 LABEL PROC
@@ -15700,18 +15810,18 @@ _sk_gather_f16_sse41 LABEL PROC
DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11
DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,16,36,0,0 ; movdqa 0x2410(%rip),%xmm8 # 5fa0 <_sk_callback_sse41+0xe8a>
+ DB 102,68,15,111,5,22,36,0,0 ; movdqa 0x2416(%rip),%xmm8 # 6010 <_sk_callback_sse41+0xe90>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,11,36,0,0 ; movdqa 0x240b(%rip),%xmm3 # 5fb0 <_sk_callback_sse41+0xe9a>
+ DB 102,15,111,29,17,36,0,0 ; movdqa 0x2411(%rip),%xmm3 # 6020 <_sk_callback_sse41+0xea0>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,247,35,0,0 ; movdqa 0x23f7(%rip),%xmm10 # 5fc0 <_sk_callback_sse41+0xeaa>
+ DB 102,68,15,111,21,253,35,0,0 ; movdqa 0x23fd(%rip),%xmm10 # 6030 <_sk_callback_sse41+0xeb0>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -15758,17 +15868,17 @@ PUBLIC _sk_store_f16_sse41
_sk_store_f16_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 102,68,15,111,21,44,35,0,0 ; movdqa 0x232c(%rip),%xmm10 # 5fd0 <_sk_callback_sse41+0xeba>
+ DB 102,68,15,111,21,50,35,0,0 ; movdqa 0x2332(%rip),%xmm10 # 6040 <_sk_callback_sse41+0xec0>
DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,235 ; pxor %xmm11,%xmm13
- DB 102,68,15,111,13,31,35,0,0 ; movdqa 0x231f(%rip),%xmm9 # 5fe0 <_sk_callback_sse41+0xeca>
+ DB 102,68,15,111,13,37,35,0,0 ; movdqa 0x2325(%rip),%xmm9 # 6050 <_sk_callback_sse41+0xed0>
DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,37,16,35,0,0 ; movdqa 0x2310(%rip),%xmm12 # 5ff0 <_sk_callback_sse41+0xeda>
+ DB 102,68,15,111,37,22,35,0,0 ; movdqa 0x2316(%rip),%xmm12 # 6060 <_sk_callback_sse41+0xee0>
DB 102,69,15,235,220 ; por %xmm12,%xmm11
DB 102,69,15,254,221 ; paddd %xmm13,%xmm11
DB 102,69,15,223,195 ; pandn %xmm11,%xmm8
@@ -15812,7 +15922,7 @@ _sk_store_f16_sse41 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,203 ; punpckldq %xmm11,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 3dd6 <_sk_store_f16_sse41+0x140>
+ DB 117,21 ; jne 3e40 <_sk_store_f16_sse41+0x140>
DB 68,15,17,12,208 ; movups %xmm9,(%rax,%rdx,8)
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 243,68,15,127,68,208,16 ; movdqu %xmm8,0x10(%rax,%rdx,8)
@@ -15820,13 +15930,13 @@ _sk_store_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,68,15,214,12,208 ; movq %xmm9,(%rax,%rdx,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 3dd2 <_sk_store_f16_sse41+0x13c>
+ DB 116,240 ; je 3e3c <_sk_store_f16_sse41+0x13c>
DB 102,68,15,23,76,208,8 ; movhpd %xmm9,0x8(%rax,%rdx,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 3dd2 <_sk_store_f16_sse41+0x13c>
+ DB 114,227 ; jb 3e3c <_sk_store_f16_sse41+0x13c>
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 102,68,15,214,68,208,16 ; movq %xmm8,0x10(%rax,%rdx,8)
- DB 235,213 ; jmp 3dd2 <_sk_store_f16_sse41+0x13c>
+ DB 235,213 ; jmp 3e3c <_sk_store_f16_sse41+0x13c>
PUBLIC _sk_load_u16_be_sse41
_sk_load_u16_be_sse41 LABEL PROC
@@ -15834,7 +15944,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,185,0,0,0 ; jne 3ecc <_sk_load_u16_be_sse41+0xcf>
+ DB 15,133,185,0,0,0 ; jne 3f36 <_sk_load_u16_be_sse41+0xcf>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 243,65,15,111,76,65,16 ; movdqu 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -15850,7 +15960,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,161,33,0,0 ; movaps 0x21a1(%rip),%xmm8 # 6000 <_sk_callback_sse41+0xeea>
+ DB 68,15,40,5,167,33,0,0 ; movaps 0x21a7(%rip),%xmm8 # 6070 <_sk_callback_sse41+0xef0>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -15878,16 +15988,16 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 3ee5 <_sk_load_u16_be_sse41+0xe8>
+ DB 117,13 ; jne 3f4f <_sk_load_u16_be_sse41+0xe8>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,59,255,255,255 ; jmpq 3e20 <_sk_load_u16_be_sse41+0x23>
+ DB 233,59,255,255,255 ; jmpq 3e8a <_sk_load_u16_be_sse41+0x23>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,38,255,255,255 ; jb 3e20 <_sk_load_u16_be_sse41+0x23>
+ DB 15,130,38,255,255,255 ; jb 3e8a <_sk_load_u16_be_sse41+0x23>
DB 243,65,15,126,76,65,16 ; movq 0x10(%r9,%rax,2),%xmm1
- DB 233,26,255,255,255 ; jmpq 3e20 <_sk_load_u16_be_sse41+0x23>
+ DB 233,26,255,255,255 ; jmpq 3e8a <_sk_load_u16_be_sse41+0x23>
PUBLIC _sk_load_rgb_u16_be_sse41
_sk_load_rgb_u16_be_sse41 LABEL PROC
@@ -15895,7 +16005,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,82 ; lea (%rdx,%rdx,2),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,170,0,0,0 ; jne 3fc2 <_sk_load_rgb_u16_be_sse41+0xbc>
+ DB 15,133,170,0,0,0 ; jne 402c <_sk_load_rgb_u16_be_sse41+0xbc>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -15915,7 +16025,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,153,32,0,0 ; movaps 0x2099(%rip),%xmm8 # 6010 <_sk_callback_sse41+0xefa>
+ DB 68,15,40,5,159,32,0,0 ; movaps 0x209f(%rip),%xmm8 # 6080 <_sk_callback_sse41+0xf00>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -15932,34 +16042,34 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,96,32,0,0 ; movaps 0x2060(%rip),%xmm3 # 6020 <_sk_callback_sse41+0xf0a>
+ DB 15,40,29,102,32,0,0 ; movaps 0x2066(%rip),%xmm3 # 6090 <_sk_callback_sse41+0xf10>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 3fe7 <_sk_load_rgb_u16_be_sse41+0xe1>
+ DB 117,13 ; jne 4051 <_sk_load_rgb_u16_be_sse41+0xe1>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,85,255,255,255 ; jmpq 3f3c <_sk_load_rgb_u16_be_sse41+0x36>
+ DB 233,85,255,255,255 ; jmpq 3fa6 <_sk_load_rgb_u16_be_sse41+0x36>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 4018 <_sk_load_rgb_u16_be_sse41+0x112>
+ DB 114,24 ; jb 4082 <_sk_load_rgb_u16_be_sse41+0x112>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,36,255,255,255 ; jmpq 3f3c <_sk_load_rgb_u16_be_sse41+0x36>
+ DB 233,36,255,255,255 ; jmpq 3fa6 <_sk_load_rgb_u16_be_sse41+0x36>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,27,255,255,255 ; jmpq 3f3c <_sk_load_rgb_u16_be_sse41+0x36>
+ DB 233,27,255,255,255 ; jmpq 3fa6 <_sk_load_rgb_u16_be_sse41+0x36>
PUBLIC _sk_store_u16_be_sse41
_sk_store_u16_be_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax
- DB 68,15,40,21,250,31,0,0 ; movaps 0x1ffa(%rip),%xmm10 # 6030 <_sk_callback_sse41+0xf1a>
+ DB 68,15,40,21,0,32,0,0 ; movaps 0x2000(%rip),%xmm10 # 60a0 <_sk_callback_sse41+0xf20>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -15996,7 +16106,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 4104 <_sk_store_u16_be_sse41+0xe3>
+ DB 117,21 ; jne 416e <_sk_store_u16_be_sse41+0xe3>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -16004,13 +16114,13 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4100 <_sk_store_u16_be_sse41+0xdf>
+ DB 116,240 ; je 416a <_sk_store_u16_be_sse41+0xdf>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4100 <_sk_store_u16_be_sse41+0xdf>
+ DB 114,227 ; jb 416a <_sk_store_u16_be_sse41+0xdf>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 4100 <_sk_store_u16_be_sse41+0xdf>
+ DB 235,213 ; jmp 416a <_sk_store_u16_be_sse41+0xdf>
PUBLIC _sk_load_f32_sse41
_sk_load_f32_sse41 LABEL PROC
@@ -16021,7 +16131,7 @@ _sk_load_f32_sse41 LABEL PROC
DB 72,193,224,4 ; shl $0x4,%rax
DB 69,15,16,4,2 ; movups (%r10,%rax,1),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 418b <_sk_load_f32_sse41+0x60>
+ DB 117,66 ; jne 41f5 <_sk_load_f32_sse41+0x60>
DB 67,15,16,68,138,16 ; movups 0x10(%r10,%r9,4),%xmm0
DB 67,15,16,92,138,32 ; movups 0x20(%r10,%r9,4),%xmm3
DB 71,15,16,76,138,48 ; movups 0x30(%r10,%r9,4),%xmm9
@@ -16041,17 +16151,17 @@ _sk_load_f32_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 419d <_sk_load_f32_sse41+0x72>
+ DB 117,8 ; jne 4207 <_sk_load_f32_sse41+0x72>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 415b <_sk_load_f32_sse41+0x30>
+ DB 235,190 ; jmp 41c5 <_sk_load_f32_sse41+0x30>
DB 67,15,16,68,138,16 ; movups 0x10(%r10,%r9,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 41b1 <_sk_load_f32_sse41+0x86>
+ DB 114,8 ; jb 421b <_sk_load_f32_sse41+0x86>
DB 67,15,16,92,138,32 ; movups 0x20(%r10,%r9,4),%xmm3
- DB 235,170 ; jmp 415b <_sk_load_f32_sse41+0x30>
+ DB 235,170 ; jmp 41c5 <_sk_load_f32_sse41+0x30>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 415b <_sk_load_f32_sse41+0x30>
+ DB 235,165 ; jmp 41c5 <_sk_load_f32_sse41+0x30>
PUBLIC _sk_store_f32_sse41
_sk_store_f32_sse41 LABEL PROC
@@ -16075,7 +16185,7 @@ _sk_store_f32_sse41 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,2 ; movupd %xmm12,(%r10,%rax,1)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 4228 <_sk_store_f32_sse41+0x72>
+ DB 117,29 ; jne 4292 <_sk_store_f32_sse41+0x72>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 71,15,17,68,138,16 ; movups %xmm8,0x10(%r10,%r9,4)
DB 102,71,15,17,76,138,32 ; movupd %xmm9,0x20(%r10,%r9,4)
@@ -16083,12 +16193,12 @@ _sk_store_f32_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 4224 <_sk_store_f32_sse41+0x6e>
+ DB 116,246 ; je 428e <_sk_store_f32_sse41+0x6e>
DB 71,15,17,68,138,16 ; movups %xmm8,0x10(%r10,%r9,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 4224 <_sk_store_f32_sse41+0x6e>
+ DB 114,234 ; jb 428e <_sk_store_f32_sse41+0x6e>
DB 102,71,15,17,76,138,32 ; movupd %xmm9,0x20(%r10,%r9,4)
- DB 235,225 ; jmp 4224 <_sk_store_f32_sse41+0x6e>
+ DB 235,225 ; jmp 428e <_sk_store_f32_sse41+0x6e>
PUBLIC _sk_clamp_x_sse41
_sk_clamp_x_sse41 LABEL PROC
@@ -16162,7 +16272,7 @@ _sk_mirror_x_sse41 LABEL PROC
DB 65,15,92,194 ; subps %xmm10,%xmm0
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,198,32,0,0 ; mulss 0x20c6(%rip),%xmm9 # 6400 <_sk_callback_sse41+0x12ea>
+ DB 243,68,15,89,13,204,32,0,0 ; mulss 0x20cc(%rip),%xmm9 # 6470 <_sk_callback_sse41+0x12f0>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -16188,7 +16298,7 @@ _sk_mirror_y_sse41 LABEL PROC
DB 65,15,92,202 ; subps %xmm10,%xmm1
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,99,32,0,0 ; mulss 0x2063(%rip),%xmm9 # 6404 <_sk_callback_sse41+0x12ee>
+ DB 243,68,15,89,13,105,32,0,0 ; mulss 0x2069(%rip),%xmm9 # 6474 <_sk_callback_sse41+0x12f4>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,201 ; mulps %xmm1,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -16208,7 +16318,7 @@ PUBLIC _sk_clamp_x_1_sse41
_sk_clamp_x_1_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,85,28,0,0 ; minps 0x1c55(%rip),%xmm8 # 6040 <_sk_callback_sse41+0xf2a>
+ DB 68,15,93,5,91,28,0,0 ; minps 0x1c5b(%rip),%xmm8 # 60b0 <_sk_callback_sse41+0xf30>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -16222,9 +16332,9 @@ _sk_repeat_x_1_sse41 LABEL PROC
PUBLIC _sk_mirror_x_1_sse41
_sk_mirror_x_1_sse41 LABEL PROC
- DB 68,15,40,5,70,28,0,0 ; movaps 0x1c46(%rip),%xmm8 # 6050 <_sk_callback_sse41+0xf3a>
+ DB 68,15,40,5,76,28,0,0 ; movaps 0x1c4c(%rip),%xmm8 # 60c0 <_sk_callback_sse41+0xf40>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,74,28,0,0 ; movaps 0x1c4a(%rip),%xmm9 # 6060 <_sk_callback_sse41+0xf4a>
+ DB 68,15,40,13,80,28,0,0 ; movaps 0x1c50(%rip),%xmm9 # 60d0 <_sk_callback_sse41+0xf50>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
DB 69,15,88,201 ; addps %xmm9,%xmm9
@@ -16239,10 +16349,10 @@ _sk_mirror_x_1_sse41 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse41
_sk_luminance_to_alpha_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,41,28,0,0 ; mulps 0x1c29(%rip),%xmm0 # 6070 <_sk_callback_sse41+0xf5a>
- DB 15,89,13,50,28,0,0 ; mulps 0x1c32(%rip),%xmm1 # 6080 <_sk_callback_sse41+0xf6a>
+ DB 15,89,5,47,28,0,0 ; mulps 0x1c2f(%rip),%xmm0 # 60e0 <_sk_callback_sse41+0xf60>
+ DB 15,89,13,56,28,0,0 ; mulps 0x1c38(%rip),%xmm1 # 60f0 <_sk_callback_sse41+0xf70>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,56,28,0,0 ; mulps 0x1c38(%rip),%xmm3 # 6090 <_sk_callback_sse41+0xf7a>
+ DB 15,89,29,62,28,0,0 ; mulps 0x1c3e(%rip),%xmm3 # 6100 <_sk_callback_sse41+0xf80>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -16509,9 +16619,9 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 4896 <_sk_evenly_spaced_gradient_sse41+0x1a>
+ DB 120,7 ; js 4900 <_sk_evenly_spaced_gradient_sse41+0x1a>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 48ab <_sk_evenly_spaced_gradient_sse41+0x2f>
+ DB 235,21 ; jmp 4915 <_sk_evenly_spaced_gradient_sse41+0x2f>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -16599,15 +16709,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse41
_sk_gauss_a_to_rgba_sse41 LABEL PROC
- DB 15,40,5,71,22,0,0 ; movaps 0x1647(%rip),%xmm0 # 60a0 <_sk_callback_sse41+0xf8a>
+ DB 15,40,5,77,22,0,0 ; movaps 0x164d(%rip),%xmm0 # 6110 <_sk_callback_sse41+0xf90>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,77,22,0,0 ; addps 0x164d(%rip),%xmm0 # 60b0 <_sk_callback_sse41+0xf9a>
+ DB 15,88,5,83,22,0,0 ; addps 0x1653(%rip),%xmm0 # 6120 <_sk_callback_sse41+0xfa0>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,83,22,0,0 ; addps 0x1653(%rip),%xmm0 # 60c0 <_sk_callback_sse41+0xfaa>
+ DB 15,88,5,89,22,0,0 ; addps 0x1659(%rip),%xmm0 # 6130 <_sk_callback_sse41+0xfb0>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,89,22,0,0 ; addps 0x1659(%rip),%xmm0 # 60d0 <_sk_callback_sse41+0xfba>
+ DB 15,88,5,95,22,0,0 ; addps 0x165f(%rip),%xmm0 # 6140 <_sk_callback_sse41+0xfc0>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,95,22,0,0 ; addps 0x165f(%rip),%xmm0 # 60e0 <_sk_callback_sse41+0xfca>
+ DB 15,88,5,101,22,0,0 ; addps 0x1665(%rip),%xmm0 # 6150 <_sk_callback_sse41+0xfd0>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -16623,12 +16733,12 @@ _sk_gradient_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 4ad4 <_sk_gradient_sse41+0x46>
+ DB 114,50 ; jb 4b3e <_sk_gradient_sse41+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,56,22,0,0 ; movaps 0x1638(%rip),%xmm2 # 60f0 <_sk_callback_sse41+0xfda>
+ DB 15,40,21,62,22,0,0 ; movaps 0x163e(%rip),%xmm2 # 6160 <_sk_callback_sse41+0xfe0>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -16636,7 +16746,7 @@ _sk_gradient_sse41 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 4ab8 <_sk_gradient_sse41+0x2a>
+ DB 117,228 ; jne 4b22 <_sk_gradient_sse41+0x2a>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -16762,26 +16872,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,237 ; mulps %xmm13,%xmm13
- DB 68,15,40,21,217,19,0,0 ; movaps 0x13d9(%rip),%xmm10 # 6100 <_sk_callback_sse41+0xfea>
+ DB 68,15,40,21,223,19,0,0 ; movaps 0x13df(%rip),%xmm10 # 6170 <_sk_callback_sse41+0xff0>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,221,19,0,0 ; addps 0x13dd(%rip),%xmm10 # 6110 <_sk_callback_sse41+0xffa>
+ DB 68,15,88,21,227,19,0,0 ; addps 0x13e3(%rip),%xmm10 # 6180 <_sk_callback_sse41+0x1000>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,225,19,0,0 ; addps 0x13e1(%rip),%xmm10 # 6120 <_sk_callback_sse41+0x100a>
+ DB 68,15,88,21,231,19,0,0 ; addps 0x13e7(%rip),%xmm10 # 6190 <_sk_callback_sse41+0x1010>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,229,19,0,0 ; addps 0x13e5(%rip),%xmm10 # 6130 <_sk_callback_sse41+0x101a>
+ DB 68,15,88,21,235,19,0,0 ; addps 0x13eb(%rip),%xmm10 # 61a0 <_sk_callback_sse41+0x1020>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 68,15,40,29,228,19,0,0 ; movaps 0x13e4(%rip),%xmm11 # 6140 <_sk_callback_sse41+0x102a>
+ DB 68,15,40,29,234,19,0,0 ; movaps 0x13ea(%rip),%xmm11 # 61b0 <_sk_callback_sse41+0x1030>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,40,29,221,19,0,0 ; movaps 0x13dd(%rip),%xmm11 # 6150 <_sk_callback_sse41+0x103a>
+ DB 68,15,40,29,227,19,0,0 ; movaps 0x13e3(%rip),%xmm11 # 61c0 <_sk_callback_sse41+0x1040>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0
- DB 68,15,40,13,207,19,0,0 ; movaps 0x13cf(%rip),%xmm9 # 6160 <_sk_callback_sse41+0x104a>
+ DB 68,15,40,13,213,19,0,0 ; movaps 0x13d5(%rip),%xmm9 # 61d0 <_sk_callback_sse41+0x1050>
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8
@@ -16803,7 +16913,7 @@ _sk_xy_to_radius_sse41 LABEL PROC
PUBLIC _sk_save_xy_sse41
_sk_save_xy_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,163,19,0,0 ; movaps 0x13a3(%rip),%xmm8 # 6170 <_sk_callback_sse41+0x105a>
+ DB 68,15,40,5,169,19,0,0 ; movaps 0x13a9(%rip),%xmm8 # 61e0 <_sk_callback_sse41+0x1060>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -16843,8 +16953,8 @@ _sk_bilinear_nx_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,37,19,0,0 ; addps 0x1325(%rip),%xmm0 # 6180 <_sk_callback_sse41+0x106a>
- DB 68,15,40,13,45,19,0,0 ; movaps 0x132d(%rip),%xmm9 # 6190 <_sk_callback_sse41+0x107a>
+ DB 15,88,5,43,19,0,0 ; addps 0x132b(%rip),%xmm0 # 61f0 <_sk_callback_sse41+0x1070>
+ DB 68,15,40,13,51,19,0,0 ; movaps 0x1333(%rip),%xmm9 # 6200 <_sk_callback_sse41+0x1080>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -16855,7 +16965,7 @@ _sk_bilinear_px_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,28,19,0,0 ; addps 0x131c(%rip),%xmm0 # 61a0 <_sk_callback_sse41+0x108a>
+ DB 15,88,5,34,19,0,0 ; addps 0x1322(%rip),%xmm0 # 6210 <_sk_callback_sse41+0x1090>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -16865,8 +16975,8 @@ _sk_bilinear_ny_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,14,19,0,0 ; addps 0x130e(%rip),%xmm1 # 61b0 <_sk_callback_sse41+0x109a>
- DB 68,15,40,13,22,19,0,0 ; movaps 0x1316(%rip),%xmm9 # 61c0 <_sk_callback_sse41+0x10aa>
+ DB 15,88,13,20,19,0,0 ; addps 0x1314(%rip),%xmm1 # 6220 <_sk_callback_sse41+0x10a0>
+ DB 68,15,40,13,28,19,0,0 ; movaps 0x131c(%rip),%xmm9 # 6230 <_sk_callback_sse41+0x10b0>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -16877,7 +16987,7 @@ _sk_bilinear_py_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,4,19,0,0 ; addps 0x1304(%rip),%xmm1 # 61d0 <_sk_callback_sse41+0x10ba>
+ DB 15,88,13,10,19,0,0 ; addps 0x130a(%rip),%xmm1 # 6240 <_sk_callback_sse41+0x10c0>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -16887,13 +16997,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,247,18,0,0 ; addps 0x12f7(%rip),%xmm0 # 61e0 <_sk_callback_sse41+0x10ca>
- DB 68,15,40,13,255,18,0,0 ; movaps 0x12ff(%rip),%xmm9 # 61f0 <_sk_callback_sse41+0x10da>
+ DB 15,88,5,253,18,0,0 ; addps 0x12fd(%rip),%xmm0 # 6250 <_sk_callback_sse41+0x10d0>
+ DB 68,15,40,13,5,19,0,0 ; movaps 0x1305(%rip),%xmm9 # 6260 <_sk_callback_sse41+0x10e0>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,251,18,0,0 ; mulps 0x12fb(%rip),%xmm9 # 6200 <_sk_callback_sse41+0x10ea>
- DB 68,15,88,13,3,19,0,0 ; addps 0x1303(%rip),%xmm9 # 6210 <_sk_callback_sse41+0x10fa>
+ DB 68,15,89,13,1,19,0,0 ; mulps 0x1301(%rip),%xmm9 # 6270 <_sk_callback_sse41+0x10f0>
+ DB 68,15,88,13,9,19,0,0 ; addps 0x1309(%rip),%xmm9 # 6280 <_sk_callback_sse41+0x1100>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -16904,16 +17014,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,242,18,0,0 ; addps 0x12f2(%rip),%xmm0 # 6220 <_sk_callback_sse41+0x110a>
- DB 68,15,40,13,250,18,0,0 ; movaps 0x12fa(%rip),%xmm9 # 6230 <_sk_callback_sse41+0x111a>
+ DB 15,88,5,248,18,0,0 ; addps 0x12f8(%rip),%xmm0 # 6290 <_sk_callback_sse41+0x1110>
+ DB 68,15,40,13,0,19,0,0 ; movaps 0x1300(%rip),%xmm9 # 62a0 <_sk_callback_sse41+0x1120>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,254,18,0,0 ; movaps 0x12fe(%rip),%xmm8 # 6240 <_sk_callback_sse41+0x112a>
+ DB 68,15,40,5,4,19,0,0 ; movaps 0x1304(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x1130>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,2,19,0,0 ; addps 0x1302(%rip),%xmm8 # 6250 <_sk_callback_sse41+0x113a>
+ DB 68,15,88,5,8,19,0,0 ; addps 0x1308(%rip),%xmm8 # 62c0 <_sk_callback_sse41+0x1140>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,6,19,0,0 ; addps 0x1306(%rip),%xmm8 # 6260 <_sk_callback_sse41+0x114a>
+ DB 68,15,88,5,12,19,0,0 ; addps 0x130c(%rip),%xmm8 # 62d0 <_sk_callback_sse41+0x1150>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,10,19,0,0 ; addps 0x130a(%rip),%xmm8 # 6270 <_sk_callback_sse41+0x115a>
+ DB 68,15,88,5,16,19,0,0 ; addps 0x1310(%rip),%xmm8 # 62e0 <_sk_callback_sse41+0x1160>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -16921,17 +17031,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse41
_sk_bicubic_p1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,4,19,0,0 ; movaps 0x1304(%rip),%xmm8 # 6280 <_sk_callback_sse41+0x116a>
+ DB 68,15,40,5,10,19,0,0 ; movaps 0x130a(%rip),%xmm8 # 62f0 <_sk_callback_sse41+0x1170>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,0,19,0,0 ; movaps 0x1300(%rip),%xmm10 # 6290 <_sk_callback_sse41+0x117a>
+ DB 68,15,40,21,6,19,0,0 ; movaps 0x1306(%rip),%xmm10 # 6300 <_sk_callback_sse41+0x1180>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,4,19,0,0 ; addps 0x1304(%rip),%xmm10 # 62a0 <_sk_callback_sse41+0x118a>
+ DB 68,15,88,21,10,19,0,0 ; addps 0x130a(%rip),%xmm10 # 6310 <_sk_callback_sse41+0x1190>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,0,19,0,0 ; addps 0x1300(%rip),%xmm10 # 62b0 <_sk_callback_sse41+0x119a>
+ DB 68,15,88,21,6,19,0,0 ; addps 0x1306(%rip),%xmm10 # 6320 <_sk_callback_sse41+0x11a0>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -16941,11 +17051,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,243,18,0,0 ; addps 0x12f3(%rip),%xmm0 # 62c0 <_sk_callback_sse41+0x11aa>
+ DB 15,88,5,249,18,0,0 ; addps 0x12f9(%rip),%xmm0 # 6330 <_sk_callback_sse41+0x11b0>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,243,18,0,0 ; mulps 0x12f3(%rip),%xmm8 # 62d0 <_sk_callback_sse41+0x11ba>
- DB 68,15,88,5,251,18,0,0 ; addps 0x12fb(%rip),%xmm8 # 62e0 <_sk_callback_sse41+0x11ca>
+ DB 68,15,89,5,249,18,0,0 ; mulps 0x12f9(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x11c0>
+ DB 68,15,88,5,1,19,0,0 ; addps 0x1301(%rip),%xmm8 # 6350 <_sk_callback_sse41+0x11d0>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -16956,13 +17066,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,233,18,0,0 ; addps 0x12e9(%rip),%xmm1 # 62f0 <_sk_callback_sse41+0x11da>
- DB 68,15,40,13,241,18,0,0 ; movaps 0x12f1(%rip),%xmm9 # 6300 <_sk_callback_sse41+0x11ea>
+ DB 15,88,13,239,18,0,0 ; addps 0x12ef(%rip),%xmm1 # 6360 <_sk_callback_sse41+0x11e0>
+ DB 68,15,40,13,247,18,0,0 ; movaps 0x12f7(%rip),%xmm9 # 6370 <_sk_callback_sse41+0x11f0>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,237,18,0,0 ; mulps 0x12ed(%rip),%xmm9 # 6310 <_sk_callback_sse41+0x11fa>
- DB 68,15,88,13,245,18,0,0 ; addps 0x12f5(%rip),%xmm9 # 6320 <_sk_callback_sse41+0x120a>
+ DB 68,15,89,13,243,18,0,0 ; mulps 0x12f3(%rip),%xmm9 # 6380 <_sk_callback_sse41+0x1200>
+ DB 68,15,88,13,251,18,0,0 ; addps 0x12fb(%rip),%xmm9 # 6390 <_sk_callback_sse41+0x1210>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -16973,16 +17083,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,227,18,0,0 ; addps 0x12e3(%rip),%xmm1 # 6330 <_sk_callback_sse41+0x121a>
- DB 68,15,40,13,235,18,0,0 ; movaps 0x12eb(%rip),%xmm9 # 6340 <_sk_callback_sse41+0x122a>
+ DB 15,88,13,233,18,0,0 ; addps 0x12e9(%rip),%xmm1 # 63a0 <_sk_callback_sse41+0x1220>
+ DB 68,15,40,13,241,18,0,0 ; movaps 0x12f1(%rip),%xmm9 # 63b0 <_sk_callback_sse41+0x1230>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,239,18,0,0 ; movaps 0x12ef(%rip),%xmm8 # 6350 <_sk_callback_sse41+0x123a>
+ DB 68,15,40,5,245,18,0,0 ; movaps 0x12f5(%rip),%xmm8 # 63c0 <_sk_callback_sse41+0x1240>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,243,18,0,0 ; addps 0x12f3(%rip),%xmm8 # 6360 <_sk_callback_sse41+0x124a>
+ DB 68,15,88,5,249,18,0,0 ; addps 0x12f9(%rip),%xmm8 # 63d0 <_sk_callback_sse41+0x1250>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,247,18,0,0 ; addps 0x12f7(%rip),%xmm8 # 6370 <_sk_callback_sse41+0x125a>
+ DB 68,15,88,5,253,18,0,0 ; addps 0x12fd(%rip),%xmm8 # 63e0 <_sk_callback_sse41+0x1260>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,251,18,0,0 ; addps 0x12fb(%rip),%xmm8 # 6380 <_sk_callback_sse41+0x126a>
+ DB 68,15,88,5,1,19,0,0 ; addps 0x1301(%rip),%xmm8 # 63f0 <_sk_callback_sse41+0x1270>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -16990,17 +17100,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse41
_sk_bicubic_p1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,245,18,0,0 ; movaps 0x12f5(%rip),%xmm8 # 6390 <_sk_callback_sse41+0x127a>
+ DB 68,15,40,5,251,18,0,0 ; movaps 0x12fb(%rip),%xmm8 # 6400 <_sk_callback_sse41+0x1280>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,240,18,0,0 ; movaps 0x12f0(%rip),%xmm10 # 63a0 <_sk_callback_sse41+0x128a>
+ DB 68,15,40,21,246,18,0,0 ; movaps 0x12f6(%rip),%xmm10 # 6410 <_sk_callback_sse41+0x1290>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,244,18,0,0 ; addps 0x12f4(%rip),%xmm10 # 63b0 <_sk_callback_sse41+0x129a>
+ DB 68,15,88,21,250,18,0,0 ; addps 0x12fa(%rip),%xmm10 # 6420 <_sk_callback_sse41+0x12a0>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,240,18,0,0 ; addps 0x12f0(%rip),%xmm10 # 63c0 <_sk_callback_sse41+0x12aa>
+ DB 68,15,88,21,246,18,0,0 ; addps 0x12f6(%rip),%xmm10 # 6430 <_sk_callback_sse41+0x12b0>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -17010,11 +17120,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,226,18,0,0 ; addps 0x12e2(%rip),%xmm1 # 63d0 <_sk_callback_sse41+0x12ba>
+ DB 15,88,13,232,18,0,0 ; addps 0x12e8(%rip),%xmm1 # 6440 <_sk_callback_sse41+0x12c0>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,226,18,0,0 ; mulps 0x12e2(%rip),%xmm8 # 63e0 <_sk_callback_sse41+0x12ca>
- DB 68,15,88,5,234,18,0,0 ; addps 0x12ea(%rip),%xmm8 # 63f0 <_sk_callback_sse41+0x12da>
+ DB 68,15,89,5,232,18,0,0 ; mulps 0x12e8(%rip),%xmm8 # 6450 <_sk_callback_sse41+0x12d0>
+ DB 68,15,88,5,240,18,0,0 ; addps 0x12f0(%rip),%xmm8 # 6460 <_sk_callback_sse41+0x12e0>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -17232,11 +17342,11 @@ ALIGN 16
DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%rdi)
DB 0,224 ; add %ah,%al
DB 64,0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 53c8 <.literal16+0x1d8>
+ DB 224,64 ; loopne 5428 <.literal16+0x1d8>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 53cc <.literal16+0x1dc>
+ DB 224,64 ; loopne 542c <.literal16+0x1dc>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 53d0 <.literal16+0x1e0>
+ DB 224,64 ; loopne 5430 <.literal16+0x1e0>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -17256,13 +17366,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 53f1 <.literal16+0x201>
+ DB 71,225,61 ; rex.RXB loope 5451 <.literal16+0x201>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 53f5 <.literal16+0x205>
+ DB 71,225,61 ; rex.RXB loope 5455 <.literal16+0x205>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 53f9 <.literal16+0x209>
+ DB 71,225,61 ; rex.RXB loope 5459 <.literal16+0x209>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 53fd <.literal16+0x20d>
+ DB 71,225,61 ; rex.RXB loope 545d <.literal16+0x20d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -17287,13 +17397,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5431 <.literal16+0x241>
+ DB 71,225,61 ; rex.RXB loope 5491 <.literal16+0x241>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5435 <.literal16+0x245>
+ DB 71,225,61 ; rex.RXB loope 5495 <.literal16+0x245>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5439 <.literal16+0x249>
+ DB 71,225,61 ; rex.RXB loope 5499 <.literal16+0x249>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 543d <.literal16+0x24d>
+ DB 71,225,61 ; rex.RXB loope 549d <.literal16+0x24d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -17318,13 +17428,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5471 <.literal16+0x281>
+ DB 71,225,61 ; rex.RXB loope 54d1 <.literal16+0x281>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5475 <.literal16+0x285>
+ DB 71,225,61 ; rex.RXB loope 54d5 <.literal16+0x285>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5479 <.literal16+0x289>
+ DB 71,225,61 ; rex.RXB loope 54d9 <.literal16+0x289>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 547d <.literal16+0x28d>
+ DB 71,225,61 ; rex.RXB loope 54dd <.literal16+0x28d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -17349,13 +17459,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 54b1 <.literal16+0x2c1>
+ DB 71,225,61 ; rex.RXB loope 5511 <.literal16+0x2c1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 54b5 <.literal16+0x2c5>
+ DB 71,225,61 ; rex.RXB loope 5515 <.literal16+0x2c5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 54b9 <.literal16+0x2c9>
+ DB 71,225,61 ; rex.RXB loope 5519 <.literal16+0x2c9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 54bd <.literal16+0x2cd>
+ DB 71,225,61 ; rex.RXB loope 551d <.literal16+0x2cd>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -17372,10 +17482,10 @@ ALIGN 16
DB 0,1 ; add %al,(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0054a8 <_sk_callback_sse41+0xa000392>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005508 <_sk_callback_sse41+0xa000388>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30054b0 <_sk_callback_sse41+0x300039a>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005510 <_sk_callback_sse41+0x3000390>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -17394,11 +17504,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
DB 67,0,0 ; rex.XB add %al,(%r8)
- DB 127,67 ; jg 551b <.literal16+0x32b>
+ DB 127,67 ; jg 557b <.literal16+0x32b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 551f <.literal16+0x32f>
+ DB 127,67 ; jg 557f <.literal16+0x32f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5523 <.literal16+0x333>
+ DB 127,67 ; jg 5583 <.literal16+0x333>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -17633,13 +17743,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 56f9 <.literal16+0x509>
+ DB 224,7 ; loopne 5759 <.literal16+0x509>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 56fd <.literal16+0x50d>
+ DB 224,7 ; loopne 575d <.literal16+0x50d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5701 <.literal16+0x511>
+ DB 224,7 ; loopne 5761 <.literal16+0x511>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5705 <.literal16+0x515>
+ DB 224,7 ; loopne 5765 <.literal16+0x515>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -17673,10 +17783,10 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005748 <_sk_callback_sse41+0xa000632>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0057a8 <_sk_callback_sse41+0xa000628>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005750 <_sk_callback_sse41+0x300063a>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30057b0 <_sk_callback_sse41+0x3000630>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -17731,11 +17841,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 581b <.literal16+0x62b>
+ DB 127,67 ; jg 587b <.literal16+0x62b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 581f <.literal16+0x62f>
+ DB 127,67 ; jg 587f <.literal16+0x62f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5823 <.literal16+0x633>
+ DB 127,67 ; jg 5883 <.literal16+0x633>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax)
@@ -17750,16 +17860,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5814 <.literal16+0x624>
+ DB 127,0 ; jg 5874 <.literal16+0x624>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5818 <.literal16+0x628>
+ DB 127,0 ; jg 5878 <.literal16+0x628>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 581c <.literal16+0x62c>
+ DB 127,0 ; jg 587c <.literal16+0x62c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5820 <.literal16+0x630>
+ DB 127,0 ; jg 5880 <.literal16+0x630>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -17768,7 +17878,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 58a5 <.literal16+0x6b5>
+ DB 119,115 ; ja 5905 <.literal16+0x6b5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -17779,7 +17889,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 5809 <.literal16+0x619>
+ DB 117,191 ; jne 5869 <.literal16+0x619>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -17791,7 +17901,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3984a <_sk_callback_sse41+0xffffffffe9a34734>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a398aa <_sk_callback_sse41+0xffffffffe9a3472a>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -17846,16 +17956,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 58e4 <.literal16+0x6f4>
+ DB 127,0 ; jg 5944 <.literal16+0x6f4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 58e8 <.literal16+0x6f8>
+ DB 127,0 ; jg 5948 <.literal16+0x6f8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 58ec <.literal16+0x6fc>
+ DB 127,0 ; jg 594c <.literal16+0x6fc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 58f0 <.literal16+0x700>
+ DB 127,0 ; jg 5950 <.literal16+0x700>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -17864,7 +17974,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5975 <.literal16+0x785>
+ DB 119,115 ; ja 59d5 <.literal16+0x785>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -17875,7 +17985,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 58d9 <.literal16+0x6e9>
+ DB 117,191 ; jne 5939 <.literal16+0x6e9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -17887,7 +17997,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a3991a <_sk_callback_sse41+0xffffffffe9a34804>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a3997a <_sk_callback_sse41+0xffffffffe9a347fa>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -17942,16 +18052,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 59b4 <.literal16+0x7c4>
+ DB 127,0 ; jg 5a14 <.literal16+0x7c4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 59b8 <.literal16+0x7c8>
+ DB 127,0 ; jg 5a18 <.literal16+0x7c8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 59bc <.literal16+0x7cc>
+ DB 127,0 ; jg 5a1c <.literal16+0x7cc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 59c0 <.literal16+0x7d0>
+ DB 127,0 ; jg 5a20 <.literal16+0x7d0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -17960,7 +18070,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5a45 <.literal16+0x855>
+ DB 119,115 ; ja 5aa5 <.literal16+0x855>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -17971,7 +18081,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 59a9 <.literal16+0x7b9>
+ DB 117,191 ; jne 5a09 <.literal16+0x7b9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -17983,7 +18093,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a399ea <_sk_callback_sse41+0xffffffffe9a348d4>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a39a4a <_sk_callback_sse41+0xffffffffe9a348ca>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -18038,16 +18148,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5a84 <.literal16+0x894>
+ DB 127,0 ; jg 5ae4 <.literal16+0x894>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5a88 <.literal16+0x898>
+ DB 127,0 ; jg 5ae8 <.literal16+0x898>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5a8c <.literal16+0x89c>
+ DB 127,0 ; jg 5aec <.literal16+0x89c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5a90 <.literal16+0x8a0>
+ DB 127,0 ; jg 5af0 <.literal16+0x8a0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -18056,7 +18166,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5b15 <.literal16+0x925>
+ DB 119,115 ; ja 5b75 <.literal16+0x925>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -18067,7 +18177,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 5a79 <.literal16+0x889>
+ DB 117,191 ; jne 5ad9 <.literal16+0x889>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -18079,7 +18189,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a39aba <_sk_callback_sse41+0xffffffffe9a349a4>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a39b1a <_sk_callback_sse41+0xffffffffe9a3499a>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -18130,13 +18240,13 @@ ALIGN 16
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
- DB 127,67 ; jg 5b97 <.literal16+0x9a7>
+ DB 127,67 ; jg 5bf7 <.literal16+0x9a7>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5b9b <.literal16+0x9ab>
+ DB 127,67 ; jg 5bfb <.literal16+0x9ab>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5b9f <.literal16+0x9af>
+ DB 127,67 ; jg 5bff <.literal16+0x9af>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5ba3 <.literal16+0x9b3>
+ DB 127,67 ; jg 5c03 <.literal16+0x9b3>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -18183,16 +18293,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 5c23 <.literal16+0xa33>
+ DB 118,63 ; jbe 5c83 <.literal16+0xa33>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 5c27 <.literal16+0xa37>
+ DB 118,63 ; jbe 5c87 <.literal16+0xa37>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 5c2b <.literal16+0xa3b>
+ DB 118,63 ; jbe 5c8b <.literal16+0xa3b>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 5c2f <.literal16+0xa3f>
+ DB 118,63 ; jbe 5c8f <.literal16+0xa3f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -18212,23 +18322,29 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5c7b <.literal16+0xa8b>
+ DB 127,67 ; jg 5cdb <.literal16+0xa8b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5c7f <.literal16+0xa8f>
+ DB 127,67 ; jg 5cdf <.literal16+0xa8f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5c83 <.literal16+0xa93>
- DB 255,0 ; incl (%rax)
+ DB 127,67 ; jg 5ce3 <.literal16+0xa93>
+ DB 0,4,0 ; add %al,(%rax,%rax,1)
DB 0,0 ; add %al,(%rax)
- DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
- DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
- DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
- DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
- DB 128,59,129 ; cmpb $0x81,(%rbx)
- DB 128,128,59,0,0,128,63 ; addb $0x3f,-0x7fffffc5(%rax)
DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,255 ; add %bh,%bh
+ DB 0,0 ; add %al,(%rax)
+ DB 0,255 ; add %bh,%bh
+ DB 0,0 ; add %al,(%rax)
+ DB 0,255 ; add %bh,%bh
+ DB 0,0 ; add %al,(%rax)
+ DB 0,255 ; add %bh,%bh
+ DB 0,0 ; add %al,(%rax)
+ DB 0,129,128,128,59,129 ; add %al,-0x7ec47f80(%rcx)
+ DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax)
+ DB 129,128,128,59,0,0,128,63,0,0 ; addl $0x3f80,0x3b80(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
DB 63 ; (bad)
@@ -18253,7 +18369,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005cc0 <_sk_callback_sse41+0x3000baa>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005d30 <_sk_callback_sse41+0x3000bb0>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -18282,13 +18398,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5cf9 <.literal16+0xb09>
+ DB 224,7 ; loopne 5d69 <.literal16+0xb19>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5cfd <.literal16+0xb0d>
+ DB 224,7 ; loopne 5d6d <.literal16+0xb1d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5d01 <.literal16+0xb11>
+ DB 224,7 ; loopne 5d71 <.literal16+0xb21>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5d05 <.literal16+0xb15>
+ DB 224,7 ; loopne 5d75 <.literal16+0xb25>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -18334,13 +18450,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5d69 <.literal16+0xb79>
+ DB 224,7 ; loopne 5dd9 <.literal16+0xb89>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5d6d <.literal16+0xb7d>
+ DB 224,7 ; loopne 5ddd <.literal16+0xb8d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5d71 <.literal16+0xb81>
+ DB 224,7 ; loopne 5de1 <.literal16+0xb91>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5d75 <.literal16+0xb85>
+ DB 224,7 ; loopne 5de5 <.literal16+0xb95>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -18378,13 +18494,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 5e06 <.literal16+0xc16>
+ DB 124,66 ; jl 5e76 <.literal16+0xc26>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 5e0a <.literal16+0xc1a>
+ DB 124,66 ; jl 5e7a <.literal16+0xc2a>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 5e0e <.literal16+0xc1e>
+ DB 124,66 ; jl 5e7e <.literal16+0xc2e>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 5e12 <.literal16+0xc22>
+ DB 124,66 ; jl 5e82 <.literal16+0xc32>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -18474,13 +18590,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 5f15 <.literal16+0xd25>
+ DB 112,65 ; jo 5f85 <.literal16+0xd35>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 5f19 <.literal16+0xd29>
+ DB 112,65 ; jo 5f89 <.literal16+0xd39>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 5f1d <.literal16+0xd2d>
+ DB 112,65 ; jo 5f8d <.literal16+0xd3d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 5f21 <.literal16+0xd31>
+ DB 112,65 ; jo 5f91 <.literal16+0xd41>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -18495,7 +18611,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005f10 <_sk_callback_sse41+0x3000dfa>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005f80 <_sk_callback_sse41+0x3000e00>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -18522,7 +18638,7 @@ ALIGN 16
DB 5,255,255,255,9 ; add $0x9ffffff,%eax
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005f50 <_sk_callback_sse41+0x3000e3a>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005fc0 <_sk_callback_sse41+0x3000e40>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -18537,11 +18653,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5fab <.literal16+0xdbb>
+ DB 127,67 ; jg 601b <.literal16+0xdcb>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5faf <.literal16+0xdbf>
+ DB 127,67 ; jg 601f <.literal16+0xdcf>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5fb3 <.literal16+0xdc3>
+ DB 127,67 ; jg 6023 <.literal16+0xdd3>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -18617,13 +18733,13 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 607b <.literal16+0xe8b>
+ DB 127,71 ; jg 60eb <.literal16+0xe9b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 607f <.literal16+0xe8f>
+ DB 127,71 ; jg 60ef <.literal16+0xe9f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 6083 <.literal16+0xe93>
+ DB 127,71 ; jg 60f3 <.literal16+0xea3>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 6087 <.literal16+0xe97>
+ DB 127,71 ; jg 60f7 <.literal16+0xea7>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -18669,10 +18785,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc071ba <_sk_callback_sse41+0x2dc020a4>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc0722a <_sk_callback_sse41+0x2dc020aa>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 60ec <.literal16+0xefc>
+ DB 120,57 ; js 615c <.literal16+0xf0c>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -18794,11 +18910,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 6222 <.literal16+0x1032>
+ DB 62,114,28 ; jb,pt 6292 <.literal16+0x1042>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6226 <.literal16+0x1036>
+ DB 62,114,28 ; jb,pt 6296 <.literal16+0x1046>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 622a <.literal16+0x103a>
+ DB 62,114,28 ; jb,pt 629a <.literal16+0x104a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -18842,7 +18958,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f0b5 <_sk_callback_sse41+0x3d639f9f>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f125 <_sk_callback_sse41+0x3d639fa5>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -18868,7 +18984,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f0f5 <_sk_callback_sse41+0x3d639fdf>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f165 <_sk_callback_sse41+0x3d639fe5>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -18877,13 +18993,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 62ee <.literal16+0x10fe>
+ DB 114,28 ; jb 635e <.literal16+0x110e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 62f2 <.literal16+0x1102>
+ DB 62,114,28 ; jb,pt 6362 <.literal16+0x1112>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 62f6 <.literal16+0x1106>
+ DB 62,114,28 ; jb,pt 6366 <.literal16+0x1116>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 62fa <.literal16+0x110a>
+ DB 62,114,28 ; jb,pt 636a <.literal16+0x111a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -18904,11 +19020,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 6332 <.literal16+0x1142>
+ DB 62,114,28 ; jb,pt 63a2 <.literal16+0x1152>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6336 <.literal16+0x1146>
+ DB 62,114,28 ; jb,pt 63a6 <.literal16+0x1156>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 633a <.literal16+0x114a>
+ DB 62,114,28 ; jb,pt 63aa <.literal16+0x115a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -18952,7 +19068,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f1c5 <_sk_callback_sse41+0x3d63a0af>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f235 <_sk_callback_sse41+0x3d63a0b5>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -18978,7 +19094,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f205 <_sk_callback_sse41+0x3d63a0ef>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f275 <_sk_callback_sse41+0x3d63a0f5>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -18987,13 +19103,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 63fe <.literal16+0x120e>
+ DB 114,28 ; jb 646e <.literal16+0x121e>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6402 <_sk_callback_sse41+0x12ec>
+ DB 62,114,28 ; jb,pt 6472 <_sk_callback_sse41+0x12f2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6406 <_sk_callback_sse41+0x12f0>
+ DB 62,114,28 ; jb,pt 6476 <_sk_callback_sse41+0x12f6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 640a <_sk_callback_sse41+0x12f4>
+ DB 62,114,28 ; jb,pt 647a <_sk_callback_sse41+0x12fa>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -19110,7 +19226,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,215,85,0,0 ; movaps 0x55d7(%rip),%xmm2 # 5730 <_sk_callback_sse2+0xcd>
+ DB 15,40,21,167,85,0,0 ; movaps 0x55a7(%rip),%xmm2 # 5700 <_sk_callback_sse2+0xd7>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -19119,7 +19235,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,198,85,0,0 ; movaps 0x55c6(%rip),%xmm2 # 5740 <_sk_callback_sse2+0xdd>
+ DB 15,40,21,150,85,0,0 ; movaps 0x5596(%rip),%xmm2 # 5710 <_sk_callback_sse2+0xe7>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -19137,14 +19253,14 @@ _sk_dither_sse2 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,148,85,0,0 ; movdqa 0x5594(%rip),%xmm10 # 5750 <_sk_callback_sse2+0xed>
+ DB 102,68,15,111,21,100,85,0,0 ; movdqa 0x5564(%rip),%xmm10 # 5720 <_sk_callback_sse2+0xf7>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,128,85,0,0 ; movdqa 0x5580(%rip),%xmm12 # 5760 <_sk_callback_sse2+0xfd>
- DB 102,68,15,111,45,135,85,0,0 ; movdqa 0x5587(%rip),%xmm13 # 5770 <_sk_callback_sse2+0x10d>
+ DB 102,68,15,111,37,80,85,0,0 ; movdqa 0x5550(%rip),%xmm12 # 5730 <_sk_callback_sse2+0x107>
+ DB 102,68,15,111,45,87,85,0,0 ; movdqa 0x5557(%rip),%xmm13 # 5740 <_sk_callback_sse2+0x117>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -19160,8 +19276,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,66,85,0,0 ; mulps 0x5542(%rip),%xmm8 # 5780 <_sk_callback_sse2+0x11d>
- DB 68,15,88,5,74,85,0,0 ; addps 0x554a(%rip),%xmm8 # 5790 <_sk_callback_sse2+0x12d>
+ DB 68,15,89,5,18,85,0,0 ; mulps 0x5512(%rip),%xmm8 # 5750 <_sk_callback_sse2+0x127>
+ DB 68,15,88,5,26,85,0,0 ; addps 0x551a(%rip),%xmm8 # 5760 <_sk_callback_sse2+0x137>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -19228,7 +19344,7 @@ _sk_clear_sse2 LABEL PROC
PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,164,84,0,0 ; movaps 0x54a4(%rip),%xmm8 # 57a0 <_sk_callback_sse2+0x13d>
+ DB 68,15,40,5,116,84,0,0 ; movaps 0x5474(%rip),%xmm8 # 5770 <_sk_callback_sse2+0x147>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -19251,7 +19367,7 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,103,84,0,0 ; movaps 0x5467(%rip),%xmm9 # 57b0 <_sk_callback_sse2+0x14d>
+ DB 68,15,40,13,55,84,0,0 ; movaps 0x5437(%rip),%xmm9 # 5780 <_sk_callback_sse2+0x157>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -19292,7 +19408,7 @@ _sk_dstin_sse2 LABEL PROC
PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
- DB 68,15,40,5,11,84,0,0 ; movaps 0x540b(%rip),%xmm8 # 57c0 <_sk_callback_sse2+0x15d>
+ DB 68,15,40,5,219,83,0,0 ; movaps 0x53db(%rip),%xmm8 # 5790 <_sk_callback_sse2+0x167>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -19303,7 +19419,7 @@ _sk_srcout_sse2 LABEL PROC
PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
- DB 68,15,40,5,251,83,0,0 ; movaps 0x53fb(%rip),%xmm8 # 57d0 <_sk_callback_sse2+0x16d>
+ DB 68,15,40,5,203,83,0,0 ; movaps 0x53cb(%rip),%xmm8 # 57a0 <_sk_callback_sse2+0x177>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -19318,7 +19434,7 @@ _sk_dstout_sse2 LABEL PROC
PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
- DB 68,15,40,5,222,83,0,0 ; movaps 0x53de(%rip),%xmm8 # 57e0 <_sk_callback_sse2+0x17d>
+ DB 68,15,40,5,174,83,0,0 ; movaps 0x53ae(%rip),%xmm8 # 57b0 <_sk_callback_sse2+0x187>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -19336,7 +19452,7 @@ _sk_srcover_sse2 LABEL PROC
PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
- DB 68,15,40,5,178,83,0,0 ; movaps 0x53b2(%rip),%xmm8 # 57f0 <_sk_callback_sse2+0x18d>
+ DB 68,15,40,5,130,83,0,0 ; movaps 0x5382(%rip),%xmm8 # 57c0 <_sk_callback_sse2+0x197>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -19360,7 +19476,7 @@ _sk_modulate_sse2 LABEL PROC
PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
- DB 68,15,40,5,134,83,0,0 ; movaps 0x5386(%rip),%xmm8 # 5800 <_sk_callback_sse2+0x19d>
+ DB 68,15,40,5,86,83,0,0 ; movaps 0x5356(%rip),%xmm8 # 57d0 <_sk_callback_sse2+0x1a7>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -19429,7 +19545,7 @@ _sk_screen_sse2 LABEL PROC
PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,187,82,0,0 ; movaps 0x52bb(%rip),%xmm3 # 5810 <_sk_callback_sse2+0x1ad>
+ DB 15,40,29,139,82,0,0 ; movaps 0x528b(%rip),%xmm3 # 57e0 <_sk_callback_sse2+0x1b7>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -19475,7 +19591,7 @@ _sk_darken_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,38,82,0,0 ; movaps 0x5226(%rip),%xmm2 # 5820 <_sk_callback_sse2+0x1bd>
+ DB 15,40,21,246,81,0,0 ; movaps 0x51f6(%rip),%xmm2 # 57f0 <_sk_callback_sse2+0x1c7>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -19507,7 +19623,7 @@ _sk_lighten_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,203,81,0,0 ; movaps 0x51cb(%rip),%xmm2 # 5830 <_sk_callback_sse2+0x1cd>
+ DB 15,40,21,155,81,0,0 ; movaps 0x519b(%rip),%xmm2 # 5800 <_sk_callback_sse2+0x1d7>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -19542,7 +19658,7 @@ _sk_difference_sse2 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,101,81,0,0 ; movaps 0x5165(%rip),%xmm2 # 5840 <_sk_callback_sse2+0x1dd>
+ DB 15,40,21,53,81,0,0 ; movaps 0x5135(%rip),%xmm2 # 5810 <_sk_callback_sse2+0x1e7>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -19568,7 +19684,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,37,81,0,0 ; movaps 0x5125(%rip),%xmm2 # 5850 <_sk_callback_sse2+0x1ed>
+ DB 15,40,21,245,80,0,0 ; movaps 0x50f5(%rip),%xmm2 # 5820 <_sk_callback_sse2+0x1f7>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -19579,7 +19695,7 @@ _sk_exclusion_sse2 LABEL PROC
PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,24,81,0,0 ; movaps 0x5118(%rip),%xmm10 # 5860 <_sk_callback_sse2+0x1fd>
+ DB 68,15,40,21,232,80,0,0 ; movaps 0x50e8(%rip),%xmm10 # 5830 <_sk_callback_sse2+0x207>
DB 69,15,40,202 ; movaps %xmm10,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,217 ; movaps %xmm9,%xmm11
@@ -19671,7 +19787,7 @@ _sk_colorburn_sse2 LABEL PROC
PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,206,79,0,0 ; movaps 0x4fce(%rip),%xmm10 # 5870 <_sk_callback_sse2+0x20d>
+ DB 68,15,40,21,158,79,0,0 ; movaps 0x4f9e(%rip),%xmm10 # 5840 <_sk_callback_sse2+0x217>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -19764,7 +19880,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,41,52,36 ; movaps %xmm6,(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 68,15,40,29,128,78,0,0 ; movaps 0x4e80(%rip),%xmm11 # 5880 <_sk_callback_sse2+0x21d>
+ DB 68,15,40,29,80,78,0,0 ; movaps 0x4e50(%rip),%xmm11 # 5850 <_sk_callback_sse2+0x227>
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,194 ; movaps %xmm10,%xmm8
@@ -19851,7 +19967,7 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 68,15,40,193 ; movaps %xmm1,%xmm8
DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,40,13,75,77,0,0 ; movaps 0x4d4b(%rip),%xmm9 # 5890 <_sk_callback_sse2+0x22d>
+ DB 68,15,40,13,27,77,0,0 ; movaps 0x4d1b(%rip),%xmm9 # 5860 <_sk_callback_sse2+0x237>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -19941,7 +20057,7 @@ _sk_softlight_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 68,15,94,215 ; divps %xmm7,%xmm10
DB 69,15,84,212 ; andps %xmm12,%xmm10
- DB 68,15,40,13,5,76,0,0 ; movaps 0x4c05(%rip),%xmm9 # 58a0 <_sk_callback_sse2+0x23d>
+ DB 68,15,40,13,213,75,0,0 ; movaps 0x4bd5(%rip),%xmm9 # 5870 <_sk_callback_sse2+0x247>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,92,250 ; subps %xmm10,%xmm15
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -19954,10 +20070,10 @@ _sk_softlight_sse2 LABEL PROC
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,53,223,75,0,0 ; movaps 0x4bdf(%rip),%xmm14 # 58b0 <_sk_callback_sse2+0x24d>
+ DB 68,15,40,53,175,75,0,0 ; movaps 0x4baf(%rip),%xmm14 # 5880 <_sk_callback_sse2+0x257>
DB 69,15,88,222 ; addps %xmm14,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
- DB 68,15,40,21,223,75,0,0 ; movaps 0x4bdf(%rip),%xmm10 # 58c0 <_sk_callback_sse2+0x25d>
+ DB 68,15,40,21,175,75,0,0 ; movaps 0x4baf(%rip),%xmm10 # 5890 <_sk_callback_sse2+0x267>
DB 69,15,89,234 ; mulps %xmm10,%xmm13
DB 69,15,88,235 ; addps %xmm11,%xmm13
DB 15,88,228 ; addps %xmm4,%xmm4
@@ -20102,7 +20218,7 @@ _sk_hue_sse2 LABEL PROC
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,40,5,27,74,0,0 ; movaps 0x4a1b(%rip),%xmm8 # 5900 <_sk_callback_sse2+0x29d>
+ DB 68,15,40,5,235,73,0,0 ; movaps 0x49eb(%rip),%xmm8 # 58d0 <_sk_callback_sse2+0x2a7>
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 15,40,207 ; movaps %xmm7,%xmm1
DB 68,15,92,217 ; subps %xmm1,%xmm11
@@ -20150,12 +20266,12 @@ _sk_hue_sse2 LABEL PROC
DB 69,15,84,206 ; andps %xmm14,%xmm9
DB 69,15,84,214 ; andps %xmm14,%xmm10
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,61,40,73,0,0 ; movaps 0x4928(%rip),%xmm15 # 58d0 <_sk_callback_sse2+0x26d>
+ DB 68,15,40,61,248,72,0,0 ; movaps 0x48f8(%rip),%xmm15 # 58a0 <_sk_callback_sse2+0x277>
DB 65,15,89,231 ; mulps %xmm15,%xmm4
- DB 15,40,5,45,73,0,0 ; movaps 0x492d(%rip),%xmm0 # 58e0 <_sk_callback_sse2+0x27d>
+ DB 15,40,5,253,72,0,0 ; movaps 0x48fd(%rip),%xmm0 # 58b0 <_sk_callback_sse2+0x287>
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
- DB 68,15,40,53,47,73,0,0 ; movaps 0x492f(%rip),%xmm14 # 58f0 <_sk_callback_sse2+0x28d>
+ DB 68,15,40,53,255,72,0,0 ; movaps 0x48ff(%rip),%xmm14 # 58c0 <_sk_callback_sse2+0x297>
DB 68,15,40,239 ; movaps %xmm7,%xmm13
DB 69,15,89,238 ; mulps %xmm14,%xmm13
DB 68,15,88,238 ; addps %xmm6,%xmm13
@@ -20333,14 +20449,14 @@ _sk_saturation_sse2 LABEL PROC
DB 68,15,84,211 ; andps %xmm3,%xmm10
DB 68,15,84,203 ; andps %xmm3,%xmm9
DB 15,84,195 ; andps %xmm3,%xmm0
- DB 68,15,40,5,188,70,0,0 ; movaps 0x46bc(%rip),%xmm8 # 5910 <_sk_callback_sse2+0x2ad>
+ DB 68,15,40,5,140,70,0,0 ; movaps 0x468c(%rip),%xmm8 # 58e0 <_sk_callback_sse2+0x2b7>
DB 15,40,214 ; movaps %xmm6,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 15,40,13,190,70,0,0 ; movaps 0x46be(%rip),%xmm1 # 5920 <_sk_callback_sse2+0x2bd>
+ DB 15,40,13,142,70,0,0 ; movaps 0x468e(%rip),%xmm1 # 58f0 <_sk_callback_sse2+0x2c7>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,217 ; mulps %xmm1,%xmm3
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 68,15,40,37,189,70,0,0 ; movaps 0x46bd(%rip),%xmm12 # 5930 <_sk_callback_sse2+0x2cd>
+ DB 68,15,40,37,141,70,0,0 ; movaps 0x468d(%rip),%xmm12 # 5900 <_sk_callback_sse2+0x2d7>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
DB 65,15,40,210 ; movaps %xmm10,%xmm2
@@ -20385,7 +20501,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,40,223 ; movaps %xmm7,%xmm3
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 68,15,40,5,34,70,0,0 ; movaps 0x4622(%rip),%xmm8 # 5940 <_sk_callback_sse2+0x2dd>
+ DB 68,15,40,5,242,69,0,0 ; movaps 0x45f2(%rip),%xmm8 # 5910 <_sk_callback_sse2+0x2e7>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 15,88,253 ; addps %xmm5,%xmm7
@@ -20486,14 +20602,14 @@ _sk_color_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 68,15,40,45,186,68,0,0 ; movaps 0x44ba(%rip),%xmm13 # 5950 <_sk_callback_sse2+0x2ed>
+ DB 68,15,40,45,138,68,0,0 ; movaps 0x448a(%rip),%xmm13 # 5920 <_sk_callback_sse2+0x2f7>
DB 68,15,40,198 ; movaps %xmm6,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,40,53,186,68,0,0 ; movaps 0x44ba(%rip),%xmm14 # 5960 <_sk_callback_sse2+0x2fd>
+ DB 68,15,40,53,138,68,0,0 ; movaps 0x448a(%rip),%xmm14 # 5930 <_sk_callback_sse2+0x307>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,29,182,68,0,0 ; movaps 0x44b6(%rip),%xmm11 # 5970 <_sk_callback_sse2+0x30d>
+ DB 68,15,40,29,134,68,0,0 ; movaps 0x4486(%rip),%xmm11 # 5940 <_sk_callback_sse2+0x317>
DB 69,15,89,227 ; mulps %xmm11,%xmm12
DB 68,15,88,224 ; addps %xmm0,%xmm12
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -20501,7 +20617,7 @@ _sk_color_sse2 LABEL PROC
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 68,15,40,5,162,68,0,0 ; movaps 0x44a2(%rip),%xmm8 # 5980 <_sk_callback_sse2+0x31d>
+ DB 68,15,40,5,114,68,0,0 ; movaps 0x4472(%rip),%xmm8 # 5950 <_sk_callback_sse2+0x327>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
DB 15,89,252 ; mulps %xmm4,%xmm7
@@ -20637,15 +20753,15 @@ _sk_luminosity_sse2 LABEL PROC
DB 68,15,40,205 ; movaps %xmm5,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 68,15,40,37,180,66,0,0 ; movaps 0x42b4(%rip),%xmm12 # 5990 <_sk_callback_sse2+0x32d>
+ DB 68,15,40,37,132,66,0,0 ; movaps 0x4284(%rip),%xmm12 # 5960 <_sk_callback_sse2+0x337>
DB 68,15,40,199 ; movaps %xmm7,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,180,66,0,0 ; movaps 0x42b4(%rip),%xmm13 # 59a0 <_sk_callback_sse2+0x33d>
+ DB 68,15,40,45,132,66,0,0 ; movaps 0x4284(%rip),%xmm13 # 5970 <_sk_callback_sse2+0x347>
DB 68,15,40,241 ; movaps %xmm1,%xmm14
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 69,15,88,240 ; addps %xmm8,%xmm14
- DB 68,15,40,29,176,66,0,0 ; movaps 0x42b0(%rip),%xmm11 # 59b0 <_sk_callback_sse2+0x34d>
- DB 68,15,40,5,184,66,0,0 ; movaps 0x42b8(%rip),%xmm8 # 59c0 <_sk_callback_sse2+0x35d>
+ DB 68,15,40,29,128,66,0,0 ; movaps 0x4280(%rip),%xmm11 # 5980 <_sk_callback_sse2+0x357>
+ DB 68,15,40,5,136,66,0,0 ; movaps 0x4288(%rip),%xmm8 # 5990 <_sk_callback_sse2+0x367>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 68,15,92,248 ; subps %xmm0,%xmm15
@@ -20783,7 +20899,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,133,227,0,0,0 ; jne 19e2 <_sk_srcover_rgba_8888_sse2+0xf1>
DB 243,68,15,111,4,144 ; movdqu (%rax,%rdx,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,53,192,64,0,0 ; movdqa 0x40c0(%rip),%xmm6 # 59d0 <_sk_callback_sse2+0x36d>
+ DB 102,15,111,53,144,64,0,0 ; movdqa 0x4090(%rip),%xmm6 # 59a0 <_sk_callback_sse2+0x377>
DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
@@ -20797,9 +20913,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7
- DB 68,15,40,5,144,64,0,0 ; movaps 0x4090(%rip),%xmm8 # 59e0 <_sk_callback_sse2+0x37d>
+ DB 68,15,40,5,96,64,0,0 ; movaps 0x4060(%rip),%xmm8 # 59b0 <_sk_callback_sse2+0x387>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,148,64,0,0 ; movaps 0x4094(%rip),%xmm12 # 59f0 <_sk_callback_sse2+0x38d>
+ DB 68,15,40,37,100,64,0,0 ; movaps 0x4064(%rip),%xmm12 # 59c0 <_sk_callback_sse2+0x397>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -20825,7 +20941,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,106 ; jne 1a33 <_sk_srcover_rgba_8888_sse2+0x142>
+ DB 117,82 ; jne 1a1b <_sk_srcover_rgba_8888_sse2+0x12a>
DB 243,15,127,4,144 ; movdqu %xmm0,(%rax,%rdx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -20835,36 +20951,33 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,48 ; je 1a24 <_sk_srcover_rgba_8888_sse2+0x133>
+ DB 116,87 ; je 1a46 <_sk_srcover_rgba_8888_sse2+0x155>
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
DB 116,22 ; je 1a10 <_sk_srcover_rgba_8888_sse2+0x11f>
DB 65,128,249,3 ; cmp $0x3,%r9b
DB 15,133,1,255,255,255 ; jne 1905 <_sk_srcover_rgba_8888_sse2+0x14>
DB 102,15,110,100,144,8 ; movd 0x8(%rax,%rdx,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
- DB 243,15,16,100,144,4 ; movss 0x4(%rax,%rdx,4),%xmm4
- DB 65,15,198,224,0 ; shufps $0x0,%xmm8,%xmm4
- DB 65,15,198,224,226 ; shufps $0xe2,%xmm8,%xmm4
- DB 68,15,40,196 ; movaps %xmm4,%xmm8
- DB 243,15,16,36,144 ; movss (%rax,%rdx,4),%xmm4
- DB 243,68,15,16,196 ; movss %xmm4,%xmm8
- DB 233,210,254,255,255 ; jmpq 1905 <_sk_srcover_rgba_8888_sse2+0x14>
+ DB 102,68,15,18,4,144 ; movlpd (%rax,%rdx,4),%xmm8
+ DB 233,234,254,255,255 ; jmpq 1905 <_sk_srcover_rgba_8888_sse2+0x14>
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,34 ; je 1a62 <_sk_srcover_rgba_8888_sse2+0x171>
+ DB 116,41 ; je 1a51 <_sk_srcover_rgba_8888_sse2+0x160>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,17 ; je 1a57 <_sk_srcover_rgba_8888_sse2+0x166>
+ DB 116,17 ; je 1a3f <_sk_srcover_rgba_8888_sse2+0x14e>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,130 ; jne 19ce <_sk_srcover_rgba_8888_sse2+0xdd>
+ DB 117,154 ; jne 19ce <_sk_srcover_rgba_8888_sse2+0xdd>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,15,126,76,144,8 ; movd %xmm1,0x8(%rax,%rdx,4)
- DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
- DB 102,15,126,76,144,4 ; movd %xmm1,0x4(%rax,%rdx,4)
+ DB 102,15,214,4,144 ; movq %xmm0,(%rax,%rdx,4)
+ DB 235,136 ; jmp 19ce <_sk_srcover_rgba_8888_sse2+0xdd>
+ DB 102,68,15,110,4,144 ; movd (%rax,%rdx,4),%xmm8
+ DB 233,180,254,255,255 ; jmpq 1905 <_sk_srcover_rgba_8888_sse2+0x14>
DB 102,15,126,4,144 ; movd %xmm0,(%rax,%rdx,4)
- DB 233,98,255,255,255 ; jmpq 19ce <_sk_srcover_rgba_8888_sse2+0xdd>
+ DB 233,115,255,255,255 ; jmpq 19ce <_sk_srcover_rgba_8888_sse2+0xdd>
PUBLIC _sk_clamp_0_sse2
_sk_clamp_0_sse2 LABEL PROC
@@ -20878,7 +20991,7 @@ _sk_clamp_0_sse2 LABEL PROC
PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
- DB 68,15,40,5,116,63,0,0 ; movaps 0x3f74(%rip),%xmm8 # 5a00 <_sk_callback_sse2+0x39d>
+ DB 68,15,40,5,85,63,0,0 ; movaps 0x3f55(%rip),%xmm8 # 59d0 <_sk_callback_sse2+0x3a7>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -20888,7 +21001,7 @@ _sk_clamp_1_sse2 LABEL PROC
PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
- DB 15,93,29,105,63,0,0 ; minps 0x3f69(%rip),%xmm3 # 5a10 <_sk_callback_sse2+0x3ad>
+ DB 15,93,29,74,63,0,0 ; minps 0x3f4a(%rip),%xmm3 # 59e0 <_sk_callback_sse2+0x3b7>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -20961,7 +21074,7 @@ _sk_premul_sse2 LABEL PROC
PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,212,62,0,0 ; movaps 0x3ed4(%rip),%xmm9 # 5a20 <_sk_callback_sse2+0x3bd>
+ DB 68,15,40,13,181,62,0,0 ; movaps 0x3eb5(%rip),%xmm9 # 59f0 <_sk_callback_sse2+0x3c7>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -20973,20 +21086,20 @@ _sk_unpremul_sse2 LABEL PROC
PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
- DB 68,15,40,5,191,62,0,0 ; movaps 0x3ebf(%rip),%xmm8 # 5a30 <_sk_callback_sse2+0x3cd>
+ DB 68,15,40,5,160,62,0,0 ; movaps 0x3ea0(%rip),%xmm8 # 5a00 <_sk_callback_sse2+0x3d7>
DB 68,15,40,232 ; movaps %xmm0,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,216 ; movaps %xmm0,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,183,62,0,0 ; movaps 0x3eb7(%rip),%xmm9 # 5a40 <_sk_callback_sse2+0x3dd>
+ DB 68,15,40,13,152,62,0,0 ; movaps 0x3e98(%rip),%xmm9 # 5a10 <_sk_callback_sse2+0x3e7>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,183,62,0,0 ; movaps 0x3eb7(%rip),%xmm10 # 5a50 <_sk_callback_sse2+0x3ed>
+ DB 68,15,40,21,152,62,0,0 ; movaps 0x3e98(%rip),%xmm10 # 5a20 <_sk_callback_sse2+0x3f7>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,183,62,0,0 ; movaps 0x3eb7(%rip),%xmm11 # 5a60 <_sk_callback_sse2+0x3fd>
+ DB 68,15,40,29,152,62,0,0 ; movaps 0x3e98(%rip),%xmm11 # 5a30 <_sk_callback_sse2+0x407>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,187,62,0,0 ; movaps 0x3ebb(%rip),%xmm12 # 5a70 <_sk_callback_sse2+0x40d>
+ DB 68,15,40,37,156,62,0,0 ; movaps 0x3e9c(%rip),%xmm12 # 5a40 <_sk_callback_sse2+0x417>
DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0
DB 68,15,84,232 ; andps %xmm0,%xmm13
DB 65,15,85,198 ; andnps %xmm14,%xmm0
@@ -21021,22 +21134,22 @@ _sk_from_srgb_sse2 LABEL PROC
PUBLIC _sk_to_srgb_sse2
_sk_to_srgb_sse2 LABEL PROC
DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13
- DB 68,15,40,5,72,62,0,0 ; movaps 0x3e48(%rip),%xmm8 # 5a80 <_sk_callback_sse2+0x41d>
+ DB 68,15,40,5,41,62,0,0 ; movaps 0x3e29(%rip),%xmm8 # 5a50 <_sk_callback_sse2+0x427>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,240 ; mulps %xmm8,%xmm14
- DB 68,15,40,13,72,62,0,0 ; movaps 0x3e48(%rip),%xmm9 # 5a90 <_sk_callback_sse2+0x42d>
+ DB 68,15,40,13,41,62,0,0 ; movaps 0x3e29(%rip),%xmm9 # 5a60 <_sk_callback_sse2+0x437>
DB 69,15,40,253 ; movaps %xmm13,%xmm15
DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 68,15,40,21,72,62,0,0 ; movaps 0x3e48(%rip),%xmm10 # 5aa0 <_sk_callback_sse2+0x43d>
+ DB 68,15,40,21,41,62,0,0 ; movaps 0x3e29(%rip),%xmm10 # 5a70 <_sk_callback_sse2+0x447>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 68,15,40,29,72,62,0,0 ; movaps 0x3e48(%rip),%xmm11 # 5ab0 <_sk_callback_sse2+0x44d>
+ DB 68,15,40,29,41,62,0,0 ; movaps 0x3e29(%rip),%xmm11 # 5a80 <_sk_callback_sse2+0x457>
DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 68,15,40,37,76,62,0,0 ; movaps 0x3e4c(%rip),%xmm12 # 5ac0 <_sk_callback_sse2+0x45d>
+ DB 68,15,40,37,45,62,0,0 ; movaps 0x3e2d(%rip),%xmm12 # 5a90 <_sk_callback_sse2+0x467>
DB 69,15,88,236 ; addps %xmm12,%xmm13
DB 69,15,83,237 ; rcpps %xmm13,%xmm13
DB 69,15,89,239 ; mulps %xmm15,%xmm13
- DB 68,15,40,61,72,62,0,0 ; movaps 0x3e48(%rip),%xmm15 # 5ad0 <_sk_callback_sse2+0x46d>
+ DB 68,15,40,61,41,62,0,0 ; movaps 0x3e29(%rip),%xmm15 # 5aa0 <_sk_callback_sse2+0x477>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,197 ; andnps %xmm13,%xmm0
@@ -21084,7 +21197,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 68,15,93,218 ; minps %xmm2,%xmm11
DB 65,15,40,202 ; movaps %xmm10,%xmm1
DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 68,15,40,45,161,61,0,0 ; movaps 0x3da1(%rip),%xmm13 # 5ae0 <_sk_callback_sse2+0x47d>
+ DB 68,15,40,45,130,61,0,0 ; movaps 0x3d82(%rip),%xmm13 # 5ab0 <_sk_callback_sse2+0x487>
DB 68,15,94,233 ; divps %xmm1,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0
@@ -21093,30 +21206,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,40,241 ; movaps %xmm9,%xmm14
DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14
- DB 68,15,84,53,135,61,0,0 ; andps 0x3d87(%rip),%xmm14 # 5af0 <_sk_callback_sse2+0x48d>
+ DB 68,15,84,53,104,61,0,0 ; andps 0x3d68(%rip),%xmm14 # 5ac0 <_sk_callback_sse2+0x497>
DB 69,15,88,244 ; addps %xmm12,%xmm14
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 68,15,40,37,122,61,0,0 ; movaps 0x3d7a(%rip),%xmm12 # 5b00 <_sk_callback_sse2+0x49d>
+ DB 68,15,40,37,91,61,0,0 ; movaps 0x3d5b(%rip),%xmm12 # 5ad0 <_sk_callback_sse2+0x4a7>
DB 65,15,88,212 ; addps %xmm12,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,88,5,118,61,0,0 ; addps 0x3d76(%rip),%xmm8 # 5b10 <_sk_callback_sse2+0x4ad>
+ DB 68,15,88,5,87,61,0,0 ; addps 0x3d57(%rip),%xmm8 # 5ae0 <_sk_callback_sse2+0x4b7>
DB 65,15,84,215 ; andps %xmm15,%xmm2
DB 69,15,85,248 ; andnps %xmm8,%xmm15
DB 68,15,86,250 ; orps %xmm2,%xmm15
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
DB 65,15,86,198 ; orps %xmm14,%xmm0
- DB 15,89,5,103,61,0,0 ; mulps 0x3d67(%rip),%xmm0 # 5b20 <_sk_callback_sse2+0x4bd>
+ DB 15,89,5,72,61,0,0 ; mulps 0x3d48(%rip),%xmm0 # 5af0 <_sk_callback_sse2+0x4c7>
DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8
DB 65,15,84,192 ; andps %xmm8,%xmm0
DB 69,15,92,226 ; subps %xmm10,%xmm12
DB 69,15,88,211 ; addps %xmm11,%xmm10
- DB 68,15,40,13,90,61,0,0 ; movaps 0x3d5a(%rip),%xmm9 # 5b30 <_sk_callback_sse2+0x4cd>
+ DB 68,15,40,13,59,61,0,0 ; movaps 0x3d3b(%rip),%xmm9 # 5b00 <_sk_callback_sse2+0x4d7>
DB 65,15,40,210 ; movaps %xmm10,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9
@@ -21139,7 +21252,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp)
DB 68,15,40,218 ; movaps %xmm2,%xmm11
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 68,15,40,13,21,61,0,0 ; movaps 0x3d15(%rip),%xmm9 # 5b40 <_sk_callback_sse2+0x4dd>
+ DB 68,15,40,13,246,60,0,0 ; movaps 0x3cf6(%rip),%xmm9 # 5b10 <_sk_callback_sse2+0x4e7>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
@@ -21156,28 +21269,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 69,15,88,211 ; addps %xmm11,%xmm10
DB 69,15,88,219 ; addps %xmm11,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 15,40,5,223,60,0,0 ; movaps 0x3cdf(%rip),%xmm0 # 5b50 <_sk_callback_sse2+0x4ed>
+ DB 15,40,5,192,60,0,0 ; movaps 0x3cc0(%rip),%xmm0 # 5b20 <_sk_callback_sse2+0x4f7>
DB 15,88,198 ; addps %xmm6,%xmm0
DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,194,217,1 ; cmpltps %xmm1,%xmm3
- DB 15,84,29,215,60,0,0 ; andps 0x3cd7(%rip),%xmm3 # 5b60 <_sk_callback_sse2+0x4fd>
+ DB 15,84,29,184,60,0,0 ; andps 0x3cb8(%rip),%xmm3 # 5b30 <_sk_callback_sse2+0x507>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 68,15,40,45,217,60,0,0 ; movaps 0x3cd9(%rip),%xmm13 # 5b70 <_sk_callback_sse2+0x50d>
+ DB 68,15,40,45,186,60,0,0 ; movaps 0x3cba(%rip),%xmm13 # 5b40 <_sk_callback_sse2+0x517>
DB 69,15,40,197 ; movaps %xmm13,%xmm8
DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8
DB 69,15,40,242 ; movaps %xmm10,%xmm14
DB 69,15,92,243 ; subps %xmm11,%xmm14
DB 65,15,40,217 ; movaps %xmm9,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
- DB 15,40,21,233,60,0,0 ; movaps 0x3ce9(%rip),%xmm2 # 5ba0 <_sk_callback_sse2+0x53d>
+ DB 15,40,21,202,60,0,0 ; movaps 0x3cca(%rip),%xmm2 # 5b70 <_sk_callback_sse2+0x547>
DB 68,15,40,250 ; movaps %xmm2,%xmm15
DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15
- DB 15,40,13,185,60,0,0 ; movaps 0x3cb9(%rip),%xmm1 # 5b80 <_sk_callback_sse2+0x51d>
+ DB 15,40,13,154,60,0,0 ; movaps 0x3c9a(%rip),%xmm1 # 5b50 <_sk_callback_sse2+0x527>
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,45,191,60,0,0 ; movaps 0x3cbf(%rip),%xmm5 # 5b90 <_sk_callback_sse2+0x52d>
+ DB 15,40,45,160,60,0,0 ; movaps 0x3ca0(%rip),%xmm5 # 5b60 <_sk_callback_sse2+0x537>
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,92,224 ; subps %xmm0,%xmm4
DB 65,15,89,230 ; mulps %xmm14,%xmm4
@@ -21200,7 +21313,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,52,60,0,0 ; andps 0x3c34(%rip),%xmm3 # 5b60 <_sk_callback_sse2+0x4fd>
+ DB 15,84,29,21,60,0,0 ; andps 0x3c15(%rip),%xmm3 # 5b30 <_sk_callback_sse2+0x507>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 68,15,40,230 ; movaps %xmm6,%xmm12
DB 68,15,92,224 ; subps %xmm0,%xmm12
@@ -21230,12 +21343,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,60,36 ; movaps (%rsp),%xmm7
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,88,53,13,60,0,0 ; addps 0x3c0d(%rip),%xmm6 # 5bb0 <_sk_callback_sse2+0x54d>
+ DB 15,88,53,238,59,0,0 ; addps 0x3bee(%rip),%xmm6 # 5b80 <_sk_callback_sse2+0x557>
DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,168,59,0,0 ; andps 0x3ba8(%rip),%xmm3 # 5b60 <_sk_callback_sse2+0x4fd>
+ DB 15,84,29,137,59,0,0 ; andps 0x3b89(%rip),%xmm3 # 5b30 <_sk_callback_sse2+0x507>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,89,206 ; mulps %xmm6,%xmm1
@@ -21292,13 +21405,13 @@ _sk_scale_u8_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,61 ; jne 20af <_sk_scale_u8_sse2+0x47>
+ DB 117,61 ; jne 209e <_sk_scale_u8_sse2+0x47>
DB 102,69,15,110,4,18 ; movd (%r10,%rdx,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,53,59,0,0 ; pand 0x3b35(%rip),%xmm8 # 5bc0 <_sk_callback_sse2+0x55d>
+ DB 102,68,15,219,5,22,59,0,0 ; pand 0x3b16(%rip),%xmm8 # 5b90 <_sk_callback_sse2+0x567>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,57,59,0,0 ; mulps 0x3b39(%rip),%xmm8 # 5bd0 <_sk_callback_sse2+0x56d>
+ DB 68,15,89,5,26,59,0,0 ; mulps 0x3b1a(%rip),%xmm8 # 5ba0 <_sk_callback_sse2+0x577>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -21308,25 +21421,25 @@ _sk_scale_u8_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 20f7 <_sk_scale_u8_sse2+0x8f>
+ DB 116,61 ; je 20e8 <_sk_scale_u8_sse2+0x91>
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 20de <_sk_scale_u8_sse2+0x76>
+ DB 116,23 ; je 20cd <_sk_scale_u8_sse2+0x76>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,181 ; jne 2082 <_sk_scale_u8_sse2+0x1a>
+ DB 117,181 ; jne 2071 <_sk_scale_u8_sse2+0x1a>
DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
- DB 65,15,182,68,18,1 ; movzbl 0x1(%r10,%rdx,1),%eax
+ DB 65,15,183,4,18 ; movzwl (%r10,%rdx,1),%eax
DB 102,68,15,110,200 ; movd %eax,%xmm9
- DB 69,15,198,200,0 ; shufps $0x0,%xmm8,%xmm9
- DB 69,15,198,200,226 ; shufps $0xe2,%xmm8,%xmm9
- DB 69,15,40,193 ; movaps %xmm9,%xmm8
+ DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
+ DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
+ DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
+ DB 235,137 ; jmp 2071 <_sk_scale_u8_sse2+0x1a>
DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax
- DB 102,68,15,110,200 ; movd %eax,%xmm9
- DB 243,69,15,16,193 ; movss %xmm9,%xmm8
- DB 233,119,255,255,255 ; jmpq 2082 <_sk_scale_u8_sse2+0x1a>
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 233,122,255,255,255 ; jmpq 2071 <_sk_scale_u8_sse2+0x1a>
PUBLIC _sk_lerp_1_float_sse2
_sk_lerp_1_float_sse2 LABEL PROC
@@ -21353,13 +21466,13 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,81 ; jne 219e <_sk_lerp_u8_sse2+0x5b>
+ DB 117,81 ; jne 218a <_sk_lerp_u8_sse2+0x5b>
DB 102,69,15,110,4,18 ; movd (%r10,%rdx,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,122,58,0,0 ; pand 0x3a7a(%rip),%xmm8 # 5be0 <_sk_callback_sse2+0x57d>
+ DB 102,68,15,219,5,94,58,0,0 ; pand 0x3a5e(%rip),%xmm8 # 5bb0 <_sk_callback_sse2+0x587>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,126,58,0,0 ; mulps 0x3a7e(%rip),%xmm8 # 5bf0 <_sk_callback_sse2+0x58d>
+ DB 68,15,89,5,98,58,0,0 ; mulps 0x3a62(%rip),%xmm8 # 5bc0 <_sk_callback_sse2+0x597>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -21376,45 +21489,45 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,54 ; je 21e6 <_sk_lerp_u8_sse2+0xa3>
+ DB 116,64 ; je 21d7 <_sk_lerp_u8_sse2+0xa8>
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,23 ; je 21cd <_sk_lerp_u8_sse2+0x8a>
+ DB 116,23 ; je 21b9 <_sk_lerp_u8_sse2+0x8a>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,161 ; jne 215d <_sk_lerp_u8_sse2+0x1a>
+ DB 117,161 ; jne 2149 <_sk_lerp_u8_sse2+0x1a>
DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
- DB 65,15,182,68,18,1 ; movzbl 0x1(%r10,%rdx,1),%eax
+ DB 65,15,183,4,18 ; movzwl (%r10,%rdx,1),%eax
DB 102,68,15,110,200 ; movd %eax,%xmm9
- DB 69,15,198,200,0 ; shufps $0x0,%xmm8,%xmm9
- DB 69,15,198,200,226 ; shufps $0xe2,%xmm8,%xmm9
- DB 69,15,40,193 ; movaps %xmm9,%xmm8
+ DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
+ DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
+ DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
+ DB 233,114,255,255,255 ; jmpq 2149 <_sk_lerp_u8_sse2+0x1a>
DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax
- DB 102,68,15,110,200 ; movd %eax,%xmm9
- DB 243,69,15,16,193 ; movss %xmm9,%xmm8
- DB 233,99,255,255,255 ; jmpq 215d <_sk_lerp_u8_sse2+0x1a>
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 233,99,255,255,255 ; jmpq 2149 <_sk_lerp_u8_sse2+0x1a>
PUBLIC _sk_lerp_565_sse2
_sk_lerp_565_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,156,0,0,0 ; jne 22a4 <_sk_lerp_565_sse2+0xaa>
+ DB 15,133,156,0,0,0 ; jne 2290 <_sk_lerp_565_sse2+0xaa>
DB 243,69,15,126,12,82 ; movq (%r10,%rdx,2),%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
- DB 102,68,15,111,5,228,57,0,0 ; movdqa 0x39e4(%rip),%xmm8 # 5c00 <_sk_callback_sse2+0x59d>
+ DB 102,68,15,111,5,200,57,0,0 ; movdqa 0x39c8(%rip),%xmm8 # 5bd0 <_sk_callback_sse2+0x5a7>
DB 102,69,15,219,193 ; pand %xmm9,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,227,57,0,0 ; mulps 0x39e3(%rip),%xmm8 # 5c10 <_sk_callback_sse2+0x5ad>
- DB 102,68,15,111,21,234,57,0,0 ; movdqa 0x39ea(%rip),%xmm10 # 5c20 <_sk_callback_sse2+0x5bd>
+ DB 68,15,89,5,199,57,0,0 ; mulps 0x39c7(%rip),%xmm8 # 5be0 <_sk_callback_sse2+0x5b7>
+ DB 102,68,15,111,21,206,57,0,0 ; movdqa 0x39ce(%rip),%xmm10 # 5bf0 <_sk_callback_sse2+0x5c7>
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,233,57,0,0 ; mulps 0x39e9(%rip),%xmm10 # 5c30 <_sk_callback_sse2+0x5cd>
- DB 102,68,15,219,13,240,57,0,0 ; pand 0x39f0(%rip),%xmm9 # 5c40 <_sk_callback_sse2+0x5dd>
+ DB 68,15,89,21,205,57,0,0 ; mulps 0x39cd(%rip),%xmm10 # 5c00 <_sk_callback_sse2+0x5d7>
+ DB 102,68,15,219,13,212,57,0,0 ; pand 0x39d4(%rip),%xmm9 # 5c10 <_sk_callback_sse2+0x5e7>
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,244,57,0,0 ; mulps 0x39f4(%rip),%xmm9 # 5c50 <_sk_callback_sse2+0x5ed>
+ DB 68,15,89,13,216,57,0,0 ; mulps 0x39d8(%rip),%xmm9 # 5c20 <_sk_callback_sse2+0x5f7>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -21438,37 +21551,35 @@ _sk_lerp_565_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,58 ; je 22f0 <_sk_lerp_565_sse2+0xf6>
+ DB 116,59 ; je 22d8 <_sk_lerp_565_sse2+0xf2>
+ DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,27 ; je 22d7 <_sk_lerp_565_sse2+0xdd>
+ DB 116,27 ; je 22c3 <_sk_lerp_565_sse2+0xdd>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 15,133,77,255,255,255 ; jne 2213 <_sk_lerp_565_sse2+0x19>
+ DB 15,133,77,255,255,255 ; jne 21ff <_sk_lerp_565_sse2+0x19>
DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,200,69 ; pshufd $0x45,%xmm8,%xmm9
- DB 65,15,183,68,82,2 ; movzwl 0x2(%r10,%rdx,2),%eax
- DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 69,15,198,193,0 ; shufps $0x0,%xmm9,%xmm8
- DB 69,15,198,193,226 ; shufps $0xe2,%xmm9,%xmm8
- DB 69,15,40,200 ; movaps %xmm8,%xmm9
+ DB 102,69,15,110,4,82 ; movd (%r10,%rdx,2),%xmm8
+ DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
+ DB 242,69,15,16,200 ; movsd %xmm8,%xmm9
+ DB 233,39,255,255,255 ; jmpq 21ff <_sk_lerp_565_sse2+0x19>
DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax
- DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 243,69,15,16,200 ; movss %xmm8,%xmm9
- DB 233,15,255,255,255 ; jmpq 2213 <_sk_lerp_565_sse2+0x19>
+ DB 102,68,15,110,200 ; movd %eax,%xmm9
+ DB 233,24,255,255,255 ; jmpq 21ff <_sk_lerp_565_sse2+0x19>
PUBLIC _sk_load_tables_sse2
_sk_load_tables_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,36,1,0,0 ; jne 2436 <_sk_load_tables_sse2+0x132>
+ DB 15,133,36,1,0,0 ; jne 2419 <_sk_load_tables_sse2+0x132>
DB 243,69,15,111,12,145 ; movdqu (%r9,%rdx,4),%xmm9
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,68,15,111,5,58,57,0,0 ; movdqa 0x393a(%rip),%xmm8 # 5c60 <_sk_callback_sse2+0x5fd>
+ DB 102,68,15,111,5,39,57,0,0 ; movdqa 0x3927(%rip),%xmm8 # 5c30 <_sk_callback_sse2+0x607>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -21524,7 +21635,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9
DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3
- DB 15,89,29,67,56,0,0 ; mulps 0x3843(%rip),%xmm3 # 5c70 <_sk_callback_sse2+0x60d>
+ DB 15,89,29,48,56,0,0 ; mulps 0x3830(%rip),%xmm3 # 5c40 <_sk_callback_sse2+0x617>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -21532,22 +21643,19 @@ _sk_load_tables_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
- DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 247a <_sk_load_tables_sse2+0x176>
+ DB 116,45 ; je 2453 <_sk_load_tables_sse2+0x16c>
+ DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 2465 <_sk_load_tables_sse2+0x161>
+ DB 116,23 ; je 2448 <_sk_load_tables_sse2+0x161>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,192,254,255,255 ; jne 2318 <_sk_load_tables_sse2+0x14>
+ DB 15,133,192,254,255,255 ; jne 22fb <_sk_load_tables_sse2+0x14>
DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
- DB 243,65,15,16,68,145,4 ; movss 0x4(%r9,%rdx,4),%xmm0
- DB 65,15,198,193,0 ; shufps $0x0,%xmm9,%xmm0
- DB 65,15,198,193,226 ; shufps $0xe2,%xmm9,%xmm0
- DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 243,65,15,16,4,145 ; movss (%r9,%rdx,4),%xmm0
- DB 243,68,15,16,200 ; movss %xmm0,%xmm9
- DB 233,142,254,255,255 ; jmpq 2318 <_sk_load_tables_sse2+0x14>
+ DB 102,69,15,18,12,145 ; movlpd (%r9,%rdx,4),%xmm9
+ DB 233,168,254,255,255 ; jmpq 22fb <_sk_load_tables_sse2+0x14>
+ DB 102,69,15,110,12,145 ; movd (%r9,%rdx,4),%xmm9
+ DB 233,157,254,255,255 ; jmpq 22fb <_sk_load_tables_sse2+0x14>
PUBLIC _sk_load_tables_u16_be_sse2
_sk_load_tables_u16_be_sse2 LABEL PROC
@@ -21555,7 +21663,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,101,1,0,0 ; jne 2605 <_sk_load_tables_u16_be_sse2+0x17b>
+ DB 15,133,101,1,0,0 ; jne 25d9 <_sk_load_tables_u16_be_sse2+0x17b>
DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0
DB 102,67,15,16,76,81,16 ; movupd 0x10(%r9,%r10,2),%xmm1
DB 65,87 ; push %r15
@@ -21567,7 +21675,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,21,169,55,0,0 ; movdqa 0x37a9(%rip),%xmm10 # 5c80 <_sk_callback_sse2+0x61d>
+ DB 102,68,15,111,21,165,55,0,0 ; movdqa 0x37a5(%rip),%xmm10 # 5c50 <_sk_callback_sse2+0x627>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -21629,7 +21737,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,235,217 ; por %xmm9,%xmm3
DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,148,54,0,0 ; mulps 0x3694(%rip),%xmm3 # 5c90 <_sk_callback_sse2+0x62d>
+ DB 15,89,29,144,54,0,0 ; mulps 0x3690(%rip),%xmm3 # 5c60 <_sk_callback_sse2+0x637>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -21637,17 +21745,17 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 2622 <_sk_load_tables_u16_be_sse2+0x198>
+ DB 117,17 ; jne 25f6 <_sk_load_tables_u16_be_sse2+0x198>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,139,254,255,255 ; jmpq 24ad <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,139,254,255,255 ; jmpq 2481 <_sk_load_tables_u16_be_sse2+0x23>
DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,118,254,255,255 ; jb 24ad <_sk_load_tables_u16_be_sse2+0x23>
+ DB 15,130,118,254,255,255 ; jb 2481 <_sk_load_tables_u16_be_sse2+0x23>
DB 242,67,15,16,76,81,16 ; movsd 0x10(%r9,%r10,2),%xmm1
- DB 233,106,254,255,255 ; jmpq 24ad <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,106,254,255,255 ; jmpq 2481 <_sk_load_tables_u16_be_sse2+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse2
_sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -21655,7 +21763,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,84,1,0,0 ; jne 27a9 <_sk_load_tables_rgb_u16_be_sse2+0x166>
+ DB 15,133,84,1,0,0 ; jne 277d <_sk_load_tables_rgb_u16_be_sse2+0x166>
DB 243,71,15,111,28,81 ; movdqu (%r9,%r10,2),%xmm11
DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -21670,7 +21778,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0
- DB 102,68,15,111,5,3,54,0,0 ; movdqa 0x3603(%rip),%xmm8 # 5ca0 <_sk_callback_sse2+0x63d>
+ DB 102,68,15,111,5,255,53,0,0 ; movdqa 0x35ff(%rip),%xmm8 # 5c70 <_sk_callback_sse2+0x647>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -21726,7 +21834,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,14,53,0,0 ; movaps 0x350e(%rip),%xmm3 # 5cb0 <_sk_callback_sse2+0x64d>
+ DB 15,40,29,10,53,0,0 ; movaps 0x350a(%rip),%xmm3 # 5c80 <_sk_callback_sse2+0x657>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -21735,21 +21843,21 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,71,15,196,92,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm11
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,14 ; jne 27cf <_sk_load_tables_rgb_u16_be_sse2+0x18c>
+ DB 117,14 ; jne 27a3 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
- DB 233,172,254,255,255 ; jmpq 267b <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,172,254,255,255 ; jmpq 264f <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,71,15,110,84,81,6 ; movd 0x6(%r9,%r10,2),%xmm10
DB 102,71,15,196,84,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm10
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 2800 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
+ DB 114,24 ; jb 27d4 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1
DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,123,254,255,255 ; jmpq 267b <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,123,254,255,255 ; jmpq 264f <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,114,254,255,255 ; jmpq 267b <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,114,254,255,255 ; jmpq 264f <_sk_load_tables_rgb_u16_be_sse2+0x38>
PUBLIC _sk_byte_tables_sse2
_sk_byte_tables_sse2 LABEL PROC
@@ -21758,7 +21866,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,167,52,0,0 ; movaps 0x34a7(%rip),%xmm8 # 5cc0 <_sk_callback_sse2+0x65d>
+ DB 68,15,40,5,163,52,0,0 ; movaps 0x34a3(%rip),%xmm8 # 5c90 <_sk_callback_sse2+0x667>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -21786,7 +21894,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,65,52,0,0 ; movaps 0x3441(%rip),%xmm10 # 5cd0 <_sk_callback_sse2+0x66d>
+ DB 68,15,40,21,61,52,0,0 ; movaps 0x343d(%rip),%xmm10 # 5ca0 <_sk_callback_sse2+0x677>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -21905,7 +22013,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,137,50,0,0 ; movaps 0x3289(%rip),%xmm10 # 5ce0 <_sk_callback_sse2+0x67d>
+ DB 68,15,40,21,133,50,0,0 ; movaps 0x3285(%rip),%xmm10 # 5cb0 <_sk_callback_sse2+0x687>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -22102,15 +22210,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,189,47,0,0 ; mulps 0x2fbd(%rip),%xmm9 # 5cf0 <_sk_callback_sse2+0x68d>
- DB 68,15,84,21,197,47,0,0 ; andps 0x2fc5(%rip),%xmm10 # 5d00 <_sk_callback_sse2+0x69d>
- DB 68,15,86,21,205,47,0,0 ; orps 0x2fcd(%rip),%xmm10 # 5d10 <_sk_callback_sse2+0x6ad>
- DB 68,15,88,13,213,47,0,0 ; addps 0x2fd5(%rip),%xmm9 # 5d20 <_sk_callback_sse2+0x6bd>
- DB 68,15,40,37,221,47,0,0 ; movaps 0x2fdd(%rip),%xmm12 # 5d30 <_sk_callback_sse2+0x6cd>
+ DB 68,15,89,13,185,47,0,0 ; mulps 0x2fb9(%rip),%xmm9 # 5cc0 <_sk_callback_sse2+0x697>
+ DB 68,15,84,21,193,47,0,0 ; andps 0x2fc1(%rip),%xmm10 # 5cd0 <_sk_callback_sse2+0x6a7>
+ DB 68,15,86,21,201,47,0,0 ; orps 0x2fc9(%rip),%xmm10 # 5ce0 <_sk_callback_sse2+0x6b7>
+ DB 68,15,88,13,209,47,0,0 ; addps 0x2fd1(%rip),%xmm9 # 5cf0 <_sk_callback_sse2+0x6c7>
+ DB 68,15,40,37,217,47,0,0 ; movaps 0x2fd9(%rip),%xmm12 # 5d00 <_sk_callback_sse2+0x6d7>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,221,47,0,0 ; addps 0x2fdd(%rip),%xmm10 # 5d40 <_sk_callback_sse2+0x6dd>
- DB 68,15,40,37,229,47,0,0 ; movaps 0x2fe5(%rip),%xmm12 # 5d50 <_sk_callback_sse2+0x6ed>
+ DB 68,15,88,21,217,47,0,0 ; addps 0x2fd9(%rip),%xmm10 # 5d10 <_sk_callback_sse2+0x6e7>
+ DB 68,15,40,37,225,47,0,0 ; movaps 0x2fe1(%rip),%xmm12 # 5d20 <_sk_callback_sse2+0x6f7>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -22118,22 +22226,22 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,207,47,0,0 ; movaps 0x2fcf(%rip),%xmm10 # 5d60 <_sk_callback_sse2+0x6fd>
+ DB 68,15,40,21,203,47,0,0 ; movaps 0x2fcb(%rip),%xmm10 # 5d30 <_sk_callback_sse2+0x707>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,195,47,0,0 ; addps 0x2fc3(%rip),%xmm9 # 5d70 <_sk_callback_sse2+0x70d>
- DB 68,15,40,37,203,47,0,0 ; movaps 0x2fcb(%rip),%xmm12 # 5d80 <_sk_callback_sse2+0x71d>
+ DB 68,15,88,13,191,47,0,0 ; addps 0x2fbf(%rip),%xmm9 # 5d40 <_sk_callback_sse2+0x717>
+ DB 68,15,40,37,199,47,0,0 ; movaps 0x2fc7(%rip),%xmm12 # 5d50 <_sk_callback_sse2+0x727>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,203,47,0,0 ; movaps 0x2fcb(%rip),%xmm12 # 5d90 <_sk_callback_sse2+0x72d>
+ DB 68,15,40,37,199,47,0,0 ; movaps 0x2fc7(%rip),%xmm12 # 5d60 <_sk_callback_sse2+0x737>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,207,47,0,0 ; movaps 0x2fcf(%rip),%xmm13 # 5da0 <_sk_callback_sse2+0x73d>
+ DB 68,15,40,45,203,47,0,0 ; movaps 0x2fcb(%rip),%xmm13 # 5d70 <_sk_callback_sse2+0x747>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,207,47,0,0 ; mulps 0x2fcf(%rip),%xmm13 # 5db0 <_sk_callback_sse2+0x74d>
+ DB 68,15,89,45,203,47,0,0 ; mulps 0x2fcb(%rip),%xmm13 # 5d80 <_sk_callback_sse2+0x757>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -22167,15 +22275,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,79,47,0,0 ; mulps 0x2f4f(%rip),%xmm9 # 5dc0 <_sk_callback_sse2+0x75d>
- DB 68,15,84,21,87,47,0,0 ; andps 0x2f57(%rip),%xmm10 # 5dd0 <_sk_callback_sse2+0x76d>
- DB 68,15,86,21,95,47,0,0 ; orps 0x2f5f(%rip),%xmm10 # 5de0 <_sk_callback_sse2+0x77d>
- DB 68,15,88,13,103,47,0,0 ; addps 0x2f67(%rip),%xmm9 # 5df0 <_sk_callback_sse2+0x78d>
- DB 68,15,40,37,111,47,0,0 ; movaps 0x2f6f(%rip),%xmm12 # 5e00 <_sk_callback_sse2+0x79d>
+ DB 68,15,89,13,75,47,0,0 ; mulps 0x2f4b(%rip),%xmm9 # 5d90 <_sk_callback_sse2+0x767>
+ DB 68,15,84,21,83,47,0,0 ; andps 0x2f53(%rip),%xmm10 # 5da0 <_sk_callback_sse2+0x777>
+ DB 68,15,86,21,91,47,0,0 ; orps 0x2f5b(%rip),%xmm10 # 5db0 <_sk_callback_sse2+0x787>
+ DB 68,15,88,13,99,47,0,0 ; addps 0x2f63(%rip),%xmm9 # 5dc0 <_sk_callback_sse2+0x797>
+ DB 68,15,40,37,107,47,0,0 ; movaps 0x2f6b(%rip),%xmm12 # 5dd0 <_sk_callback_sse2+0x7a7>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,111,47,0,0 ; addps 0x2f6f(%rip),%xmm10 # 5e10 <_sk_callback_sse2+0x7ad>
- DB 68,15,40,37,119,47,0,0 ; movaps 0x2f77(%rip),%xmm12 # 5e20 <_sk_callback_sse2+0x7bd>
+ DB 68,15,88,21,107,47,0,0 ; addps 0x2f6b(%rip),%xmm10 # 5de0 <_sk_callback_sse2+0x7b7>
+ DB 68,15,40,37,115,47,0,0 ; movaps 0x2f73(%rip),%xmm12 # 5df0 <_sk_callback_sse2+0x7c7>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -22183,22 +22291,22 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,97,47,0,0 ; movaps 0x2f61(%rip),%xmm10 # 5e30 <_sk_callback_sse2+0x7cd>
+ DB 68,15,40,21,93,47,0,0 ; movaps 0x2f5d(%rip),%xmm10 # 5e00 <_sk_callback_sse2+0x7d7>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,85,47,0,0 ; addps 0x2f55(%rip),%xmm9 # 5e40 <_sk_callback_sse2+0x7dd>
- DB 68,15,40,37,93,47,0,0 ; movaps 0x2f5d(%rip),%xmm12 # 5e50 <_sk_callback_sse2+0x7ed>
+ DB 68,15,88,13,81,47,0,0 ; addps 0x2f51(%rip),%xmm9 # 5e10 <_sk_callback_sse2+0x7e7>
+ DB 68,15,40,37,89,47,0,0 ; movaps 0x2f59(%rip),%xmm12 # 5e20 <_sk_callback_sse2+0x7f7>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,93,47,0,0 ; movaps 0x2f5d(%rip),%xmm12 # 5e60 <_sk_callback_sse2+0x7fd>
+ DB 68,15,40,37,89,47,0,0 ; movaps 0x2f59(%rip),%xmm12 # 5e30 <_sk_callback_sse2+0x807>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,97,47,0,0 ; movaps 0x2f61(%rip),%xmm13 # 5e70 <_sk_callback_sse2+0x80d>
+ DB 68,15,40,45,93,47,0,0 ; movaps 0x2f5d(%rip),%xmm13 # 5e40 <_sk_callback_sse2+0x817>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,97,47,0,0 ; mulps 0x2f61(%rip),%xmm13 # 5e80 <_sk_callback_sse2+0x81d>
+ DB 68,15,89,45,93,47,0,0 ; mulps 0x2f5d(%rip),%xmm13 # 5e50 <_sk_callback_sse2+0x827>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -22232,15 +22340,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,225,46,0,0 ; mulps 0x2ee1(%rip),%xmm9 # 5e90 <_sk_callback_sse2+0x82d>
- DB 68,15,84,21,233,46,0,0 ; andps 0x2ee9(%rip),%xmm10 # 5ea0 <_sk_callback_sse2+0x83d>
- DB 68,15,86,21,241,46,0,0 ; orps 0x2ef1(%rip),%xmm10 # 5eb0 <_sk_callback_sse2+0x84d>
- DB 68,15,88,13,249,46,0,0 ; addps 0x2ef9(%rip),%xmm9 # 5ec0 <_sk_callback_sse2+0x85d>
- DB 68,15,40,37,1,47,0,0 ; movaps 0x2f01(%rip),%xmm12 # 5ed0 <_sk_callback_sse2+0x86d>
+ DB 68,15,89,13,221,46,0,0 ; mulps 0x2edd(%rip),%xmm9 # 5e60 <_sk_callback_sse2+0x837>
+ DB 68,15,84,21,229,46,0,0 ; andps 0x2ee5(%rip),%xmm10 # 5e70 <_sk_callback_sse2+0x847>
+ DB 68,15,86,21,237,46,0,0 ; orps 0x2eed(%rip),%xmm10 # 5e80 <_sk_callback_sse2+0x857>
+ DB 68,15,88,13,245,46,0,0 ; addps 0x2ef5(%rip),%xmm9 # 5e90 <_sk_callback_sse2+0x867>
+ DB 68,15,40,37,253,46,0,0 ; movaps 0x2efd(%rip),%xmm12 # 5ea0 <_sk_callback_sse2+0x877>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,1,47,0,0 ; addps 0x2f01(%rip),%xmm10 # 5ee0 <_sk_callback_sse2+0x87d>
- DB 68,15,40,37,9,47,0,0 ; movaps 0x2f09(%rip),%xmm12 # 5ef0 <_sk_callback_sse2+0x88d>
+ DB 68,15,88,21,253,46,0,0 ; addps 0x2efd(%rip),%xmm10 # 5eb0 <_sk_callback_sse2+0x887>
+ DB 68,15,40,37,5,47,0,0 ; movaps 0x2f05(%rip),%xmm12 # 5ec0 <_sk_callback_sse2+0x897>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -22248,22 +22356,22 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,243,46,0,0 ; movaps 0x2ef3(%rip),%xmm10 # 5f00 <_sk_callback_sse2+0x89d>
+ DB 68,15,40,21,239,46,0,0 ; movaps 0x2eef(%rip),%xmm10 # 5ed0 <_sk_callback_sse2+0x8a7>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,231,46,0,0 ; addps 0x2ee7(%rip),%xmm9 # 5f10 <_sk_callback_sse2+0x8ad>
- DB 68,15,40,37,239,46,0,0 ; movaps 0x2eef(%rip),%xmm12 # 5f20 <_sk_callback_sse2+0x8bd>
+ DB 68,15,88,13,227,46,0,0 ; addps 0x2ee3(%rip),%xmm9 # 5ee0 <_sk_callback_sse2+0x8b7>
+ DB 68,15,40,37,235,46,0,0 ; movaps 0x2eeb(%rip),%xmm12 # 5ef0 <_sk_callback_sse2+0x8c7>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,239,46,0,0 ; movaps 0x2eef(%rip),%xmm12 # 5f30 <_sk_callback_sse2+0x8cd>
+ DB 68,15,40,37,235,46,0,0 ; movaps 0x2eeb(%rip),%xmm12 # 5f00 <_sk_callback_sse2+0x8d7>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,243,46,0,0 ; movaps 0x2ef3(%rip),%xmm13 # 5f40 <_sk_callback_sse2+0x8dd>
+ DB 68,15,40,45,239,46,0,0 ; movaps 0x2eef(%rip),%xmm13 # 5f10 <_sk_callback_sse2+0x8e7>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,243,46,0,0 ; mulps 0x2ef3(%rip),%xmm13 # 5f50 <_sk_callback_sse2+0x8ed>
+ DB 68,15,89,45,239,46,0,0 ; mulps 0x2eef(%rip),%xmm13 # 5f20 <_sk_callback_sse2+0x8f7>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -22297,15 +22405,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,115,46,0,0 ; mulps 0x2e73(%rip),%xmm9 # 5f60 <_sk_callback_sse2+0x8fd>
- DB 68,15,84,21,123,46,0,0 ; andps 0x2e7b(%rip),%xmm10 # 5f70 <_sk_callback_sse2+0x90d>
- DB 68,15,86,21,131,46,0,0 ; orps 0x2e83(%rip),%xmm10 # 5f80 <_sk_callback_sse2+0x91d>
- DB 68,15,88,13,139,46,0,0 ; addps 0x2e8b(%rip),%xmm9 # 5f90 <_sk_callback_sse2+0x92d>
- DB 68,15,40,37,147,46,0,0 ; movaps 0x2e93(%rip),%xmm12 # 5fa0 <_sk_callback_sse2+0x93d>
+ DB 68,15,89,13,111,46,0,0 ; mulps 0x2e6f(%rip),%xmm9 # 5f30 <_sk_callback_sse2+0x907>
+ DB 68,15,84,21,119,46,0,0 ; andps 0x2e77(%rip),%xmm10 # 5f40 <_sk_callback_sse2+0x917>
+ DB 68,15,86,21,127,46,0,0 ; orps 0x2e7f(%rip),%xmm10 # 5f50 <_sk_callback_sse2+0x927>
+ DB 68,15,88,13,135,46,0,0 ; addps 0x2e87(%rip),%xmm9 # 5f60 <_sk_callback_sse2+0x937>
+ DB 68,15,40,37,143,46,0,0 ; movaps 0x2e8f(%rip),%xmm12 # 5f70 <_sk_callback_sse2+0x947>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,147,46,0,0 ; addps 0x2e93(%rip),%xmm10 # 5fb0 <_sk_callback_sse2+0x94d>
- DB 68,15,40,37,155,46,0,0 ; movaps 0x2e9b(%rip),%xmm12 # 5fc0 <_sk_callback_sse2+0x95d>
+ DB 68,15,88,21,143,46,0,0 ; addps 0x2e8f(%rip),%xmm10 # 5f80 <_sk_callback_sse2+0x957>
+ DB 68,15,40,37,151,46,0,0 ; movaps 0x2e97(%rip),%xmm12 # 5f90 <_sk_callback_sse2+0x967>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -22313,22 +22421,22 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,133,46,0,0 ; movaps 0x2e85(%rip),%xmm10 # 5fd0 <_sk_callback_sse2+0x96d>
+ DB 68,15,40,21,129,46,0,0 ; movaps 0x2e81(%rip),%xmm10 # 5fa0 <_sk_callback_sse2+0x977>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,121,46,0,0 ; addps 0x2e79(%rip),%xmm9 # 5fe0 <_sk_callback_sse2+0x97d>
- DB 68,15,40,37,129,46,0,0 ; movaps 0x2e81(%rip),%xmm12 # 5ff0 <_sk_callback_sse2+0x98d>
+ DB 68,15,88,13,117,46,0,0 ; addps 0x2e75(%rip),%xmm9 # 5fb0 <_sk_callback_sse2+0x987>
+ DB 68,15,40,37,125,46,0,0 ; movaps 0x2e7d(%rip),%xmm12 # 5fc0 <_sk_callback_sse2+0x997>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,129,46,0,0 ; movaps 0x2e81(%rip),%xmm12 # 6000 <_sk_callback_sse2+0x99d>
+ DB 68,15,40,37,125,46,0,0 ; movaps 0x2e7d(%rip),%xmm12 # 5fd0 <_sk_callback_sse2+0x9a7>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,133,46,0,0 ; movaps 0x2e85(%rip),%xmm13 # 6010 <_sk_callback_sse2+0x9ad>
+ DB 68,15,40,45,129,46,0,0 ; movaps 0x2e81(%rip),%xmm13 # 5fe0 <_sk_callback_sse2+0x9b7>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,133,46,0,0 ; mulps 0x2e85(%rip),%xmm13 # 6020 <_sk_callback_sse2+0x9bd>
+ DB 68,15,89,45,129,46,0,0 ; mulps 0x2e81(%rip),%xmm13 # 5ff0 <_sk_callback_sse2+0x9c7>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -22343,29 +22451,29 @@ _sk_parametric_a_sse2 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
- DB 15,89,5,98,46,0,0 ; mulps 0x2e62(%rip),%xmm0 # 6030 <_sk_callback_sse2+0x9cd>
- DB 68,15,40,5,106,46,0,0 ; movaps 0x2e6a(%rip),%xmm8 # 6040 <_sk_callback_sse2+0x9dd>
+ DB 15,89,5,94,46,0,0 ; mulps 0x2e5e(%rip),%xmm0 # 6000 <_sk_callback_sse2+0x9d7>
+ DB 68,15,40,5,102,46,0,0 ; movaps 0x2e66(%rip),%xmm8 # 6010 <_sk_callback_sse2+0x9e7>
DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 68,15,40,13,110,46,0,0 ; movaps 0x2e6e(%rip),%xmm9 # 6050 <_sk_callback_sse2+0x9ed>
+ DB 68,15,40,13,106,46,0,0 ; movaps 0x2e6a(%rip),%xmm9 # 6020 <_sk_callback_sse2+0x9f7>
DB 65,15,88,201 ; addps %xmm9,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 15,88,5,107,46,0,0 ; addps 0x2e6b(%rip),%xmm0 # 6060 <_sk_callback_sse2+0x9fd>
- DB 15,89,5,116,46,0,0 ; mulps 0x2e74(%rip),%xmm0 # 6070 <_sk_callback_sse2+0xa0d>
- DB 15,89,13,125,46,0,0 ; mulps 0x2e7d(%rip),%xmm1 # 6080 <_sk_callback_sse2+0xa1d>
+ DB 15,88,5,103,46,0,0 ; addps 0x2e67(%rip),%xmm0 # 6030 <_sk_callback_sse2+0xa07>
+ DB 15,89,5,112,46,0,0 ; mulps 0x2e70(%rip),%xmm0 # 6040 <_sk_callback_sse2+0xa17>
+ DB 15,89,13,121,46,0,0 ; mulps 0x2e79(%rip),%xmm1 # 6050 <_sk_callback_sse2+0xa27>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,21,131,46,0,0 ; mulps 0x2e83(%rip),%xmm2 # 6090 <_sk_callback_sse2+0xa2d>
+ DB 15,89,21,127,46,0,0 ; mulps 0x2e7f(%rip),%xmm2 # 6060 <_sk_callback_sse2+0xa37>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 68,15,92,202 ; subps %xmm2,%xmm9
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
DB 68,15,89,225 ; mulps %xmm1,%xmm12
- DB 15,40,21,120,46,0,0 ; movaps 0x2e78(%rip),%xmm2 # 60a0 <_sk_callback_sse2+0xa3d>
+ DB 15,40,21,116,46,0,0 ; movaps 0x2e74(%rip),%xmm2 # 6070 <_sk_callback_sse2+0xa47>
DB 68,15,40,194 ; movaps %xmm2,%xmm8
DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8
- DB 68,15,40,21,119,46,0,0 ; movaps 0x2e77(%rip),%xmm10 # 60b0 <_sk_callback_sse2+0xa4d>
+ DB 68,15,40,21,115,46,0,0 ; movaps 0x2e73(%rip),%xmm10 # 6080 <_sk_callback_sse2+0xa57>
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,40,29,123,46,0,0 ; movaps 0x2e7b(%rip),%xmm11 # 60c0 <_sk_callback_sse2+0xa5d>
+ DB 68,15,40,29,119,46,0,0 ; movaps 0x2e77(%rip),%xmm11 # 6090 <_sk_callback_sse2+0xa67>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 69,15,84,224 ; andps %xmm8,%xmm12
DB 68,15,85,193 ; andnps %xmm1,%xmm8
@@ -22389,8 +22497,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,84,194 ; andps %xmm2,%xmm0
DB 65,15,85,209 ; andnps %xmm9,%xmm2
DB 15,86,208 ; orps %xmm0,%xmm2
- DB 68,15,89,5,43,46,0,0 ; mulps 0x2e2b(%rip),%xmm8 # 60d0 <_sk_callback_sse2+0xa6d>
- DB 15,89,21,52,46,0,0 ; mulps 0x2e34(%rip),%xmm2 # 60e0 <_sk_callback_sse2+0xa7d>
+ DB 68,15,89,5,39,46,0,0 ; mulps 0x2e27(%rip),%xmm8 # 60a0 <_sk_callback_sse2+0xa77>
+ DB 15,89,21,48,46,0,0 ; mulps 0x2e30(%rip),%xmm2 # 60b0 <_sk_callback_sse2+0xa87>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -22400,39 +22508,39 @@ _sk_load_a8_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,45 ; jne 32eb <_sk_load_a8_sse2+0x37>
+ DB 117,46 ; jne 32c0 <_sk_load_a8_sse2+0x38>
DB 102,65,15,110,4,18 ; movd (%r10,%rdx,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,28,46,0,0 ; pand 0x2e1c(%rip),%xmm0 # 60f0 <_sk_callback_sse2+0xa8d>
+ DB 102,15,219,5,24,46,0,0 ; pand 0x2e18(%rip),%xmm0 # 60c0 <_sk_callback_sse2+0xa97>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,34,46,0,0 ; mulps 0x2e22(%rip),%xmm3 # 6100 <_sk_callback_sse2+0xa9d>
+ DB 15,89,29,30,46,0,0 ; mulps 0x2e1e(%rip),%xmm3 # 60d0 <_sk_callback_sse2+0xaa7>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 15,87,201 ; xorps %xmm1,%xmm1
+ DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,48 ; je 332c <_sk_load_a8_sse2+0x78>
+ DB 116,54 ; je 3303 <_sk_load_a8_sse2+0x7b>
+ DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 3317 <_sk_load_a8_sse2+0x63>
+ DB 116,21 ; je 32ec <_sk_load_a8_sse2+0x64>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,196 ; jne 32cc <_sk_load_a8_sse2+0x18>
+ DB 117,195 ; jne 32a0 <_sk_load_a8_sse2+0x18>
DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
- DB 65,15,182,68,18,1 ; movzbl 0x1(%r10,%rdx,1),%eax
+ DB 65,15,183,4,18 ; movzwl (%r10,%rdx,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 15,198,200,0 ; shufps $0x0,%xmm0,%xmm1
- DB 15,198,200,226 ; shufps $0xe2,%xmm0,%xmm1
- DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
+ DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
+ DB 242,15,16,193 ; movsd %xmm1,%xmm0
+ DB 235,157 ; jmp 32a0 <_sk_load_a8_sse2+0x18>
DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax
- DB 102,15,110,200 ; movd %eax,%xmm1
- DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 235,145 ; jmp 32cc <_sk_load_a8_sse2+0x18>
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 235,146 ; jmp 32a0 <_sk_load_a8_sse2+0x18>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -22472,7 +22580,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,66,45,0,0 ; mulps 0x2d42(%rip),%xmm3 # 6110 <_sk_callback_sse2+0xaad>
+ DB 15,89,29,63,45,0,0 ; mulps 0x2d3f(%rip),%xmm3 # 60e0 <_sk_callback_sse2+0xab7>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -22483,10 +22591,10 @@ _sk_gather_a8_sse2 LABEL PROC
PUBLIC _sk_store_a8_sse2
_sk_store_a8_sse2 LABEL PROC
- DB 72,131,236,56 ; sub $0x38,%rsp
+ DB 72,131,236,40 ; sub $0x28,%rsp
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 68,15,40,5,48,45,0,0 ; movaps 0x2d30(%rip),%xmm8 # 6120 <_sk_callback_sse2+0xabd>
+ DB 68,15,40,5,45,45,0,0 ; movaps 0x2d2d(%rip),%xmm8 # 60f0 <_sk_callback_sse2+0xac7>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8
@@ -22494,71 +22602,74 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 3425 <_sk_store_a8_sse2+0x46>
+ DB 117,17 ; jne 33f8 <_sk_store_a8_sse2+0x46>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 65,137,4,18 ; mov %eax,(%r10,%rdx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 72,131,196,56 ; add $0x38,%rsp
+ DB 72,131,196,40 ; add $0x28,%rsp
DB 255,224 ; jmpq *%rax
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,44 ; je 3468 <_sk_store_a8_sse2+0x89>
+ DB 116,59 ; je 344a <_sk_store_a8_sse2+0x98>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,22 ; je 3458 <_sk_store_a8_sse2+0x79>
+ DB 116,22 ; je 342b <_sk_store_a8_sse2+0x79>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,213 ; jne 341d <_sk_store_a8_sse2+0x3e>
- DB 102,68,15,127,68,36,32 ; movdqa %xmm8,0x20(%rsp)
- DB 138,68,36,40 ; mov 0x28(%rsp),%al
- DB 65,136,68,18,2 ; mov %al,0x2(%r10,%rdx,1)
+ DB 117,213 ; jne 33f0 <_sk_store_a8_sse2+0x3e>
DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp)
- DB 138,68,36,20 ; mov 0x14(%rsp),%al
- DB 65,136,68,18,1 ; mov %al,0x1(%r10,%rdx,1)
+ DB 138,68,36,24 ; mov 0x18(%rsp),%al
+ DB 65,136,68,18,2 ; mov %al,0x2(%r10,%rdx,1)
+ DB 102,68,15,219,5,204,44,0,0 ; pand 0x2ccc(%rip),%xmm8 # 6100 <_sk_callback_sse2+0xad7>
+ DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
+ DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
+ DB 102,68,15,126,192 ; movd %xmm8,%eax
+ DB 102,65,137,4,18 ; mov %ax,(%r10,%rdx,1)
+ DB 235,166 ; jmp 33f0 <_sk_store_a8_sse2+0x3e>
DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 65,136,4,18 ; mov %al,(%r10,%rdx,1)
- DB 235,166 ; jmp 341d <_sk_store_a8_sse2+0x3e>
+ DB 235,151 ; jmp 33f0 <_sk_store_a8_sse2+0x3e>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 34b2 <_sk_load_g8_sse2+0x3b>
+ DB 117,49 ; jne 3494 <_sk_load_g8_sse2+0x3b>
DB 102,65,15,110,4,18 ; movd (%r10,%rdx,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,153,44,0,0 ; pand 0x2c99(%rip),%xmm0 # 6130 <_sk_callback_sse2+0xacd>
+ DB 102,15,219,5,151,44,0,0 ; pand 0x2c97(%rip),%xmm0 # 6110 <_sk_callback_sse2+0xae7>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,159,44,0,0 ; mulps 0x2c9f(%rip),%xmm0 # 6140 <_sk_callback_sse2+0xadd>
+ DB 15,89,5,157,44,0,0 ; mulps 0x2c9d(%rip),%xmm0 # 6120 <_sk_callback_sse2+0xaf7>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,166,44,0,0 ; movaps 0x2ca6(%rip),%xmm3 # 6150 <_sk_callback_sse2+0xaed>
+ DB 15,40,29,164,44,0,0 ; movaps 0x2ca4(%rip),%xmm3 # 6130 <_sk_callback_sse2+0xb07>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,48 ; je 34f3 <_sk_load_g8_sse2+0x7c>
+ DB 116,54 ; je 34d7 <_sk_load_g8_sse2+0x7e>
+ DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 34de <_sk_load_g8_sse2+0x67>
+ DB 116,21 ; je 34c0 <_sk_load_g8_sse2+0x67>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,192 ; jne 348f <_sk_load_g8_sse2+0x18>
+ DB 117,192 ; jne 3471 <_sk_load_g8_sse2+0x18>
DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
- DB 65,15,182,68,18,1 ; movzbl 0x1(%r10,%rdx,1),%eax
+ DB 65,15,183,4,18 ; movzwl (%r10,%rdx,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 15,198,200,0 ; shufps $0x0,%xmm0,%xmm1
- DB 15,198,200,226 ; shufps $0xe2,%xmm0,%xmm1
- DB 15,40,193 ; movaps %xmm1,%xmm0
+ DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
+ DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
+ DB 242,15,16,193 ; movsd %xmm1,%xmm0
+ DB 235,154 ; jmp 3471 <_sk_load_g8_sse2+0x18>
DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax
- DB 102,15,110,200 ; movd %eax,%xmm1
- DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 235,141 ; jmp 348f <_sk_load_g8_sse2+0x18>
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 235,143 ; jmp 3471 <_sk_load_g8_sse2+0x18>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -22598,9 +22709,9 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,203,43,0,0 ; mulps 0x2bcb(%rip),%xmm0 # 6160 <_sk_callback_sse2+0xafd>
+ DB 15,89,5,203,43,0,0 ; mulps 0x2bcb(%rip),%xmm0 # 6140 <_sk_callback_sse2+0xb17>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,210,43,0,0 ; movaps 0x2bd2(%rip),%xmm3 # 6170 <_sk_callback_sse2+0xb0d>
+ DB 15,40,29,210,43,0,0 ; movaps 0x2bd2(%rip),%xmm3 # 6150 <_sk_callback_sse2+0xb27>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -22612,9 +22723,9 @@ _sk_gather_i8_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 73,137,193 ; mov %rax,%r9
DB 77,133,201 ; test %r9,%r9
- DB 116,5 ; je 35b7 <_sk_gather_i8_sse2+0xf>
+ DB 116,5 ; je 3597 <_sk_gather_i8_sse2+0xf>
DB 76,137,200 ; mov %r9,%rax
- DB 235,2 ; jmp 35b9 <_sk_gather_i8_sse2+0x11>
+ DB 235,2 ; jmp 3599 <_sk_gather_i8_sse2+0x11>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 85 ; push %rbp
DB 65,86 ; push %r14
@@ -22666,11 +22777,11 @@ _sk_gather_i8_sse2 LABEL PROC
DB 102,66,15,110,76,149,0 ; movd 0x0(%rbp,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,235,42,0,0 ; movdqa 0x2aeb(%rip),%xmm2 # 6180 <_sk_callback_sse2+0xb1d>
+ DB 102,15,111,21,235,42,0,0 ; movdqa 0x2aeb(%rip),%xmm2 # 6160 <_sk_callback_sse2+0xb37>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,231,42,0,0 ; movaps 0x2ae7(%rip),%xmm8 # 6190 <_sk_callback_sse2+0xb2d>
+ DB 68,15,40,5,231,42,0,0 ; movaps 0x2ae7(%rip),%xmm8 # 6170 <_sk_callback_sse2+0xb47>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -22696,44 +22807,42 @@ _sk_load_565_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,83 ; jne 374a <_sk_load_565_sse2+0x5d>
+ DB 117,83 ; jne 372a <_sk_load_565_sse2+0x5d>
DB 243,65,15,126,20,82 ; movq (%r10,%rdx,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,151,42,0,0 ; movdqa 0x2a97(%rip),%xmm0 # 61a0 <_sk_callback_sse2+0xb3d>
+ DB 102,15,111,5,151,42,0,0 ; movdqa 0x2a97(%rip),%xmm0 # 6180 <_sk_callback_sse2+0xb57>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,153,42,0,0 ; mulps 0x2a99(%rip),%xmm0 # 61b0 <_sk_callback_sse2+0xb4d>
- DB 102,15,111,13,161,42,0,0 ; movdqa 0x2aa1(%rip),%xmm1 # 61c0 <_sk_callback_sse2+0xb5d>
+ DB 15,89,5,153,42,0,0 ; mulps 0x2a99(%rip),%xmm0 # 6190 <_sk_callback_sse2+0xb67>
+ DB 102,15,111,13,161,42,0,0 ; movdqa 0x2aa1(%rip),%xmm1 # 61a0 <_sk_callback_sse2+0xb77>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,163,42,0,0 ; mulps 0x2aa3(%rip),%xmm1 # 61d0 <_sk_callback_sse2+0xb6d>
- DB 102,15,219,21,171,42,0,0 ; pand 0x2aab(%rip),%xmm2 # 61e0 <_sk_callback_sse2+0xb7d>
+ DB 15,89,13,163,42,0,0 ; mulps 0x2aa3(%rip),%xmm1 # 61b0 <_sk_callback_sse2+0xb87>
+ DB 102,15,219,21,171,42,0,0 ; pand 0x2aab(%rip),%xmm2 # 61c0 <_sk_callback_sse2+0xb97>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,177,42,0,0 ; mulps 0x2ab1(%rip),%xmm2 # 61f0 <_sk_callback_sse2+0xb8d>
+ DB 15,89,21,177,42,0,0 ; mulps 0x2ab1(%rip),%xmm2 # 61d0 <_sk_callback_sse2+0xba7>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,184,42,0,0 ; movaps 0x2ab8(%rip),%xmm3 # 6200 <_sk_callback_sse2+0xb9d>
+ DB 15,40,29,184,42,0,0 ; movaps 0x2ab8(%rip),%xmm3 # 61e0 <_sk_callback_sse2+0xbb7>
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,48 ; je 378b <_sk_load_565_sse2+0x9e>
+ DB 116,50 ; je 3769 <_sk_load_565_sse2+0x9c>
+ DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 3776 <_sk_load_565_sse2+0x89>
+ DB 116,21 ; je 3756 <_sk_load_565_sse2+0x89>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,154 ; jne 3701 <_sk_load_565_sse2+0x14>
+ DB 117,154 ; jne 36e1 <_sk_load_565_sse2+0x14>
DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
- DB 65,15,183,68,82,2 ; movzwl 0x2(%r10,%rdx,2),%eax
- DB 102,15,110,192 ; movd %eax,%xmm0
- DB 15,198,194,0 ; shufps $0x0,%xmm2,%xmm0
- DB 15,198,194,226 ; shufps $0xe2,%xmm2,%xmm0
- DB 15,40,208 ; movaps %xmm0,%xmm2
+ DB 102,65,15,110,4,82 ; movd (%r10,%rdx,2),%xmm0
+ DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
+ DB 242,15,16,208 ; movsd %xmm0,%xmm2
+ DB 233,120,255,255,255 ; jmpq 36e1 <_sk_load_565_sse2+0x14>
DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax
- DB 102,15,110,192 ; movd %eax,%xmm0
- DB 243,15,16,208 ; movss %xmm0,%xmm2
- DB 233,100,255,255,255 ; jmpq 3701 <_sk_load_565_sse2+0x14>
+ DB 102,15,110,208 ; movd %eax,%xmm2
+ DB 233,106,255,255,255 ; jmpq 36e1 <_sk_load_565_sse2+0x14>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -22766,19 +22875,19 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,237,41,0,0 ; movdqa 0x29ed(%rip),%xmm0 # 6210 <_sk_callback_sse2+0xbad>
+ DB 102,15,111,5,243,41,0,0 ; movdqa 0x29f3(%rip),%xmm0 # 61f0 <_sk_callback_sse2+0xbc7>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,239,41,0,0 ; mulps 0x29ef(%rip),%xmm0 # 6220 <_sk_callback_sse2+0xbbd>
- DB 102,15,111,13,247,41,0,0 ; movdqa 0x29f7(%rip),%xmm1 # 6230 <_sk_callback_sse2+0xbcd>
+ DB 15,89,5,245,41,0,0 ; mulps 0x29f5(%rip),%xmm0 # 6200 <_sk_callback_sse2+0xbd7>
+ DB 102,15,111,13,253,41,0,0 ; movdqa 0x29fd(%rip),%xmm1 # 6210 <_sk_callback_sse2+0xbe7>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,249,41,0,0 ; mulps 0x29f9(%rip),%xmm1 # 6240 <_sk_callback_sse2+0xbdd>
- DB 102,15,219,21,1,42,0,0 ; pand 0x2a01(%rip),%xmm2 # 6250 <_sk_callback_sse2+0xbed>
+ DB 15,89,13,255,41,0,0 ; mulps 0x29ff(%rip),%xmm1 # 6220 <_sk_callback_sse2+0xbf7>
+ DB 102,15,219,21,7,42,0,0 ; pand 0x2a07(%rip),%xmm2 # 6230 <_sk_callback_sse2+0xc07>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,7,42,0,0 ; mulps 0x2a07(%rip),%xmm2 # 6260 <_sk_callback_sse2+0xbfd>
+ DB 15,89,21,13,42,0,0 ; mulps 0x2a0d(%rip),%xmm2 # 6240 <_sk_callback_sse2+0xc17>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,14,42,0,0 ; movaps 0x2a0e(%rip),%xmm3 # 6270 <_sk_callback_sse2+0xc0d>
+ DB 15,40,29,20,42,0,0 ; movaps 0x2a14(%rip),%xmm3 # 6250 <_sk_callback_sse2+0xc27>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -22786,12 +22895,12 @@ PUBLIC _sk_store_565_sse2
_sk_store_565_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 68,15,40,5,14,42,0,0 ; movaps 0x2a0e(%rip),%xmm8 # 6280 <_sk_callback_sse2+0xc1d>
+ DB 68,15,40,5,20,42,0,0 ; movaps 0x2a14(%rip),%xmm8 # 6260 <_sk_callback_sse2+0xc37>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,3,42,0,0 ; movaps 0x2a03(%rip),%xmm10 # 6290 <_sk_callback_sse2+0xc2d>
+ DB 68,15,40,21,9,42,0,0 ; movaps 0x2a09(%rip),%xmm10 # 6270 <_sk_callback_sse2+0xc47>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -22803,7 +22912,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 38cf <_sk_store_565_sse2+0x6a>
+ DB 117,10 ; jne 38a9 <_sk_store_565_sse2+0x6a>
DB 242,69,15,17,4,82 ; movsd %xmm8,(%r10,%rdx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22811,65 +22920,64 @@ _sk_store_565_sse2 LABEL PROC
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,36 ; je 3905 <_sk_store_565_sse2+0xa0>
+ DB 116,38 ; je 38e1 <_sk_store_565_sse2+0xa2>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 38f9 <_sk_store_565_sse2+0x94>
+ DB 116,18 ; je 38d3 <_sk_store_565_sse2+0x94>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,222 ; jne 38cb <_sk_store_565_sse2+0x66>
+ DB 117,222 ; jne 38a5 <_sk_store_565_sse2+0x66>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,65,137,68,82,4 ; mov %ax,0x4(%r10,%rdx,2)
- DB 102,65,15,197,192,2 ; pextrw $0x2,%xmm8,%eax
- DB 102,65,137,68,82,2 ; mov %ax,0x2(%r10,%rdx,2)
+ DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
+ DB 102,69,15,126,4,82 ; movd %xmm8,(%r10,%rdx,2)
+ DB 235,196 ; jmp 38a5 <_sk_store_565_sse2+0x66>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,65,137,4,82 ; mov %ax,(%r10,%rdx,2)
- DB 235,186 ; jmp 38cb <_sk_store_565_sse2+0x66>
+ DB 235,184 ; jmp 38a5 <_sk_store_565_sse2+0x66>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 397d <_sk_load_4444_sse2+0x6c>
+ DB 117,98 ; jne 3959 <_sk_load_4444_sse2+0x6c>
DB 243,65,15,126,28,82 ; movq (%r10,%rdx,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,115,41,0,0 ; movdqa 0x2973(%rip),%xmm0 # 62a0 <_sk_callback_sse2+0xc3d>
+ DB 102,15,111,5,119,41,0,0 ; movdqa 0x2977(%rip),%xmm0 # 6280 <_sk_callback_sse2+0xc57>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,117,41,0,0 ; mulps 0x2975(%rip),%xmm0 # 62b0 <_sk_callback_sse2+0xc4d>
- DB 102,15,111,13,125,41,0,0 ; movdqa 0x297d(%rip),%xmm1 # 62c0 <_sk_callback_sse2+0xc5d>
+ DB 15,89,5,121,41,0,0 ; mulps 0x2979(%rip),%xmm0 # 6290 <_sk_callback_sse2+0xc67>
+ DB 102,15,111,13,129,41,0,0 ; movdqa 0x2981(%rip),%xmm1 # 62a0 <_sk_callback_sse2+0xc77>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,127,41,0,0 ; mulps 0x297f(%rip),%xmm1 # 62d0 <_sk_callback_sse2+0xc6d>
- DB 102,15,111,21,135,41,0,0 ; movdqa 0x2987(%rip),%xmm2 # 62e0 <_sk_callback_sse2+0xc7d>
+ DB 15,89,13,131,41,0,0 ; mulps 0x2983(%rip),%xmm1 # 62b0 <_sk_callback_sse2+0xc87>
+ DB 102,15,111,21,139,41,0,0 ; movdqa 0x298b(%rip),%xmm2 # 62c0 <_sk_callback_sse2+0xc97>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,137,41,0,0 ; mulps 0x2989(%rip),%xmm2 # 62f0 <_sk_callback_sse2+0xc8d>
- DB 102,15,219,29,145,41,0,0 ; pand 0x2991(%rip),%xmm3 # 6300 <_sk_callback_sse2+0xc9d>
+ DB 15,89,21,141,41,0,0 ; mulps 0x298d(%rip),%xmm2 # 62d0 <_sk_callback_sse2+0xca7>
+ DB 102,15,219,29,149,41,0,0 ; pand 0x2995(%rip),%xmm3 # 62e0 <_sk_callback_sse2+0xcb7>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,151,41,0,0 ; mulps 0x2997(%rip),%xmm3 # 6310 <_sk_callback_sse2+0xcad>
+ DB 15,89,29,155,41,0,0 ; mulps 0x299b(%rip),%xmm3 # 62f0 <_sk_callback_sse2+0xcc7>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,48 ; je 39be <_sk_load_4444_sse2+0xad>
+ DB 116,50 ; je 3998 <_sk_load_4444_sse2+0xab>
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,21 ; je 39a9 <_sk_load_4444_sse2+0x98>
+ DB 116,21 ; je 3985 <_sk_load_4444_sse2+0x98>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,139 ; jne 3925 <_sk_load_4444_sse2+0x14>
+ DB 117,139 ; jne 3901 <_sk_load_4444_sse2+0x14>
DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
- DB 65,15,183,68,82,2 ; movzwl 0x2(%r10,%rdx,2),%eax
- DB 102,15,110,192 ; movd %eax,%xmm0
- DB 15,198,195,0 ; shufps $0x0,%xmm3,%xmm0
- DB 15,198,195,226 ; shufps $0xe2,%xmm3,%xmm0
- DB 15,40,216 ; movaps %xmm0,%xmm3
+ DB 102,65,15,110,4,82 ; movd (%r10,%rdx,2),%xmm0
+ DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
+ DB 242,15,16,216 ; movsd %xmm0,%xmm3
+ DB 233,105,255,255,255 ; jmpq 3901 <_sk_load_4444_sse2+0x14>
DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax
- DB 102,15,110,192 ; movd %eax,%xmm0
- DB 243,15,16,216 ; movss %xmm0,%xmm3
- DB 233,85,255,255,255 ; jmpq 3925 <_sk_load_4444_sse2+0x14>
+ DB 102,15,110,216 ; movd %eax,%xmm3
+ DB 233,91,255,255,255 ; jmpq 3901 <_sk_load_4444_sse2+0x14>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -22902,21 +23010,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,202,40,0,0 ; movdqa 0x28ca(%rip),%xmm0 # 6320 <_sk_callback_sse2+0xcbd>
+ DB 102,15,111,5,212,40,0,0 ; movdqa 0x28d4(%rip),%xmm0 # 6300 <_sk_callback_sse2+0xcd7>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,204,40,0,0 ; mulps 0x28cc(%rip),%xmm0 # 6330 <_sk_callback_sse2+0xccd>
- DB 102,15,111,13,212,40,0,0 ; movdqa 0x28d4(%rip),%xmm1 # 6340 <_sk_callback_sse2+0xcdd>
+ DB 15,89,5,214,40,0,0 ; mulps 0x28d6(%rip),%xmm0 # 6310 <_sk_callback_sse2+0xce7>
+ DB 102,15,111,13,222,40,0,0 ; movdqa 0x28de(%rip),%xmm1 # 6320 <_sk_callback_sse2+0xcf7>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,214,40,0,0 ; mulps 0x28d6(%rip),%xmm1 # 6350 <_sk_callback_sse2+0xced>
- DB 102,15,111,21,222,40,0,0 ; movdqa 0x28de(%rip),%xmm2 # 6360 <_sk_callback_sse2+0xcfd>
+ DB 15,89,13,224,40,0,0 ; mulps 0x28e0(%rip),%xmm1 # 6330 <_sk_callback_sse2+0xd07>
+ DB 102,15,111,21,232,40,0,0 ; movdqa 0x28e8(%rip),%xmm2 # 6340 <_sk_callback_sse2+0xd17>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,224,40,0,0 ; mulps 0x28e0(%rip),%xmm2 # 6370 <_sk_callback_sse2+0xd0d>
- DB 102,15,219,29,232,40,0,0 ; pand 0x28e8(%rip),%xmm3 # 6380 <_sk_callback_sse2+0xd1d>
+ DB 15,89,21,234,40,0,0 ; mulps 0x28ea(%rip),%xmm2 # 6350 <_sk_callback_sse2+0xd27>
+ DB 102,15,219,29,242,40,0,0 ; pand 0x28f2(%rip),%xmm3 # 6360 <_sk_callback_sse2+0xd37>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,238,40,0,0 ; mulps 0x28ee(%rip),%xmm3 # 6390 <_sk_callback_sse2+0xd2d>
+ DB 15,89,29,248,40,0,0 ; mulps 0x28f8(%rip),%xmm3 # 6370 <_sk_callback_sse2+0xd47>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -22925,7 +23033,7 @@ PUBLIC _sk_store_4444_sse2
_sk_store_4444_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,16 ; mov (%rax),%r10
- DB 68,15,40,5,236,40,0,0 ; movaps 0x28ec(%rip),%xmm8 # 63a0 <_sk_callback_sse2+0xd3d>
+ DB 68,15,40,5,246,40,0,0 ; movaps 0x28f6(%rip),%xmm8 # 6380 <_sk_callback_sse2+0xd57>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -22947,7 +23055,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3b25 <_sk_store_4444_sse2+0x7e>
+ DB 117,10 ; jne 3afb <_sk_store_4444_sse2+0x7e>
DB 242,69,15,17,4,82 ; movsd %xmm8,(%r10,%rdx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22955,31 +23063,32 @@ _sk_store_4444_sse2 LABEL PROC
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,36 ; je 3b5b <_sk_store_4444_sse2+0xb4>
+ DB 116,38 ; je 3b33 <_sk_store_4444_sse2+0xb6>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 3b4f <_sk_store_4444_sse2+0xa8>
+ DB 116,18 ; je 3b25 <_sk_store_4444_sse2+0xa8>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,222 ; jne 3b21 <_sk_store_4444_sse2+0x7a>
+ DB 117,222 ; jne 3af7 <_sk_store_4444_sse2+0x7a>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,65,137,68,82,4 ; mov %ax,0x4(%r10,%rdx,2)
- DB 102,65,15,197,192,2 ; pextrw $0x2,%xmm8,%eax
- DB 102,65,137,68,82,2 ; mov %ax,0x2(%r10,%rdx,2)
+ DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
+ DB 102,69,15,126,4,82 ; movd %xmm8,(%r10,%rdx,2)
+ DB 235,196 ; jmp 3af7 <_sk_store_4444_sse2+0x7a>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,65,137,4,82 ; mov %ax,(%r10,%rdx,2)
- DB 235,186 ; jmp 3b21 <_sk_store_4444_sse2+0x7a>
+ DB 235,184 ; jmp 3af7 <_sk_store_4444_sse2+0x7a>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 3bd3 <_sk_load_8888_sse2+0x6c>
+ DB 117,98 ; jne 3bab <_sk_load_8888_sse2+0x6c>
DB 243,68,15,111,12,144 ; movdqu (%rax,%rdx,4),%xmm9
- DB 102,15,111,21,49,40,0,0 ; movdqa 0x2831(%rip),%xmm2 # 63b0 <_sk_callback_sse2+0xd4d>
+ DB 102,15,111,21,57,40,0,0 ; movdqa 0x2839(%rip),%xmm2 # 6390 <_sk_callback_sse2+0xd67>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,45,40,0,0 ; movaps 0x282d(%rip),%xmm8 # 63c0 <_sk_callback_sse2+0xd5d>
+ DB 68,15,40,5,53,40,0,0 ; movaps 0x2835(%rip),%xmm8 # 63a0 <_sk_callback_sse2+0xd77>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -22998,22 +23107,19 @@ _sk_load_8888_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
- DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,44 ; je 3c11 <_sk_load_8888_sse2+0xaa>
+ DB 116,40 ; je 3be0 <_sk_load_8888_sse2+0xa1>
+ DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,18 ; je 3bfd <_sk_load_8888_sse2+0x96>
+ DB 116,18 ; je 3bd5 <_sk_load_8888_sse2+0x96>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,134 ; jne 3b77 <_sk_load_8888_sse2+0x10>
+ DB 117,134 ; jne 3b4f <_sk_load_8888_sse2+0x10>
DB 102,15,110,68,144,8 ; movd 0x8(%rax,%rdx,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
- DB 243,15,16,68,144,4 ; movss 0x4(%rax,%rdx,4),%xmm0
- DB 65,15,198,193,0 ; shufps $0x0,%xmm9,%xmm0
- DB 65,15,198,193,226 ; shufps $0xe2,%xmm9,%xmm0
- DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 243,15,16,4,144 ; movss (%rax,%rdx,4),%xmm0
- DB 243,68,15,16,200 ; movss %xmm0,%xmm9
- DB 233,87,255,255,255 ; jmpq 3b77 <_sk_load_8888_sse2+0x10>
+ DB 102,68,15,18,12,144 ; movlpd (%rax,%rdx,4),%xmm9
+ DB 233,111,255,255,255 ; jmpq 3b4f <_sk_load_8888_sse2+0x10>
+ DB 102,68,15,110,12,144 ; movd (%rax,%rdx,4),%xmm9
+ DB 233,100,255,255,255 ; jmpq 3b4f <_sk_load_8888_sse2+0x10>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -23045,11 +23151,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,46,39,0,0 ; movdqa 0x272e(%rip),%xmm2 # 63d0 <_sk_callback_sse2+0xd6d>
+ DB 102,15,111,21,67,39,0,0 ; movdqa 0x2743(%rip),%xmm2 # 63b0 <_sk_callback_sse2+0xd87>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,42,39,0,0 ; movaps 0x272a(%rip),%xmm8 # 63e0 <_sk_callback_sse2+0xd7d>
+ DB 68,15,40,5,63,39,0,0 ; movaps 0x273f(%rip),%xmm8 # 63c0 <_sk_callback_sse2+0xd97>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -23072,7 +23178,7 @@ PUBLIC _sk_store_8888_sse2
_sk_store_8888_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 68,15,40,5,236,38,0,0 ; movaps 0x26ec(%rip),%xmm8 # 63f0 <_sk_callback_sse2+0xd8d>
+ DB 68,15,40,5,1,39,0,0 ; movaps 0x2701(%rip),%xmm8 # 63d0 <_sk_callback_sse2+0xda7>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -23091,31 +23197,31 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 3d64 <_sk_store_8888_sse2+0x6d>
+ DB 117,10 ; jne 3d2f <_sk_store_8888_sse2+0x6d>
DB 243,68,15,127,4,144 ; movdqu %xmm8,(%rax,%rdx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,3 ; and $0x3,%r9b
DB 65,128,249,1 ; cmp $0x1,%r9b
- DB 116,38 ; je 3d97 <_sk_store_8888_sse2+0xa0>
+ DB 116,33 ; je 3d5d <_sk_store_8888_sse2+0x9b>
DB 65,128,249,2 ; cmp $0x2,%r9b
- DB 116,19 ; je 3d8a <_sk_store_8888_sse2+0x93>
+ DB 116,19 ; je 3d55 <_sk_store_8888_sse2+0x93>
DB 65,128,249,3 ; cmp $0x3,%r9b
- DB 117,227 ; jne 3d60 <_sk_store_8888_sse2+0x69>
+ DB 117,227 ; jne 3d2b <_sk_store_8888_sse2+0x69>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,68,15,126,76,144,8 ; movd %xmm9,0x8(%rax,%rdx,4)
- DB 102,69,15,112,200,229 ; pshufd $0xe5,%xmm8,%xmm9
- DB 102,68,15,126,76,144,4 ; movd %xmm9,0x4(%rax,%rdx,4)
+ DB 102,68,15,214,4,144 ; movq %xmm8,(%rax,%rdx,4)
+ DB 235,206 ; jmp 3d2b <_sk_store_8888_sse2+0x69>
DB 102,68,15,126,4,144 ; movd %xmm8,(%rax,%rdx,4)
- DB 235,193 ; jmp 3d60 <_sk_store_8888_sse2+0x69>
+ DB 235,198 ; jmp 3d2b <_sk_store_8888_sse2+0x69>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,96,1,0,0 ; jne 3f0d <_sk_load_f16_sse2+0x16e>
+ DB 15,133,96,1,0,0 ; jne 3ed3 <_sk_load_f16_sse2+0x16e>
DB 102,15,16,4,208 ; movupd (%rax,%rdx,8),%xmm0
DB 102,15,16,76,208,16 ; movupd 0x10(%rax,%rdx,8),%xmm1
DB 102,68,15,40,192 ; movapd %xmm0,%xmm8
@@ -23127,7 +23233,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,19,38,0,0 ; movdqa 0x2613(%rip),%xmm9 # 6400 <_sk_callback_sse2+0xd9d>
+ DB 102,68,15,111,13,45,38,0,0 ; movdqa 0x262d(%rip),%xmm9 # 63e0 <_sk_callback_sse2+0xdb7>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -23135,11 +23241,11 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,248,37,0,0 ; movdqa 0x25f8(%rip),%xmm11 # 6410 <_sk_callback_sse2+0xdad>
+ DB 102,68,15,111,29,18,38,0,0 ; movdqa 0x2612(%rip),%xmm11 # 63f0 <_sk_callback_sse2+0xdc7>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,250,37,0,0 ; movdqa 0x25fa(%rip),%xmm12 # 6420 <_sk_callback_sse2+0xdbd>
+ DB 102,68,15,111,37,20,38,0,0 ; movdqa 0x2614(%rip),%xmm12 # 6400 <_sk_callback_sse2+0xdd7>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,253,37,0,0 ; movdqa 0x25fd(%rip),%xmm3 # 6430 <_sk_callback_sse2+0xdcd>
+ DB 102,15,111,29,23,38,0,0 ; movdqa 0x2617(%rip),%xmm3 # 6410 <_sk_callback_sse2+0xde7>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -23187,17 +23293,17 @@ _sk_load_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,15,16,4,208 ; movsd (%rax,%rdx,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 3f29 <_sk_load_f16_sse2+0x18a>
+ DB 117,17 ; jne 3eef <_sk_load_f16_sse2+0x18a>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,143,254,255,255 ; jmpq 3db8 <_sk_load_f16_sse2+0x19>
+ DB 233,143,254,255,255 ; jmpq 3d7e <_sk_load_f16_sse2+0x19>
DB 102,15,22,68,208,8 ; movhpd 0x8(%rax,%rdx,8),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,123,254,255,255 ; jb 3db8 <_sk_load_f16_sse2+0x19>
+ DB 15,130,123,254,255,255 ; jb 3d7e <_sk_load_f16_sse2+0x19>
DB 242,15,16,76,208,16 ; movsd 0x10(%rax,%rdx,8),%xmm1
- DB 233,112,254,255,255 ; jmpq 3db8 <_sk_load_f16_sse2+0x19>
+ DB 233,112,254,255,255 ; jmpq 3d7e <_sk_load_f16_sse2+0x19>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -23237,7 +23343,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,79,36,0,0 ; movdqa 0x244f(%rip),%xmm9 # 6440 <_sk_callback_sse2+0xddd>
+ DB 102,68,15,111,13,105,36,0,0 ; movdqa 0x2469(%rip),%xmm9 # 6420 <_sk_callback_sse2+0xdf7>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -23245,11 +23351,11 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,52,36,0,0 ; movdqa 0x2434(%rip),%xmm11 # 6450 <_sk_callback_sse2+0xded>
+ DB 102,68,15,111,29,78,36,0,0 ; movdqa 0x244e(%rip),%xmm11 # 6430 <_sk_callback_sse2+0xe07>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,54,36,0,0 ; movdqa 0x2436(%rip),%xmm12 # 6460 <_sk_callback_sse2+0xdfd>
+ DB 102,68,15,111,37,80,36,0,0 ; movdqa 0x2450(%rip),%xmm12 # 6440 <_sk_callback_sse2+0xe17>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,57,36,0,0 ; movdqa 0x2439(%rip),%xmm3 # 6470 <_sk_callback_sse2+0xe0d>
+ DB 102,15,111,29,83,36,0,0 ; movdqa 0x2453(%rip),%xmm3 # 6450 <_sk_callback_sse2+0xe27>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -23301,17 +23407,17 @@ PUBLIC _sk_store_f16_sse2
_sk_store_f16_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 72,139,0 ; mov (%rax),%rax
- DB 102,68,15,111,21,96,35,0,0 ; movdqa 0x2360(%rip),%xmm10 # 6480 <_sk_callback_sse2+0xe1d>
+ DB 102,68,15,111,21,122,35,0,0 ; movdqa 0x237a(%rip),%xmm10 # 6460 <_sk_callback_sse2+0xe37>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,69,15,219,226 ; pand %xmm10,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,236 ; pxor %xmm12,%xmm13
- DB 102,68,15,111,13,83,35,0,0 ; movdqa 0x2353(%rip),%xmm9 # 6490 <_sk_callback_sse2+0xe2d>
+ DB 102,68,15,111,13,109,35,0,0 ; movdqa 0x236d(%rip),%xmm9 # 6470 <_sk_callback_sse2+0xe47>
DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,29,68,35,0,0 ; movdqa 0x2344(%rip),%xmm11 # 64a0 <_sk_callback_sse2+0xe3d>
+ DB 102,68,15,111,29,94,35,0,0 ; movdqa 0x235e(%rip),%xmm11 # 6480 <_sk_callback_sse2+0xe57>
DB 102,69,15,235,227 ; por %xmm11,%xmm12
DB 102,69,15,254,229 ; paddd %xmm13,%xmm12
DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12
@@ -23363,7 +23469,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,204 ; punpckldq %xmm12,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 427e <_sk_store_f16_sse2+0x16c>
+ DB 117,21 ; jne 4244 <_sk_store_f16_sse2+0x16c>
DB 68,15,17,12,208 ; movups %xmm9,(%rax,%rdx,8)
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 243,68,15,127,68,208,16 ; movdqu %xmm8,0x10(%rax,%rdx,8)
@@ -23371,13 +23477,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,68,15,214,12,208 ; movq %xmm9,(%rax,%rdx,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 427a <_sk_store_f16_sse2+0x168>
+ DB 116,240 ; je 4240 <_sk_store_f16_sse2+0x168>
DB 102,68,15,23,76,208,8 ; movhpd %xmm9,0x8(%rax,%rdx,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 427a <_sk_store_f16_sse2+0x168>
+ DB 114,227 ; jb 4240 <_sk_store_f16_sse2+0x168>
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 102,68,15,214,68,208,16 ; movq %xmm8,0x10(%rax,%rdx,8)
- DB 235,213 ; jmp 427a <_sk_store_f16_sse2+0x168>
+ DB 235,213 ; jmp 4240 <_sk_store_f16_sse2+0x168>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -23385,7 +23491,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,190,0,0,0 ; jne 4379 <_sk_load_u16_be_sse2+0xd4>
+ DB 15,133,190,0,0,0 ; jne 433f <_sk_load_u16_be_sse2+0xd4>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 102,65,15,16,76,65,16 ; movupd 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -23402,7 +23508,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,5,164,33,0,0 ; movaps 0x21a4(%rip),%xmm8 # 64b0 <_sk_callback_sse2+0xe4d>
+ DB 68,15,40,5,190,33,0,0 ; movaps 0x21be(%rip),%xmm8 # 6490 <_sk_callback_sse2+0xe67>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -23430,17 +23536,17 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 4396 <_sk_load_u16_be_sse2+0xf1>
+ DB 117,17 ; jne 435c <_sk_load_u16_be_sse2+0xf1>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,50,255,255,255 ; jmpq 42c8 <_sk_load_u16_be_sse2+0x23>
+ DB 233,50,255,255,255 ; jmpq 428e <_sk_load_u16_be_sse2+0x23>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,29,255,255,255 ; jb 42c8 <_sk_load_u16_be_sse2+0x23>
+ DB 15,130,29,255,255,255 ; jb 428e <_sk_load_u16_be_sse2+0x23>
DB 242,65,15,16,76,65,16 ; movsd 0x10(%r9,%rax,2),%xmm1
- DB 233,17,255,255,255 ; jmpq 42c8 <_sk_load_u16_be_sse2+0x23>
+ DB 233,17,255,255,255 ; jmpq 428e <_sk_load_u16_be_sse2+0x23>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -23448,7 +23554,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,82 ; lea (%rdx,%rdx,2),%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,175,0,0,0 ; jne 4478 <_sk_load_rgb_u16_be_sse2+0xc1>
+ DB 15,133,175,0,0,0 ; jne 443e <_sk_load_rgb_u16_be_sse2+0xc1>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -23469,7 +23575,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,13,147,32,0,0 ; movaps 0x2093(%rip),%xmm9 # 64c0 <_sk_callback_sse2+0xe5d>
+ DB 68,15,40,13,173,32,0,0 ; movaps 0x20ad(%rip),%xmm9 # 64a0 <_sk_callback_sse2+0xe77>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -23486,34 +23592,34 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,90,32,0,0 ; movaps 0x205a(%rip),%xmm3 # 64d0 <_sk_callback_sse2+0xe6d>
+ DB 15,40,29,116,32,0,0 ; movaps 0x2074(%rip),%xmm3 # 64b0 <_sk_callback_sse2+0xe87>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 449d <_sk_load_rgb_u16_be_sse2+0xe6>
+ DB 117,13 ; jne 4463 <_sk_load_rgb_u16_be_sse2+0xe6>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,80,255,255,255 ; jmpq 43ed <_sk_load_rgb_u16_be_sse2+0x36>
+ DB 233,80,255,255,255 ; jmpq 43b3 <_sk_load_rgb_u16_be_sse2+0x36>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 44ce <_sk_load_rgb_u16_be_sse2+0x117>
+ DB 114,24 ; jb 4494 <_sk_load_rgb_u16_be_sse2+0x117>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,31,255,255,255 ; jmpq 43ed <_sk_load_rgb_u16_be_sse2+0x36>
+ DB 233,31,255,255,255 ; jmpq 43b3 <_sk_load_rgb_u16_be_sse2+0x36>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,22,255,255,255 ; jmpq 43ed <_sk_load_rgb_u16_be_sse2+0x36>
+ DB 233,22,255,255,255 ; jmpq 43b3 <_sk_load_rgb_u16_be_sse2+0x36>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax
- DB 68,15,40,21,244,31,0,0 ; movaps 0x1ff4(%rip),%xmm10 # 64e0 <_sk_callback_sse2+0xe7d>
+ DB 68,15,40,21,14,32,0,0 ; movaps 0x200e(%rip),%xmm10 # 64c0 <_sk_callback_sse2+0xe97>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -23558,7 +23664,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 45e6 <_sk_store_u16_be_sse2+0x10f>
+ DB 117,21 ; jne 45ac <_sk_store_u16_be_sse2+0x10f>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -23566,13 +23672,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 45e2 <_sk_store_u16_be_sse2+0x10b>
+ DB 116,240 ; je 45a8 <_sk_store_u16_be_sse2+0x10b>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 45e2 <_sk_store_u16_be_sse2+0x10b>
+ DB 114,227 ; jb 45a8 <_sk_store_u16_be_sse2+0x10b>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 45e2 <_sk_store_u16_be_sse2+0x10b>
+ DB 235,213 ; jmp 45a8 <_sk_store_u16_be_sse2+0x10b>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -23583,7 +23689,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 72,193,224,4 ; shl $0x4,%rax
DB 69,15,16,4,2 ; movups (%r10,%rax,1),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 466d <_sk_load_f32_sse2+0x60>
+ DB 117,66 ; jne 4633 <_sk_load_f32_sse2+0x60>
DB 67,15,16,68,138,16 ; movups 0x10(%r10,%r9,4),%xmm0
DB 67,15,16,92,138,32 ; movups 0x20(%r10,%r9,4),%xmm3
DB 71,15,16,76,138,48 ; movups 0x30(%r10,%r9,4),%xmm9
@@ -23603,17 +23709,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 467f <_sk_load_f32_sse2+0x72>
+ DB 117,8 ; jne 4645 <_sk_load_f32_sse2+0x72>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 463d <_sk_load_f32_sse2+0x30>
+ DB 235,190 ; jmp 4603 <_sk_load_f32_sse2+0x30>
DB 67,15,16,68,138,16 ; movups 0x10(%r10,%r9,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 4693 <_sk_load_f32_sse2+0x86>
+ DB 114,8 ; jb 4659 <_sk_load_f32_sse2+0x86>
DB 67,15,16,92,138,32 ; movups 0x20(%r10,%r9,4),%xmm3
- DB 235,170 ; jmp 463d <_sk_load_f32_sse2+0x30>
+ DB 235,170 ; jmp 4603 <_sk_load_f32_sse2+0x30>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 463d <_sk_load_f32_sse2+0x30>
+ DB 235,165 ; jmp 4603 <_sk_load_f32_sse2+0x30>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -23637,7 +23743,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,2 ; movupd %xmm12,(%r10,%rax,1)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 470a <_sk_store_f32_sse2+0x72>
+ DB 117,29 ; jne 46d0 <_sk_store_f32_sse2+0x72>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 71,15,17,68,138,16 ; movups %xmm8,0x10(%r10,%r9,4)
DB 102,71,15,17,76,138,32 ; movupd %xmm9,0x20(%r10,%r9,4)
@@ -23645,12 +23751,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 4706 <_sk_store_f32_sse2+0x6e>
+ DB 116,246 ; je 46cc <_sk_store_f32_sse2+0x6e>
DB 71,15,17,68,138,16 ; movups %xmm8,0x10(%r10,%r9,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 4706 <_sk_store_f32_sse2+0x6e>
+ DB 114,234 ; jb 46cc <_sk_store_f32_sse2+0x6e>
DB 102,71,15,17,76,138,32 ; movupd %xmm9,0x20(%r10,%r9,4)
- DB 235,225 ; jmp 4706 <_sk_store_f32_sse2+0x6e>
+ DB 235,225 ; jmp 46cc <_sk_store_f32_sse2+0x6e>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -23690,7 +23796,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,77,29,0,0 ; andps 0x1d4d(%rip),%xmm9 # 64f0 <_sk_callback_sse2+0xe8d>
+ DB 68,15,84,13,103,29,0,0 ; andps 0x1d67(%rip),%xmm9 # 64d0 <_sk_callback_sse2+0xea7>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -23711,7 +23817,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,14,29,0,0 ; andps 0x1d0e(%rip),%xmm9 # 6500 <_sk_callback_sse2+0xe9d>
+ DB 68,15,84,13,40,29,0,0 ; andps 0x1d28(%rip),%xmm9 # 64e0 <_sk_callback_sse2+0xeb7>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -23732,13 +23838,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 65,15,92,192 ; subps %xmm8,%xmm0
DB 243,69,15,88,201 ; addss %xmm9,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
- DB 243,68,15,89,21,222,32,0,0 ; mulss 0x20de(%rip),%xmm10 # 6920 <_sk_callback_sse2+0x12bd>
+ DB 243,68,15,89,21,248,32,0,0 ; mulss 0x20f8(%rip),%xmm10 # 6900 <_sk_callback_sse2+0x12d7>
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 68,15,89,208 ; mulps %xmm0,%xmm10
DB 243,69,15,91,218 ; cvttps2dq %xmm10,%xmm11
DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,175,28,0,0 ; andps 0x1caf(%rip),%xmm10 # 6510 <_sk_callback_sse2+0xead>
+ DB 68,15,84,21,201,28,0,0 ; andps 0x1cc9(%rip),%xmm10 # 64f0 <_sk_callback_sse2+0xec7>
DB 69,15,87,228 ; xorps %xmm12,%xmm12
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,89,217 ; mulps %xmm9,%xmm11
@@ -23762,13 +23868,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 65,15,92,200 ; subps %xmm8,%xmm1
DB 243,69,15,88,201 ; addss %xmm9,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
- DB 243,68,15,89,21,104,32,0,0 ; mulss 0x2068(%rip),%xmm10 # 6924 <_sk_callback_sse2+0x12c1>
+ DB 243,68,15,89,21,130,32,0,0 ; mulss 0x2082(%rip),%xmm10 # 6904 <_sk_callback_sse2+0x12db>
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 243,69,15,91,218 ; cvttps2dq %xmm10,%xmm11
DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,69,28,0,0 ; andps 0x1c45(%rip),%xmm10 # 6520 <_sk_callback_sse2+0xebd>
+ DB 68,15,84,21,95,28,0,0 ; andps 0x1c5f(%rip),%xmm10 # 6500 <_sk_callback_sse2+0xed7>
DB 69,15,87,228 ; xorps %xmm12,%xmm12
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,89,217 ; mulps %xmm9,%xmm11
@@ -23786,7 +23892,7 @@ PUBLIC _sk_clamp_x_1_sse2
_sk_clamp_x_1_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,23,28,0,0 ; minps 0x1c17(%rip),%xmm8 # 6530 <_sk_callback_sse2+0xecd>
+ DB 68,15,93,5,49,28,0,0 ; minps 0x1c31(%rip),%xmm8 # 6510 <_sk_callback_sse2+0xee7>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -23797,7 +23903,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,84,13,5,28,0,0 ; andps 0x1c05(%rip),%xmm9 # 6540 <_sk_callback_sse2+0xedd>
+ DB 68,15,84,13,31,28,0,0 ; andps 0x1c1f(%rip),%xmm9 # 6520 <_sk_callback_sse2+0xef7>
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -23805,14 +23911,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
PUBLIC _sk_mirror_x_1_sse2
_sk_mirror_x_1_sse2 LABEL PROC
- DB 68,15,40,5,1,28,0,0 ; movaps 0x1c01(%rip),%xmm8 # 6550 <_sk_callback_sse2+0xeed>
+ DB 68,15,40,5,27,28,0,0 ; movaps 0x1c1b(%rip),%xmm8 # 6530 <_sk_callback_sse2+0xf07>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,5,28,0,0 ; movaps 0x1c05(%rip),%xmm9 # 6560 <_sk_callback_sse2+0xefd>
+ DB 68,15,40,13,31,28,0,0 ; movaps 0x1c1f(%rip),%xmm9 # 6540 <_sk_callback_sse2+0xf17>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,251,27,0,0 ; andps 0x1bfb(%rip),%xmm9 # 6570 <_sk_callback_sse2+0xf0d>
+ DB 68,15,84,13,21,28,0,0 ; andps 0x1c15(%rip),%xmm9 # 6550 <_sk_callback_sse2+0xf27>
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,88,210 ; addps %xmm10,%xmm10
@@ -23826,10 +23932,10 @@ _sk_mirror_x_1_sse2 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,225,27,0,0 ; mulps 0x1be1(%rip),%xmm0 # 6580 <_sk_callback_sse2+0xf1d>
- DB 15,89,13,234,27,0,0 ; mulps 0x1bea(%rip),%xmm1 # 6590 <_sk_callback_sse2+0xf2d>
+ DB 15,89,5,251,27,0,0 ; mulps 0x1bfb(%rip),%xmm0 # 6560 <_sk_callback_sse2+0xf37>
+ DB 15,89,13,4,28,0,0 ; mulps 0x1c04(%rip),%xmm1 # 6570 <_sk_callback_sse2+0xf47>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,240,27,0,0 ; mulps 0x1bf0(%rip),%xmm3 # 65a0 <_sk_callback_sse2+0xf3d>
+ DB 15,89,29,10,28,0,0 ; mulps 0x1c0a(%rip),%xmm3 # 6580 <_sk_callback_sse2+0xf57>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -24095,9 +24201,9 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 4dec <_sk_evenly_spaced_gradient_sse2+0x18>
+ DB 120,7 ; js 4db2 <_sk_evenly_spaced_gradient_sse2+0x18>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 4e01 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ DB 235,21 ; jmp 4dc7 <_sk_evenly_spaced_gradient_sse2+0x2d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -24193,15 +24299,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse2
_sk_gauss_a_to_rgba_sse2 LABEL PROC
- DB 15,40,5,35,22,0,0 ; movaps 0x1623(%rip),%xmm0 # 65b0 <_sk_callback_sse2+0xf4d>
+ DB 15,40,5,61,22,0,0 ; movaps 0x163d(%rip),%xmm0 # 6590 <_sk_callback_sse2+0xf67>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,41,22,0,0 ; addps 0x1629(%rip),%xmm0 # 65c0 <_sk_callback_sse2+0xf5d>
+ DB 15,88,5,67,22,0,0 ; addps 0x1643(%rip),%xmm0 # 65a0 <_sk_callback_sse2+0xf77>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,47,22,0,0 ; addps 0x162f(%rip),%xmm0 # 65d0 <_sk_callback_sse2+0xf6d>
+ DB 15,88,5,73,22,0,0 ; addps 0x1649(%rip),%xmm0 # 65b0 <_sk_callback_sse2+0xf87>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,53,22,0,0 ; addps 0x1635(%rip),%xmm0 # 65e0 <_sk_callback_sse2+0xf7d>
+ DB 15,88,5,79,22,0,0 ; addps 0x164f(%rip),%xmm0 # 65c0 <_sk_callback_sse2+0xf97>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,59,22,0,0 ; addps 0x163b(%rip),%xmm0 # 65f0 <_sk_callback_sse2+0xf8d>
+ DB 15,88,5,85,22,0,0 ; addps 0x1655(%rip),%xmm0 # 65d0 <_sk_callback_sse2+0xfa7>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -24217,12 +24323,12 @@ _sk_gradient_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 5008 <_sk_gradient_sse2+0x46>
+ DB 114,50 ; jb 4fce <_sk_gradient_sse2+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,20,22,0,0 ; movaps 0x1614(%rip),%xmm2 # 6600 <_sk_callback_sse2+0xf9d>
+ DB 15,40,21,46,22,0,0 ; movaps 0x162e(%rip),%xmm2 # 65e0 <_sk_callback_sse2+0xfb7>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -24230,7 +24336,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 4fec <_sk_gradient_sse2+0x2a>
+ DB 117,228 ; jne 4fb2 <_sk_gradient_sse2+0x2a>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,211 ; movq %xmm2,%r11
DB 69,137,217 ; mov %r11d,%r9d
@@ -24365,29 +24471,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 69,15,94,220 ; divps %xmm12,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
- DB 68,15,40,45,213,19,0,0 ; movaps 0x13d5(%rip),%xmm13 # 6610 <_sk_callback_sse2+0xfad>
+ DB 68,15,40,45,239,19,0,0 ; movaps 0x13ef(%rip),%xmm13 # 65f0 <_sk_callback_sse2+0xfc7>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,217,19,0,0 ; addps 0x13d9(%rip),%xmm13 # 6620 <_sk_callback_sse2+0xfbd>
+ DB 68,15,88,45,243,19,0,0 ; addps 0x13f3(%rip),%xmm13 # 6600 <_sk_callback_sse2+0xfd7>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,221,19,0,0 ; addps 0x13dd(%rip),%xmm13 # 6630 <_sk_callback_sse2+0xfcd>
+ DB 68,15,88,45,247,19,0,0 ; addps 0x13f7(%rip),%xmm13 # 6610 <_sk_callback_sse2+0xfe7>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,225,19,0,0 ; addps 0x13e1(%rip),%xmm13 # 6640 <_sk_callback_sse2+0xfdd>
+ DB 68,15,88,45,251,19,0,0 ; addps 0x13fb(%rip),%xmm13 # 6620 <_sk_callback_sse2+0xff7>
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,40,21,224,19,0,0 ; movaps 0x13e0(%rip),%xmm10 # 6650 <_sk_callback_sse2+0xfed>
+ DB 68,15,40,21,250,19,0,0 ; movaps 0x13fa(%rip),%xmm10 # 6630 <_sk_callback_sse2+0x1007>
DB 69,15,92,213 ; subps %xmm13,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,205 ; andnps %xmm13,%xmm9
DB 69,15,86,202 ; orps %xmm10,%xmm9
DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8
- DB 68,15,40,21,211,19,0,0 ; movaps 0x13d3(%rip),%xmm10 # 6660 <_sk_callback_sse2+0xffd>
+ DB 68,15,40,21,237,19,0,0 ; movaps 0x13ed(%rip),%xmm10 # 6640 <_sk_callback_sse2+0x1017>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,84,208 ; andps %xmm8,%xmm10
DB 69,15,85,193 ; andnps %xmm9,%xmm8
DB 69,15,86,194 ; orps %xmm10,%xmm8
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9
- DB 68,15,40,21,194,19,0,0 ; movaps 0x13c2(%rip),%xmm10 # 6670 <_sk_callback_sse2+0x100d>
+ DB 68,15,40,21,220,19,0,0 ; movaps 0x13dc(%rip),%xmm10 # 6650 <_sk_callback_sse2+0x1027>
DB 69,15,92,208 ; subps %xmm8,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,200 ; andnps %xmm8,%xmm9
@@ -24410,7 +24516,7 @@ _sk_xy_to_radius_sse2 LABEL PROC
PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,148,19,0,0 ; movaps 0x1394(%rip),%xmm8 # 6680 <_sk_callback_sse2+0x101d>
+ DB 68,15,40,5,174,19,0,0 ; movaps 0x13ae(%rip),%xmm8 # 6660 <_sk_callback_sse2+0x1037>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -24418,7 +24524,7 @@ _sk_save_xy_sse2 LABEL PROC
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,40,217 ; movaps %xmm9,%xmm11
DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11
- DB 68,15,40,37,127,19,0,0 ; movaps 0x137f(%rip),%xmm12 # 6690 <_sk_callback_sse2+0x102d>
+ DB 68,15,40,37,153,19,0,0 ; movaps 0x1399(%rip),%xmm12 # 6670 <_sk_callback_sse2+0x1047>
DB 69,15,84,220 ; andps %xmm12,%xmm11
DB 69,15,92,211 ; subps %xmm11,%xmm10
DB 69,15,92,202 ; subps %xmm10,%xmm9
@@ -24461,8 +24567,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,248,18,0,0 ; addps 0x12f8(%rip),%xmm0 # 66a0 <_sk_callback_sse2+0x103d>
- DB 68,15,40,13,0,19,0,0 ; movaps 0x1300(%rip),%xmm9 # 66b0 <_sk_callback_sse2+0x104d>
+ DB 15,88,5,18,19,0,0 ; addps 0x1312(%rip),%xmm0 # 6680 <_sk_callback_sse2+0x1057>
+ DB 68,15,40,13,26,19,0,0 ; movaps 0x131a(%rip),%xmm9 # 6690 <_sk_callback_sse2+0x1067>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -24473,7 +24579,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,239,18,0,0 ; addps 0x12ef(%rip),%xmm0 # 66c0 <_sk_callback_sse2+0x105d>
+ DB 15,88,5,9,19,0,0 ; addps 0x1309(%rip),%xmm0 # 66a0 <_sk_callback_sse2+0x1077>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -24483,8 +24589,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,225,18,0,0 ; addps 0x12e1(%rip),%xmm1 # 66d0 <_sk_callback_sse2+0x106d>
- DB 68,15,40,13,233,18,0,0 ; movaps 0x12e9(%rip),%xmm9 # 66e0 <_sk_callback_sse2+0x107d>
+ DB 15,88,13,251,18,0,0 ; addps 0x12fb(%rip),%xmm1 # 66b0 <_sk_callback_sse2+0x1087>
+ DB 68,15,40,13,3,19,0,0 ; movaps 0x1303(%rip),%xmm9 # 66c0 <_sk_callback_sse2+0x1097>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -24495,7 +24601,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,215,18,0,0 ; addps 0x12d7(%rip),%xmm1 # 66f0 <_sk_callback_sse2+0x108d>
+ DB 15,88,13,241,18,0,0 ; addps 0x12f1(%rip),%xmm1 # 66d0 <_sk_callback_sse2+0x10a7>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -24505,13 +24611,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,202,18,0,0 ; addps 0x12ca(%rip),%xmm0 # 6700 <_sk_callback_sse2+0x109d>
- DB 68,15,40,13,210,18,0,0 ; movaps 0x12d2(%rip),%xmm9 # 6710 <_sk_callback_sse2+0x10ad>
+ DB 15,88,5,228,18,0,0 ; addps 0x12e4(%rip),%xmm0 # 66e0 <_sk_callback_sse2+0x10b7>
+ DB 68,15,40,13,236,18,0,0 ; movaps 0x12ec(%rip),%xmm9 # 66f0 <_sk_callback_sse2+0x10c7>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,206,18,0,0 ; mulps 0x12ce(%rip),%xmm9 # 6720 <_sk_callback_sse2+0x10bd>
- DB 68,15,88,13,214,18,0,0 ; addps 0x12d6(%rip),%xmm9 # 6730 <_sk_callback_sse2+0x10cd>
+ DB 68,15,89,13,232,18,0,0 ; mulps 0x12e8(%rip),%xmm9 # 6700 <_sk_callback_sse2+0x10d7>
+ DB 68,15,88,13,240,18,0,0 ; addps 0x12f0(%rip),%xmm9 # 6710 <_sk_callback_sse2+0x10e7>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -24522,16 +24628,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,197,18,0,0 ; addps 0x12c5(%rip),%xmm0 # 6740 <_sk_callback_sse2+0x10dd>
- DB 68,15,40,13,205,18,0,0 ; movaps 0x12cd(%rip),%xmm9 # 6750 <_sk_callback_sse2+0x10ed>
+ DB 15,88,5,223,18,0,0 ; addps 0x12df(%rip),%xmm0 # 6720 <_sk_callback_sse2+0x10f7>
+ DB 68,15,40,13,231,18,0,0 ; movaps 0x12e7(%rip),%xmm9 # 6730 <_sk_callback_sse2+0x1107>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,209,18,0,0 ; movaps 0x12d1(%rip),%xmm8 # 6760 <_sk_callback_sse2+0x10fd>
+ DB 68,15,40,5,235,18,0,0 ; movaps 0x12eb(%rip),%xmm8 # 6740 <_sk_callback_sse2+0x1117>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,213,18,0,0 ; addps 0x12d5(%rip),%xmm8 # 6770 <_sk_callback_sse2+0x110d>
+ DB 68,15,88,5,239,18,0,0 ; addps 0x12ef(%rip),%xmm8 # 6750 <_sk_callback_sse2+0x1127>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,217,18,0,0 ; addps 0x12d9(%rip),%xmm8 # 6780 <_sk_callback_sse2+0x111d>
+ DB 68,15,88,5,243,18,0,0 ; addps 0x12f3(%rip),%xmm8 # 6760 <_sk_callback_sse2+0x1137>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,221,18,0,0 ; addps 0x12dd(%rip),%xmm8 # 6790 <_sk_callback_sse2+0x112d>
+ DB 68,15,88,5,247,18,0,0 ; addps 0x12f7(%rip),%xmm8 # 6770 <_sk_callback_sse2+0x1147>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -24539,17 +24645,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,215,18,0,0 ; movaps 0x12d7(%rip),%xmm8 # 67a0 <_sk_callback_sse2+0x113d>
+ DB 68,15,40,5,241,18,0,0 ; movaps 0x12f1(%rip),%xmm8 # 6780 <_sk_callback_sse2+0x1157>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,211,18,0,0 ; movaps 0x12d3(%rip),%xmm10 # 67b0 <_sk_callback_sse2+0x114d>
+ DB 68,15,40,21,237,18,0,0 ; movaps 0x12ed(%rip),%xmm10 # 6790 <_sk_callback_sse2+0x1167>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,215,18,0,0 ; addps 0x12d7(%rip),%xmm10 # 67c0 <_sk_callback_sse2+0x115d>
+ DB 68,15,88,21,241,18,0,0 ; addps 0x12f1(%rip),%xmm10 # 67a0 <_sk_callback_sse2+0x1177>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,211,18,0,0 ; addps 0x12d3(%rip),%xmm10 # 67d0 <_sk_callback_sse2+0x116d>
+ DB 68,15,88,21,237,18,0,0 ; addps 0x12ed(%rip),%xmm10 # 67b0 <_sk_callback_sse2+0x1187>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -24559,11 +24665,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,198,18,0,0 ; addps 0x12c6(%rip),%xmm0 # 67e0 <_sk_callback_sse2+0x117d>
+ DB 15,88,5,224,18,0,0 ; addps 0x12e0(%rip),%xmm0 # 67c0 <_sk_callback_sse2+0x1197>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,198,18,0,0 ; mulps 0x12c6(%rip),%xmm8 # 67f0 <_sk_callback_sse2+0x118d>
- DB 68,15,88,5,206,18,0,0 ; addps 0x12ce(%rip),%xmm8 # 6800 <_sk_callback_sse2+0x119d>
+ DB 68,15,89,5,224,18,0,0 ; mulps 0x12e0(%rip),%xmm8 # 67d0 <_sk_callback_sse2+0x11a7>
+ DB 68,15,88,5,232,18,0,0 ; addps 0x12e8(%rip),%xmm8 # 67e0 <_sk_callback_sse2+0x11b7>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -24574,13 +24680,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,188,18,0,0 ; addps 0x12bc(%rip),%xmm1 # 6810 <_sk_callback_sse2+0x11ad>
- DB 68,15,40,13,196,18,0,0 ; movaps 0x12c4(%rip),%xmm9 # 6820 <_sk_callback_sse2+0x11bd>
+ DB 15,88,13,214,18,0,0 ; addps 0x12d6(%rip),%xmm1 # 67f0 <_sk_callback_sse2+0x11c7>
+ DB 68,15,40,13,222,18,0,0 ; movaps 0x12de(%rip),%xmm9 # 6800 <_sk_callback_sse2+0x11d7>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,192,18,0,0 ; mulps 0x12c0(%rip),%xmm9 # 6830 <_sk_callback_sse2+0x11cd>
- DB 68,15,88,13,200,18,0,0 ; addps 0x12c8(%rip),%xmm9 # 6840 <_sk_callback_sse2+0x11dd>
+ DB 68,15,89,13,218,18,0,0 ; mulps 0x12da(%rip),%xmm9 # 6810 <_sk_callback_sse2+0x11e7>
+ DB 68,15,88,13,226,18,0,0 ; addps 0x12e2(%rip),%xmm9 # 6820 <_sk_callback_sse2+0x11f7>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -24591,16 +24697,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,182,18,0,0 ; addps 0x12b6(%rip),%xmm1 # 6850 <_sk_callback_sse2+0x11ed>
- DB 68,15,40,13,190,18,0,0 ; movaps 0x12be(%rip),%xmm9 # 6860 <_sk_callback_sse2+0x11fd>
+ DB 15,88,13,208,18,0,0 ; addps 0x12d0(%rip),%xmm1 # 6830 <_sk_callback_sse2+0x1207>
+ DB 68,15,40,13,216,18,0,0 ; movaps 0x12d8(%rip),%xmm9 # 6840 <_sk_callback_sse2+0x1217>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,194,18,0,0 ; movaps 0x12c2(%rip),%xmm8 # 6870 <_sk_callback_sse2+0x120d>
+ DB 68,15,40,5,220,18,0,0 ; movaps 0x12dc(%rip),%xmm8 # 6850 <_sk_callback_sse2+0x1227>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,198,18,0,0 ; addps 0x12c6(%rip),%xmm8 # 6880 <_sk_callback_sse2+0x121d>
+ DB 68,15,88,5,224,18,0,0 ; addps 0x12e0(%rip),%xmm8 # 6860 <_sk_callback_sse2+0x1237>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,202,18,0,0 ; addps 0x12ca(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x122d>
+ DB 68,15,88,5,228,18,0,0 ; addps 0x12e4(%rip),%xmm8 # 6870 <_sk_callback_sse2+0x1247>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,206,18,0,0 ; addps 0x12ce(%rip),%xmm8 # 68a0 <_sk_callback_sse2+0x123d>
+ DB 68,15,88,5,232,18,0,0 ; addps 0x12e8(%rip),%xmm8 # 6880 <_sk_callback_sse2+0x1257>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -24608,17 +24714,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,200,18,0,0 ; movaps 0x12c8(%rip),%xmm8 # 68b0 <_sk_callback_sse2+0x124d>
+ DB 68,15,40,5,226,18,0,0 ; movaps 0x12e2(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x1267>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,195,18,0,0 ; movaps 0x12c3(%rip),%xmm10 # 68c0 <_sk_callback_sse2+0x125d>
+ DB 68,15,40,21,221,18,0,0 ; movaps 0x12dd(%rip),%xmm10 # 68a0 <_sk_callback_sse2+0x1277>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,199,18,0,0 ; addps 0x12c7(%rip),%xmm10 # 68d0 <_sk_callback_sse2+0x126d>
+ DB 68,15,88,21,225,18,0,0 ; addps 0x12e1(%rip),%xmm10 # 68b0 <_sk_callback_sse2+0x1287>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,195,18,0,0 ; addps 0x12c3(%rip),%xmm10 # 68e0 <_sk_callback_sse2+0x127d>
+ DB 68,15,88,21,221,18,0,0 ; addps 0x12dd(%rip),%xmm10 # 68c0 <_sk_callback_sse2+0x1297>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -24628,11 +24734,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,181,18,0,0 ; addps 0x12b5(%rip),%xmm1 # 68f0 <_sk_callback_sse2+0x128d>
+ DB 15,88,13,207,18,0,0 ; addps 0x12cf(%rip),%xmm1 # 68d0 <_sk_callback_sse2+0x12a7>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,181,18,0,0 ; mulps 0x12b5(%rip),%xmm8 # 6900 <_sk_callback_sse2+0x129d>
- DB 68,15,88,5,189,18,0,0 ; addps 0x12bd(%rip),%xmm8 # 6910 <_sk_callback_sse2+0x12ad>
+ DB 68,15,89,5,207,18,0,0 ; mulps 0x12cf(%rip),%xmm8 # 68e0 <_sk_callback_sse2+0x12b7>
+ DB 68,15,88,5,215,18,0,0 ; addps 0x12d7(%rip),%xmm8 # 68f0 <_sk_callback_sse2+0x12c7>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -24850,11 +24956,11 @@ ALIGN 16
DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%rdi)
DB 0,224 ; add %ah,%al
DB 64,0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 5908 <.literal16+0x1d8>
+ DB 224,64 ; loopne 58d8 <.literal16+0x1d8>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 590c <.literal16+0x1dc>
+ DB 224,64 ; loopne 58dc <.literal16+0x1dc>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 5910 <.literal16+0x1e0>
+ DB 224,64 ; loopne 58e0 <.literal16+0x1e0>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -24874,13 +24980,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5931 <.literal16+0x201>
+ DB 71,225,61 ; rex.RXB loope 5901 <.literal16+0x201>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5935 <.literal16+0x205>
+ DB 71,225,61 ; rex.RXB loope 5905 <.literal16+0x205>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5939 <.literal16+0x209>
+ DB 71,225,61 ; rex.RXB loope 5909 <.literal16+0x209>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 593d <.literal16+0x20d>
+ DB 71,225,61 ; rex.RXB loope 590d <.literal16+0x20d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -24905,13 +25011,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5971 <.literal16+0x241>
+ DB 71,225,61 ; rex.RXB loope 5941 <.literal16+0x241>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5975 <.literal16+0x245>
+ DB 71,225,61 ; rex.RXB loope 5945 <.literal16+0x245>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 5979 <.literal16+0x249>
+ DB 71,225,61 ; rex.RXB loope 5949 <.literal16+0x249>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 597d <.literal16+0x24d>
+ DB 71,225,61 ; rex.RXB loope 594d <.literal16+0x24d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -24936,13 +25042,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 59b1 <.literal16+0x281>
+ DB 71,225,61 ; rex.RXB loope 5981 <.literal16+0x281>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 59b5 <.literal16+0x285>
+ DB 71,225,61 ; rex.RXB loope 5985 <.literal16+0x285>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 59b9 <.literal16+0x289>
+ DB 71,225,61 ; rex.RXB loope 5989 <.literal16+0x289>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 59bd <.literal16+0x28d>
+ DB 71,225,61 ; rex.RXB loope 598d <.literal16+0x28d>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -24967,13 +25073,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 59f1 <.literal16+0x2c1>
+ DB 71,225,61 ; rex.RXB loope 59c1 <.literal16+0x2c1>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 59f5 <.literal16+0x2c5>
+ DB 71,225,61 ; rex.RXB loope 59c5 <.literal16+0x2c5>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 59f9 <.literal16+0x2c9>
+ DB 71,225,61 ; rex.RXB loope 59c9 <.literal16+0x2c9>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 59fd <.literal16+0x2cd>
+ DB 71,225,61 ; rex.RXB loope 59cd <.literal16+0x2cd>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -24994,11 +25100,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax)
DB 67,0,0 ; rex.XB add %al,(%r8)
- DB 127,67 ; jg 5a3b <.literal16+0x30b>
+ DB 127,67 ; jg 5a0b <.literal16+0x30b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5a3f <.literal16+0x30f>
+ DB 127,67 ; jg 5a0f <.literal16+0x30f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5a43 <.literal16+0x313>
+ DB 127,67 ; jg 5a13 <.literal16+0x313>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -25238,13 +25344,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 5c29 <.literal16+0x4f9>
+ DB 224,7 ; loopne 5bf9 <.literal16+0x4f9>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5c2d <.literal16+0x4fd>
+ DB 224,7 ; loopne 5bfd <.literal16+0x4fd>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5c31 <.literal16+0x501>
+ DB 224,7 ; loopne 5c01 <.literal16+0x501>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 5c35 <.literal16+0x505>
+ DB 224,7 ; loopne 5c05 <.literal16+0x505>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -25309,11 +25415,11 @@ ALIGN 16
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5d0b <.literal16+0x5db>
+ DB 127,67 ; jg 5cdb <.literal16+0x5db>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5d0f <.literal16+0x5df>
+ DB 127,67 ; jg 5cdf <.literal16+0x5df>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 5d13 <.literal16+0x5e3>
+ DB 127,67 ; jg 5ce3 <.literal16+0x5e3>
DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax)
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax)
@@ -25328,16 +25434,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5d04 <.literal16+0x5d4>
+ DB 127,0 ; jg 5cd4 <.literal16+0x5d4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5d08 <.literal16+0x5d8>
+ DB 127,0 ; jg 5cd8 <.literal16+0x5d8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5d0c <.literal16+0x5dc>
+ DB 127,0 ; jg 5cdc <.literal16+0x5dc>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5d10 <.literal16+0x5e0>
+ DB 127,0 ; jg 5ce0 <.literal16+0x5e0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -25346,7 +25452,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5d95 <.literal16+0x665>
+ DB 119,115 ; ja 5d65 <.literal16+0x665>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -25357,7 +25463,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 5cf9 <.literal16+0x5c9>
+ DB 117,191 ; jne 5cc9 <.literal16+0x5c9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -25369,7 +25475,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a39d3a <_sk_callback_sse2+0xffffffffe9a346d7>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a39d0a <_sk_callback_sse2+0xffffffffe9a346e1>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -25423,16 +25529,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5dd4 <.literal16+0x6a4>
+ DB 127,0 ; jg 5da4 <.literal16+0x6a4>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5dd8 <.literal16+0x6a8>
+ DB 127,0 ; jg 5da8 <.literal16+0x6a8>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5ddc <.literal16+0x6ac>
+ DB 127,0 ; jg 5dac <.literal16+0x6ac>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5de0 <.literal16+0x6b0>
+ DB 127,0 ; jg 5db0 <.literal16+0x6b0>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -25441,7 +25547,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5e65 <.literal16+0x735>
+ DB 119,115 ; ja 5e35 <.literal16+0x735>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -25452,7 +25558,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 5dc9 <.literal16+0x699>
+ DB 117,191 ; jne 5d99 <.literal16+0x699>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -25464,7 +25570,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a39e0a <_sk_callback_sse2+0xffffffffe9a347a7>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a39dda <_sk_callback_sse2+0xffffffffe9a347b1>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -25518,16 +25624,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5ea4 <.literal16+0x774>
+ DB 127,0 ; jg 5e74 <.literal16+0x774>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5ea8 <.literal16+0x778>
+ DB 127,0 ; jg 5e78 <.literal16+0x778>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5eac <.literal16+0x77c>
+ DB 127,0 ; jg 5e7c <.literal16+0x77c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5eb0 <.literal16+0x780>
+ DB 127,0 ; jg 5e80 <.literal16+0x780>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -25536,7 +25642,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 5f35 <.literal16+0x805>
+ DB 119,115 ; ja 5f05 <.literal16+0x805>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -25547,7 +25653,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 5e99 <.literal16+0x769>
+ DB 117,191 ; jne 5e69 <.literal16+0x769>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -25559,7 +25665,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a39eda <_sk_callback_sse2+0xffffffffe9a34877>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a39eaa <_sk_callback_sse2+0xffffffffe9a34881>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -25613,16 +25719,16 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 5f74 <.literal16+0x844>
+ DB 127,0 ; jg 5f44 <.literal16+0x844>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5f78 <.literal16+0x848>
+ DB 127,0 ; jg 5f48 <.literal16+0x848>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5f7c <.literal16+0x84c>
+ DB 127,0 ; jg 5f4c <.literal16+0x84c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 5f80 <.literal16+0x850>
+ DB 127,0 ; jg 5f50 <.literal16+0x850>
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -25631,7 +25737,7 @@ ALIGN 16
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
- DB 119,115 ; ja 6005 <.literal16+0x8d5>
+ DB 119,115 ; ja 5fd5 <.literal16+0x8d5>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -25642,7 +25748,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 5f69 <.literal16+0x839>
+ DB 117,191 ; jne 5f39 <.literal16+0x839>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -25654,7 +25760,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a39faa <_sk_callback_sse2+0xffffffffe9a34947>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a39f7a <_sk_callback_sse2+0xffffffffe9a34951>
DB 220,63 ; fdivrl (%rdi)
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
@@ -25704,13 +25810,13 @@ ALIGN 16
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
DB 200,66,0,0 ; enterq $0x42,$0x0
- DB 127,67 ; jg 6087 <.literal16+0x957>
+ DB 127,67 ; jg 6057 <.literal16+0x957>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 608b <.literal16+0x95b>
+ DB 127,67 ; jg 605b <.literal16+0x95b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 608f <.literal16+0x95f>
+ DB 127,67 ; jg 605f <.literal16+0x95f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6093 <.literal16+0x963>
+ DB 127,67 ; jg 6063 <.literal16+0x963>
DB 0,0 ; add %al,(%rax)
DB 0,195 ; add %al,%bl
DB 0,0 ; add %al,(%rax)
@@ -25757,16 +25863,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6113 <.literal16+0x9e3>
+ DB 118,63 ; jbe 60e3 <.literal16+0x9e3>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 6117 <.literal16+0x9e7>
+ DB 118,63 ; jbe 60e7 <.literal16+0x9e7>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 611b <.literal16+0x9eb>
+ DB 118,63 ; jbe 60eb <.literal16+0x9eb>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 611f <.literal16+0x9ef>
+ DB 118,63 ; jbe 60ef <.literal16+0x9ef>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -25786,11 +25892,19 @@ ALIGN 16
DB 128,59,0 ; cmpb $0x0,(%rbx)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 616b <.literal16+0xa3b>
+ DB 127,67 ; jg 613b <.literal16+0xa3b>
+ DB 0,0 ; add %al,(%rax)
+ DB 127,67 ; jg 613f <.literal16+0xa3f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 616f <.literal16+0xa3f>
+ DB 127,67 ; jg 6143 <.literal16+0xa43>
+ DB 255,0 ; incl (%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 255,0 ; incl (%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 255,0 ; incl (%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6173 <.literal16+0xa43>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -25838,13 +25952,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 61c9 <.literal16+0xa99>
+ DB 224,7 ; loopne 61a9 <.literal16+0xaa9>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 61cd <.literal16+0xa9d>
+ DB 224,7 ; loopne 61ad <.literal16+0xaad>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 61d1 <.literal16+0xaa1>
+ DB 224,7 ; loopne 61b1 <.literal16+0xab1>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 61d5 <.literal16+0xaa5>
+ DB 224,7 ; loopne 61b5 <.literal16+0xab5>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -25890,13 +26004,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 6239 <.literal16+0xb09>
+ DB 224,7 ; loopne 6219 <.literal16+0xb19>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 623d <.literal16+0xb0d>
+ DB 224,7 ; loopne 621d <.literal16+0xb1d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6241 <.literal16+0xb11>
+ DB 224,7 ; loopne 6221 <.literal16+0xb21>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 6245 <.literal16+0xb15>
+ DB 224,7 ; loopne 6225 <.literal16+0xb25>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -25934,13 +26048,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 62d6 <.literal16+0xba6>
+ DB 124,66 ; jl 62b6 <.literal16+0xbb6>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 62da <.literal16+0xbaa>
+ DB 124,66 ; jl 62ba <.literal16+0xbba>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 62de <.literal16+0xbae>
+ DB 124,66 ; jl 62be <.literal16+0xbbe>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 62e2 <.literal16+0xbb2>
+ DB 124,66 ; jl 62c2 <.literal16+0xbc2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -26030,13 +26144,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 63e5 <.literal16+0xcb5>
+ DB 112,65 ; jo 63c5 <.literal16+0xcc5>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 63e9 <.literal16+0xcb9>
+ DB 112,65 ; jo 63c9 <.literal16+0xcc9>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 63ed <.literal16+0xcbd>
+ DB 112,65 ; jo 63cd <.literal16+0xccd>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 63f1 <.literal16+0xcc1>
+ DB 112,65 ; jo 63d1 <.literal16+0xcd1>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -26058,11 +26172,11 @@ ALIGN 16
DB 128,59,129 ; cmpb $0x81,(%rbx)
DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%rax)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 643b <.literal16+0xd0b>
+ DB 127,67 ; jg 641b <.literal16+0xd1b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 643f <.literal16+0xd0f>
+ DB 127,67 ; jg 641f <.literal16+0xd1f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 6443 <.literal16+0xd13>
+ DB 127,67 ; jg 6423 <.literal16+0xd23>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -26138,13 +26252,13 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 255 ; (bad)
- DB 127,71 ; jg 652b <.literal16+0xdfb>
+ DB 127,71 ; jg 650b <.literal16+0xe0b>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 652f <.literal16+0xdff>
+ DB 127,71 ; jg 650f <.literal16+0xe0f>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 6533 <.literal16+0xe03>
+ DB 127,71 ; jg 6513 <.literal16+0xe13>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 6537 <.literal16+0xe07>
+ DB 127,71 ; jg 6517 <.literal16+0xe17>
DB 0,0 ; add %al,(%rax)
DB 128,63,0 ; cmpb $0x0,(%rdi)
DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax)
@@ -26221,10 +26335,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc076ca <_sk_callback_sse2+0x2dc02067>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc076aa <_sk_callback_sse2+0x2dc02081>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 65fc <.literal16+0xecc>
+ DB 120,57 ; js 65dc <.literal16+0xedc>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -26352,11 +26466,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 6742 <.literal16+0x1012>
+ DB 62,114,28 ; jb,pt 6722 <.literal16+0x1022>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6746 <.literal16+0x1016>
+ DB 62,114,28 ; jb,pt 6726 <.literal16+0x1026>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 674a <.literal16+0x101a>
+ DB 62,114,28 ; jb,pt 672a <.literal16+0x102a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -26400,7 +26514,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f5d5 <_sk_callback_sse2+0x3d639f72>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f5b5 <_sk_callback_sse2+0x3d639f8c>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -26426,7 +26540,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f615 <_sk_callback_sse2+0x3d639fb2>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f5f5 <_sk_callback_sse2+0x3d639fcc>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -26435,13 +26549,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 680e <.literal16+0x10de>
+ DB 114,28 ; jb 67ee <.literal16+0x10ee>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6812 <.literal16+0x10e2>
+ DB 62,114,28 ; jb,pt 67f2 <.literal16+0x10f2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6816 <.literal16+0x10e6>
+ DB 62,114,28 ; jb,pt 67f6 <.literal16+0x10f6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 681a <.literal16+0x10ea>
+ DB 62,114,28 ; jb,pt 67fa <.literal16+0x10fa>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -26462,11 +26576,11 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 128,63,114 ; cmpb $0x72,(%rdi)
DB 28,199 ; sbb $0xc7,%al
- DB 62,114,28 ; jb,pt 6852 <.literal16+0x1122>
+ DB 62,114,28 ; jb,pt 6832 <.literal16+0x1132>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6856 <.literal16+0x1126>
+ DB 62,114,28 ; jb,pt 6836 <.literal16+0x1136>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 685a <.literal16+0x112a>
+ DB 62,114,28 ; jb,pt 683a <.literal16+0x113a>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -26510,7 +26624,7 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 0,63 ; add %bh,(%rdi)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f6e5 <_sk_callback_sse2+0x3d63a082>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f6c5 <_sk_callback_sse2+0x3d63a09c>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 0,63 ; add %bh,(%rdi)
DB 0,0 ; add %al,(%rax)
@@ -26536,7 +26650,7 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f725 <_sk_callback_sse2+0x3d63a0c2>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f705 <_sk_callback_sse2+0x3d63a0dc>
DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi)
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
@@ -26545,13 +26659,13 @@ ALIGN 16
DB 192,63,0 ; sarb $0x0,(%rdi)
DB 0,192 ; add %al,%al
DB 63 ; (bad)
- DB 114,28 ; jb 691e <.literal16+0x11ee>
+ DB 114,28 ; jb 68fe <.literal16+0x11fe>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6922 <_sk_callback_sse2+0x12bf>
+ DB 62,114,28 ; jb,pt 6902 <_sk_callback_sse2+0x12d9>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 6926 <_sk_callback_sse2+0x12c3>
+ DB 62,114,28 ; jb,pt 6906 <_sk_callback_sse2+0x12dd>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 692a <_sk_callback_sse2+0x12c7>
+ DB 62,114,28 ; jb,pt 690a <_sk_callback_sse2+0x12e1>
DB 199 ; (bad)
DB 62,171 ; ds stos %eax,%es:(%rdi)
DB 170 ; stos %al,%es:(%rdi)
@@ -26672,7 +26786,7 @@ PUBLIC _sk_constant_color_ssse3_lowp
_sk_constant_color_ssse3_lowp LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,24 ; movups (%rax),%xmm3
- DB 15,88,29,95,18,0,0 ; addps 0x125f(%rip),%xmm3 # 13c0 <_sk_xor__ssse3_lowp+0xa7>
+ DB 15,88,29,111,18,0,0 ; addps 0x126f(%rip),%xmm3 # 13d0 <_sk_xor__ssse3_lowp+0x9f>
DB 242,15,112,195,0 ; pshuflw $0x0,%xmm3,%xmm0
DB 102,15,112,192,80 ; pshufd $0x50,%xmm0,%xmm0
DB 242,15,112,203,170 ; pshuflw $0xaa,%xmm3,%xmm1
@@ -26687,7 +26801,7 @@ _sk_constant_color_ssse3_lowp LABEL PROC
PUBLIC _sk_set_rgb_ssse3_lowp
_sk_set_rgb_ssse3_lowp LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,21,9,20,0,0 ; movss 0x1409(%rip),%xmm2 # 15a0 <_sk_xor__ssse3_lowp+0x287>
+ DB 243,15,16,21,57,20,0,0 ; movss 0x1439(%rip),%xmm2 # 15d0 <_sk_xor__ssse3_lowp+0x29f>
DB 243,15,16,0 ; movss (%rax),%xmm0
DB 243,15,88,194 ; addss %xmm2,%xmm0
DB 102,65,15,126,193 ; movd %xmm0,%r9d
@@ -26724,35 +26838,35 @@ _sk_load_8888_ssse3_lowp LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,187,0,0,0 ; jne 2d6 <_sk_load_8888_ssse3_lowp+0xc9>
+ DB 15,133,191,0,0,0 ; jne 2da <_sk_load_8888_ssse3_lowp+0xcd>
DB 69,15,16,68,147,16 ; movups 0x10(%r11,%rdx,4),%xmm8
- DB 65,15,16,28,147 ; movups (%r11,%rdx,4),%xmm3
- DB 102,15,111,13,162,17,0,0 ; movdqa 0x11a2(%rip),%xmm1 # 13d0 <_sk_xor__ssse3_lowp+0xb7>
- DB 15,40,195 ; movaps %xmm3,%xmm0
+ DB 102,65,15,16,28,147 ; movupd (%r11,%rdx,4),%xmm3
+ DB 102,15,111,13,177,17,0,0 ; movdqa 0x11b1(%rip),%xmm1 # 13e0 <_sk_xor__ssse3_lowp+0xaf>
+ DB 102,15,40,195 ; movapd %xmm3,%xmm0
DB 102,15,56,0,193 ; pshufb %xmm1,%xmm0
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
DB 102,15,56,0,209 ; pshufb %xmm1,%xmm2
DB 102,15,108,194 ; punpcklqdq %xmm2,%xmm0
DB 102,15,113,240,8 ; psllw $0x8,%xmm0
- DB 102,68,15,111,13,142,17,0,0 ; movdqa 0x118e(%rip),%xmm9 # 13e0 <_sk_xor__ssse3_lowp+0xc7>
+ DB 102,68,15,111,13,156,17,0,0 ; movdqa 0x119c(%rip),%xmm9 # 13f0 <_sk_xor__ssse3_lowp+0xbf>
DB 102,65,15,228,193 ; pmulhuw %xmm9,%xmm0
- DB 102,68,15,111,21,144,17,0,0 ; movdqa 0x1190(%rip),%xmm10 # 13f0 <_sk_xor__ssse3_lowp+0xd7>
- DB 15,40,203 ; movaps %xmm3,%xmm1
+ DB 102,68,15,111,21,158,17,0,0 ; movdqa 0x119e(%rip),%xmm10 # 1400 <_sk_xor__ssse3_lowp+0xcf>
+ DB 102,15,40,203 ; movapd %xmm3,%xmm1
DB 102,65,15,56,0,202 ; pshufb %xmm10,%xmm1
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
DB 102,65,15,56,0,210 ; pshufb %xmm10,%xmm2
DB 102,15,108,202 ; punpcklqdq %xmm2,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
DB 102,65,15,228,201 ; pmulhuw %xmm9,%xmm1
- DB 102,68,15,111,21,117,17,0,0 ; movdqa 0x1175(%rip),%xmm10 # 1400 <_sk_xor__ssse3_lowp+0xe7>
- DB 15,40,211 ; movaps %xmm3,%xmm2
+ DB 102,68,15,111,21,130,17,0,0 ; movdqa 0x1182(%rip),%xmm10 # 1410 <_sk_xor__ssse3_lowp+0xdf>
+ DB 102,15,40,211 ; movapd %xmm3,%xmm2
DB 102,65,15,56,0,210 ; pshufb %xmm10,%xmm2
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,56,0,218 ; pshufb %xmm10,%xmm11
DB 102,65,15,108,211 ; punpcklqdq %xmm11,%xmm2
DB 102,15,113,242,8 ; psllw $0x8,%xmm2
DB 102,65,15,228,209 ; pmulhuw %xmm9,%xmm2
- DB 102,68,15,111,21,89,17,0,0 ; movdqa 0x1159(%rip),%xmm10 # 1410 <_sk_xor__ssse3_lowp+0xf7>
+ DB 102,68,15,111,21,101,17,0,0 ; movdqa 0x1165(%rip),%xmm10 # 1420 <_sk_xor__ssse3_lowp+0xef>
DB 102,65,15,56,0,218 ; pshufb %xmm10,%xmm3
DB 102,69,15,56,0,194 ; pshufb %xmm10,%xmm8
DB 102,65,15,108,216 ; punpcklqdq %xmm8,%xmm3
@@ -26763,52 +26877,47 @@ _sk_load_8888_ssse3_lowp LABEL PROC
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
- DB 15,87,219 ; xorps %xmm3,%xmm3
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,52,255,255,255 ; ja 226 <_sk_load_8888_ssse3_lowp+0x19>
+ DB 15,135,48,255,255,255 ; ja 227 <_sk_load_8888_ssse3_lowp+0x1a>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 378 <_sk_load_8888_ssse3_lowp+0x16b>
+ DB 76,141,21,94,0,0,0 ; lea 0x5e(%rip),%r10 # 360 <_sk_load_8888_ssse3_lowp+0x153>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 243,65,15,16,28,147 ; movss (%r11,%rdx,4),%xmm3
+ DB 233,17,255,255,255 ; jmpq 227 <_sk_load_8888_ssse3_lowp+0x1a>
+ DB 102,65,15,110,68,147,8 ; movd 0x8(%r11,%rdx,4),%xmm0
+ DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
+ DB 102,65,15,18,28,147 ; movlpd (%r11,%rdx,4),%xmm3
+ DB 233,250,254,255,255 ; jmpq 227 <_sk_load_8888_ssse3_lowp+0x1a>
DB 102,65,15,110,68,147,24 ; movd 0x18(%r11,%rdx,4),%xmm0
DB 102,68,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm8
- DB 15,87,219 ; xorps %xmm3,%xmm3
DB 243,65,15,16,68,147,20 ; movss 0x14(%r11,%rdx,4),%xmm0
DB 65,15,198,192,0 ; shufps $0x0,%xmm8,%xmm0
DB 65,15,198,192,226 ; shufps $0xe2,%xmm8,%xmm0
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 243,65,15,16,68,147,16 ; movss 0x10(%r11,%rdx,4),%xmm0
DB 243,68,15,16,192 ; movss %xmm0,%xmm8
- DB 243,65,15,16,68,147,12 ; movss 0xc(%r11,%rdx,4),%xmm0
- DB 15,198,195,32 ; shufps $0x20,%xmm3,%xmm0
- DB 15,198,216,36 ; shufps $0x24,%xmm0,%xmm3
- DB 243,65,15,16,68,147,8 ; movss 0x8(%r11,%rdx,4),%xmm0
- DB 15,198,195,48 ; shufps $0x30,%xmm3,%xmm0
- DB 15,198,216,132 ; shufps $0x84,%xmm0,%xmm3
- DB 243,65,15,16,68,147,4 ; movss 0x4(%r11,%rdx,4),%xmm0
- DB 15,198,195,0 ; shufps $0x0,%xmm3,%xmm0
- DB 15,198,195,226 ; shufps $0xe2,%xmm3,%xmm0
- DB 15,40,216 ; movaps %xmm0,%xmm3
- DB 243,65,15,16,4,147 ; movss (%r11,%rdx,4),%xmm0
- DB 243,15,16,216 ; movss %xmm0,%xmm3
- DB 233,176,254,255,255 ; jmpq 226 <_sk_load_8888_ssse3_lowp+0x19>
- DB 102,144 ; xchg %ax,%ax
- DB 239 ; out %eax,(%dx)
+ DB 233,193,254,255,255 ; jmpq 221 <_sk_load_8888_ssse3_lowp+0x14>
+ DB 171 ; stos %eax,%es:(%rdi)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,194 ; inc %edx
DB 255 ; (bad)
- DB 221,255 ; (bad)
DB 255 ; (bad)
- DB 255,206 ; dec %esi
+ DB 255,182,255,255,255,193 ; pushq -0x3e000001(%rsi)
+ DB 254 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 239 ; out %eax,(%dx)
DB 255 ; (bad)
- DB 191,255,255,255,179 ; mov $0xb3ffffff,%edi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,158,255,255,255,142 ; lcall *-0x71000001(%rsi)
+ DB 218,255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,205 ; dec %ebp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -26819,7 +26928,7 @@ _sk_store_8888_ssse3_lowp LABEL PROC
DB 76,139,24 ; mov (%rax),%r11
DB 102,68,15,111,192 ; movdqa %xmm0,%xmm8
DB 102,65,15,113,208,7 ; psrlw $0x7,%xmm8
- DB 102,68,15,111,21,115,16,0,0 ; movdqa 0x1073(%rip),%xmm10 # 1420 <_sk_xor__ssse3_lowp+0x107>
+ DB 102,68,15,111,21,155,16,0,0 ; movdqa 0x109b(%rip),%xmm10 # 1430 <_sk_xor__ssse3_lowp+0xff>
DB 102,69,15,234,194 ; pminsw %xmm10,%xmm8
DB 102,69,15,239,219 ; pxor %xmm11,%xmm11
DB 102,69,15,111,232 ; movdqa %xmm8,%xmm13
@@ -26856,7 +26965,7 @@ _sk_store_8888_ssse3_lowp LABEL PROC
DB 102,69,15,235,198 ; por %xmm14,%xmm8
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 47b <_sk_store_8888_ssse3_lowp+0xe7>
+ DB 117,17 ; jne 463 <_sk_store_8888_ssse3_lowp+0xe7>
DB 243,69,15,127,4,147 ; movdqu %xmm8,(%r11,%rdx,4)
DB 243,69,15,127,84,147,16 ; movdqu %xmm10,0x10(%r11,%rdx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -26865,43 +26974,43 @@ _sk_store_8888_ssse3_lowp LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 477 <_sk_store_8888_ssse3_lowp+0xe3>
+ DB 119,236 ; ja 45f <_sk_store_8888_ssse3_lowp+0xe3>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,90,0,0,0 ; lea 0x5a(%rip),%r10 # 4f0 <_sk_store_8888_ssse3_lowp+0x15c>
+ DB 76,141,21,82,0,0,0 ; lea 0x52(%rip),%r10 # 4d0 <_sk_store_8888_ssse3_lowp+0x154>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 102,69,15,126,4,147 ; movd %xmm8,(%r11,%rdx,4)
+ DB 235,208 ; jmp 45f <_sk_store_8888_ssse3_lowp+0xe3>
+ DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
+ DB 102,69,15,126,76,147,8 ; movd %xmm9,0x8(%r11,%rdx,4)
+ DB 102,69,15,214,4,147 ; movq %xmm8,(%r11,%rdx,4)
+ DB 235,187 ; jmp 45f <_sk_store_8888_ssse3_lowp+0xe3>
DB 102,69,15,112,202,78 ; pshufd $0x4e,%xmm10,%xmm9
DB 102,69,15,126,76,147,24 ; movd %xmm9,0x18(%r11,%rdx,4)
DB 102,69,15,112,202,229 ; pshufd $0xe5,%xmm10,%xmm9
DB 102,69,15,126,76,147,20 ; movd %xmm9,0x14(%r11,%rdx,4)
DB 102,69,15,126,84,147,16 ; movd %xmm10,0x10(%r11,%rdx,4)
- DB 102,69,15,112,200,231 ; pshufd $0xe7,%xmm8,%xmm9
- DB 102,69,15,126,76,147,12 ; movd %xmm9,0xc(%r11,%rdx,4)
- DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
- DB 102,69,15,126,76,147,8 ; movd %xmm9,0x8(%r11,%rdx,4)
- DB 102,69,15,112,200,229 ; pshufd $0xe5,%xmm8,%xmm9
- DB 102,69,15,126,76,147,4 ; movd %xmm9,0x4(%r11,%rdx,4)
- DB 102,69,15,126,4,147 ; movd %xmm8,(%r11,%rdx,4)
- DB 235,136 ; jmp 477 <_sk_store_8888_ssse3_lowp+0xe3>
- DB 144 ; nop
- DB 247,255 ; idiv %edi
+ DB 243,69,15,127,4,147 ; movdqu %xmm8,(%r11,%rdx,4)
+ DB 235,146 ; jmp 45f <_sk_store_8888_ssse3_lowp+0xe3>
+ DB 15,31,0 ; nopl (%rax)
+ DB 183,255 ; mov $0xff,%bh
DB 255 ; (bad)
+ DB 255,204 ; dec %esp
DB 255 ; (bad)
- DB 234 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 191,255,255,255,245 ; mov $0xf5ffffff,%edi
DB 255 ; (bad)
- DB 221,255 ; (bad)
DB 255 ; (bad)
- DB 255,208 ; callq *%rax
DB 255 ; (bad)
+ DB 238 ; out %al,(%dx)
DB 255 ; (bad)
- DB 255,201 ; dec %ecx
DB 255 ; (bad)
+ DB 255,225 ; jmpq *%rcx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 188,255,255,255,175 ; mov $0xafffffff,%esp
+ DB 255,212 ; callq *%rsp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -26911,13 +27020,13 @@ _sk_load_a8_ssse3_lowp LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,37 ; jne 53b <_sk_load_a8_ssse3_lowp+0x2f>
+ DB 117,36 ; jne 51a <_sk_load_a8_ssse3_lowp+0x2e>
DB 243,65,15,126,28,19 ; movq (%r11,%rdx,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 102,15,113,243,8 ; psllw $0x8,%xmm3
- DB 102,15,228,29,3,15,0,0 ; pmulhuw 0xf03(%rip),%xmm3 # 1430 <_sk_xor__ssse3_lowp+0x117>
+ DB 102,15,228,29,51,15,0,0 ; pmulhuw 0xf33(%rip),%xmm3 # 1440 <_sk_xor__ssse3_lowp+0x10f>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 102,15,239,192 ; pxor %xmm0,%xmm0
+ DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
DB 255,224 ; jmpq *%rax
@@ -26926,12 +27035,23 @@ _sk_load_a8_ssse3_lowp LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,209 ; ja 520 <_sk_load_a8_ssse3_lowp+0x14>
+ DB 119,210 ; ja 500 <_sk_load_a8_ssse3_lowp+0x14>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,94,0,0,0 ; lea 0x5e(%rip),%r10 # 5b8 <_sk_load_a8_ssse3_lowp+0xac>
+ DB 76,141,21,111,0,0,0 ; lea 0x6f(%rip),%r10 # 5a8 <_sk_load_a8_ssse3_lowp+0xbc>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 102,15,110,216 ; movd %eax,%xmm3
+ DB 235,179 ; jmp 500 <_sk_load_a8_ssse3_lowp+0x14>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 102,15,239,219 ; pxor %xmm3,%xmm3
+ DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
+ DB 243,15,16,216 ; movss %xmm0,%xmm3
+ DB 235,145 ; jmp 500 <_sk_load_a8_ssse3_lowp+0x14>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -26939,95 +27059,95 @@ _sk_load_a8_ssse3_lowp LABEL PROC
DB 102,15,196,216,5 ; pinsrw $0x5,%eax,%xmm3
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 102,15,196,216,4 ; pinsrw $0x4,%eax,%xmm3
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 102,15,196,216,1 ; pinsrw $0x1,%eax,%xmm3
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 102,15,196,216,0 ; pinsrw $0x0,%eax,%xmm3
- DB 233,104,255,255,255 ; jmpq 520 <_sk_load_a8_ssse3_lowp+0x14>
- DB 241 ; icebp
- DB 255 ; (bad)
+ DB 102,65,15,110,4,19 ; movd (%r11,%rdx,1),%xmm0
+ DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
+ DB 242,15,16,216 ; movsd %xmm0,%xmm3
+ DB 233,89,255,255,255 ; jmpq 500 <_sk_load_a8_ssse3_lowp+0x14>
+ DB 144 ; nop
+ DB 154 ; (bad)
DB 255 ; (bad)
- DB 255,230 ; jmpq *%rsi
DB 255 ; (bad)
+ DB 255,180,255,255,255,165,255 ; pushq -0x5a0001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 219,255 ; (bad)
+ DB 236 ; in (%dx),%al
DB 255 ; (bad)
- DB 255,208 ; callq *%rax
DB 255 ; (bad)
+ DB 255,225 ; jmpq *%rcx
DB 255 ; (bad)
- DB 255,197 ; inc %ebp
DB 255 ; (bad)
+ DB 255,214 ; callq *%rsi
DB 255 ; (bad)
DB 255 ; (bad)
- DB 186,255,255,255,171 ; mov $0xabffffff,%edx
+ DB 255,199 ; inc %edi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
PUBLIC _sk_store_a8_ssse3_lowp
_sk_store_a8_ssse3_lowp LABEL PROC
+ DB 72,131,236,88 ; sub $0x58,%rsp
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 102,68,15,111,195 ; movdqa %xmm3,%xmm8
DB 102,65,15,113,208,7 ; psrlw $0x7,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 5f8 <_sk_store_a8_ssse3_lowp+0x24>
+ DB 117,14 ; jne 5f0 <_sk_store_a8_ssse3_lowp+0x2c>
DB 242,69,15,17,4,19 ; movsd %xmm8,(%r11,%rdx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,236 ; ja 5f4 <_sk_store_a8_ssse3_lowp+0x20>
- DB 72,131,236,120 ; sub $0x78,%rsp
+ DB 119,232 ; ja 5e8 <_sk_store_a8_ssse3_lowp+0x24>
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,128,0,0,0 ; lea 0x80(%rip),%r10 # 69c <_sk_store_a8_ssse3_lowp+0xc8>
+ DB 76,141,21,132,0,0,0 ; lea 0x84(%rip),%r10 # 694 <_sk_store_a8_ssse3_lowp+0xd0>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
- DB 102,68,15,127,68,36,96 ; movdqa %xmm8,0x60(%rsp)
- DB 138,68,36,108 ; mov 0x6c(%rsp),%al
- DB 65,136,68,19,6 ; mov %al,0x6(%r11,%rdx,1)
- DB 102,68,15,127,68,36,80 ; movdqa %xmm8,0x50(%rsp)
- DB 138,68,36,90 ; mov 0x5a(%rsp),%al
- DB 65,136,68,19,5 ; mov %al,0x5(%r11,%rdx,1)
DB 102,68,15,127,68,36,64 ; movdqa %xmm8,0x40(%rsp)
- DB 138,68,36,72 ; mov 0x48(%rsp),%al
- DB 65,136,68,19,4 ; mov %al,0x4(%r11,%rdx,1)
+ DB 138,68,36,64 ; mov 0x40(%rsp),%al
+ DB 65,136,4,19 ; mov %al,(%r11,%rdx,1)
+ DB 235,190 ; jmp 5e8 <_sk_store_a8_ssse3_lowp+0x24>
DB 102,68,15,127,68,36,48 ; movdqa %xmm8,0x30(%rsp)
- DB 138,68,36,54 ; mov 0x36(%rsp),%al
- DB 65,136,68,19,3 ; mov %al,0x3(%r11,%rdx,1)
- DB 102,68,15,127,68,36,32 ; movdqa %xmm8,0x20(%rsp)
- DB 138,68,36,36 ; mov 0x24(%rsp),%al
+ DB 138,68,36,52 ; mov 0x34(%rsp),%al
DB 65,136,68,19,2 ; mov %al,0x2(%r11,%rdx,1)
+ DB 102,68,15,56,0,5,12,14,0,0 ; pshufb 0xe0c(%rip),%xmm8 # 1450 <_sk_xor__ssse3_lowp+0x11f>
+ DB 102,68,15,126,192 ; movd %xmm8,%eax
+ DB 102,65,137,4,19 ; mov %ax,(%r11,%rdx,1)
+ DB 235,152 ; jmp 5e8 <_sk_store_a8_ssse3_lowp+0x24>
+ DB 102,68,15,127,68,36,32 ; movdqa %xmm8,0x20(%rsp)
+ DB 138,68,36,44 ; mov 0x2c(%rsp),%al
+ DB 65,136,68,19,6 ; mov %al,0x6(%r11,%rdx,1)
DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp)
- DB 138,68,36,18 ; mov 0x12(%rsp),%al
- DB 65,136,68,19,1 ; mov %al,0x1(%r11,%rdx,1)
+ DB 138,68,36,26 ; mov 0x1a(%rsp),%al
+ DB 65,136,68,19,5 ; mov %al,0x5(%r11,%rdx,1)
DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp)
- DB 138,4,36 ; mov (%rsp),%al
- DB 65,136,4,19 ; mov %al,(%r11,%rdx,1)
- DB 72,131,196,120 ; add $0x78,%rsp
- DB 233,89,255,255,255 ; jmpq 5f4 <_sk_store_a8_ssse3_lowp+0x20>
- DB 144 ; nop
- DB 233,255,255,255,217 ; jmpq ffffffffda0006a0 <_sk_xor__ssse3_lowp+0xffffffffd9fff387>
+ DB 138,68,36,8 ; mov 0x8(%rsp),%al
+ DB 65,136,68,19,4 ; mov %al,0x4(%r11,%rdx,1)
+ DB 102,68,15,56,0,5,215,13,0,0 ; pshufb 0xdd7(%rip),%xmm8 # 1460 <_sk_xor__ssse3_lowp+0x12f>
+ DB 102,69,15,126,4,19 ; movd %xmm8,(%r11,%rdx,1)
+ DB 233,84,255,255,255 ; jmpq 5e8 <_sk_store_a8_ssse3_lowp+0x24>
+ DB 133,255 ; test %edi,%edi
DB 255 ; (bad)
+ DB 255,166,255,255,255,150 ; jmpq *-0x69000001(%rsi)
DB 255 ; (bad)
- DB 255,201 ; dec %ecx
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 235,255 ; jmp 6a1 <_sk_store_a8_ssse3_lowp+0xdd>
DB 255 ; (bad)
- DB 185,255,255,255,169 ; mov $0xa9ffffff,%ecx
+ DB 255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
+ DB 255 ; (bad)
+ DB 255,204 ; dec %esp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,153,255,255,255,137 ; lcall *-0x76000001(%rcx)
+ DB 255 ; (bad)
+ DB 188 ; .byte 0xbc
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -27037,13 +27157,13 @@ _sk_load_g8_ssse3_lowp LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 6ec <_sk_load_g8_ssse3_lowp+0x34>
+ DB 117,42 ; jne 6e4 <_sk_load_g8_ssse3_lowp+0x34>
DB 243,65,15,126,4,19 ; movq (%r11,%rdx,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,113,240,8 ; psllw $0x8,%xmm0
- DB 102,15,228,5,103,13,0,0 ; pmulhuw 0xd67(%rip),%xmm0 # 1440 <_sk_xor__ssse3_lowp+0x127>
+ DB 102,15,228,5,159,13,0,0 ; pmulhuw 0xd9f(%rip),%xmm0 # 1470 <_sk_xor__ssse3_lowp+0x13f>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,110,13,0,0 ; movaps 0xd6e(%rip),%xmm3 # 1450 <_sk_xor__ssse3_lowp+0x137>
+ DB 15,40,29,166,13,0,0 ; movaps 0xda6(%rip),%xmm3 # 1480 <_sk_xor__ssse3_lowp+0x14f>
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
@@ -27052,12 +27172,23 @@ _sk_load_g8_ssse3_lowp LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,204 ; ja 6cc <_sk_load_g8_ssse3_lowp+0x14>
+ DB 119,204 ; ja 6c4 <_sk_load_g8_ssse3_lowp+0x14>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,97,0,0,0 ; lea 0x61(%rip),%r10 # 76c <_sk_load_g8_ssse3_lowp+0xb4>
+ DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 774 <_sk_load_g8_ssse3_lowp+0xc4>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 102,15,110,192 ; movd %eax,%xmm0
+ DB 235,173 ; jmp 6c4 <_sk_load_g8_ssse3_lowp+0x14>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 102,15,239,192 ; pxor %xmm0,%xmm0
+ DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 102,15,110,200 ; movd %eax,%xmm1
+ DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
+ DB 243,15,16,193 ; movss %xmm1,%xmm0
+ DB 235,139 ; jmp 6c4 <_sk_load_g8_ssse3_lowp+0x14>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -27065,32 +27196,28 @@ _sk_load_g8_ssse3_lowp LABEL PROC
DB 102,15,196,192,5 ; pinsrw $0x5,%eax,%xmm0
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 102,15,196,192,4 ; pinsrw $0x4,%eax,%xmm0
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 102,15,196,192,1 ; pinsrw $0x1,%eax,%xmm0
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 102,15,196,192,0 ; pinsrw $0x0,%eax,%xmm0
- DB 233,99,255,255,255 ; jmpq 6cc <_sk_load_g8_ssse3_lowp+0x14>
+ DB 102,65,15,110,12,19 ; movd (%r11,%rdx,1),%xmm1
+ DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
+ DB 242,15,16,193 ; movsd %xmm1,%xmm0
+ DB 233,83,255,255,255 ; jmpq 6c4 <_sk_load_g8_ssse3_lowp+0x14>
DB 15,31,0 ; nopl (%rax)
- DB 238 ; out %al,(%dx)
+ DB 152 ; cwtl
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,227 ; jmpq *%rbx
+ DB 255,178,255,255,255,163 ; pushq -0x5c000001(%rdx)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 216,255 ; fdivr %st(7),%st
+ DB 234 ; (bad)
DB 255 ; (bad)
- DB 255,205 ; dec %ebp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,194 ; inc %edx
+ DB 223,255 ; (bad)
+ DB 255 ; (bad)
+ DB 255,212 ; callq *%rsp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,183,255,255,255,168 ; pushq -0x57000001(%rdi)
+ DB 255,197 ; inc %ebp
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -27101,43 +27228,43 @@ _sk_srcover_rgba_8888_ssse3_lowp LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,17,2,0,0 ; jne 9ac <_sk_srcover_rgba_8888_ssse3_lowp+0x224>
+ DB 15,133,17,2,0,0 ; jne 9b4 <_sk_srcover_rgba_8888_ssse3_lowp+0x224>
DB 69,15,16,68,147,16 ; movups 0x10(%r11,%rdx,4),%xmm8
- DB 65,15,16,60,147 ; movups (%r11,%rdx,4),%xmm7
+ DB 102,65,15,16,60,147 ; movupd (%r11,%rdx,4),%xmm7
DB 72,131,236,24 ; sub $0x18,%rsp
- DB 102,15,111,45,174,12,0,0 ; movdqa 0xcae(%rip),%xmm5 # 1460 <_sk_xor__ssse3_lowp+0x147>
- DB 15,40,231 ; movaps %xmm7,%xmm4
+ DB 102,15,111,45,213,12,0,0 ; movdqa 0xcd5(%rip),%xmm5 # 1490 <_sk_xor__ssse3_lowp+0x15f>
+ DB 102,15,40,231 ; movapd %xmm7,%xmm4
DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4
DB 102,65,15,111,240 ; movdqa %xmm8,%xmm6
DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6
DB 102,15,108,230 ; punpcklqdq %xmm6,%xmm4
- DB 102,15,111,13,160,12,0,0 ; movdqa 0xca0(%rip),%xmm1 # 1470 <_sk_xor__ssse3_lowp+0x157>
+ DB 102,15,111,13,198,12,0,0 ; movdqa 0xcc6(%rip),%xmm1 # 14a0 <_sk_xor__ssse3_lowp+0x16f>
DB 102,15,113,244,8 ; psllw $0x8,%xmm4
- DB 102,68,15,111,13,162,12,0,0 ; movdqa 0xca2(%rip),%xmm9 # 1480 <_sk_xor__ssse3_lowp+0x167>
+ DB 102,68,15,111,13,200,12,0,0 ; movdqa 0xcc8(%rip),%xmm9 # 14b0 <_sk_xor__ssse3_lowp+0x17f>
DB 102,65,15,228,225 ; pmulhuw %xmm9,%xmm4
- DB 102,68,15,111,21,164,12,0,0 ; movdqa 0xca4(%rip),%xmm10 # 1490 <_sk_xor__ssse3_lowp+0x177>
- DB 15,40,239 ; movaps %xmm7,%xmm5
+ DB 102,68,15,111,21,202,12,0,0 ; movdqa 0xcca(%rip),%xmm10 # 14c0 <_sk_xor__ssse3_lowp+0x18f>
+ DB 102,15,40,239 ; movapd %xmm7,%xmm5
DB 102,65,15,56,0,234 ; pshufb %xmm10,%xmm5
DB 102,65,15,111,240 ; movdqa %xmm8,%xmm6
DB 102,65,15,56,0,242 ; pshufb %xmm10,%xmm6
DB 102,15,108,238 ; punpcklqdq %xmm6,%xmm5
DB 102,15,113,245,8 ; psllw $0x8,%xmm5
DB 102,65,15,228,233 ; pmulhuw %xmm9,%xmm5
- DB 102,68,15,111,21,137,12,0,0 ; movdqa 0xc89(%rip),%xmm10 # 14a0 <_sk_xor__ssse3_lowp+0x187>
- DB 15,40,247 ; movaps %xmm7,%xmm6
+ DB 102,68,15,111,21,174,12,0,0 ; movdqa 0xcae(%rip),%xmm10 # 14d0 <_sk_xor__ssse3_lowp+0x19f>
+ DB 102,15,40,247 ; movapd %xmm7,%xmm6
DB 102,65,15,56,0,242 ; pshufb %xmm10,%xmm6
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,56,0,218 ; pshufb %xmm10,%xmm11
DB 102,65,15,108,243 ; punpcklqdq %xmm11,%xmm6
DB 102,15,113,246,8 ; psllw $0x8,%xmm6
DB 102,65,15,228,241 ; pmulhuw %xmm9,%xmm6
- DB 102,68,15,111,21,109,12,0,0 ; movdqa 0xc6d(%rip),%xmm10 # 14b0 <_sk_xor__ssse3_lowp+0x197>
+ DB 102,68,15,111,21,145,12,0,0 ; movdqa 0xc91(%rip),%xmm10 # 14e0 <_sk_xor__ssse3_lowp+0x1af>
DB 102,65,15,56,0,250 ; pshufb %xmm10,%xmm7
DB 102,69,15,56,0,194 ; pshufb %xmm10,%xmm8
DB 102,65,15,108,248 ; punpcklqdq %xmm8,%xmm7
DB 102,15,113,247,8 ; psllw $0x8,%xmm7
DB 102,65,15,228,249 ; pmulhuw %xmm9,%xmm7
- DB 102,68,15,111,29,89,12,0,0 ; movdqa 0xc59(%rip),%xmm11 # 14c0 <_sk_xor__ssse3_lowp+0x1a7>
+ DB 102,68,15,111,29,125,12,0,0 ; movdqa 0xc7d(%rip),%xmm11 # 14f0 <_sk_xor__ssse3_lowp+0x1bf>
DB 102,68,15,249,219 ; psubw %xmm3,%xmm11
DB 102,68,15,111,196 ; movdqa %xmm4,%xmm8
DB 102,69,15,56,11,195 ; pmulhrsw %xmm11,%xmm8
@@ -27193,7 +27320,7 @@ _sk_srcover_rgba_8888_ssse3_lowp LABEL PROC
DB 102,65,15,235,192 ; por %xmm8,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 77,133,192 ; test %r8,%r8
- DB 15,133,200,0,0,0 ; jne a4c <_sk_srcover_rgba_8888_ssse3_lowp+0x2c4>
+ DB 117,100 ; jne 9f0 <_sk_srcover_rgba_8888_ssse3_lowp+0x260>
DB 243,65,15,127,4,147 ; movdqu %xmm0,(%r11,%rdx,4)
DB 243,65,15,127,76,147,16 ; movdqu %xmm1,0x10(%r11,%rdx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -27206,90 +27333,84 @@ _sk_srcover_rgba_8888_ssse3_lowp LABEL PROC
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
- DB 15,87,255 ; xorps %xmm7,%xmm7
+ DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,222,253,255,255 ; ja 7a6 <_sk_srcover_rgba_8888_ssse3_lowp+0x1e>
+ DB 15,135,222,253,255,255 ; ja 7af <_sk_srcover_rgba_8888_ssse3_lowp+0x1f>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,241,0,0,0 ; lea 0xf1(%rip),%r10 # ac4 <_sk_srcover_rgba_8888_ssse3_lowp+0x33c>
+ DB 76,141,21,208,0,0,0 ; lea 0xd0(%rip),%r10 # aac <_sk_srcover_rgba_8888_ssse3_lowp+0x31c>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
- DB 102,65,15,110,100,147,24 ; movd 0x18(%r11,%rdx,4),%xmm4
- DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
- DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 243,65,15,16,100,147,20 ; movss 0x14(%r11,%rdx,4),%xmm4
- DB 65,15,198,224,0 ; shufps $0x0,%xmm8,%xmm4
- DB 65,15,198,224,226 ; shufps $0xe2,%xmm8,%xmm4
- DB 68,15,40,196 ; movaps %xmm4,%xmm8
- DB 243,65,15,16,100,147,16 ; movss 0x10(%r11,%rdx,4),%xmm4
- DB 243,68,15,16,196 ; movss %xmm4,%xmm8
- DB 243,65,15,16,100,147,12 ; movss 0xc(%r11,%rdx,4),%xmm4
- DB 15,198,231,32 ; shufps $0x20,%xmm7,%xmm4
- DB 15,198,252,36 ; shufps $0x24,%xmm4,%xmm7
- DB 243,65,15,16,100,147,8 ; movss 0x8(%r11,%rdx,4),%xmm4
- DB 15,198,231,48 ; shufps $0x30,%xmm7,%xmm4
- DB 15,198,252,132 ; shufps $0x84,%xmm4,%xmm7
- DB 243,65,15,16,100,147,4 ; movss 0x4(%r11,%rdx,4),%xmm4
- DB 15,198,231,0 ; shufps $0x0,%xmm7,%xmm4
- DB 15,198,231,226 ; shufps $0xe2,%xmm7,%xmm4
- DB 15,40,252 ; movaps %xmm4,%xmm7
- DB 243,65,15,16,36,147 ; movss (%r11,%rdx,4),%xmm4
- DB 243,15,16,252 ; movss %xmm4,%xmm7
- DB 233,90,253,255,255 ; jmpq 7a6 <_sk_srcover_rgba_8888_ssse3_lowp+0x1e>
+ DB 243,65,15,16,60,147 ; movss (%r11,%rdx,4),%xmm7
+ DB 233,191,253,255,255 ; jmpq 7af <_sk_srcover_rgba_8888_ssse3_lowp+0x1f>
DB 69,137,193 ; mov %r8d,%r9d
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,49,255,255,255 ; ja 991 <_sk_srcover_rgba_8888_ssse3_lowp+0x209>
+ DB 119,153 ; ja 999 <_sk_srcover_rgba_8888_ssse3_lowp+0x209>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 76,141,13,117,0,0,0 ; lea 0x75(%rip),%r9 # ae0 <_sk_srcover_rgba_8888_ssse3_lowp+0x358>
+ DB 76,141,13,189,0,0,0 ; lea 0xbd(%rip),%r9 # ac8 <_sk_srcover_rgba_8888_ssse3_lowp+0x338>
DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax
DB 76,1,200 ; add %r9,%rax
DB 255,224 ; jmpq *%rax
+ DB 102,65,15,126,4,147 ; movd %xmm0,(%r11,%rdx,4)
+ DB 233,122,255,255,255 ; jmpq 999 <_sk_srcover_rgba_8888_ssse3_lowp+0x209>
+ DB 102,65,15,110,100,147,8 ; movd 0x8(%r11,%rdx,4),%xmm4
+ DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
+ DB 102,65,15,18,60,147 ; movlpd (%r11,%rdx,4),%xmm7
+ DB 233,121,253,255,255 ; jmpq 7af <_sk_srcover_rgba_8888_ssse3_lowp+0x1f>
+ DB 102,65,15,110,100,147,24 ; movd 0x18(%r11,%rdx,4),%xmm4
+ DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
+ DB 243,65,15,16,100,147,20 ; movss 0x14(%r11,%rdx,4),%xmm4
+ DB 65,15,198,224,0 ; shufps $0x0,%xmm8,%xmm4
+ DB 65,15,198,224,226 ; shufps $0xe2,%xmm8,%xmm4
+ DB 68,15,40,196 ; movaps %xmm4,%xmm8
+ DB 243,65,15,16,100,147,16 ; movss 0x10(%r11,%rdx,4),%xmm4
+ DB 243,68,15,16,196 ; movss %xmm4,%xmm8
+ DB 233,64,253,255,255 ; jmpq 7a9 <_sk_srcover_rgba_8888_ssse3_lowp+0x19>
+ DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
+ DB 102,65,15,126,76,147,8 ; movd %xmm1,0x8(%r11,%rdx,4)
+ DB 102,65,15,214,4,147 ; movq %xmm0,(%r11,%rdx,4)
+ DB 233,25,255,255,255 ; jmpq 999 <_sk_srcover_rgba_8888_ssse3_lowp+0x209>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,65,15,126,84,147,24 ; movd %xmm2,0x18(%r11,%rdx,4)
DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2
DB 102,65,15,126,84,147,20 ; movd %xmm2,0x14(%r11,%rdx,4)
DB 102,65,15,126,76,147,16 ; movd %xmm1,0x10(%r11,%rdx,4)
- DB 102,15,112,200,231 ; pshufd $0xe7,%xmm0,%xmm1
- DB 102,65,15,126,76,147,12 ; movd %xmm1,0xc(%r11,%rdx,4)
- DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
- DB 102,65,15,126,76,147,8 ; movd %xmm1,0x8(%r11,%rdx,4)
- DB 102,15,112,200,229 ; pshufd $0xe5,%xmm0,%xmm1
- DB 102,65,15,126,76,147,4 ; movd %xmm1,0x4(%r11,%rdx,4)
- DB 102,65,15,126,4,147 ; movd %xmm0,(%r11,%rdx,4)
- DB 233,207,254,255,255 ; jmpq 991 <_sk_srcover_rgba_8888_ssse3_lowp+0x209>
+ DB 243,65,15,127,4,147 ; movdqu %xmm0,(%r11,%rdx,4)
+ DB 233,239,254,255,255 ; jmpq 999 <_sk_srcover_rgba_8888_ssse3_lowp+0x209>
DB 102,144 ; xchg %ax,%ax
- DB 121,255 ; jns ac5 <_sk_srcover_rgba_8888_ssse3_lowp+0x33d>
+ DB 57,255 ; cmp %edi,%edi
DB 255 ; (bad)
- DB 255,103,255 ; jmpq *-0x1(%rdi)
DB 255 ; (bad)
- DB 255,88,255 ; lcall *-0x1(%rax)
+ DB 127,255 ; jg ab1 <_sk_srcover_rgba_8888_ssse3_lowp+0x321>
DB 255 ; (bad)
- DB 255,73,255 ; decl -0x1(%rcx)
+ DB 255,115,255 ; pushq -0x1(%rbx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 61,255,255,255,40 ; cmp $0x28ffffff,%eax
+ DB 253 ; std
+ DB 252 ; cld
DB 255 ; (bad)
+ DB 255,172,255,255,255,151,255 ; ljmp *-0x680001(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 255,24 ; lcall *(%rax)
+ DB 255,138,255,255,255,76 ; decl 0x4cffffff(%rdx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,215 ; callq *%rdi
+ DB 255,173,255,255,255,161 ; ljmp *-0x5e000001(%rbp)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,203 ; dec %ebx
+ DB 255,215 ; callq *%rdi
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 255,208 ; callq *%rax
DB 255 ; (bad)
- DB 191,255,255,255,179 ; mov $0xb3ffffff,%edi
DB 255 ; (bad)
+ DB 255,196 ; inc %esp
DB 255 ; (bad)
- DB 255,172,255,255,255,160,255 ; ljmp *-0x5f0001(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 255 ; .byte 0xff
- DB 148 ; xchg %eax,%esp
+ DB 255 ; (bad)
+ DB 184 ; .byte 0xb8
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -27298,7 +27419,7 @@ PUBLIC _sk_scale_1_float_ssse3_lowp
_sk_scale_1_float_ssse3_lowp LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,68,15,16,0 ; movss (%rax),%xmm8
- DB 243,68,15,88,5,152,10,0,0 ; addss 0xa98(%rip),%xmm8 # 15a4 <_sk_xor__ssse3_lowp+0x28b>
+ DB 243,68,15,88,5,224,10,0,0 ; addss 0xae0(%rip),%xmm8 # 15d4 <_sk_xor__ssse3_lowp+0x2a3>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 242,69,15,112,192,0 ; pshuflw $0x0,%xmm8,%xmm8
@@ -27319,11 +27440,11 @@ _sk_scale_u8_ssse3_lowp LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,24 ; mov (%rax),%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,74 ; jne ba6 <_sk_scale_u8_ssse3_lowp+0x54>
+ DB 117,74 ; jne b8e <_sk_scale_u8_ssse3_lowp+0x54>
DB 243,69,15,126,4,19 ; movq (%r11,%rdx,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,65,15,113,240,8 ; psllw $0x8,%xmm8
- DB 102,68,15,228,5,90,9,0,0 ; pmulhuw 0x95a(%rip),%xmm8 # 14d0 <_sk_xor__ssse3_lowp+0x1b7>
+ DB 102,68,15,228,5,162,9,0,0 ; pmulhuw 0x9a2(%rip),%xmm8 # 1500 <_sk_xor__ssse3_lowp+0x1cf>
DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0
DB 102,15,56,29,192 ; pabsw %xmm0,%xmm0
DB 102,65,15,56,11,200 ; pmulhrsw %xmm8,%xmm1
@@ -27339,12 +27460,23 @@ _sk_scale_u8_ssse3_lowp LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,172 ; ja b67 <_sk_scale_u8_ssse3_lowp+0x15>
+ DB 119,172 ; ja b4f <_sk_scale_u8_ssse3_lowp+0x15>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,102,0,0,0 ; lea 0x66(%rip),%r10 # c2c <_sk_scale_u8_ssse3_lowp+0xda>
+ DB 76,141,21,126,0,0,0 ; lea 0x7e(%rip),%r10 # c2c <_sk_scale_u8_ssse3_lowp+0xf2>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 235,140 ; jmp b4f <_sk_scale_u8_ssse3_lowp+0x15>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
+ DB 102,68,15,196,192,2 ; pinsrw $0x2,%eax,%xmm8
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 102,68,15,110,200 ; movd %eax,%xmm9
+ DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
+ DB 243,69,15,16,193 ; movss %xmm9,%xmm8
+ DB 233,98,255,255,255 ; jmpq b4f <_sk_scale_u8_ssse3_lowp+0x15>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,68,15,196,192,6 ; pinsrw $0x6,%eax,%xmm8
@@ -27352,30 +27484,28 @@ _sk_scale_u8_ssse3_lowp LABEL PROC
DB 102,68,15,196,192,5 ; pinsrw $0x5,%eax,%xmm8
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 102,68,15,196,192,4 ; pinsrw $0x4,%eax,%xmm8
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 102,68,15,196,192,3 ; pinsrw $0x3,%eax,%xmm8
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 102,68,15,196,192,2 ; pinsrw $0x2,%eax,%xmm8
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 102,68,15,196,192,1 ; pinsrw $0x1,%eax,%xmm8
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 102,68,15,196,192,0 ; pinsrw $0x0,%eax,%xmm8
- DB 233,59,255,255,255 ; jmpq b67 <_sk_scale_u8_ssse3_lowp+0x15>
- DB 240,255 ; lock (bad)
+ DB 102,69,15,110,12,19 ; movd (%r11,%rdx,1),%xmm9
+ DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
+ DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
+ DB 233,36,255,255,255 ; jmpq b4f <_sk_scale_u8_ssse3_lowp+0x15>
+ DB 144 ; nop
+ DB 139,255 ; mov %edi,%edi
DB 255 ; (bad)
- DB 255,228 ; jmpq *%rsp
+ DB 255,168,255,255,255,151 ; ljmp *-0x68000001(%rax)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 216,255 ; fdivr %st(7),%st
+ DB 234 ; (bad)
DB 255 ; (bad)
- DB 255,204 ; dec %esp
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,192 ; inc %eax
+ DB 222,255 ; fdivrp %st,%st(7)
+ DB 255 ; (bad)
+ DB 255,210 ; callq *%rdx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,180,255,255,255,163,255 ; pushq -0x5c0001(%rdi,%rdi,8)
+ DB 255,193 ; inc %ecx
+ DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -27383,14 +27513,14 @@ PUBLIC _sk_lerp_1_float_ssse3_lowp
_sk_lerp_1_float_ssse3_lowp LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,68,15,16,0 ; movss (%rax),%xmm8
- DB 243,68,15,88,5,80,9,0,0 ; addss 0x950(%rip),%xmm8 # 15a8 <_sk_xor__ssse3_lowp+0x28f>
+ DB 243,68,15,88,5,128,9,0,0 ; addss 0x980(%rip),%xmm8 # 15d8 <_sk_xor__ssse3_lowp+0x2a7>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 242,69,15,112,192,0 ; pshuflw $0x0,%xmm8,%xmm8
DB 102,69,15,112,192,80 ; pshufd $0x50,%xmm8,%xmm8
DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0
DB 102,68,15,56,29,200 ; pabsw %xmm0,%xmm9
- DB 102,68,15,111,21,93,8,0,0 ; movdqa 0x85d(%rip),%xmm10 # 14e0 <_sk_xor__ssse3_lowp+0x1c7>
+ DB 102,68,15,111,21,141,8,0,0 ; movdqa 0x88d(%rip),%xmm10 # 1510 <_sk_xor__ssse3_lowp+0x1df>
DB 102,69,15,249,208 ; psubw %xmm8,%xmm10
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,65,15,56,11,194 ; pmulhrsw %xmm10,%xmm0
@@ -27425,10 +27555,10 @@ _sk_lerp_u8_ssse3_lowp LABEL PROC
DB 243,69,15,126,4,19 ; movq (%r11,%rdx,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,65,15,113,240,8 ; psllw $0x8,%xmm8
- DB 102,68,15,228,5,203,7,0,0 ; pmulhuw 0x7cb(%rip),%xmm8 # 14f0 <_sk_xor__ssse3_lowp+0x1d7>
+ DB 102,68,15,228,5,251,7,0,0 ; pmulhuw 0x7fb(%rip),%xmm8 # 1520 <_sk_xor__ssse3_lowp+0x1ef>
DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0
DB 102,68,15,56,29,200 ; pabsw %xmm0,%xmm9
- DB 102,68,15,111,21,198,7,0,0 ; movdqa 0x7c6(%rip),%xmm10 # 1500 <_sk_xor__ssse3_lowp+0x1e7>
+ DB 102,68,15,111,21,246,7,0,0 ; movdqa 0x7f6(%rip),%xmm10 # 1530 <_sk_xor__ssse3_lowp+0x1ff>
DB 102,69,15,249,208 ; psubw %xmm8,%xmm10
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,65,15,56,11,194 ; pmulhrsw %xmm10,%xmm0
@@ -27460,10 +27590,21 @@ _sk_lerp_u8_ssse3_lowp LABEL PROC
DB 65,128,249,6 ; cmp $0x6,%r9b
DB 15,135,73,255,255,255 ; ja d16 <_sk_lerp_u8_ssse3_lowp+0x19>
DB 69,15,182,201 ; movzbl %r9b,%r9d
- DB 76,141,21,104,0,0,0 ; lea 0x68(%rip),%r10 # e40 <_sk_lerp_u8_ssse3_lowp+0x143>
+ DB 76,141,21,128,0,0,0 ; lea 0x80(%rip),%r10 # e58 <_sk_lerp_u8_ssse3_lowp+0x15b>
DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
+ DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
+ DB 102,68,15,110,192 ; movd %eax,%xmm8
+ DB 233,38,255,255,255 ; jmpq d16 <_sk_lerp_u8_ssse3_lowp+0x19>
+ DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
+ DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
+ DB 102,68,15,196,192,2 ; pinsrw $0x2,%eax,%xmm8
+ DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax
+ DB 102,68,15,110,200 ; movd %eax,%xmm9
+ DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
+ DB 243,69,15,16,193 ; movss %xmm9,%xmm8
+ DB 233,252,254,255,255 ; jmpq d16 <_sk_lerp_u8_ssse3_lowp+0x19>
DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,68,15,196,192,6 ; pinsrw $0x6,%eax,%xmm8
@@ -27471,34 +27612,25 @@ _sk_lerp_u8_ssse3_lowp LABEL PROC
DB 102,68,15,196,192,5 ; pinsrw $0x5,%eax,%xmm8
DB 65,15,182,68,19,4 ; movzbl 0x4(%r11,%rdx,1),%eax
DB 102,68,15,196,192,4 ; pinsrw $0x4,%eax,%xmm8
- DB 65,15,182,68,19,3 ; movzbl 0x3(%r11,%rdx,1),%eax
- DB 102,68,15,196,192,3 ; pinsrw $0x3,%eax,%xmm8
- DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax
- DB 102,68,15,196,192,2 ; pinsrw $0x2,%eax,%xmm8
- DB 65,15,182,68,19,1 ; movzbl 0x1(%r11,%rdx,1),%eax
- DB 102,68,15,196,192,1 ; pinsrw $0x1,%eax,%xmm8
- DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax
- DB 102,68,15,196,192,0 ; pinsrw $0x0,%eax,%xmm8
- DB 233,216,254,255,255 ; jmpq d16 <_sk_lerp_u8_ssse3_lowp+0x19>
- DB 102,144 ; xchg %ax,%ax
- DB 238 ; out %al,(%dx)
- DB 255 ; (bad)
+ DB 102,69,15,110,12,19 ; movd (%r11,%rdx,1),%xmm9
+ DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
+ DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
+ DB 233,190,254,255,255 ; jmpq d16 <_sk_lerp_u8_ssse3_lowp+0x19>
+ DB 137,255 ; mov %edi,%edi
DB 255 ; (bad)
- DB 255,226 ; jmpq *%rdx
+ DB 255,169,255,255,255,152 ; ljmp *-0x67000001(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,214 ; callq *%rsi
- DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,202 ; dec %edx
+ DB 235,255 ; jmp e65 <_sk_lerp_u8_ssse3_lowp+0x168>
DB 255 ; (bad)
DB 255 ; (bad)
+ DB 223,255 ; (bad)
DB 255 ; (bad)
- DB 190,255,255,255,178 ; mov $0xb2ffffff,%esi
+ DB 255,211 ; callq *%rbx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255 ; .byte 0xff
- DB 161 ; .byte 0xa1
+ DB 255,194 ; inc %edx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -27559,7 +27691,7 @@ PUBLIC _sk_srcatop_ssse3_lowp
_sk_srcatop_ssse3_lowp LABEL PROC
DB 102,15,56,11,199 ; pmulhrsw %xmm7,%xmm0
DB 102,68,15,56,29,192 ; pabsw %xmm0,%xmm8
- DB 102,68,15,111,13,49,6,0,0 ; movdqa 0x631(%rip),%xmm9 # 1510 <_sk_xor__ssse3_lowp+0x1f7>
+ DB 102,68,15,111,13,73,6,0,0 ; movdqa 0x649(%rip),%xmm9 # 1540 <_sk_xor__ssse3_lowp+0x20f>
DB 102,68,15,249,203 ; psubw %xmm3,%xmm9
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,65,15,56,11,193 ; pmulhrsw %xmm9,%xmm0
@@ -27590,7 +27722,7 @@ _sk_dstatop_ssse3_lowp LABEL PROC
DB 102,68,15,111,196 ; movdqa %xmm4,%xmm8
DB 102,68,15,56,11,195 ; pmulhrsw %xmm3,%xmm8
DB 102,69,15,56,29,192 ; pabsw %xmm8,%xmm8
- DB 102,68,15,111,13,176,5,0,0 ; movdqa 0x5b0(%rip),%xmm9 # 1520 <_sk_xor__ssse3_lowp+0x207>
+ DB 102,68,15,111,13,200,5,0,0 ; movdqa 0x5c8(%rip),%xmm9 # 1550 <_sk_xor__ssse3_lowp+0x21f>
DB 102,68,15,249,207 ; psubw %xmm7,%xmm9
DB 102,65,15,56,11,193 ; pmulhrsw %xmm9,%xmm0
DB 102,15,56,29,192 ; pabsw %xmm0,%xmm0
@@ -27647,7 +27779,7 @@ _sk_dstin_ssse3_lowp LABEL PROC
PUBLIC _sk_srcout_ssse3_lowp
_sk_srcout_ssse3_lowp LABEL PROC
- DB 102,68,15,111,5,214,4,0,0 ; movdqa 0x4d6(%rip),%xmm8 # 1530 <_sk_xor__ssse3_lowp+0x217>
+ DB 102,68,15,111,5,238,4,0,0 ; movdqa 0x4ee(%rip),%xmm8 # 1560 <_sk_xor__ssse3_lowp+0x22f>
DB 102,68,15,249,199 ; psubw %xmm7,%xmm8
DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0
DB 102,15,56,29,192 ; pabsw %xmm0,%xmm0
@@ -27662,7 +27794,7 @@ _sk_srcout_ssse3_lowp LABEL PROC
PUBLIC _sk_dstout_ssse3_lowp
_sk_dstout_ssse3_lowp LABEL PROC
- DB 102,68,15,111,5,167,4,0,0 ; movdqa 0x4a7(%rip),%xmm8 # 1540 <_sk_xor__ssse3_lowp+0x227>
+ DB 102,68,15,111,5,191,4,0,0 ; movdqa 0x4bf(%rip),%xmm8 # 1570 <_sk_xor__ssse3_lowp+0x23f>
DB 102,68,15,249,195 ; psubw %xmm3,%xmm8
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0
@@ -27680,7 +27812,7 @@ _sk_dstout_ssse3_lowp LABEL PROC
PUBLIC _sk_srcover_ssse3_lowp
_sk_srcover_ssse3_lowp LABEL PROC
- DB 102,68,15,111,5,108,4,0,0 ; movdqa 0x46c(%rip),%xmm8 # 1550 <_sk_xor__ssse3_lowp+0x237>
+ DB 102,68,15,111,5,132,4,0,0 ; movdqa 0x484(%rip),%xmm8 # 1580 <_sk_xor__ssse3_lowp+0x24f>
DB 102,68,15,249,195 ; psubw %xmm3,%xmm8
DB 102,68,15,111,204 ; movdqa %xmm4,%xmm9
DB 102,69,15,56,11,200 ; pmulhrsw %xmm8,%xmm9
@@ -27702,7 +27834,7 @@ _sk_srcover_ssse3_lowp LABEL PROC
PUBLIC _sk_dstover_ssse3_lowp
_sk_dstover_ssse3_lowp LABEL PROC
- DB 102,68,15,111,5,23,4,0,0 ; movdqa 0x417(%rip),%xmm8 # 1560 <_sk_xor__ssse3_lowp+0x247>
+ DB 102,68,15,111,5,47,4,0,0 ; movdqa 0x42f(%rip),%xmm8 # 1590 <_sk_xor__ssse3_lowp+0x25f>
DB 102,68,15,249,199 ; psubw %xmm7,%xmm8
DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0
DB 102,15,56,29,192 ; pabsw %xmm0,%xmm0
@@ -27734,7 +27866,7 @@ _sk_modulate_ssse3_lowp LABEL PROC
PUBLIC _sk_multiply_ssse3_lowp
_sk_multiply_ssse3_lowp LABEL PROC
- DB 102,68,15,111,5,172,3,0,0 ; movdqa 0x3ac(%rip),%xmm8 # 1570 <_sk_xor__ssse3_lowp+0x257>
+ DB 102,68,15,111,5,196,3,0,0 ; movdqa 0x3c4(%rip),%xmm8 # 15a0 <_sk_xor__ssse3_lowp+0x26f>
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,68,15,249,207 ; psubw %xmm7,%xmm9
DB 102,68,15,111,208 ; movdqa %xmm0,%xmm10
@@ -27781,7 +27913,7 @@ _sk_multiply_ssse3_lowp LABEL PROC
PUBLIC _sk_screen_ssse3_lowp
_sk_screen_ssse3_lowp LABEL PROC
- DB 102,68,15,111,5,210,2,0,0 ; movdqa 0x2d2(%rip),%xmm8 # 1580 <_sk_xor__ssse3_lowp+0x267>
+ DB 102,68,15,111,5,234,2,0,0 ; movdqa 0x2ea(%rip),%xmm8 # 15b0 <_sk_xor__ssse3_lowp+0x27f>
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,68,15,249,200 ; psubw %xmm0,%xmm9
DB 102,68,15,56,11,204 ; pmulhrsw %xmm4,%xmm9
@@ -27806,7 +27938,7 @@ _sk_screen_ssse3_lowp LABEL PROC
PUBLIC _sk_xor__ssse3_lowp
_sk_xor__ssse3_lowp LABEL PROC
- DB 102,68,15,111,5,110,2,0,0 ; movdqa 0x26e(%rip),%xmm8 # 1590 <_sk_xor__ssse3_lowp+0x277>
+ DB 102,68,15,111,5,134,2,0,0 ; movdqa 0x286(%rip),%xmm8 # 15c0 <_sk_xor__ssse3_lowp+0x28f>
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,68,15,249,207 ; psubw %xmm7,%xmm9
DB 102,65,15,56,11,193 ; pmulhrsw %xmm9,%xmm0
@@ -27849,7 +27981,7 @@ ALIGN 16
DB 12,13 ; or $0xd,%al
DB 12,13 ; or $0xd,%al
DB 14 ; (bad)
- DB 15,129,128,129,128,129 ; jno ffffffff81809565 <_sk_xor__ssse3_lowp+0xffffffff8180824c>
+ DB 15,129,128,129,128,129 ; jno ffffffff81809575 <_sk_xor__ssse3_lowp+0xffffffff81808244>
DB 128,129,128,129,128,129,128 ; addb $0x80,-0x7e7f7e80(%rcx)
DB 129,128,129,128,1,2,5,6,9,10 ; addl $0xa090605,0x2018081(%rax)
DB 13,14,9,10,13 ; or $0xd0a090e,%eax
@@ -27882,11 +28014,27 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 255,0 ; incl (%rax)
DB 129,128,129,128,129,128,129,128,129,128; addl $0x80818081,-0x7f7e7f7f(%rax)
+ DB 129,128,129,128,129,128,0,2,0,0 ; addl $0x200,-0x7f7e7f7f(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,2 ; add %al,(%rdx)
+ DB 4,6 ; add $0x6,%al
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
+ DB 0,0 ; add %al,(%rax)
DB 129,128,129,128,129,128,129,128,129,128; addl $0x80818081,-0x7f7e7f7f(%rax)
- DB 129,128,129,128,129,128,129,128,129,128; addl $0x80818081,-0x7f7e7f7f(%rax)
- DB 129,128,0,128,0,128,0,128,0,128 ; addl $0x80008000,-0x7fff8000(%rax)
+ DB 129,128,129,128,129,128,0,128,0,128 ; addl $0x80008000,-0x7f7e7f7f(%rax)
+ DB 0,128,0,128,0,128 ; add %al,-0x7fff8000(%rax)
DB 0,128,0,128,0,128 ; add %al,-0x7fff8000(%rax)
- DB 0,128,0,1,4,5 ; add %al,0x5040100(%rax)
+ DB 0,1 ; add %al,(%rcx)
+ DB 4,5 ; add $0x5,%al
DB 8,9 ; or %cl,(%rcx)
DB 12,13 ; or $0xd,%al
DB 8,9 ; or %cl,(%rcx)
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index 5993ec03db..1ac444441a 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -94,14 +94,14 @@ SI V load(const T* src, size_t tail) {
__builtin_assume(tail < kStride);
if (__builtin_expect(tail, 0)) {
V v{}; // Any inactive lanes are zeroed.
- switch (tail-1) {
- case 6: v[6] = src[6];
- case 5: v[5] = src[5];
- case 4: v[4] = src[4];
- case 3: v[3] = src[3];
- case 2: v[2] = src[2];
- case 1: v[1] = src[1];
- case 0: v[0] = src[0];
+ switch (tail) {
+ case 7: v[6] = src[6];
+ case 6: v[5] = src[5];
+ case 5: v[4] = src[4];
+ case 4: memcpy(&v, src, 4*sizeof(T)); break;
+ case 3: v[2] = src[2];
+ case 2: memcpy(&v, src, 2*sizeof(T)); break;
+ case 1: memcpy(&v, src, 1*sizeof(T)); break;
}
return v;
}
@@ -114,14 +114,14 @@ SI void store(T* dst, V v, size_t tail) {
#if defined(JUMPER)
__builtin_assume(tail < kStride);
if (__builtin_expect(tail, 0)) {
- switch (tail-1) {
- case 6: dst[6] = v[6];
- case 5: dst[5] = v[5];
- case 4: dst[4] = v[4];
- case 3: dst[3] = v[3];
- case 2: dst[2] = v[2];
- case 1: dst[1] = v[1];
- case 0: dst[0] = v[0];
+ switch (tail) {
+ case 7: dst[6] = v[6];
+ case 6: dst[5] = v[5];
+ case 5: dst[4] = v[4];
+ case 4: memcpy(dst, &v, 4*sizeof(T)); break;
+ case 3: dst[2] = v[2];
+ case 2: memcpy(dst, &v, 2*sizeof(T)); break;
+ case 1: memcpy(dst, &v, 1*sizeof(T)); break;
}
return;
}
diff --git a/src/jumper/SkJumper_stages_lowp.cpp b/src/jumper/SkJumper_stages_lowp.cpp
index 740a06b925..d6adc39af6 100644
--- a/src/jumper/SkJumper_stages_lowp.cpp
+++ b/src/jumper/SkJumper_stages_lowp.cpp
@@ -87,14 +87,14 @@ SI V load(const T* src, size_t tail) {
__builtin_assume(tail < kStride);
if (__builtin_expect(tail, 0)) {
V v{}; // Any inactive lanes are zeroed.
- switch (tail-1) {
- case 6: v[6] = src[6];
- case 5: v[5] = src[5];
- case 4: v[4] = src[4];
- case 3: v[3] = src[3];
- case 2: v[2] = src[2];
- case 1: v[1] = src[1];
- case 0: v[0] = src[0];
+ switch (tail) {
+ case 7: v[6] = src[6];
+ case 6: v[5] = src[5];
+ case 5: v[4] = src[4];
+ case 4: memcpy(&v, src, 4*sizeof(T)); break;
+ case 3: v[2] = src[2];
+ case 2: memcpy(&v, src, 2*sizeof(T)); break;
+ case 1: memcpy(&v, src, 1*sizeof(T)); break;
}
return v;
}
@@ -105,14 +105,14 @@ template <typename V, typename T>
SI void store(T* dst, V v, size_t tail) {
__builtin_assume(tail < kStride);
if (__builtin_expect(tail, 0)) {
- switch (tail-1) {
- case 6: dst[6] = v[6];
- case 5: dst[5] = v[5];
- case 4: dst[4] = v[4];
- case 3: dst[3] = v[3];
- case 2: dst[2] = v[2];
- case 1: dst[1] = v[1];
- case 0: dst[0] = v[0];
+ switch (tail) {
+ case 7: dst[6] = v[6];
+ case 6: dst[5] = v[5];
+ case 5: dst[4] = v[4];
+ case 4: memcpy(dst, &v, 4*sizeof(T)); break;
+ case 3: dst[2] = v[2];
+ case 2: memcpy(dst, &v, 2*sizeof(T)); break;
+ case 1: memcpy(dst, &v, 1*sizeof(T)); break;
}
return;
}